一译 —— 文档和论文翻译、对照阅读、讨论和社区

Enhancing Cross-domain Click-Through Rate Prediction via Explicit Feature Augmentation

跨域CTR（CDCTR）预测是一个重要的研究主题，它研究了如何利用来自相关领域的有意义的数据来帮助目标域中的CTR预测。大多数现有的CDCTR的作品设计与跨域转移知识（例如参数共享）的隐性方法，该域将目标域中的模型培训正规化。更有效的是，最近的研究人员提出了明确的技术来提取用户兴趣知识并将这些知识转移到目标领域 ...

0 0 0 2025/06/18 arXiv:2312.00078v2 Leeyhom

xFinder: Large Language Models as Automated Evaluators for Reliable Evaluation

大型语言模型（LLM）的不断进步使人们越来越关注开发公平可靠的方法来评估其性能的关键问题。特别是测试集泄漏、提示格式过拟合等主观或非主观作弊现象的出现，给 LLM 的可靠评估带来了重大挑战。由于评估框架通常利用正则表达式 (RegEx) 进行答案提取，因此某些模型可能会调整其响应以符合 RegEx 可以轻松提取的特定格式 ...

0 0 0 2025/06/18 arXiv:2405.11874v3 aaaa1

EmoAgent: Assessing and Safeguarding Human-AI Interaction for Mental Health Safety

LLM驱动的AI角色的兴起引起了安全问题，特别是对于患有心理疾病的脆弱人类用户。为了解决这些风险，我们提出了EmoAgent，这是一个多代理AI框架，旨在评估和减轻人类互动中的心理健康危害。 EmoAgent包括两个组成部分：Emoeval模拟虚拟用户，包括那些描绘精神脆弱的人，以评估与AI角色互动之前和之后的心理健康变化 ...

0 0 0 2025/06/18 arXiv:2504.09689v3 bubbleoo

Maximum Total Correlation Reinforcement Learning

简单是强大的归纳偏见。在强化学习中，正则化用于更简单的策略，数据扩展以进行简单的表示，以及稀疏的奖励功能，以实现更简单的目标，所有这些都具有基本动机，以通过关注必需品来提高普遍性和鲁棒性。对这些技术的补充，我们研究了如何在整个情节中促进简单行为 ...

0 0 0 2025/06/18 arXiv:2505.16734v1 weanhear

Lingshu: A Generalist Foundation Model for Unified Multimodal Medical Understanding and Reasoning

多模式的大语言模型（MLLM）在理解常见的视觉元素方面表现出了令人印象深刻的能力，这主要是由于它们的大规模数据集和高级培训策略。但是，由于医疗方案与一般领域中的数据和任务之间的固有差异，它们在医疗应用中的有效性仍然有限。具体而言，现有的医疗MLLM面临以下临界局限性：（1）由于次优数据策划过程而导致的幻觉效果增强了对医学知识的覆盖有限，（2）缺乏针对复杂医疗场景量身定制的推理能力 ...

0 0 0 2025/06/18 arXiv:2506.07044v4 cool_zeng

FPSAttention: Training-Aware FP8 and Sparsity Co-Design for Fast Video Diffusion

扩散生成模型已成为生产高质量，连贯的视频内容的标准，但它们的推理速度缓慢和高度计算需求阻碍了实际部署。尽管量化和稀疏性都可以独立地加速推理，同时保持发电质量，但由于缺乏关节优化，在现有的无训练方法中天真地结合了这些技术，导致了显着的性能下降。我们介绍了FPSATENTION，这是FP8量化和稀疏性的新型培训合作设计，以供视频产生，重点是3D双向注意机制 ...

0 0 0 2025/06/18 arXiv:2506.04648v2 zhangxinyu

A Lightweight Hybrid Dual Channel Speech Enhancement System under Low-SNR Conditions

尽管基于深度学习的多通道语音增强已取得了重大进步，但其实际部署通常受到计算资源约束的限制，尤其是在低信噪比（SNR）条件下。在本文中，我们提出了一个轻巧的混合双通道语音增强系统，该系统将独立向量分析（IVA）与双通道分组的时间卷积复发网络（GTCRN）结合在一起。 IVA用作粗糙的估计器，为语音和噪声提供辅助信息，而修改后的GTCRN进一步完善了语音质量 ...

0 1 0 2025/06/18 arXiv:2505.19597v1 陶陶不在

A Comprehensive Survey of Deep Research: Systems, Methodologies, and Applications

这项调查研究了深层研究系统的快速发展的领域 - 通过大型语言模型，高级信息检索和自主推理功能的集成，通过AI驱动的应用程序来自动化复杂的研究工作流程。我们分析了自2023年以来出现的80多种商业和非商业实施，包括Openai/Deep Research，Gemini/Deep Research，Gemini/Deep研究，困惑/深度研究以及许多开源替代方案。通过全面的检查，我们提出了一种新型的层次 ...

0 0 0 2025/06/18 arXiv:2506.12594v1 hwrabbit

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）