一译 —— 文档和论文翻译、对照阅读、讨论和社区

Building English ASR model with regional language support

在本文中，我们提出了一种新的方法，用于开发一种可以有效处理印地语查询的英语自动语音识别（ASR）系统，而不会损害其在英语上的性能。我们提出了一种新颖的声学模型（AM），称为“注意”（SHA）模型，具有跨语言共享的隐藏层，而特定于语言的投影层则通过自我发挥作用机制组合。该机制根据输入数据估算每种语言的权重，并相应地称重相应的语言投影层 ...

0 0 0 2025/03/12 arXiv:2503.07522v1 luffy

Robust Change Captioning

描述场景中发生变化的内容对用户有用，但是只有生成的文本侧重于语义上相关的内容。因此，重要的是要区分干扰因素（例如 ...

0 0 0 2025/03/12 arXiv:1901.02527v2 17733052961

Foundation Models for the Electric Power Grid

基金会模型（FMS）当前主导新闻头条。他们采用先进的深度学习体系结构，通过自学从广泛的数据集自主提取结构信息。所得的复杂系统和动力学的丰富表示形式可以应用于许多下游应用程序 ...

0 0 0 2025/03/12 arXiv:2407.09434v2 bdcdjg

PersonaMagic: Stage-Regulated High-Fidelity Face Customization with Tandem Equilibrium

个性化的图像生成在将内容适应新颖概念方面取得了长足的进步。但是，持续的挑战仍然存在：平衡对未见概念的准确重建，并根据提示需要编辑能力，尤其是在处理复杂的面部特征差异时。在这项研究中，我们深入研究了文本形象调节过程的时间动态，强调了舞台分配在引入新概念中的关键作用 ...

0 0 0 2025/03/12 arXiv:2412.15674v1 jeft

Survey of Large Multimodal Model Datasets, Application Categories and Taxonomy

多模式学习是人工智能中快速发展的领域，试图通过整合和分析各种类型的数据（包括文本，图像，音频和视频）来构建更广泛和健壮的系统。受到人类通过多种感官吸收信息的能力的启发，此方法可以实现诸如文本到视频转换，视觉问题的回答和图像字幕之类的应用程序。在此概述中，强调了支持多模式模型（MLLM）的数据集中的最新发展 ...

0 0 0 2025/03/12 arXiv:2412.17759v1 my_lsz

SHARPIE: A Modular Framework for Reinforcement Learning and Human-AI Interaction Experiments

强化学习（RL）提供了一种建模和训练AI代理的通用方法，包括人类的相互作用方案。在本文中，我们提出了Sharpie（交互式实验的共享人类增强学习平台），以满足对支持RL代理和人类实验的通用框架的需求。它的模块化设计由用于RL环境和算法库的多功能包装器，面向参与者的Web界面，日志记录实用程序，在流行云上部署以及参与者招聘平台 ...

0 0 0 2025/03/12 arXiv:2501.19245v2 1424089348

COAST: Enhancing the Code Debugging Ability of LLMs through Communicative Agent Based Data Synthesis

代码调试是软件开发的重要阶段，对于确保代码生成任务中大语言模型（LLM）的可靠性和性能至关重要。人类调试通常遵循多阶段过程，其中包括错误本地化，错误标识，代码修复和代码识别。但是，现有的代码调试基准主要集中在代码维修阶段，该阶段仅提供有限的观点，可以评估LLMS的调试功能 ...

0 0 0 2025/03/12 arXiv:2408.05006v3 owenzds

Machine Learning Unveils the power law of Finite-Volume Energy Shifts

有限体积外推是从晶格计算中提取物理可观察物的重要步骤。但是，对于具有远距离相互作用的系统而言，这是一个重大挑战。我们采用符号回归来回归有限体积的外推公式，以进行短程和远程相互作用 ...

0 0 0 2025/03/12 arXiv:2503.06496v1 amen668

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）