一译 —— 文档和论文翻译、对照阅读、讨论和社区

WebEvolver: Enhancing Web Agent Self-Improvement with Coevolving World Model

代理人的自我完善，代理的主链大语言模型（LLM）是根据自己的政策自动采样的轨迹进行培训的，它已成为提高性能的一种有希望的方法。最近的进步，尤其是在网络环境中，面临着一个关键的局限性：它们的性能将在自主学习周期期间达到停滞点，从而阻碍进一步的进步。我们认为，这源于对Web环境的探索有限，以及对LLMS中预训练的Web知识的利用不足 ...

0 0 0 2025/08/23 arXiv:2504.21024v2 panda__

RoboCulture: A Robotics Platform for Automated Biological Experimentation

自动化生物学实验由于需要毫米级的精度，长而多步实验以及生活系统的动态性质而保持挑战性。当前的液体处理程序仅部分自动化工作流程，需要人为干预板的装载，尖端更换和校准。工业解决方案提供了更多的自动化，但昂贵，并且缺乏研究环境中所需的灵活性 ...

0 0 0 2025/08/23 arXiv:2505.14941v2 uu2222

ZSDEVC: Zero-Shot Diffusion-based Emotional Voice Conversion with Disentangled Mechanism

人的声音不仅传达了言语，还传达了情感状态和个性。情感语音转换（EVC）会改变情绪表达，同时保留语言内容和说话者的身份，从而改善了人机互动等应用。尽管深度学习为精心制作的情感数据集提供了EVC模型，但现有方法通常会面临情绪准确性和语音失真的问题 ...

0 0 0 2025/08/23 arXiv:2409.03636v4 jack_j

Steer LLM Latents for Hallucination Detection

LLMS中的幻觉对他们在现实世界应用中的安全部署引起了重大关注。最近的方法利用LLM的潜在空间进行幻觉检测，但是它们的嵌入以语言连贯性而不是事实准确性进行了优化，通常无法清楚地分离出真实和幻觉的内容。为此，我们提出了真实性分离器向量（TSV），这是一种轻巧且灵活的转向向量，可以重塑推断期间LLM的表示空间，以增强不改变模型参数的真实和幻觉输出之间的分离 ...

0 0 0 2025/08/23 arXiv:2503.01917v2 smallz

From Show to Tell: A Survey on Deep Learning-based Image Captioning

连接视觉和语言在生成智能中起着至关重要的作用。因此，大量的研究工作已致力于图像字幕，即 ...

0 0 0 2025/08/23 arXiv:2107.06912v3 yuantao1224

Closing the Performance Gap in Generative Recommenders with Collaborative Tokenization and Efficient Modeling

最近的工作探索了生成推荐系统作为传统基于ID的模型的替代方法，将项目推荐作为一个序列生成任务而不是离散的项目 Token 。尽管有希望，但与SASREC这样的基于ID的基准相比，这种方法在实践中通常表现不佳。在本文中，我们确定了阻止生成方法的两个关键局限性：项目 Token 化中缺乏协作信号，以及常用的编码器decoder架构中的效率低下 ...

0 0 0 2025/08/23 arXiv:2508.14910v1 missbear

Improving AI weather prediction models using global mass and energy conservation schemes

人工智能 (AI) 天气预报 (AIWP) 模型是中期预报的强大工具，但往往缺乏物理一致性，导致输出违反守恒定律。本研究介绍了一组新颖的基于物理的方案，旨在加强 AIWP 模型中全球干燥空气质量、水分收支和大气总能量的守恒。这些方案是高度模块化的，可以无缝集成到各种人工智能模型架构中 ...

0 0 0 2025/08/23 arXiv:2501.05648v2 SeeYa

Advances and Challenges in Foundation Agents: From Brain-Inspired Intelligence to Evolutionary, Collaborative, and Safe Systems

大型语言模型（LLM）的出现促进了人工智能的变革转变，为能够在不同领域跨越复杂的推理，强大的感知和多才多艺的动作铺平了道路。随着这些代理人越来越多地推动了人工智能研究和实际应用，它们的设计，评估和持续改进会带来复杂的多方面挑战。这项调查提供了全面的概述，在模块化的，脑为灵感的体系结构中构建了智能代理，该体系结构整合了认知科学，神经科学和计算研究的原理 ...

0 0 0 2025/08/23 arXiv:2504.01990v2 15766388315

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）