科学新闻业向非专业主义者报告了当前的科学发现,旨在使公众理解艺术状况。但是,由于观众通常缺乏有关提出的研究的特定知识,因此这项任务可能具有挑战性。为了应对这一挑战,我们提出了一个框架,该框架集成了三个LLM,模仿了现实世界中的写入阅读反馈 - 革命工作流,其中一个LLM充当记者,较小的LLM作为公众公众读者,而第三个LLM则是编辑 ...
0 0 0 2025/03/12 arXiv:2407.09756v1 owenzds
现实世界中的家庭任务对移动操纵机器人面临着重大挑战。对现有机器人技术基准的分析表明,成功的任务绩效取决于三个关键的全身控制功能:双层协调,稳定且精确的导航以及广泛的最终效果可达性。实现这些功能需要仔细的硬件设计,但是由此产生的系统复杂性进一步使视觉运动策略学习变得复杂 ...
0 0 0 2025/03/12 arXiv:2503.05652v1 lucian_p
我们研究对比视力语言模型(VLM)中的文化和社会经济多样性。使用广泛的基准数据集和评估指标,我们引起了一些重要发现。首先,将培训数据的常见过滤到英语图像文本对较低的社会经济地位的劣势社区,并对文化理解产生负面影响 ...
0 0 0 2025/03/12 arXiv:2405.13777v3 shiwei
机器翻译(mt)的最新进展显着提高了各个领域的翻译质量。然而,由于其复杂的语言、比喻表达和文化差异,文学文本的翻译仍然是一个艰巨的挑战。在这项工作中,llm)的文学翻译新颖的多代理框架 ...
0 0 0 2025/03/12 arXiv:2405.11804v1 JayLiu
基于注意力的神经网络(例如Vision Transformer(VIT))最近在许多计算机视觉基准上取得了最新的结果。尺度是获得出色结果的主要成分,因此,了解模型的缩放属性是有效设计子孙后代的关键。尽管已经研究了用于扩展 Transformer 语言模型的法律,但视觉 Transformer 如何扩展是未知的 ...
0 0 0 2025/03/12 arXiv:2106.04560v2 shiwei
大型语言模型(LLM)表现出令人印象深刻的现实实用性,体现了人工有用的智能(AUI)。但是,他们的自适应推理能力 - 人工智能(AGI)的标志 - 仍然是脆弱的。尽管LLM似乎成功地进行了常识性推理,编程和数学,但他们努力跨越新的环境中的算法理解 ...
0 0 0 2025/03/12 arXiv:2502.19402v1 hx5563
知识基础问题回答(KBQA)旨在通过知识库(KB)回答一个问题。早期研究主要集中于回答有关KB的简单问题并取得了巨大的成功。但是,他们在复杂问题上的表现仍然远非令人满意 ...
0 0 0 2025/03/12 arXiv:2108.06688v5 kayne
扩散语言模型已成为文本生成的有前途的方法。人们自然会期望这种方法是自回归模型的有效替换,因为在每个扩散步骤中可以并行采样多个 Token 。但是,其效率准确的权衡尚未得到充分理解 ...
0 0 0 2025/03/12 arXiv:2502.09622v1 pixianer

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)