一译 —— 文档和论文翻译、对照阅读、讨论和社区

InternAgent: When Agent Becomes the Scientist -- Building Closed-Loop System from Hypothesis to Verification

人工智能（AI）正在加快科学研究范式的转变，不仅提高了研究效率，而且还推动了创新。我们介绍了Internatent，这是一个统一的闭环多代理框架，以在各个科学研究领域进行自主科学研究（ASR），使研究人员能够以前所未有的速度和精确度解决这些领域的复杂问题。国际强调了三个关键优势：1）可伸缩性：国际证明了其在12个科学研究任务中的多功能性，能够产生创新的想法以增强基线代码的性能 ...

0 0 0 2025/09/17 arXiv:2505.16938v3 王俊凯

Cosmos-Transfer1: Conditional World Generation with Adaptive Multimodal Control

我们介绍了Cosmos-Transfer，这是一个有条件的世界一代模型，可以基于各种模式的多种空间控制输入（例如分割，深度和边缘）生成世界模拟。在设计中，空间条件方案是自适应和可定制的。它允许在不同的空间位置加权不同的条件输入 ...

0 0 0 2025/09/17 arXiv:2503.14492v2 布朗瓶

Zorro: the masked multimodal transformer

基于注意力的模型吸引了多模式处理，因为可以将多种模式的输入加入并馈送到单个骨干网络 - 因此几乎不需要融合工程。但是，由此产生的表示形式完全纠缠在整个网络中，这可能并不总是可取的：在学习中，对比的是视听自我监督的学习需要独立的音频和视觉功能才能操作，否则学习崩溃了；在推断中，应该在仅具有音频或视频的基准上进行视听模型的评估。在本文中，我们介绍了Zorro，该技术使用掩码来控制每个模态的输入如何在  ...

0 0 0 2025/09/17 arXiv:2301.09595v2 HeiHuZi

One weird trick for parallelizing convolutional neural networks

我提出了一种并行化跨多个GPU的卷积神经网络培训的新方法。当应用于现代卷积神经网络时，该方法比所有替代方案都明显更好 ...

0 0 0 2025/09/17 arXiv:1404.5997v2 13026155693

UniPre3D: Unified Pre-training of 3D Point Cloud Models with Cross-Modal Gaussian Splatting

点云数据的规模多样性在为3D视觉开发统一的表示学习技术方面提出了重大挑战。当前，几乎没有统一的3D模型，并且没有现有的预训练方法对对象和场景级点云同样有效。在本文中，我们介绍了Unipre3D，这是第一种统一的预训练方法，可以无缝应用于任何体系结构的任何规模和3D模型的点云 ...

0 0 0 2025/09/17 arXiv:2506.09952v1 zyy

ToolComp: A Multi-Tool Reasoning & Process Supervision Benchmark

尽管AI最近取得了进步，但能够执行复杂的系统的发展，涉及多个工具的多步推理任务仍然是一个重大挑战。当前的基准测试在捕获工具使用推理的实际复杂性方面缺乏，在这种情况下，不仅验证最终答案的正确性，而且中间步骤的正确性对于评估，开发和识别推理期间的失败很重要。为了弥合这一差距，我们介绍了ToolComp，这是一种综合基准，旨在评估多步工具使用推理 ...

0 0 0 2025/09/17 arXiv:2501.01290v1 YONG

A Survey of Progress on Cooperative Multi-agent Reinforcement Learning in Open Environment

多智能体强化学习（（marl）近年来受到广泛关注，并在各个领域取得了进展。具体来说，合作式 ...

0 0 0 2025/09/17 arXiv:2312.01058v1 1-8

TemPrompt: Multi-Task Prompt Learning for Temporal Relation Extraction in RAG-based Crowdsourcing Systems

时间关系提取（TRE）旨在掌握事件或动作的演变，从而塑造相关任务的工作流程，因此它有望帮助了解众群体中请求者发起的任务请求。但是，现有方法仍然在有限且分布不均的注释数据方面困难。因此，受到预先训练语言模型（PLM）中存储的丰富的全球知识的启发，我们提出了一个多任务及时的TRE学习框架（TEMPROMPT），结合了及时的调整和对比度学习以解决这些问题 ...

0 0 0 2025/09/17 arXiv:2406.14825v4 munian

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）