人工智能(AI)正在加快科学研究范式的转变,不仅提高了研究效率,而且还推动了创新。我们介绍了Internatent,这是一个统一的闭环多代理框架,以在各个科学研究领域进行自主科学研究(ASR),使研究人员能够以前所未有的速度和精确度解决这些领域的复杂问题。国际强调了三个关键优势:1)可伸缩性:国际证明了其在12个科学研究任务中的多功能性,能够产生创新的想法以增强基线代码的性能 ...
我们介绍了Cosmos-Transfer,这是一个有条件的世界一代模型,可以基于各种模式的多种空间控制输入(例如分割,深度和边缘)生成世界模拟。在设计中,空间条件方案是自适应和可定制的。它允许在不同的空间位置加权不同的条件输入 ...
基于注意力的模型吸引了多模式处理,因为可以将多种模式的输入加入并馈送到单个骨干网络 - 因此几乎不需要融合工程。但是,由此产生的表示形式完全纠缠在整个网络中,这可能并不总是可取的:在学习中,对比的是视听自我监督的学习需要独立的音频和视觉功能才能操作,否则学习崩溃了;在推断中,应该在仅具有音频或视频的基准上进行视听模型的评估。在本文中,我们介绍了Zorro,该技术使用掩码来控制每个模态的输入如何在 ...
我提出了一种并行化跨多个GPU的卷积神经网络培训的新方法。当应用于现代卷积神经网络时,该方法比所有替代方案都明显更好 ...
点云数据的规模多样性在为3D视觉开发统一的表示学习技术方面提出了重大挑战。当前,几乎没有统一的3D模型,并且没有现有的预训练方法对对象和场景级点云同样有效。在本文中,我们介绍了Unipre3D,这是第一种统一的预训练方法,可以无缝应用于任何体系结构的任何规模和3D模型的点云 ...
尽管AI最近取得了进步,但能够执行复杂的系统的发展,涉及多个工具的多步推理任务仍然是一个重大挑战。当前的基准测试在捕获工具使用推理的实际复杂性方面缺乏,在这种情况下,不仅验证最终答案的正确性,而且中间步骤的正确性对于评估,开发和识别推理期间的失败很重要。为了弥合这一差距,我们介绍了ToolComp,这是一种综合基准,旨在评估多步工具使用推理 ...
多智能体强化学习((marl)近年来受到广泛关注,并在各个领域取得了进展。具体来说,合作式 ...
时间关系提取(TRE)旨在掌握事件或动作的演变,从而塑造相关任务的工作流程,因此它有望帮助了解众群体中请求者发起的任务请求。但是,现有方法仍然在有限且分布不均的注释数据方面困难。因此,受到预先训练语言模型(PLM)中存储的丰富的全球知识的启发,我们提出了一个多任务及时的TRE学习框架(TEMPROMPT),结合了及时的调整和对比度学习以解决这些问题 ...