代理软件工程(SE 3.0)代表了一个新时代,智能代理的任务不是简单的代码生成,而是实现复杂的,面向目标的SE目标。为了利用这些新的能力,同时确保了可信度,我们必须认识到代理SE时代SE领域内的基本二元性,包括两种共生方式:SE为人类和SE代理 ...
0 0 0 2025/09/26 arXiv:2509.06216v2 rogers
视觉语言行动政策通过大规模的预训练来学习跨任务,环境和实施方案的操纵技巧。但是,它们概括为新型机器人配置的能力仍然有限。大多数方法都强调模型大小,数据集量表和多样性,同时更少关注动作空间的设计 ...
0 0 0 2025/09/26 arXiv:2509.14630v1 kkkk
标准深度加固学习方法的样本效率低下,排除了它们在许多现实世界中的应用。利用人类示范的方法所需的样本较少,但研究较少。正如计算机视觉和自然语言处理社区所证明的那样,大型数据集具有通过作为新方法的实验和基准测试平台来促进研究的能力 ...
0 0 0 2025/09/26 arXiv:1907.13440v1 plum
人工智能(AI)的最新进展很大程度上是通过缩放来推动的。在机器人技术中,由于缺乏获得大量机器人数据集的访问而阻碍了缩放。我们主张使用现实的物理仿真作为机器人学习方法扩展环境,任务和数据集的一种手段 ...
0 0 0 2025/09/26 arXiv:2406.02523v1 暖暖yiyi
最近的视频扩散模型表明,由于其丰富的潜在世界先验,在空间情报任务中的潜力很大。但是,这种潜力受到了有限的可控性和几何不一致的阻碍,从而在强大的先验和在3D/4D任务中的实际使用之间差距。结果,当前的方法通常依赖于重新调整或微调,这有可能降低预验证的知识并带来高度的计算成本 ...
0 0 0 2025/09/26 arXiv:2509.15130v1 陆三七
统一的多模型模型(UMMS)在单个体系结构中统一视觉理解和生成。但是,传统的培训依赖于图像文本对(或序列)的字幕通常是稀疏的,并且错过了细颗粒的视觉细节 - 即使他们使用数百个单词来描述一个简单的图像。我们介绍了重建对齐(RECA),这是一种资源有效的训练后方法,利用视觉理解编码器嵌入为密集的“文本提示”,提供了没有标题的丰富监督 ...
0 0 0 2025/09/26 arXiv:2509.07295v2 qzfm
大型语言模型彻底改变了NLP,并在几个任务中表现出了巨大的性能提高。在本文中,我们调查了此类语言模型在文本分类中的作用,以及它们与依靠较小训练的训练性语言模型的其他方法进行比较。考虑到跨越8种语言的32个数据集,我们比较了使用完整的人类标记的数据集构建的分类器,比较了零摄像的分类,很少弹出的微调和基于合成数据的分类器 ...
0 0 0 2025/09/26 arXiv:2502.11830v1 luke
 Token 通信(TC)有望在新兴语言驱动的应用程序(例如AI生成的内容(AIGC)和无线语言模型(LLMS))中发挥关键作用。但是,通道噪声造成的 Token 损失会严重降低任务性能。为了解决这一问题,在本文中,我们关注语义吸引的包装化问题,并开发出一种新颖的算法,称为语义数据包聚合,遗传束搜索(SEMPA-GBEAM),旨在使擦除通道上的平均标记相似性(ATS)最大化 ...
0 0 0 2025/09/26 arXiv:2504.19591v1 mby

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)