我们如何使用周围的环境环境教人类机器人攀登楼梯并坐在椅子上?可以说,最简单的方法是仅向他们展示人类运动视频并将其喂给人形生物。我们介绍了VideoMimic,这是一种真正到现实的管道,挖掘了日常视频,共同重建了人类和环境,并为人类机器人制定了执行相应技能的人形机器人的全身控制策略。我们展示了我们对真实类人机器人的管道的结果,显示出稳健,可重复的上下文控制,例如楼梯上升和下降,坐姿和站立,坐在椅子和 ...
0 0 0 2025/05/08 arXiv:2505.03729v2 attention2
图形结构的数据在各个领域都变得越来越普遍,从而提高了对有效模型处理图形任务等有效模型的需求,例如节点分类和链接预测。传统的图形学习模型(例如图形神经网络(GNN))已取得了长足的进步,但是它们在处理图形数据方面的功能在某些情况下仍然有限。近年来,大型语言模型(LLM)已成为有前途的图形任务候选人,但是大多数研究主要集中在性能基准上,并且无法应对其更广泛的潜力,包括他们处理有限数据的能力,跨任务的可 ...
0 0 0 2025/05/08 arXiv:2502.18771v1 lindaxu
基础模型的时代已经彻底改变了AI研究,但是图形基础模型(GFM)仍然受到大规模图表的稀缺性的限制。传统的图形数据综合技术主要集中于简单的结构操作,缺乏具有有意义的文本属性的语义上丰富节点的能力:对现实世界应用的关键限制。尽管大型语言模型(LLMS)表现出非凡的文本生成能力,但它们在图形合成中的直接应用会受到上下文窗口限制,幻觉现象和结构一致性挑战的阻碍 ...
0 0 0 2025/05/08 arXiv:2504.00711v2 lindaxu
生成模型正在改变音乐生成等创意领域,并具有无分类器指导(CFG)的推理时间策略,扮演着至关重要的角色。但是,CFG的推理成本增加了一倍,同时限制了生成内容的原创性和多样性。在本文中,我们引入了多样性奖励的CFG蒸馏,这是一种新型的固定程序,可以在解决其局限性的同时提炼CFG的优势 ...
0 0 0 2025/05/08 arXiv:2410.06084v1 leec
大语言模型(LLM)的进步激起了人们对开发基于LLM的语言代理以自动化科学发现端到端的兴趣,这引发了人们对其真正能力的兴奋和怀疑。在这项工作中,我们呼吁对科学工作流程中各个任务的代理进行严格评估,然后再对端到端自动化提出大胆的主张。为此,我们介绍了ScienceagentBench,这是一种评估语言代理的新基准,用于数据驱动的科学发现 ...
0 0 0 2025/05/08 arXiv:2410.05080v3 leec
时间序列预测对于包括天气预测和金融市场建模在内的众多现实应用程序至关重要。尽管时间域方法仍然很普遍,但频域方法可以有效地捕获多尺度周期性模式,减少序列依赖性并自然地信号。但是,现有方法通常在统一训练目标下的所有频率训练模型组件,通常会导致学习速度不匹配:高频组件会更快地收敛和风险过高,而由于训练时间不足,因此低频组件降低了 ...
0 0 0 2025/05/08 arXiv:2501.19065v1 oneyhu
将大型语言模型 (LLM) 与人类偏好保持一致成为获得最先进性能的关键组成部分,但构建大型人类注释偏好数据集会产生巨大成本。为了解决这个问题,我们提出了一个新的框架,该框架仅使用极少量的人工注释偏好数据,通过自我生成的偏好数据(Selfie)来提高 LLM 的一致性。我们的关键思想是利用小(种子)数据中的人类先验知识,通过迭代生成响应并使用自我注释的偏好数据从中学习,逐步改进 LLM 的一致性 . ...
0 0 0 2025/05/08 arXiv:2406.04412v2 leec
大型语言模型(LLM)的最新进展彻底改变了智能代理的领域,使能够解决各个领域的复杂问题的协作多机构系统。但是,这些系统中的一致性的潜力类似于人类群体动力学中的合格偏见和集体思维的现象,在很大程度上尚未探索,引起了人们对其集体解决问题的能力和可能的伦理意义的关注。本文介绍了一项关于LLM驱动的多代理系统合规性的综合研究,重点介绍了三个方面:合格的存在,影响合格的因素和潜在的缓解策略 ...
0 0 0 2025/05/08 arXiv:2501.13381v2 leec

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)