从人类示范中学习是学习复杂的操纵技巧的有效方法。但是,现有方法集中在从被动人类示范数据中学习,以简化数据收集。互动人类的教学具有具有理论和实用性的吸引力,但是现有的人类机器人界面并没有很好地支持它们 ...
当前的测试时间缩放范围依赖于在产生响应之前生成较长的推理轨迹(“更多”)。在需要互动的代理问题中,这可以通过在世界上行动之前产生思维痕迹来完成。但是,此过程不允许代理商从环境中获取新信息或随着时间的推移调整其行为 ...
广义知识图(GKG)的构建,包括知识图,事件知识图和常识知识图,对于各种自然语言处理任务至关重要。当前的研究通常分别构建这些类型的图形,忽略了整体见解和潜在统一,这可能对计算资源和使用观点有益。但是,开发GKG统一框架的主要挑战是特定于任务的差异引起的障碍 ...
虽然6D对象姿势估计在计算机视觉和机器人技术中具有广泛的应用,但由于缺乏注释,它仍无法解决。当转向类别级别的6D姿势时,问题变得更加具有挑战性,这需要概括才能看不见的实例。当前的方法受到利用模拟或从人类收集的注释的限制 ...
大语言模型(LLM)中的多模式推理与不完整的知识和幻觉伪像斗争,挑战文本知识图(kgs)仅由于其模态隔离而部分缓解。尽管多模式知识图(MMKGS)有望增强跨模式的理解,但它们的实际结构受到了手动文本注释和视觉声音实体链接中固有噪声的语义狭窄的影响。在本文中,我们提出了视觉对语言对语言的综合知识图(Valik),这是一种构建MMKGS的新方法,可通过补充跨模式信息来增强LLMS推理 ...
配备逐步思维功能的多模式大语言模型(MLLM)在复杂的推理问题上表现出色。但是,对于无需复杂推理即可解决的简单问题,此思维过程是多余的。为了解决这种效率低下,我们提出了一种自动思想的MLLM R-4B,可以根据问题的复杂性自适应地决定何时思考 ...
本文探讨了一种见解,即语言模型自然可以使智能变异操作员在精神上与进化跨界相似。特别是,足够规模的语言模型表明了文化学习,即 ...
自动评估是对话系统研究的组成部分。通常发现基于参考的NLG指标不适合对话评估。因此,最近的研究提出了各种独特的无参考神经指标,以更好地与人类评估保持一致 ...