大型语言模型的可靠性仍然是一个关键的挑战,尤其是由于它们在文本生成过程中对幻觉和事实不准确的敏感性。现有的解决方案要么通过预先策略的自我纠正不足,要么使用昂贵的事后验证。为了进一步探索实时自我验证和校正的潜力,我们提出了动态自我验证解码(DSVD),这是一个新型的解码框架,可通过实时幻觉检测和有效的误差校正来增强产生可靠性 ...
尽管面部交换的任务最近在研究界引起了人们的关注,但头部交换的相关问题仍未得到探索。除了肤色转移外,头交换还带来了额外的挑战,例如需要在合成过程中保留整个头部的结构信息以及交换头和背景之间的涂料差距。在本文中,我们用鬼2解决了这些问题 ...
我们提出了一种通用运动表示,其中包含基于物理的人形控制的全面运动技能。由于类人机器人的高维性和强化学习固有的困难,先前的方法主要集中于学习小范围运动风格的技能嵌入(例如,运动风格)... ...
近期github问题解决引起了学术界和工业界的高度关注。建议使用swe-bench来衡量解决问题的性能。在本文中,我们提出了编码器,它采用多代理框架和预定义的任务图来修复和解决报告的错误并在代码存储库中添加新功能... ...
灵巧的机器人操纵仍然是一个重大挑战,这是因为诸如手机操纵和对象抓握之类的任务所需的手部运动的高度和复杂性。本文通过引入矢量量化的动作块嵌入(VQ-ACE)来解决此问题,该动作块嵌入(VQ-ACE)是一个新颖的框架,将人的手运动压缩到量化的潜在空间中,从而大大降低了动作空间的维度,同时保留了关键运动特性。通过将VQ-ACE与模型预测控制(MPC)和增强学习(RL)相结合,我们可以使用仿生机器人手在灵 ...
在本文中,我们介绍了Hom-lie tialgebras的交叉模块的概念。事实证明,hom-lie tialgebras的交叉模块类别和$ cat^1 $ -hom-hom-lie antialgebras的类别相互等同。研究了Hom-Lie抗杀伤膜的交叉模块扩展与第三个同胞组之间的关系 ...
现有的大型推理模型(LRMS)表明了增强学习的潜力(RL),以增强大语言模型〜(LLMS)的复杂推理能力。尽管他们在数学和编码等具有挑战性的任务上取得了显着的绩效,但他们通常依靠自己的内部知识来解决问题,这可能是不足的时间敏感或知识密集型问题,从而导致不准确和幻觉。为了解决这个问题,我们建议\ textbf {r1-searcher},这是一种新颖的基于两阶段结果的RL方法,旨在增强LLM的搜索功 ...
事实证明,自我监督的表示学习被证明是分布(OOD)检测的有价值的组成部分,仅具有分布(ID)示例的文本。这些方法要么使用ID示例从头开始训练语言模型,要么对预训练的语言模型进行微调,然后将语言模型的困惑输出作为OOD分数。在本文中,我们分析了两种OOD检测方法的互补特征,并提出了一种多级知识蒸馏方法,该方法在缓解其局限性的同时整合了其优势 ...