我们提出了一种控制模拟的类人动物以抓住对象并将其移动以遵循对象轨迹的方法。由于在用灵巧的手控制类人动物方面面临的挑战,先前的方法通常使用无形的手,仅考虑垂直升降机或短轨迹。这种有限的范围妨碍了对动画和模拟所需的对象操纵的适用性 ...

0 0 0 0 2025/07/02 arXiv:2407.11385v2 晚餐杀手

将人类运动技能转移到人形机器人仍然是一个重大挑战。在这项研究中,我们介绍了Wasserstein对抗性模仿学习系统,允许人形机器人复制自然的全身运动模式,并通过模仿人体动作来执行无缝的过渡。首先,我们提出了统一的原始骨骼运动重新定位,以减轻任意人类示威者和人形机器人之间的形态差异 ...

0 1 0 0 2025/07/02 arXiv:2309.14225v4 mark

我们提出了SIM3D,这是第一个基准,即考虑到全面的3D异常检测和分割(ADS)的多模式和多模式信息的集成,其中任务是产生基于Voxel的异常体积。此外,SIM3D重点介绍了对制造业浓厚兴趣的方案:单稳定异常检测,其中只有一个物体可用于培训。在这方面,SIM3D是第一个针对从合成训练数据到实际测试数据的概括的挑战的ADS基准 ...

0 0 0 0 2025/07/02 arXiv:2506.21549v1 KingXHJ

推荐系统(RS)通常会受到流行偏见的困扰。当在典型的长尾数据集上训练推荐模型时,该模型不仅倾向于继承这种偏见,而且经常加剧它,从而导致推荐列表中流行项目的过度代表。这项研究进行了全面的经验和理论分析,以揭示这种现象的根本原因,产生了两个核心见解:1)项目流行度在建议模型预测的分数矩阵的主要光谱中记住; 2)维度崩溃现象扩大了主要光谱的相对突出,从而加剧了普及偏差 ...

0 0 0 0 2025/07/02 arXiv:2404.12008v6 chenjl

随着能够在单个通行证中处理数万个 Token 的长篇文章模型(LMS)的兴起,多阶段检索生成一代(RAG)管道是否仍然为简单,单阶段的方法提供可衡量的好处吗?为了评估这个问题,我们对系统缩放的 Token 预算进行了对质量检查任务的受控评估,比较了两个最近的多阶段管道,Readagent和Raptor,与三个基线,包括Dos Rag(文档的原始结构RAG),一种简单的回传方法,是一种保留原始通道订单。尽管设计直接设计,但DOS RAG仍始终在多个长篇下说QA基准上匹配或优于更复杂的方法。我们建议将DOS抹布建立为未来破布评估的简单但强大的基准,将其与新兴的嵌入和语言模型配对,以评估随着模型能力的发展,复杂性和有效性之间的权衡 ...

0 0 0 0 2025/07/02 arXiv:2506.03989v1 lb47719448

语音编解码器是语音信号和大型语言模型之间的桥梁。语言模型的理想编解码器不仅应保留声学信息,还应捕获丰富的语义信息。但是,现有的语音编解码器努力平衡高质量的音频重建,并易于通过语言模型进行建模 ...

0 0 0 0 2025/07/02 arXiv:2506.23325v1 lizhipeng99

大型语言模型(LLM)的最新进展已通过多代理系统实现了社交模拟。先前的努力专注于从头开始创建的代理社会,将代理商分配给了新定义的角色。然而,尽管实用的实践价值很高,但模拟既定的虚构世界和角色仍然在很大程度上尚未得到充实 ...

0 0 0 0 2025/07/02 arXiv:2504.14538v1 wuyangecit

在顺序推荐系统(SRSS)中, Transformer 模型由于DOT-PRODUCT COATION机制的二次复杂性而对长期用户行为序列进行建模时,面对计算成本挑战。通过近似点产生的注意,线性注意力提供了有效的选择,具有线性复杂性。但是,现有的线性注意方法面临两个局限性:1)他们经常使用可学习的位置编码,在长期序列方案中会产生额外的计算成本,而2)他们可能不会考虑用户的良好元素本地偏好,并将这些偏好与长期利益的实际变化混淆 ...

0 0 0 0 2025/07/02 arXiv:2506.13315v1 milimiko

Transformer 体系结构中的自我注意事项机制(序列顺序不变)需要位置嵌入来编码时间序列预测中的时间顺序。我们认为,这种对位置嵌入的依赖限制了 Transformer 有效表示时间序列的能力,尤其是在使用更长的回溯窗口时。为了解决这个问题,我们介绍了一种创新的方法,该方法将单变量时间序列的金字塔RNN嵌入(PRE)与 Transformer 对多元依赖性建模的能力结合在一起 ...

0 0 0 0 2025/07/02 arXiv:2408.10483v1 zjn_a

最近,人们对将大语言模型(LLM)的成功从文本扩展到分子引起了人们的兴趣。大多数现有方法都采用图形神经网络来表示分子作为一系列分子语言比对的节点 Token ,但是,该图形忽略了分子中固有的层次结构。值得注意的是,高阶分子结构包含官能基的丰富语义,它们编码了分子的关键生化功能 ...

0 0 0 0 2025/07/02 arXiv:2406.14021v2 TJ

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)