从互联网视频中学习潜在运动对于建造通才机器人至关重要。但是,现有的离散潜在作用方法遭受信息损失和复杂且细粒度动态的斗争。我们提出了COMO,旨在从各种互联网规模的视频中学习更多内容丰富的连续运动表示 ...
0 0 0 2025/05/26 arXiv:2505.17006v1 Langston
图形欺诈检测(GFD)通过识别恶意欺诈者在保护在线服务方面已迅速进步。最近有监督的GFD研究强调,欺诈者和用户之间的异性联系可能会极大地影响检测性能,因为欺诈者倾向于通过与良性用户建立更多联系来伪装自己。尽管有希望的监督GFD方法表现出色,但对标签的依赖仍将其应用程序限制为无监督的情况。此外,准确捕获没有标签的复杂和多样的异质模式带来了进一步的挑战 ...
0 0 0 2025/05/26 arXiv:2502.13308v3 hjx9004
注意操作员可以说是 Transformer 体系结构的关键区别因素,这些因素已经在各种任务上证明了最先进的性能。但是, Transformer 注意运营商通常会施加重大的计算负担,而计算复杂性随着 Token 数量的数量二次缩放。在这项工作中,我们提出了一个新颖的 Transformer 注意操作员,其计算复杂性与 Token 数量线性缩放 ...
0 0 0 2025/05/26 arXiv:2412.17810v1 ttwt
视觉语言模型(VLMS)是否用于开放式视频感知固有的开放式模型,因为它们是在互联网规模数据集中训练的?我们以清晰的否-VLMS通过其有限查询集引入了封闭设置的假设,使其容易受到开放式条件的影响。我们系统地评估VLM的开放式识别,发现它们经常错误分类的查询集中未包含的对象,从而导致高度较低的精度高于高召回率,反之亦然。我们表明,天真地增加查询设置的大小以包含越来越多的类并不能减轻此问题,而是会导致任 ...
0 0 0 2025/05/26 arXiv:2403.16528v2 ppbc
无碰撞计划对于在非结构化环境中运行的两足机器人至关重要。本文介绍了一个实时模型预测控制(MPC)框架,该框架解决了动态双皮机器人的身体和脚部避免。我们的贡献是两个方面:我们引入(1)一种新的配方,用于调整步骤时机以促进更快的身体避免速度,以及(2)一种新颖的3D脚步避免式配方,该配方隐含地选择了挥杆轨迹和立足点,该轨迹和立足点越过,或者在中心(COM)动力学中意识到障碍物围绕障碍而导致障碍 ...
0 0 0 2025/05/26 arXiv:2505.13715v1 yukun
本文提出了一个3-DOF跳跃机器人,具有类似人类的下LIMB关节构型和平坦的脚,能够执行动态和重复的跳跃运动。为了实现高扭矩输出和大型的空心轴直径以实现有效的电缆路由,使用混合智能非线性编程设计了一个紧凑的3K复合行星变速箱,以优化齿轮齿齿。为了满足受约束的关节几何形状中的性能要求,所有主要组件 - 包括执行器,电机驱动器和通信界面的定制设计 ...
0 0 0 2025/05/26 arXiv:2505.12231v2 yukun
最近利用深度加强学习的数据驱动方法已成为开发控制器的有效范式,该控制器能够实现物理模拟的角色产生自然的人类行为。但是,这些数据驱动的方法通常很难适应新颖的环境,并构成多样化的技能,以执行更复杂的任务。为了应对这些挑战,我们提出了一个混合模仿学习(HIL)框架,该框架结合了运动跟踪,以精确的技能复制以及对抗性模仿学习,以增强适应性和技能组成 ...
0 0 0 2025/05/26 arXiv:2505.12619v1 yukun
随着科学研究变得越来越复杂,需要创新的工具来管理大量数据,促进跨学科的合作并加速发现。大型语言模型(LLM)现在正在发展为基于LLM的科学代理,这些科学代理将关键任务自动化,从假设产生和实验设计到数据分析和仿真。与通用LLM不同,这些专业的代理集成了特定于域的知识,高级工具集和健壮的验证机制,从而使它们能够处理复杂的数据类型,确保可重复性并推动科学突破 ...
0 0 0 2025/05/26 arXiv:2503.24047v2 timturing

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)