尽管扩散模型最近取得了进步,但顶级文本对图像(T2I)模型仍然难以实现精确的空间布局控制,即准确地生成具有指定属性和位置的实体 ...
0 0 0 2025/09/22 arXiv:2506.00596v1 鸡腿堡
知识蒸馏(KD)是一种通过将知识从大型教师模型转移到较小的学生模型来压缩大型神经网络的广泛采用方法。在大型语言模型的背景下, Token KD级别通常可以最大程度地减少学生成果分布和教师成果分布之间的差异,并显示出强烈的经验表现。但是,先前的工作假设学生的产出分布和教师产出分布共享相同的最佳表示空间,这一前提在许多情况下可能不存在 ...
0 0 0 2025/09/22 arXiv:2509.14526v1 haoyi199815
我们介绍电影,这是一种新颖的馈送模型,它在一秒钟内从单眼视频中综合了4D动态的小说观点。电影使用高斯原语的像素对齐的网格代表动态3D场景,明确监督其随时间变化的运动。这首先允许在单个基于学习的框架内首次实现外观,几何和运动的统一建模,并启用查看合成,重建和3D点跟踪 ...
0 0 0 2025/09/22 arXiv:2507.10065v1 陆三七
我们介绍OpenReviewer,这是一种开源系统,用于生成机器学习和AI会议论文的高质量同行评论。其核心是Llama-Openreviewer-8B,这是一个8B参数语言模型,专门针对来自顶级会议的79,000次专家评论进行了微调。鉴于PDF论文提交和查看模板作为输入,OpenReviewer提取了全文,包括方程式和表等技术内容,并在以下会议特定的指导下生成结构化的审查 ...
0 0 0 2025/09/22 arXiv:2412.11948v3 xufang027
我们提出了一条分层的RL管道,用于训练单臂腿部机器人,以执行端到端的选择(P&P)任务 - 从接近有效载荷到在目标区域中释放它 - 在单机器人和合作双重机器人设置中释放它。我们介绍了一种新颖的动态奖励课程,该课程使单个政策通过通过有效载荷以有效载荷为中心的子目标来逐步指导代理,从而有效地学习长途p&p操作。与长途RL任务的最新方法相比,我们的方法提高了培训效率55%,并将执行时间减少了18 ...
0 0 0 2025/09/22 arXiv:2509.13239v1 yukun
尽管强化学习(RL)在腿部的运动控制中取得了显着进步,但它通常会遭受分布外(OOD)条件(OOD)条件的性能降解以及模拟与真实环境之间的差异。这项工作并没有主要依靠域随机化(DR)来最好地覆盖真实的环境,从而缩小SIM到真实的差距并增强鲁棒性,而是提出了一个新兴的解耦框架,从而通过隔离型号的Leg Control和Swing-Leg-Leg Control和Swing-Leg-Leg-Leg Co ...
0 0 0 2025/09/22 arXiv:2509.13737v1 yukun
针对人形机器人的全身操纵(WBM)提出了一种有希望的方法,用于执行涉及笨重物体的任务,在这种情况下,由于固有的稳定性和有效载荷约束,传统的抓取最终依赖最终效果的方法仅在这种情况下仍然有限。本文介绍了一个增强学习框架,该框架将预先训练的人类运动与神经签名的距离场(NSDF)表示,以实现强大的全身拥抱。我们的方法利用教师建筑来提炼大规模的人类运动数据,从而产生运动学​​自然和物理上可行的全身运动模式  ...
0 0 0 2025/09/22 arXiv:2509.13534v1 yukun
人形机器人有望在日常的人类环境中运作,而无需对周围环境进行修改。在所需的众多技能中,开门是必不可少的,因为门是建筑空间中最常见的门户,并且通常会限制机器人可以进入的地方。然而,门开出构成了独特的挑战,因为这是部分可观察性的长期任务,例如关于门不可观察的闩锁状态的推理,该状态决定机器人是否应该旋转手柄或推门 ...
0 0 0 2025/09/22 arXiv:2509.13200v2 yukun

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)