我们推出了 BEHAVIOR-1K,这是一个以人为本的机器人的综合模拟基准。 BEHAVIOR-1K 包括两个组成部分,以“您希望机器人为您做什么?”的广泛调查结果为指导和激励。第一个是基于 50 个场景(房屋、花园、餐馆、办公室等)的 1,000 种日常活动的定义 ...
0 0 0 2024/10/18 arXiv:2403.09227v1 IceRain
在最近的研究中,从 VLM(视觉语言模型)生成的伪标签中学习已被证明是辅助开放词汇检测(OVD)的一种有前途的解决方案。然而,由于 VLM 和视觉检测任务之间的领域差距,VLM 产生的伪标签容易产生噪声,而检测器的训练设计进一步放大了偏差。在这项工作中,我们研究了 OVD 背景下 VLM 预测偏差的根本原因 ...
0 0 0 2024/10/18 arXiv:2407.21465v1 Autism_1111
基于 NeRF 的方法通过构建具有隐式或显式表示的辐射场来重建 3D 场景。虽然基于 NeRF 的方法可以执行任意规模的新颖视图合成 (NVS),但具有低分辨率 (LR) 优化的高分辨率新颖视图合成 (HRNVS) 的性能通常会导致过度平滑。另一方面,单图像超分辨率(SR)旨在将 LR 图像增强为 HR 图像,但缺乏多视图一致性 ...
0 0 0 2024/10/18 arXiv:2406.20066v1 13886416427
最近的研究使用数十张模糊图像构建去模糊神经辐射场(DeRF),如果只有有限数量的模糊图像,这不是实际场景。本文重点关注从稀疏视图构建 DeRF,以实现更务实的现实场景。正如我们在实验中观察到的,从稀疏视图建立 DeRF 被证明是一个更具挑战性的问题,因为同时优化模糊核和稀疏视图 NeRF 所产生的固有复杂性 ...
0 0 0 2024/10/18 arXiv:2407.06613v1 13886416427
基于模型的强化学习方法通​​常仅将学习用于估计近似动态模型,将其余决策工作卸载给经典轨迹优化器。虽然概念上很简单,但这种组合存在许多经验缺陷,表明学习模型可能不太适合标准轨迹优化。在本文中,我们考虑将尽可能多的轨迹优化管道折叠到建模问题中会是什么样子,这样从模型中采样并用它进行规划变得几乎相同 ...
0 0 0 2024/10/18 arXiv:2205.09991v2 hdp-ads-algo
我们引入了一种新的基准来评估语言模型的角色扮演能力。我们的方法利用语言模型本身来模拟动态、多轮对话中的用户,并评估由此产生的对话。该框架由三个主要组件组成:假设特定角色角色的玩家模型、模拟用户行为的询问器模型以及评估对话质量的判断模型 ...
0 0 0 2024/10/17 arXiv:2409.06820v1 ymx
Gatys等人最近推出了一种神经算法,可以将一幅内容图像渲染为另一幅图像的风格,实现所谓的风格迁移。然而,他们的框架需要缓慢的迭代优化过程,这限制了其实际应用 ...
0 0 0 2024/10/17 arXiv:1703.06868v2 sweet

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)