大型语言模型(RLLM)(例如OpenAI-O1和DeepSeek-R1)的推理的最新进展已证明了它们在数学和编码等复杂领域中令人印象深刻的功能。其成功的一个核心因素在于应用长链(长COT)特征,从而增强了推理能力并能够解决复杂的问题。然而,尽管有这些发展,但仍缺乏对长床的全面调查,限制了我们对传统的短链(短COT)的区别的理解,并使关于“过度思考”和“测试时间扩展”等问题的持续辩论变得复杂 ...

0 0 0 0 2025/03/13 arXiv:2503.09567v1 KingXHJ

无人机(UAVS)举例说明的低空迁移率已经引入了各个领域的变革性进步,例如运输,物流和农业。利用灵活的观点和快速的机动性,无人机扩展了传统系统的感知和动作能力,从而引起了学术界和行业的广泛关注。但是,当前的无人机操作主要取决于人类控制,在简单的情况下仅具有有限的自主权,并且缺乏更复杂的环境和任务所需的智能和适应性 ...

0 0 0 0 2025/02/24 arXiv:2501.02341v1 KingXHJ

大型语言模型(LLM)表现出了各种领域的出色推理能力。最近的研究表明,增加测试时间计算增强了LLMS的推理能力。这通常涉及在推理时间以外部LLM验证器为指导的推理时间进行大量抽样,从而产生了两个玩具系统 ...

0 0 0 0 2025/02/11 arXiv:2502.02508v1 KingXHJ

自发布以来,神经辐射场(NERF)已重塑了3D场景表示。 NERF可以有效地从2D图像中重建复杂的3D场景,从而推进不同的字段和应用程序,例如场景理解,3D内容生成和机器人技术。尽管进行了重大的研究进展,但仍缺乏对最近的创新,应用和挑战的彻底回顾 ...

0 0 0 0 2025/01/26 arXiv:2501.13104v1 KingXHJ

视觉基础也称为引用表达理解和短语基础。它涉及根据给定的文本描述定位图像内自然数量的特定区域。这项任务的目标是模拟社交对话中普遍存在的参照关系,为机器配备类似人类的多模态理解能力 ...

0 1 0 0 2025/01/21 arXiv:2412.20206v1 KingXHJ

机器人布置的一个基本目标是使模型能够理解视觉场景并执行动作。尽管现有的机器人多模态大语言模型(MLLM)可以处理一系列基本任务,但它们仍然面临两个方面的挑战:1)处理复杂任务的推理能力不足,2)MLLM消耗和推理的计算成本较高。最近提出的称为Mamba的状态空间模型(SSM)在具有线性推理复杂性的非简单序列建模中展示了有前景的功能... ...

0 0 0 0 2025/01/14 arXiv:2406.04339v2 KingXHJ

3D 高斯泼溅 (3DGS) 在场景表示和神经渲染方面取得了重大进展,并致力于使其适应动态场景。尽管提供了卓越的渲染质量和速度,现有方法仍难以满足存储需求并代表复杂的现实世界运动。为了解决这些问题,我们提出了 MoDecGS,这是一种内存高效的高斯泼溅框架,旨在在具有复杂运动的挑战性场景中重建新颖的视图 ...

0 0 0 0 2025/01/13 arXiv:2501.03714v1 KingXHJ

人工智能的快速发展,特别是随着基于 Transformer 架构的大型语言模型 (LLM) 的发展,重新定义了自然语言处理的能力。这些模型现在在各种与语言相关的任务中表现出了卓越的性能,例如文本生成、问答、翻译和摘要,通常可以与人类的理解能力相媲美。更有趣的是, LLM 已经表现出了超越其核心功能的新兴能力,表现出对常识推理、代码生成和算术等任务的熟练程度 ...

0 0 0 0 2025/01/10 arXiv:2501.04040v1 KingXHJ

类别级 6D 姿态估计旨在预测未见过的对象实例的位置和方向,是机器人操作和增强现实等许多场景的基础,但仍未得到解决。在规范空间中精确恢复实例 3D 模型并将其与观察结果精确匹配是估计未见过物体的 6D 姿态时的关键点。在本文中,我们通过级联关系和循环重建网络实现了准确的类别级 6D 姿态估计 ...

0 0 0 0 2025/01/04 arXiv:2108.08755v1 KingXHJ

我们提出了一种新颖的学习方法,可以从 RGB-D 图像中恢复未见过的对象实例的 6D 姿态和大小。为了处理类内形状变化,我们提出了一个深度网络,通过对预先学习的分类形状先验的变形进行显式建模来重建 3D 对象模型。此外,我们的网络推断对象实例的深度观察与重建的 3D 模型之间的密集对应关系,以联合估计 6D 对象的姿态和大小 ...

0 0 0 0 2025/01/04 arXiv:2007.08454v1 KingXHJ

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)