自主驾驶系统在基于本地视觉信息的Q&A,感知,预测和规划方面取得了重大进步,但他们努力纳入人类驾驶员通常使用的更广泛的导航环境。我们通过提出NavigScene(辅助导航引导的自然语言数据集)来解决本地传感器数据和全球导航信息之间的关键差距,该数据集在自主驾驶系统中模拟类似人类的驾驶环境。此外,我们开发了三个补充范式来利用NavigScene:(1)导航引导的推理,通过将导航环境纳入提示方法来增强 ...
0 0 0 2025/07/18 arXiv:2507.05227v1 hulin01
当今患者需求与可用的心理健康支持之间存在很大的差距。在本文中,我们旨在彻底研究使用大语言模型(LLM)来协助专业心理治疗的潜力。为此,我们提出了一个新的基准测试基准CBT基准,以系统地评估认知行为疗法(CBT)援助 ...
0 0 0 2025/07/18 arXiv:2410.13218v2 wtx
体重初始化在神经网络训练中起着重要作用。提出了广泛使用的初始化方法,并评估了从头开始训练的网络。但是,审核的型号越来越多,为解决这个经典的体重初始化问题提供了新的机会 ...
0 0 0 2025/07/18 arXiv:2311.18823v1 kkkk
当代人工智能研究的一个关键目标是开发精通多智能体协调的智能体,从而实现与人类和其他系统的有效协作。大型语言模型(LLM)具有以类似人类的方式理解、生成和解释语言的显着能力,是开发此类代理的有希望的候选者。在这项研究中,我们构建并评估了在各种协调场景中使用 LLM 制作的代理的有效性 ...
0 0 0 2025/07/18 arXiv:2310.03903v3 wtx
最近的出版物表明,应用于心脏MRI的现代卷积神经网络(CNN)的分割准确性可以达到专家间的可变性,这是这一研究领域的巨大成就。然而,尽管取得了这些成功,CNN仍会在解剖学上产生不准确的分割,因为它们无法保证其结果的解剖学合理性,即使在先前使用形状。在本文中,我们提出了一种心脏MRI分割方法,该方法总是产生解剖学上合理的结果 ...
0 0 0 2025/07/18 arXiv:1907.02865v2 mixiu
数据修剪 - 从大数据集中选择一个小型和代表性子集的组合任务对于减轻与培训数据渴望数据的现代深度学习模型相关的巨大计算成本至关重要。由于大规模的数据收集总是嘈杂,因此即使在腐败存在的情况下,制定数据修剪策略在实践中至关重要。但是,由于对经验平均值的依赖,现有的数据修剪方法通常在高腐败率下失败,这对异常值高度敏感 ...
0 0 0 2025/07/18 arXiv:2504.00564v2 cuirun
在高级多模型学习时代,GPT-4V 等多模态大语言模型 (MLLM) 在连接语言和视觉元素方面取得了显着的进步。然而,闭源性质和大量的计算需求给普遍使用和修改带来了显着的挑战。这就是 LLaVA 和 MiniGPT-4 等开源 MLLM 的用武之地,它们在各个任务上取得了突破性的成就 ...
0 0 0 2025/07/18 arXiv:2312.16862v3 Victor
我们介绍了出色的团队,这是一个多机构愿景大语言模型(VLLM)框架,用于在零拍摄方面执行高级机器人计划。在我们的上下文中,零射击高级计划意味着,对于新颖的环境,我们提供了一个带有机器人周围环境图像和任务描述的VLLM,并且VLLM输出了机器人完成任务所需的动作顺序。与以前的用于机器人操作的高级视觉计划的方法不同,我们的方法在整个计划过程中使用VLLM,从而在感知,控制和计划之间实现了更紧密的循环  ...
0 0 0 2025/07/18 arXiv:2407.19094v6 Hatteras

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)