一译 —— 文档和论文翻译、对照阅读、讨论和社区

VL-Nav: Real-time Vision-Language Navigation with Spatial Reasoning

在未知环境中的视觉导航对于移动机器人至关重要。在家庭援助和救援等情况下，移动机器人需要了解人类的命令，例如“找到一个穿黑色的人”。我们提出了一种新颖的视觉导航（VL-NAV）系统，该系统在低功率机器人上集成了有效的空间推理 ...

0 0 0 2025/02/09 arXiv:2502.00931v1 小胖猴

Semantic Evaluation for Text-to-SQL with Distilled Test Suites

我们建议测试套件的准确性来近似文本到sql模型的语义准确性。我们的方法提取了一个小型数据库测试套件，可以从大量随机生成的数据库中实现黄金查询的高代码覆盖率。在评估时，，，它计算提炼测试套件上预测查询的表示准确性，从而有效地计算语义准确性的严格上限... ...

0 0 0 2025/02/09 arXiv:2010.02840v1 lesleytang

How Could Generative AI Support Compliance with the EU AI Act? A Review for Safe Automated Driving Perception

深度神经网络（DNN）已成为自动驾驶汽车感知功能的核心，从而大大增强了其理解和解释环境的能力。但是，这些系统表现出固有的局限性，例如在分发场景中的脆性，不透明性和不可预测的行为。欧盟（EU）人工智能（AI）作为开创性的立法框架，旨在通过为AI系统建立严格的规范和标准来应对这些挑战，包括在自主驾驶中使用的挑战（AD），这些挑战被归类为高级驾驶（AD）风险AI ...

0 0 0 2025/02/09 arXiv:2408.17222v1 hhhhh

COCONut-PanCap: Joint Panoptic Segmentation and Grounded Captions for Fine-Grained Understanding and Generation

本文介绍了椰子pancap数据集，该数据集是为了增强全景分割和接地图像字幕而创建的。该数据集在带有先进的椰子泛面罩的可可数据集的基础上，旨在克服通常缺乏详细，场景全面描述的现有图像text数据集中的局限性。椰子pancap数据集结合了扎根于全景分割面罩的细粒度的区域级字幕，可确保一致性并改善生成的字幕的细节 ...

0 0 0 2025/02/09 arXiv:2502.02589v1 yiweima

PLLaVA : Parameter-free LLaVA Extension from Images to Videos for Video Dense Captioning

视觉语言预训练显着提高了各种图像语言应用程序的性能。然而，视频相关任务的预训练过程需要异常大量的计算和数据资源，这阻碍了视频语言模型的进步。本文研究了一种直接、高效且资源匮乏的方法，以适应现有的图像语言预训练模型以实现密集视频理解... ...

0 0 0 2025/02/09 arXiv:2404.16994v2 emmating

Deep Learning-based Approaches for State Space Models: A Selective Review

状态空间模型（SSM）为动态系统分析提供了一个强大的框架，其中假定系统的时间动力学是通过潜在状态的演变来捕获的，该潜在状态控制了观测值的值。本文对SSM的深神网络方法的最新进展进行了选择性的综述，并为离散时间深度空间模型和连续的时间（例如潜在神经普通差分和随机微分方程）提供了统一的观点。它首先概述了基于经典的最大可能性学习SSM的方法，在存在潜在变量的情况下，审查了各种自动编码器作为基于神经网络的 ...

0 0 0 2025/02/09 arXiv:2412.11211v1 庸俗唯物主义者

LLM Augmented LLMs: Expanding Capabilities through Composition

具有数十亿参数的基础模型已经在大型数据集上进行了训练，已经在各个领域展示了不平凡的技能。然而，由于它们的整体结构，增强它们或传授新技能具有挑战性且成本高昂。，增强它们或传授新技能具有挑战性且成本高昂。另一方面，由于它们的适应能力，这些模型的几个新实例正在针对新领域和任务进行训练... ...

0 0 0 2025/02/09 arXiv:2401.02412v1 quziyan

A Mechanistic Understanding of Alignment Algorithms: A Case Study on DPO and Toxicity

虽然对齐算法现在通常用于根据用户的偏好调整预先训练的语言模型，但我们缺乏对模型“对齐”，因此很难解释越狱等现象。在这项工作中，我们研究了一，我们研究了一种流行的算法，dpo），以及它减少毒性的机制。也就是说，我们首先研究如何在预训练的语言模型 ...

0 0 0 2025/02/09 arXiv:2401.01967v1 luhengtong

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）