随着大型语言模型(LLM)越来越多地应用于基于文档的任务(例如文档汇总,问题答案和信息提取),在这里,用户需求专注于从提供的文档中检索信息,而不是依靠模型的参数知识,从而确保对这些系统的可信度和解释性的解释性成为了关键的问题。应对这一挑战的一种核心方法是归因,它涉及将生成的输出追溯到其源文档。但是,由于LLM会产生不准确或不精确的响应,因此评估这些引用的可靠性至关重要 ...
0 0 0 2025/05/14 arXiv:2505.06324v1 waterfall666
3D高斯脱落(3DGS)可实现对消费者硬件上复杂场景的有效重建和高保真实时渲染。然而,由于其基于栅格化的配方,3DGS被限制在理想的针孔摄像机上,并且缺乏对二次照明效应的支持。最近的方法是通过追踪粒子来解决这些局限性,但这是以明显较慢的渲染成本来解决这些局限性 ...
0 0 0 2025/05/14 arXiv:2412.12507v2 ywc
如果AI系统在各种任务上匹配或超越人类的能力,那么人类可能很难有效判断他们的行动 - 使他们难以使用人类的反馈来将其转向理想的特征。一种建议的解决方案是利用另一个超人系统通过辩论指出系统输出中的缺陷。本文概述了辩论对AI安全的价值,以及使辩论工作所需的假设和进一步的研究 ...
0 0 0 2025/05/14 arXiv:2505.03989v2 leec
3D语义分割的最新作品建议通过使用专用网络处理每种模式并将学习的2D特征投射到3D点上,从而利用图像和点云之间的协同作用。合并大规模点云和图像会引起几个挑战,例如在点和像素之间构建映射,以及在多个视图之间汇总特征。当前的方法需要网格重建或专门的传感器来恢复闭塞,并使用启发式方法选择和汇总可用的图像 ...
0 0 0 2025/05/14 arXiv:2204.07548v2 DamnMan
最近的工作表明,大型语言模型(LLMS)不仅是代码生成的合适工具,而且能够生成基于注释的代码规范。扩展这些方法可能使我们能够针对大型软件系统推断出可证明的正确性保证。与其他LLM任务相比,演绎验证的应用程序字段具有明显的优势,即提供严格的工具集来检查LLM生成的解决方案 ...
0 0 0 2025/05/14 arXiv:2502.01573v1 xinn
尽管正式方法能够生产可靠的软件,但他们在日常编程中的采用最少。使用大型语言模型的自动代码生成越来越普遍,但很少考虑产生强大的正确性保证。在这项研究中,我们探讨了LLM以三种验证语言(DAFNY,Nagini和Verus)生成经过验证的代码的能力 ...
0 0 0 2025/05/14 arXiv:2503.14183v1 xinn
计算机视觉中的一个长期问题涉及识别3D形状的表示:3D形状是否应以其本机3D格式(例如Voxel Grid或Polygon网格)运行的描述符来表示,还是可以用基于视图的描述符有效地表示?我们在学习从他们对2D图像的渲染观点中识别3D形状的上下文中解决了这个问题。我们首先提出了一个标准的CNN体​​系结构,该体系结构训练有素,可以识别形状的呈现视图,并表明即使从单个视图的精度也可以比使用最先进的3D ...
0 0 0 2025/05/14 arXiv:1505.00880v3 DamnMan
我们提出了Skywork-VL奖励,这是一种多式联运奖励模型,可为多模式理解和推理任务提供奖励信号。我们的技术方法包括两个关键组成部分:首先,我们构建了一个大规模的多模式偏好数据集,该数据集涵盖了广泛的任务和场景,并从标准视觉语言模型(VLMS)和高级VLM推理器中收集了响应。其次,我们设计了基于QWEN2的奖励模型架构 ...
0 0 0 2025/05/14 arXiv:2505.07263v1 麦兜

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)