这项工作旨在解决文本到SQL任务中具有挑战性的异质图编码问题。以前的方法通常以节点为中心,仅利用不同的权重矩阵来参数化边缘类型,其中1)忽略边缘拓扑结构中的丰富语义,以及2)无法区分每个节点的局部和非局部关系。为此,我们提出了一个线图增强了文本到SQL(LGESQL)模型,以挖掘基本的关系特征,而无需构造元路径 ...

0 0 0 0 2025/07/06 arXiv:2106.01093v3 qzw

事件因果关系识别(ECI)旨在检测文本上下文中事件之间的因果关系。现有的ECI模型主要依赖于监督方法,依赖于大规模注释的数据。尽管大型语言模型(LLMS)使ECI呈零摄,但它们倾向于因果幻觉而建立虚假的因果关系 ...

0 0 0 0 2025/07/06 arXiv:2506.05675v2 xuexizhanghao

索引是增强检索增强生成 (RAG) 系统性能的重要一步。然而,现有的方法基于语义相似性(相似性)或相关信息(相关性)来组织数据,但没有全面涵盖这两个视角。我们的分析表明,仅对一种视角进行建模会导致知识综合不足,导致在需要多跳推理的复杂任务上表现不佳 ...

0 0 0 0 2025/07/06 arXiv:2412.06206v2 xiaowuxiaowu

在对象目标导航中,代理使用视觉和空间信息通过类别标签标识的对象导航。以前,仅基于网络的方法通常依靠历史数据来进行对象亲和力估计,缺乏对新环境和看不见的目标的适应性。同时,采用大型语言模型(LLM)作为规划者或代理人,尽管提供广泛的知识基础,但具有成本范围,并且缺乏针对性的历史经验 ...

0 0 0 0 2025/07/06 arXiv:2403.09971v2 白石

引用视频对象细分(RVO)的目的是基于文本描述整个视频中的目标对象。尽管近年来取得了显着的进展,但由于视频语言的理解有限,当前的RVOS模型仍在努力处理复杂的对象描述。为了解决此限制,我们提出\ textbf {refledino},这是一种端到端的RVOS模型,从预算的视觉接地基础模型中继承了强烈的视觉理解,并进一步赋予了有效的时间理解和对象细分功能 ...

0 0 0 0 2025/07/06 arXiv:2501.14607v2 chengwenxuan7

视觉推理是人类智力的核心组成部分,也是高级多模型的关键能力。然而,当前对多模式大语言模型(MLLM)的推理评估通常依赖文本描述并允许基于语言的推理快捷方式,无法衡量以真正的视觉为中心的推理。为了解决这个问题,我们介绍了Visulogic:六个类别的1,000个人类验证问题的基准(e ...

0 0 0 0 2025/07/06 arXiv:2504.15279v1 17733052961

多模式的大语言模型(MLLM)在各个领域表现出了令人印象深刻的功能,在处理和理解多种方式的信息方面表现出色。尽管以前取得了迅速的进展,但OCR的能力不足会阻碍MLLM在与文本相关的任务方面出色。在本文中,我们提出\ textbf {Ocean-ocr},这是一个在各种OCR方案上具有最先进性能的3B MLLM,并且对一般任务的理解能力可比 ...

0 0 0 0 2025/07/06 arXiv:2501.15558v1 moshmode

我们提出了4Real-Video,这是一个用于生成4D视频的新型框架,该框架是带有时间和观点轴的视频框架网格。在此网格中,每一行都包含共享相同时间步长的帧,而每列从相同的角度包含帧。我们提出了一个新颖的两流架构 ...

0 0 0 0 2025/07/06 arXiv:2412.04462v1 陆三七

通过可验证的奖励(RLVR)进行的增强学习表现出有望在推进LLM的推理能力方面的潜力。但是,它的成功仍然限于数学和代码域。这一主要限制源于对域特异性验证仪的严重依赖,这导致了过于复杂性和有限的可扩展性 ...

0 0 0 0 2025/07/06 arXiv:2506.18254v1 qq466943803

强化学习已成为训练后大语言模型(LLM)的强大范式,以改善推理。诸如从人类反馈(RLHF)中学习的方法和具有可验证奖励(RLVR)的增强学习的方法已显示出很强的结果,但是它们需要广泛的外部监督。我们研究了一种替代的方法,即从内部反馈(RLIF)中学习的替代方法,该方法仅依赖于固有的模型衍生信号而不是外部奖励 ...

0 0 0 0 2025/07/06 arXiv:2506.17219v2 qq466943803

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)