推荐系统(RS)的最终目标是提高用户参与度。强化学习(RL)是实现这一目标的一个有前途的范例,因为它直接优化了顺序推荐的整体性能。然而,许多现有的基于强化学习的方法会产生巨大的计算开销,因为它们不仅需要存储推荐项目,还需要存储所有其他候选项目 ...
根据自然语言问题生成准确的 SQL(文本到 SQL)是一个长期存在的问题,因为它在用户问题理解、数据库模式理解和 SQL 生成方面具有挑战性。传统的文本到 SQL 系统包括人体工程学和深度神经网络。随后,预训练语言模型 (PLM) 被开发出来并用于文本到 SQL 任务,取得了可喜的性能 ...
多模态大语言模型 (MLLM) 的最新进展值得注意,但是,这些通用域 MLLM 往往缺乏理解用户界面 (UI) 屏幕并与其有效交互的能力。在本文中,我们提出了 Ferret-UI,这是一种专为增强对移动 UI 屏幕的理解而定制的新型 MLLM,配备了引用、接地和推理功能。鉴于 UI 屏幕通常表现出更长的纵横比并包含较小的感兴趣对象(例如, ...
多语言大语言模型能够利用强大的大语言模型来处理和响应多种语言的查询,在多语言自然语言处理任务中取得了显着的成功。尽管取得了这些突破,但仍然缺乏全面的调查来总结该领域的现有方法和最新发展。为此,在本文中,我们对多语言大语言模型(MLLM)文献的最新进展和新兴趋势进行了全面的回顾并提供了统一的视角 ...
大型语言模型 (LLM) 在处理超过 32K 标记的长序列方面取得了重大进展。然而,他们的绩效评估很大程度上局限于复杂度和综合任务等指标,这些指标可能无法完全捕捉他们在更细致的现实场景中的能力。这项研究引入了一个专门的基准(LIConBench),专注于极端标签分类领域内的长期上下文学习 ...
大型语言模型 (LLM) 在自然语言理解和生成方面表现出了令人印象深刻的能力,导致它们在聊天机器人和虚拟助理等应用中得到使用。然而,现有的 LLM 框架在处理具有丰富数据结构的特定领域数据分析任务时面临局限性。此外,他们还难以灵活地满足不同的用户需求 ...
大型语言模型 (LLM) 在理解和生成文本方面表现出了卓越的能力,促使众多研究人员将其用于信息提取 (IE) 目的,包括关系提取 (RE)。尽管如此,大多数现有方法主要是为句子级关系提取(SentRE)任务而设计的,该任务通常在单个句子中包含一组有限的关系和三元组事实。此外,某些方法将关系视为集成到提示模板中的候选选择,导致处理文档级关系提取(DocRE)任务时处理效率低下和性能不佳,这需要处理分布在给定文档中的多个关系和三元组事实,提出独特的挑战 ...
大型语言模型 (LLM) 在自然语言处理方面表现出了令人印象深刻的能力。然而,它们的内部机制仍不清楚,缺乏透明度给下游应用带来了不必要的风险。因此,理解和解释这些模型对于阐明它们的行为、局限性和社会影响至关重要 ...
大型语言模型 (LLM) 在各种任务中表现出了卓越的能力。然而,他们有时会产生幻觉,特别是在尽管拥有正确的知识但仍可能产生不真实反应的情况下。在本文中,我们提出了 TruthX,这是一种推理时间方法,通过编辑真实空间中的内部表示来得出 LLM 的真实性 ...
我们提出了一种端到端系统设计,旨在利用检索增强生成(RAG)来提高大型语言模型(LLM)针对与私有知识库相关的特定领域和时间敏感查询的事实准确性。我们的系统将 RAG 管道与上游数据集处理和下游性能评估集成在一起。为了解决 LLM 幻觉的挑战,我们使用源自 CMU 广泛资源并用教师模型注释的精选数据集对模型进行微调 ...