大型语言模型(LLM)开创了自然语言处理领域的变革时代,在文本理解和生成相关的任务中表现出色。然而,当面对混乱的环境时,他们会遇到困难(例如, ...
多模式电子健康记录 (EHR) 数据的集成具有显着先进的临床预测能力。然而,当前利用临床记录和多变量时间序列 EHR 数据的模型通常缺乏精确临床任务所需的医学背景。以前使用知识图(KG)的方法主要侧重于结构化知识提取 ...
近年来,llm)chatgpt因其强大的涌现能力而受到广泛关注。一些研究人员认为,llm 有可能取代知识图( kg)等结构化知识库 ...
结构化自然语言处理 (XNLP) 是 NLP 的一个重要子集,需要理解文本的底层语义或句法结构,这是许多下游应用程序的基础组件。尽管最近做出了一些努力来探索针对特定类别的 XNLP 任务的通用解决方案,但长期以来,统一所有 XNLP 任务的全面有效的方法仍然不足。与此同时,虽然 XNLP 演示系统对于研究人员探索各种 XNLP 任务至关重要,但现有平台可能仅限于,例如 ...
本文介绍了Fundus,一个用户友好的新闻抓取工具,使用户只需几行代码即可获取数百万篇高质量的新闻文章。与现有的新闻抓取器不同,我们使用手动制作的定制内容提取器,这些提取器是专门根据每个受支持的在线报纸的格式指南量身定制的。这使我们能够优化抓取质量,使检索到的新闻文章在文本上完整且没有 HTML 伪影 ...
大型语言模型(LLM)通常会遇到知识切断或谬误问题,这意味着它们不知道未见过的事件或由于过时/嘈杂的数据而生成包含不正确事实的文本。为此,出现了许多针对 LLM 的知识编辑方法——旨在巧妙地注入/编辑更新的知识或调整不良行为,同时最大限度地减少对不相关输入的影响。然而,由于各种知识编辑方法之间存在显着差异以及任务设置的差异,社区没有可用的标准实现框架,这阻碍了从业者将知识编辑应用于应用程序 ...
移动设备操作任务迫切成为流行的多模态人工智能应用。当前的多模态大模型语言(MLLM)受训练数据的限制,缺乏有效充当操作助手的能力。相反,基于MLLM的代理,通过工具调用能力增强,正在逐渐意识到该场景…… ...
基于记忆的神经网络利用长期记住信息的能力来对时间数据进行建模。然而,目前尚不清楚他们是否也有能力利用他们记住的信息进行复杂的关系推理。在这里,我们首先确认我们的直觉,即标准内存架构可能难以完成大量涉及理解实体连接方式的任务——即 ...
关系推理是一般智能行为的核心组成部分,但事实证明神经网络很难学习。在本文中,我们描述了如何使用关系网络(RN)作为简单的即插即用模块来解决从根本上取决于关系推理的问题。我们在三项任务上测试了 RN 增强网络:使用名为 CLEVR 的挑战性数据集进行视觉问答,我们在该数据集上实现了最先进的超人类表现;使用 bAbI 任务套件进行基于文本的问答;以及关于动态物理系统的复杂推理 ...
深度残差网络已经成为一系列极深的架构,显示出令人信服的准确性和良好的收敛行为。在本文中,我们分析了残差构建块背后的传播公式,这表明当使用恒等映射作为跳过连接和添加后激活时,前向和后向信号可以直接从一个块传播到任何其他块。一系列消融实验支持了这些身份映射的重要性 ...