近年来,llm)chatgpt因其强大的涌现能力而受到广泛关注。一些研究人员认为,llm 有可能取代知识图( kg)等结构化知识库 ...
结构化自然语言处理 (XNLP) 是 NLP 的一个重要子集,需要理解文本的底层语义或句法结构,这是许多下游应用程序的基础组件。尽管最近做出了一些努力来探索针对特定类别的 XNLP 任务的通用解决方案,但长期以来,统一所有 XNLP 任务的全面有效的方法仍然不足。与此同时,虽然 XNLP 演示系统对于研究人员探索各种 XNLP 任务至关重要,但现有平台可能仅限于,例如 ...
本文介绍了Fundus,一个用户友好的新闻抓取工具,使用户只需几行代码即可获取数百万篇高质量的新闻文章。与现有的新闻抓取器不同,我们使用手动制作的定制内容提取器,这些提取器是专门根据每个受支持的在线报纸的格式指南量身定制的。这使我们能够优化抓取质量,使检索到的新闻文章在文本上完整且没有 HTML 伪影 ...
大型语言模型(LLM)通常会遇到知识切断或谬误问题,这意味着它们不知道未见过的事件或由于过时/嘈杂的数据而生成包含不正确事实的文本。为此,出现了许多针对 LLM 的知识编辑方法——旨在巧妙地注入/编辑更新的知识或调整不良行为,同时最大限度地减少对不相关输入的影响。然而,由于各种知识编辑方法之间存在显着差异以及任务设置的差异,社区没有可用的标准实现框架,这阻碍了从业者将知识编辑应用于应用程序 ...
移动设备操作任务迫切成为流行的多模态人工智能应用。当前的多模态大模型语言(MLLM)受训练数据的限制,缺乏有效充当操作助手的能力。相反,基于MLLM的代理,通过工具调用能力增强,正在逐渐意识到该场景…… ...
基于记忆的神经网络利用长期记住信息的能力来对时间数据进行建模。然而,目前尚不清楚他们是否也有能力利用他们记住的信息进行复杂的关系推理。在这里,我们首先确认我们的直觉,即标准内存架构可能难以完成大量涉及理解实体连接方式的任务——即 ...
关系推理是一般智能行为的核心组成部分,但事实证明神经网络很难学习。在本文中,我们描述了如何使用关系网络(RN)作为简单的即插即用模块来解决从根本上取决于关系推理的问题。我们在三项任务上测试了 RN 增强网络:使用名为 CLEVR 的挑战性数据集进行视觉问答,我们在该数据集上实现了最先进的超人类表现;使用 bAbI 任务套件进行基于文本的问答;以及关于动态物理系统的复杂推理 ...
深度残差网络已经成为一系列极深的架构,显示出令人信服的准确性和良好的收敛行为。在本文中,我们分析了残差构建块背后的传播公式,这表明当使用恒等映射作为跳过连接和添加后激活时,前向和后向信号可以直接从一个块传播到任何其他块。一系列消融实验支持了这些身份映射的重要性 ...
最先进的语义分割模型基于最初为图像分类而设计的卷积网络的改编。然而,密集预测和图像分类在结构上是不同的。在这项工作中,我们开发了一种新的卷积网络模块,专为密集预测而设计 ...
扩展深度限制神经网络容量被认为是提高多种不同机器学习任务模型质量的有效方法。在许多情况下,将模型容量提高到超出单个加速器的内存容量需要开发特殊的算法或基础设施。这些解决方案通常是于特定的体系结构的,并且不会转移到其他任务... ...