视觉信息提取(VIE)在文档智能中发挥着重要作用。一般来说,它分为两个任务:语义实体识别(SER)和关系提取(RE)。最近,文档预训练模型在VIE,特别是SER方面取得了实质性进展 ...
最近,在许多人工智能领域取得巨大成功的Transformer模型展示了其在图结构数据建模方面的巨大潜力。到目前为止,已经提出了各种各样的 Transformer 来适应图结构数据。然而,对这些图的 Transformer 变体的全面文献综述和系统评估仍然无法实现 ...
极限多标签文本分类 (XMC) 旨在从给定文本输入的极大标签集合中查找相关标签。许多现实世界的应用程序都可以表述为 XMC 问题,例如推荐系统、文档标记和语义搜索。最近,基于 Transformer 的 XMC 方法(例如 X-Transformer 和 LightXML)已显示出比其他 XMC 方法显着的改进 ...
已经提出图嵌入来将图数据映射到低维空间以进行下游处理(例如,节点分类或链接预测) ...
我们引入了“思维助手”的概念,这种方法鼓励用户通过头脑风暴和发人深省的提问进行深度反思和批判性思维。我们将这样一个思维助手 Gradschool.chat 实例化,作为专门为未来的研究生提供帮助的虚拟助手 ...
每学期在在线问答平台上回答数千个学生问题会产生相当大的人力成本,特别是在入学人数快速增长的计算机课程中。为了应对可扩展和智能问答 (QA) 的挑战,我们引入了一种创新解决方案,该解决方案利用 LLaMA-2 系列的开源大型语言模型 (LLM) 来确保数据隐私。我们的方法结合了增强技术,例如检索增强生成(RAG)、监督微调(SFT)以及使用直接偏好优化(DPO)从人类偏好数据中学习 ...
随着人工智能技术的快速发展,大语言模型(LLM)已成为研究热点。教育对人类社会的发展和进步发挥着重要作用。传统教育面临学生个体差异、教学资源配置不足、教学效果评估等挑战 ...
使用大型语言模型(llm)的多模态推理经常会出现幻觉,llm中存在缺陷或过时的知识。一些方法试图通过采用文本知识图来缓解这些问题,但它们单一的知识模态限制了全面的跨模态理解。在本文中,mr-mkg)方法,该方法利用多模态知识图谱(mmkg(mmkg),来学习跨模态的丰富语义知识,显着增强了llm的多模态推理能力... ...
网络钓鱼攻击给个人和企业造成了巨大损失,因此需要开发强大且高效的自动网络钓鱼检测方法。基于参考的网络钓鱼检测器 (RBPD) 可将目标网页上的徽标与一组已知的徽标进行比较,已成为最先进的方法。然而,现有RBPD的一个主要限制是它们依赖于手动构建的品牌知识库,使其无法扩展到大量品牌,从而由于知识库的品牌覆盖率不足而导致假阴性错误 ...
即使保守估计,80% 的企业数据也驻留在非结构化文件中,存储在支持异构格式的数据湖中。传统的搜索引擎不再能够满足信息搜索的需求,特别是当任务是浏览和探索洞察力时。换句话说,没有明显的搜索关键字可供使用 ...