本体对齐是语义网中用于检测不同本体之间关系的关键过程,传统上侧重于通过类标签和属性比较来识别所谓的“简单”一对一关系。对更复杂的对齐的更实际有用的探索仍然是自动化的难题,因此很大程度上尚未得到充分探索,即 ...
本体匹配(OM)是知识集成中的一项关键任务,其中对齐异构本体有助于数据互操作和知识共享。传统的 OM 系统通常依赖于专家知识或预测模型,对大型语言模型 (LLM) 潜力的探索有限。我们提出了 LLMs4OM 框架,这是一种评估 LLM 在 OM 任务中有效性的新方法 ...
近年来,大型语言模型(LLM)在许多领域得到了快速发展。作为一项经典的机器学习任务,时间序列预测最近得到了 LLM 的大力推动。然而, LLM 在该领域的偏好存在研究差距 ...
基础模型已成为各种人工智能应用中的关键组件,并在自然语言处理和其他几个领域取得了巨大成功。与此同时,图机器学习领域正在见证从浅层方法到更复杂的深度学习方法的范式转变。基础模型的泛化和适应能力促使图机器学习研究人员讨论开发新的图学习范式的潜力 ...
在这项工作中,我们明确表明,现代 LLM 倾向于首先生成正确的事实,然后“偏离”并随后生成错误的事实:偶尔会观察到这种情况,但从未正确测量过。我们开发了一个语义漂移分数,用于衡量生成文本中正确和不正确事实之间的分离程度,并在生成维基百科风格的传记时证实我们的假设。这种先正确后错误的生成模式表明,通过了解何时停止生成可以提高事实准确性 ...
法律判决预测(LJP)应用自然语言处理(NLP)技术,根据事实描述自动预测判决结果。最近,大规模公共数据集和 NLP 研究的进展导致人们对 LJP 的兴趣日益浓厚。尽管机器和人类的表现之间存在明显差距,但在各种基准数据集中仍取得了令人印象深刻的结果 ...
gpt-4等通用基础模型在各种领域和任务中展现了令人惊讶的能力。然而,人们普遍认为它们无法与微调模型的专业能力相匹配。例如 ...
我们提出了后退提示,这是一种简单的提示技术,使LLM能够进行抽象,从包含特定细节的实例中导出高级概念和第一原理。利用概念和原则来指导推理,LLM可以显着提高他们遵循正确的推理路径获得解决方案的能力。我们使用PaLM-2L、GPT-4和Llama2-70B模型进行了后退提示实验,并观察到各种常见的推理密集型任务(包括STEM、知识)质量保证和多跳推理)上取得了显着的性能提升...... ...
法律案件检索和判决预测是智能法律系统的重要组成部分。在实践中,通过法律判决预测判断两个案件是否具有相同罪名对于案件检索中确定其相关性至关重要。然而,目前法律案例检索的研究仅仅关注配对案例之间的语义相似性,而忽略了它们的指控级别一致性 ...
基于内容的生成任务的高质量内容已被认为是推进这些任务的主要障碍。为了解决这一差距,我们提出了Genie,一种自动生成高质量内容基础的数据新方法。它由三个阶段组成:(a) 内容准备,(b) 生成:根据内容创建特定于任务的示例(例如,示例) ... ...