近年来,大型语言模型(LLM)在许多领域得到了快速发展。作为一项经典的机器学习任务,时间序列预测最近得到了 LLM 的大力推动。然而, LLM 在该领域的偏好存在研究差距 ...
基础模型已成为各种人工智能应用中的关键组件,并在自然语言处理和其他几个领域取得了巨大成功。与此同时,图机器学习领域正在见证从浅层方法到更复杂的深度学习方法的范式转变。基础模型的泛化和适应能力促使图机器学习研究人员讨论开发新的图学习范式的潜力 ...
在这项工作中,我们明确表明,现代 LLM 倾向于首先生成正确的事实,然后“偏离”并随后生成错误的事实:偶尔会观察到这种情况,但从未正确测量过。我们开发了一个语义漂移分数,用于衡量生成文本中正确和不正确事实之间的分离程度,并在生成维基百科风格的传记时证实我们的假设。这种先正确后错误的生成模式表明,通过了解何时停止生成可以提高事实准确性 ...
法律判决预测(LJP)应用自然语言处理(NLP)技术,根据事实描述自动预测判决结果。最近,大规模公共数据集和 NLP 研究的进展导致人们对 LJP 的兴趣日益浓厚。尽管机器和人类的表现之间存在明显差距,但在各种基准数据集中仍取得了令人印象深刻的结果 ...
gpt-4等通用基础模型在各种领域和任务中展现了令人惊讶的能力。然而,人们普遍认为它们无法与微调模型的专业能力相匹配。例如 ...
我们提出了后退提示,这是一种简单的提示技术,使LLM能够进行抽象,从包含特定细节的实例中导出高级概念和第一原理。利用概念和原则来指导推理,LLM可以显着提高他们遵循正确的推理路径获得解决方案的能力。我们使用PaLM-2L、GPT-4和Llama2-70B模型进行了后退提示实验,并观察到各种常见的推理密集型任务(包括STEM、知识)质量保证和多跳推理)上取得了显着的性能提升...... ...
法律案件检索和判决预测是智能法律系统的重要组成部分。在实践中,通过法律判决预测判断两个案件是否具有相同罪名对于案件检索中确定其相关性至关重要。然而,目前法律案例检索的研究仅仅关注配对案例之间的语义相似性,而忽略了它们的指控级别一致性 ...
基于内容的生成任务的高质量内容已被认为是推进这些任务的主要障碍。为了解决这一差距,我们提出了Genie,一种自动生成高质量内容基础的数据新方法。它由三个阶段组成:(a) 内容准备,(b) 生成:根据内容创建特定于任务的示例(例如,示例) ... ...
收集相关判决书进行法律案件检索是一项具有挑战性且耗时的任务。准确判断两个法律案件之间的关联性,需要付出相当大的努力来阅读冗长的文本,并需要高水平的领域专业知识来提取法律事实并做出司法判断。随着先进的大语言模型的出现,最近的一些研究表明使用 LLM 进行相关性判断是有希望的 ...
大型语言模型(LLM)最近已被用于各种自然语言处理(NLP)任务的训练数据生成器。虽然之前的研究探索了使用生成数据模型的不同方法,但它们通常依赖于简单的类条件提示,这可能会限制生成数据的多样性训练并继承LLM的系统偏差因此。,我们研究具有不同属性提示的数据生成(例如,... ...