基于内容的生成任务的高质量内容已被认为是推进这些任务的主要障碍。为了解决这一差距,我们提出了Genie,一种自动生成高质量内容基础的数据新方法。它由三个阶段组成:(a) 内容准备,(b) 生成:根据内容创建特定于任务的示例(例如,示例) ... ...

0 0 0 0 2024/11/14 arXiv:2401.14367v1 JayLiu

收集相关判决书进行法律案件检索是一项具有挑战性且耗时的任务。准确判断两个法律案件之间的关联性,需要付出相当大的努力来阅读冗长的文本,并需要高水平的领域专业知识来提取法律事实并做出司法判断。随着先进的大语言模型的出现,最近的一些研究表明使用 LLM 进行相关性判断是有希望的 ...

0 0 0 0 2024/03/30 arXiv:2403.18405v1 JayLiu

大型语言模型(LLM)最近已被用于各种自然语言处理(NLP)任务的训练数据生成器。虽然之前的研究探索了使用生成数据模型的不同方法,但它们通常依赖于简单的类条件提示,这可能会限制生成数据的多样性训练并继承LLM的系统偏差因此。,我们研究具有不同属性提示的数据生成(例如,... ...

0 0 1 2 2024/12/10 arXiv:2306.15895v2 JayLiu

上下文学习(ICL)是大语言模型(LLM)时代的趋势提示策略,其中展示了一些例子来激发LLM对给定任务的能力。如何选择信息丰富的示例仍然是一个悬而未决的问题。之前关于机器翻译(MT)的上下文示例选择的工作侧重于表面的单词级特征,而忽略了深层的语法级知识 ...

0 0 0 0 2024/03/30 arXiv:2403.19285v1 JayLiu

预测知识图谱(KG)中的多个链接的任务是知识图谱分析领域的一个挑战,由于自然语言处理(NLP)和知识图谱嵌入技术的进步,这一挑战越来越容易解决。本文介绍了一种新颖的方法,即知识图大语言模型框架(KG-LLM),该框架利用关键的 NLP 范式,包括思想链(CoT)提示和上下文学习(ICL)来增强多跳KG 中的链接预测。通过将 KG 转换为 CoT 提示,我们的框架旨在辨别和学习实体的潜在表示及其相互关系 ...

0 0 0 0 2024/03/30 arXiv:2403.07311v5 JayLiu

自然语言处理(NLP)中的预测模型已经从从头开始的训练模型发展到使用标记数据微调预训练模型。这种微调的一种极端形式涉及上下文学习(ICL),其中预训练生成模型(冻结解码器参数)的输出仅通过输入字符串(称为指令或提示)的变化进行控制。 ICL 的一个重要组成部分是在提示中使用少量标记数据实例作为示例 ...

0 1 0 0 2024/03/30 arXiv:2403.06402v1 JayLiu

情境学习(ICL)是通过一些演示使大型语言模型(LLM)适应下游任务的重要范例。尽管ICL取得了巨大成功,但演示数量的限制可能会导致演示偏差,即 ...

0 0 0 0 2024/03/30 arXiv:2312.07476v2 JayLiu

法律三段论是法律专业人士分析案件时常用的一种演绎推理形式。在本文中,我们提出了法律三段论提示(LoT),这是一种用于教授用于法律判断预测的大型语言模型(LLM)的简单提示方法。 LoT只教导说,在法律三段论中,大前提是法律,小前提是事实,结论是判断 ...

0 0 0 0 2024/03/28 arXiv:2307.08321v1 JayLiu

虽然像 GPT-4 这样的大型语言模型(LLM)最近在一般领域任务中展示了惊人的零样本能力,但它们经常在中国法律等特定领域生成带有幻觉的内容,从而阻碍了它们在这些领域的应用。这通常是由于缺乏包含此类特定领域的训练数据,导致 GPT-4 无法获取领域内的知识。一个紧迫的挑战是,继续在领域内数据上培训如此规模的 LLM 是不合理的 ...

0 0 0 0 2024/03/28 arXiv:2310.03328v2 JayLiu

大型语言模型 (LLM) 在特定领域的应用程序(例如法律领域)中展现出了巨大的潜力。然而,最近关于 GPT-4 法律评估的争议引发了对其在现实世界法律任务中表现的质疑。为了系统地调查他们的法律能力,我们设计了基于 LLM 的实用基线解决方案,并在法律判决预测任务上进行了测试 ...

0 0 0 0 2024/03/28 arXiv:2310.11761v1 JayLiu

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)