通过训练示例和任务描述来提示语言模型 (LM) 被视为最近在少样本学习中取得成功的关键。在这项工作中,我们证明了在少样本设置中微调 LM 可以大大减少对即时工程的需求。事实上,我们可以使用空提示,即既不包含特定于任务的模板也不包含训练示例的提示,并在各种任务中实现与手动调整的提示相比具有竞争力的准确性 ...

0 0 0 0 2024/06/21 arXiv:2106.13353v2 richardson

问题生成旨在根据作为上下文提供的给定输入自动生成问题。可控问题生成方案侧重于生成具有特定属性的问题,从而实现更好的控制。在这项研究中,我们提出了一种几次提示策略来控制儿童叙述文本中问答对的生成 ...

0 0 0 0 2024/06/21 arXiv:2404.02800v1 richardson

大型语言模型 (LLM) 擅长文本操作,例如机器翻译和文本摘要等任务。然而,这些模型也可能容易产生幻觉,这可能不利于模型提供的任何答案的忠实度。最近 LLM 对抗幻觉的工作涉及识别幻觉句子并对模型产生幻觉的不同方式进行分类 ...

0 0 0 0 2024/06/10 arXiv:2312.14346v2 richardson

尽管大型语言模型(LLM)的能力令人印象深刻,但人们仍然观察到它会生成包含不准确或捏造信息的响应,这种现象通常被称为“幻觉”。在这项工作中,我们提出了一种简单的 \textit{Induce-then-Contrast} 解码(ICD)策略来减弱幻觉。我们首先通过从原始 LLM 中诱发幻觉来构建一个事实上薄弱的 LLM ... ...

0 0 0 0 2024/11/12 arXiv:2312.15710v2 richardson

随着人工智能的发展,大型模型变得越来越智能。然而,大量研究表明,这些大型模型中的幻觉是阻碍人工智能研究发展的瓶颈。为了实现强大的人工智能,大量的研究工作投入到 AGI(通用人工智能)幻觉研究中 ...

0 0 0 0 2024/06/10 arXiv:2401.06792v2 richardson

尽管自然语言生成 (NLG) 和大型语言模型 (LLM) 取得了令人印象深刻的进步,但研究人员仍然不清楚 NLG 评估的重要方面。为了证实这一说法,我检查了数据文本 NLG 中幻觉和遗漏的当前分类,并提出了这些分类的基于逻辑的综合。最后,我强调了当前关于幻觉的所有想法的一些剩余局限性,并讨论了对 LLM 的影响 ...

0 0 0 0 2024/06/10 arXiv:2401.07897v1 richardson

llm)辨别和表达其内部知识状态的能力,llm可靠应用的关键因素。我们观察到llm对内部知识状态有很强的自我意识,知识探索的准确率超过85%就证明了这一点。然而,llm在生成过程中往往无法表达他们的内部知识,导致事实幻觉... ...

0 0 0 0 2025/02/12 arXiv:2401.15449v1 richardson

在大型语言模型(llm)时代,幻觉(即生成事实上不正确的内容的倾向)对llm在现实应用中的可信和可靠部署提出了巨大的挑战... ...

0 0 0 0 2025/02/27 arXiv:2401.03205v1 richardson

随着大型语言模型在人工智能 (AI) 领域的不断进步,文本生成系统已被证明遇到了通常被称为“幻觉”的问题现象。然而,随着人工智能在包括医学在内的各个领域的日益普及,人们对该术语本身的使用产生了担忧。在这项研究中,我们进行了系统回顾,以识别十四个数据库中定义“人工智能幻觉”的论文 ...

0 0 0 0 2024/06/10 arXiv:2401.06796v1 richardson

虽然大型语言模型 (LLM) 在人类对齐后的各种任务中表现出了卓越的性能,但它们仍然可能产生听起来合理但与事实知识相矛盾的响应,这种现象称为 \emph{幻觉}。在本文中,我们通过验证和最小化对齐数据中存在的外部知识与基础法学硕士中嵌入的内在知识之间的不一致来证明减轻幻觉的可行性。具体来说,我们提出了一种称为知识一致性对齐(KCA)的新方法,该方法采用良好对齐的法学硕士根据外部知识自动制定评估,以评估基础法学硕士的知识边界 ...

0 0 0 0 2024/06/10 arXiv:2401.10768v4 richardson

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)