大型语言模型(LLMS)的最新进展已在简单的文本分类任务上表现出很强的性能,通常在零击设置下。但是,在应对复杂的社交媒体挑战(例如宣传检测,可恨模因分类和毒性识别)等复杂的社交媒体挑战时,它们的功效会下降。现有的许多工作都集中在使用LLMS生成合成训练数据,从而忽视了基于LLM的文本预处理和语义增强的潜力 ...

0 0 0 0 2025/04/27 arXiv:2504.15548v1 huaizhe2000

当前的LLM通常会遵循安全要求,并倾向于拒绝有毒的提示。但是,LLM可能无法拒绝有毒的提示,也可能过分拒绝良性的例子。此外,最先进的毒性探测器在低FPR下的TPR较低,在很少有毒性实例的实际应用中产生高成本 ...

0 0 0 0 2025/04/27 arXiv:2405.18822v2 huaizhe2000

大型语言模型(LLMS)在各种领域都表现出了出色的表现。尽管如此,通才LLM在需要专业知识的推理任务中仍然缺乏。对专门针对特定领域培训的专业LLM的事先研究,这需要在域数据采集和模型参数微调方面进行大量努力 ...

0 0 0 0 2025/02/17 arXiv:2411.19064v1 huaizhe2000

通过解决幻觉,过时的知识和域适应性等问题,检索增强的生成(RAG)技术已成为提高大语言模型(LLM)可靠性的有前途解决方案。特别是,现有的抹布方法附加了从外部语料库或数据库中检索到LLMS的输入的相关文档,以指导其生成过程,我们将其称为“文化知识注入方法”。尽管这种方法很简单并且通常有效,但它具有固有的局限性 ...

0 0 0 0 2025/02/13 arXiv:2501.15915v1 huaizhe2000

大型语言模型 (LLM),包括 GPT-3.5、LLaMA 和 PaLM,似乎知识渊博并且能够适应许多任务。然而,我们仍然不能完全相信他们的答案,因为 LLM 患有 \textbf{幻觉}\textemdash 捏造不存在的事实,在有意识或无意识的情况下欺骗用户 ...

0 0 0 0 2025/01/20 arXiv:2310.01469v3 huaizhe2000

从大型文档语料库中有效地检索一组简明的候选者仍然是信息检索(IR)中的关键挑战。神经检索模型,特别是使用 Transformer 和预训练语言模型构建的密集检索模型,由于其卓越的性能而广受欢迎。然而,也有人批评它们缺乏可解释性和容易受到对抗性攻击 ...

0 0 0 0 2025/01/05 arXiv:2412.20756v1 huaizhe2000

动态检索增强生成(RAG)范式主动决定在大型语言模型(LLM)的文本生成过程中检索何时以及检索什么。该范例有两个关键要素:确定激活检索模块的最佳时刻(决定何时检索)以及在触发检索后制定适当的查询(确定检索什么)。然而,当前的动态 RAG 方法在这两方面都存在不足 ...

0 0 0 0 2024/12/18 arXiv:2403.10081v3 huaizhe2000

常识问答 (QA) 需要一个模型来掌握常识和事实知识,以回答有关世界事件的问题。许多现有方法将语言建模与知识图(KG)结合起来。然而,尽管知识图谱包含丰富的结构信息,但它缺乏上下文来提供对概念的更精确的理解 ...

0 0 0 0 2024/10/12 arXiv:2012.04808v3 huaizhe2000

正式验证软件属性是一项非常理想但劳动密集型的任务。最近的工作开发了使用证明助手(例如 Coq 和 Isabelle/HOL)自动进行形式验证的方法 ...

0 0 0 0 2024/09/28 arXiv:2303.04910v2 huaizhe2000

关系数据库中存储的数据量不断增加,导致各个部门需要高效查询和利用这些数据。然而,编写 SQL 查询需要专业知识,这给尝试访问和查询数据库的非专业用户带来了挑战。文本到 SQL 解析通过将自然语言查询转换为 SQL 查询来解决这个问题,从而使非专家用户更容易访问数据库 ...

0 0 0 0 2024/09/24 arXiv:2407.15186v3 huaizhe2000

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)