huaizhe2000的文档

huaizhe2000

个性签名 ...

RGL: A Graph-Centric, Modular Framework for Efficient Retrieval-Augmented Generation on Graphs

图形学习的最新进展为利用图形数据中固有的关系结构的创新检索生成（RAG）系统铺平了道路。但是，许多现有的方法都遭受了严格的，固定的设置和大量的工程开销，从而限制了它们的适应性和可扩展性。此外，RAG社区在很大程度上忽略了图数据库社区中有关大规模图上有趣的子结构的有效检索的数十年研究 ...

0 0 0 0 2025/06/09 arXiv:2503.19314v1 huaizhe2000

Multi-hop Question Answering under Temporal Knowledge Editing

在知识编辑（KE）下，多跳的问题回答（MQA）在大型语言模型时代引起了极大的关注。但是，在处理包含明确时间上下文的问题时，MQA的现有模型表现出较差的性能。为了解决这一局限性，我们提出了一个新颖的框架，即时间知识增强多跳问题回答（Temple-MQA） ...

0 0 0 0 2025/06/08 arXiv:2404.00492v1 huaizhe2000

LLM-based Semantic Augmentation for Harmful Content Detection

大型语言模型（LLMS）的最新进展已在简单的文本分类任务上表现出很强的性能，通常在零击设置下。但是，在应对复杂的社交媒体挑战（例如宣传检测，可恨模因分类和毒性识别）等复杂的社交媒体挑战时，它们的功效会下降。现有的许多工作都集中在使用LLMS生成合成训练数据，从而忽视了基于LLM的文本预处理和语义增强的潜力 ...

0 0 0 0 2025/04/27 arXiv:2504.15548v1 huaizhe2000

Toxicity Detection for Free

当前的LLM通常会遵循安全要求，并倾向于拒绝有毒的提示。但是，LLM可能无法拒绝有毒的提示，也可能过分拒绝良性的例子。此外，最先进的毒性探测器在低FPR下的TPR较低，在很少有毒性实例的实际应用中产生高成本 ...

0 0 0 0 2025/04/27 arXiv:2405.18822v2 huaizhe2000

Parametric Retrieval Augmented Generation

通过解决幻觉，过时的知识和域适应性等问题，检索增强的生成（RAG）技术已成为提高大语言模型（LLM）可靠性的有前途解决方案。特别是，现有的抹布方法附加了从外部语料库或数据库中检索到LLMS的输入的相关文档，以指导其生成过程，我们将其称为“文化知识注入方法”。尽管这种方法很简单并且通常有效，但它具有固有的局限性 ...

0 0 0 0 2025/02/13 arXiv:2501.15915v1 huaizhe2000

LLM Lies: Hallucinations are not Bugs, but Features as Adversarial Examples

大型语言模型 (LLM)，包括 GPT-3.5、LLaMA 和 PaLM，似乎知识渊博并且能够适应许多任务。然而，我们仍然不能完全相信他们的答案，因为 LLM 患有 \textbf{幻觉}\textemdash 捏造不存在的事实，在有意识或无意识的情况下欺骗用户 ...

0 0 0 0 2025/01/20 arXiv:2310.01469v3 huaizhe2000

Unsupervised dense retrieval with conterfactual contrastive learning

从大型文档语料库中有效地检索一组简明的候选者仍然是信息检索（IR）中的关键挑战。神经检索模型，特别是使用 Transformer 和预训练语言模型构建的密集检索模型，由于其卓越的性能而广受欢迎。然而，也有人批评它们缺乏可解释性和容易受到对抗性攻击 ...

0 0 0 0 2025/01/05 arXiv:2412.20756v1 huaizhe2000

DRAGIN: Dynamic Retrieval Augmented Generation based on the Information Needs of Large Language Models

动态检索增强生成（RAG）范式主动决定在大型语言模型（LLM）的文本生成过程中检索何时以及检索什么。该范例有两个关键要素：确定激活检索模块的最佳时刻（决定何时检索）以及在触发检索后制定适当的查询（确定检索什么）。然而，当前的动态 RAG 方法在这两方面都存在不足 ...

0 0 0 0 2024/12/18 arXiv:2403.10081v3 huaizhe2000

Fusing Context Into Knowledge Graph for Commonsense Question Answering

常识问答 (QA) 需要一个模型来掌握常识和事实知识，以回答有关世界事件的问题。许多现有方法将语言建模与知识图（KG）结合起来。然而，尽管知识图谱包含丰富的结构信息，但它缺乏上下文来提供对概念的更精确的理解 ...

0 0 0 0 2024/10/12 arXiv:2012.04808v3 huaizhe2000

Baldur: Whole-Proof Generation and Repair with Large Language Models

正式验证软件属性是一项非常理想但劳动密集型的任务。最近的工作开发了使用证明助手（例如 Coq 和 Isabelle/HOL）自动进行形式验证的方法 ...

0 0 0 0 2024/09/28 arXiv:2303.04910v2 huaizhe2000