在先进的人工智能(AI)技术的支持下,ChatGPT等对话式AI系统和Siri等数字助理已在日常生活中广泛部署。然而,此类系统仍可能产生包含偏见和刻板印象的内容,从而造成潜在的社会问题。由于现代人工智能技术的数据驱动、黑匣子性质,全面识别和测量对话系统中的偏见仍然是一项具有挑战性的任务 ...
心理学、医疗保健和教育等学科的研究表明,社区归属感是人类的基本需求,会影响个人的行为、长期参与和工作满意度。尽管对如何在开源软件项目和其他虚拟的同行生产社区中留住开发人员进行了大量研究,但很少有研究调查什么可能有助于在这些社区中产生归属感。为此,我们开发了一个理论模型,旨在了解 OSS 开发者动机与虚拟社区意识之间的联系 ...
软件开发人员经常求助于 Stack Overflow (SO) 来满足他们的编程需求。鉴于相关帖子数量众多,浏览它们并比较不同的解决方案是乏味且耗时的。最近的工作建议自动将 SO 帖子总结为简洁的文本,以方便 SO 帖子的导航 ...
生成信息检索包括生成文档检索(GDR)和接地答案生成(GAR)两大任务,在信息检索和自然语言处理领域获得了极大的关注。 GDR 和 GAR 的现有方法依赖于单独的检索和阅读器模块,这阻碍了同时优化。为了克服这个问题,我们提出了 \textbf{UniGen},这是一个用于检索和问答的 \textbf{Uni}fied \textbf{Gen} 生成框架,它利用大型语言模型的功能将这两个任务集成到一个生成模型中 ...
在当今的数字世界中,在互联网上寻求健康问题的答案是一种常见的做法。然而,现有的问答(QA)系统通常依赖于使用预先选择和带注释的证据文档,因此不足以解决新问题。我们的研究重点是开放领域的质量保证设置,其中的关键挑战是首先在大型知识库中发现相关证据 ...
准确评估金融问答 (QA) 系统需要包含不同问题类型和上下文的综合数据集。然而,当前的财务 QA 数据集缺乏范围多样性和问题复杂性。这项工作介绍了 FinTextQA,这是一个用于金融领域长格式问答 (LFQA) 的新颖数据集 ...
自动形式化是将自然语言编写的数学内容自动翻译成形式语言表达的任务。大型语言模型 (LLM) 不断增强的语言解释能力(包括形式语言)正在降低自动形式化的障碍。然而, LLM 本身并不能一致、可靠地提供自动形式化,特别是随着目标领域的复杂性和专业化的增长 ...
检索增强生成(RAG)通过将外部知识与语言模型的参数记忆相结合,已成为开放域 QA 任务的最先进的架构。然而,公共知识库本质上受到有限的覆盖范围和嘈杂信息的限制,使得基于检索的方法不足以回答隐式推理问题。在本文中,我们提出了一种归纳增强生成(IAG)框架,该框架利用归纳知识以及检索到的文档进行隐式推理 ...
古典汉语是通往中国古代丰富遗产和智慧的门户,但它的复杂性对大多数没有专业知识的现代人构成了巨大的理解障碍。虽然大型语言模型 (LLM) 在自然语言处理 (NLP) 方面表现出了卓越的能力,但它们在古典汉语理解 (CCU) 方面表现不佳,尤其是在数据要求高和知识密集型任务中。为了应对这一困境,我们提出了 \textbf{TongGu}(意思是理解古代和现代),这是第一个针对 CCU 的 LLM ,以三个核心贡献为基础 ...
检索增强生成(RAG)方法是解决预训练语言模型静态内存限制的可行解决方案。然而,在检索上下文中遇到冲突的信息源是不可避免的实际挑战。在这种情况下,建议语言模型透明地告知用户冲突,而不是根据用户固有的偏见自主决定呈现什么 ...