逻辑推理,即从一组前提演绎地推断出结论的真值,是人工智能的一项重要任务,对科学、数学和社会具有广泛的潜在影响 ...
大型语言模型 (LLM) 因其卓越的性能而在人工智能领域获得了突出地位。因此,有必要更好地理解它们的能力和局限性,尤其是在非单调推理方面。本文提出了一个与各种可废止的基于规则的推理模式相对应的基准 ...
归纳推理是人类智能的核心组成部分。在过去计算机科学中的归纳推理研究中,形式语言被用作知识(更具体地说是事实和规则)的表示。然而,形式语言可能会导致归纳推理出现系统性问题,例如无法处理自然语言等原始输入、对错误标签数据敏感以及无法处理模糊输入 ...
可废止推理是一种可以通过考虑新证据来推翻结论的推理模式。现有关于可废推理的认知科学文献表明,一个人在回答问题之前会形成问题场景的心理模型。我们的研究目标是询问神经模型是否可以同样从回答可废止的查询之前设想问题场景中受益 ...
最近的技术进步导致来自网络、传感器网络和社交媒体的生成数据数量空前。可废止推理方面的分析(例如决策制定)可以提供更丰富的基础领域知识。传统上,可废止推理主要关注中小量数据上的复杂知识结构,但最近的研究工作试图将理论推理过程与大量事实并行化 ...
先前的工作将大型语言模型(LLM)中的思维链提示与程序化表示相结合,以执行有效且透明的推理。虽然这种方法非常适合只需要前向推理的任务(例如 ...
使用非结构化自然文本进行自动推理是 NLP 的许多潜在应用和开发强大的人工智能系统的关键要求。最近,语言模型(LM)即使在没有任何微调的情况下也表现出了复杂的推理能力。然而,现有的自动推理评估假设可以访问模型推理所依据的一致且连贯的信息集 ...
在临床推理中使用大型语言模型 (LLM) 存在两个主要障碍。首先,虽然 LLM 在自然语言处理(NLP)任务中表现出巨大的前景,但他们在复杂推理和规划方面的表现却低于预期。其次, LLM 使用无法解释的方法来做出与临床医生的认知过程根本不同的临床决策 ...
我们评估了两个大型语言模型(LLM)执行论证推理的能力。我们尝试论证挖掘(AM)和论证对提取(APE),并评估 LLM 在逐渐更抽象的输入和输出(I/O)表示(例如, ...
近年来,深度学习驱动的自然语言模型的性能取得了显着的进步,特别是大型语言模型(LLM)的开发和发布。这些改进导致人工智能生成的输出质量更高,但依赖于资源昂贵的培训和模型升级。尽管不同的研究提出了一系列无需再培训即可增强 LLM 的技术,但没有一个研究考虑将计算论证作为一种选择 ...