因果关系揭示了现实场景中数据分布背后的基本原理,大型语言模型 (LLM) 理解因果关系的能力直接影响其在解释输出、适应新证据和生成反事实方面的功效。随着 LLM 的激增,对这种能力的评估越来越受到关注。然而,由于缺乏全面的基准,现有的评估研究变得简单、单一和同质化 ...
因果关系揭示了现实场景中数据分布背后的基本原理,大型语言模型 (LLM) 理解因果关系的能力直接影响其在解释输出、适应新证据和生成反事实方面的功效。随着 LLM 的激增,对这种能力的评估越来越受到关注。然而,由于缺乏全面的基准,现有的评估研究变得简单、单一和同质化 ...