基本信息 - XLNet: Generalized Autoregressive Pretraining for Language Understanding

arxiv XLNet: Generalized Autoregressive Pretraining for Language Understanding

阅读

Star 2

名称: XLNet: Generalized Autoregressive Pretraining for Language Understanding

首页: https://yiyibooks.cn/arxiv/1906.08237v2/index.html

原始地址: https://ar5iv.labs.arxiv.org/html/1906.08237

描述

凭借对双向上下文进行建模的能力，BERT 等基于去噪自编码的预训练比基于自回归语言建模的预训练方法具有更好的性能。然而，依赖于用掩码破坏输入，BERT 忽略了掩码位置之间的依赖性，并遭受预训练微调差异的影响。鉴于这些优点和缺点，我们提出了 XLNet，一种广义的自回归预训练方法，它 (1) 通过最大化分解顺序的所有排列的预期可能性来学习双向上下文，(2) 由于其自回归克服了 BERT 的局限性公式 ...