arxiv NeoBERT: A Next-Generation BERT

名称
NeoBERT: A Next-Generation BERT
首页
https://yiyibooks.cn/arxiv/2502.19587v2/index.html
原始地址
https://arxiv.org/pdf/2502.19587
描述
建筑,预培训和微调的最新创新导致了大型自动退缩语言模型(例如Llama and Deepseek)的非凡学习和推理能力。相比之下,尽管许多下游NLP应用是基础,但像Bert和Roberta这样的编码者并未看到相同的进度。为了弥合这一差距,我们介绍了Neobert,Neobert是下一代编码器,通过整合建筑,现代数据和优化的预训练方法中的最新进步,重新定义了双向模型的功能 ...