arxiv Counting-Stars: A Simple, Efficient, and Reasonable Strategy for Evaluating Long-Context Large Language Models

名称
Counting-Stars: A Simple, Efficient, and Reasonable Strategy for Evaluating Long-Context Large Language Models
首页
https://yiyibooks.cn/arxiv/2403.11802v2/index.html
原始地址
https://arxiv.org/pdf/2403.11802v1.pdf
描述
虽然最近的研究工作集中在开发具有强大的长上下文能力的大型语言模型(LLM),但由于缺乏适当的评估策略,人们对领先的 LLM 的长上下文处理能力和性能知之甚少(例如,LLM)。 、ChatGPT 和 KimiChat) ...