arxiv LLMLingua-2: Data Distillation for Efficient and Faithful Task-Agnostic Prompt Compression

名称
LLMLingua-2: Data Distillation for Efficient and Faithful Task-Agnostic Prompt Compression
首页
https://yiyibooks.cn/arxiv/2403.12968v1/index.html
原始地址
https://arxiv.org/abs/2403.12968
描述
本文重点关注与任务无关的提示压缩,以提高通用性和效率。考虑到自然语言中的冗余,现有方法通过根据从因果语言模型(例如LLaMa-7B)获得的信息熵删除标记或词汇单元来压缩提示。挑战在于信息熵可能是次优压缩指标:(i)它仅利用单向上下文,可能无法捕获即时压缩所需的所有基本信息; (ii) 它与即时压缩目标不一致 ...