arxiv DRUM: Learning Demonstration Retriever for Large MUlti-modal Models

名称
DRUM: Learning Demonstration Retriever for Large MUlti-modal Models
首页
https://yiyibooks.cn/arxiv/2412.07619v1/index.html
原始地址
https://arxiv.org/abs/2412.07619
描述
最近,大型语言模型(LLM)在上下文学习(ICL)的帮助下展示了处理新任务的令人印象深刻的能力。在大视觉语言模型(LVLM)的研究中,在实现 ICL 时,研究人员通常采用简单的策略,例如跨不同样本的固定演示,或直接通过视觉语言嵌入模型选择演示。这些方法不能保证配置的演示符合 LVLM 的需要 ...