- 名称
- Benchmarking Multimodal Retrieval Augmented Generation with Dynamic VQA Dataset and Self-adaptive Planning Agent
- 描述
多模态检索增强生成(mRAG)在缓解多模态大语言模型(MLLM)固有的“幻觉”问题方面发挥着重要作用。尽管很有希望,但现有的启发式 mRAG 通常预定义固定的检索过程,这会导致两个问题:(1)非自适应检索查询。 (2) 重载检索查询 ...
多模态检索增强生成(mRAG)在缓解多模态大语言模型(MLLM)固有的“幻觉”问题方面发挥着重要作用。尽管很有希望,但现有的启发式 mRAG 通常预定义固定的检索过程,这会导致两个问题:(1)非自适应检索查询。 (2) 重载检索查询 ...