arxiv ViDoRAG: Visual Document Retrieval-Augmented Generation via Dynamic Iterative Reasoning Agents

名称
ViDoRAG: Visual Document Retrieval-Augmented Generation via Dynamic Iterative Reasoning Agents
首页
https://yiyibooks.cn/arxiv/2502.18017v1/index.html
原始地址
https://arxiv.org/abs/2502.18017
描述
从视觉上富裕的文档中了解信息仍然是传统检索型生成(RAG)方法的重大挑战。现有基准主要集中在基于图像的问题答案(QA)上,忽视了密集的视觉文档中有效检索,理解和推理的基本挑战。为了弥合这一差距,我们介绍了Vidoseek,这是一个新颖的数据集,旨在评估需要复杂推理的视觉丰富文档的抹布性能 ...