- 名称
- ViDoRAG: Visual Document Retrieval-Augmented Generation via Dynamic Iterative Reasoning Agents
- 描述
从视觉上富裕的文档中了解信息仍然是传统检索型生成(RAG)方法的重大挑战。现有基准主要集中在基于图像的问题答案(QA)上,忽视了密集的视觉文档中有效检索,理解和推理的基本挑战。为了弥合这一差距,我们介绍了Vidoseek,这是一个新颖的数据集,旨在评估需要复杂推理的视觉丰富文档的抹布性能 ...
从视觉上富裕的文档中了解信息仍然是传统检索型生成(RAG)方法的重大挑战。现有基准主要集中在基于图像的问题答案(QA)上,忽视了密集的视觉文档中有效检索,理解和推理的基本挑战。为了弥合这一差距,我们介绍了Vidoseek,这是一个新颖的数据集,旨在评估需要复杂推理的视觉丰富文档的抹布性能 ...