- 名称
- MMT-Bench: A Comprehensive Multimodal Benchmark for Evaluating Large Vision-Language Models Towards Multitask AGI
- 描述
大型视觉语言模型 (LVLM) 在视觉对话和实体导航等通用多模式应用中显示出显着的进步。然而,现有的多模态评估基准涵盖了有限数量的测试基本能力的多模态任务,在跟踪 LVLM 开发方面存在不足。在这项研究中,我们提出了 MMT-Bench,这是一个综合基准,旨在评估需要专业知识和深思熟虑的视觉识别、定位、推理和规划的大规模多模态任务中的 LVLM ...