arxiv MM-Vet: Evaluating Large Multimodal Models for Integrated Capabilities

名称
MM-Vet: Evaluating Large Multimodal Models for Integrated Capabilities
首页
https://yiyibooks.cn/arxiv/2308.02490v3/index.html
原始地址
https://arxiv.org/abs/2308.02490
描述
我们提出了 MM-Vet,这是一种评估基准,用于检查复杂多模态任务上的大型多模态模型(LMM)。最近的 LMM 表现出了各种有趣的能力,例如解决黑板上写的数学问题、推理新闻图像中的事件和名人以及解释视觉笑话。模型的快速进步给评估基准的开发带来了挑战 ...