/documents/73331/
基本信息
文件基本信息
名称
TIIF-Bench: How Does Your T2I Model Follow Your Instructions?
描述
文本到图像 (T2I) 模型的快速发展迎来了人工智能生成内容的新阶段,其标志是解释和遵循用户指令的能力不断增强。然而,现有的T2I模型评估基准在提示多样性和复杂性有限以及评估指标粗略方面存在不足,使得难以评估文本指令和生成图像之间的细粒度对齐性能。在本文中,我们提出了 TIIF-Bench(文本到图像指令遵循基准),旨在系统地评估 T2I 模型解释和遵循复杂文本指令的能力。 TIIF-Bench 包含一组按多个维度组织的 5000 个提示,分为三个难度和复杂性级别。为了严格评估模型对不同提示长度的鲁棒性,我们为每个提示提供了具有相同核心语义的短版本和长版本。引入文本渲染和风格控制这两个关键属性来评估文本合成的精度和 T2I 模型的美学连贯性。此外,我们还收集了100条高质量的设计师级提示,涵盖各种场景,以全面评估模型性能。利用大型视觉语言模型中编码的世界知识,我们提出了一种新颖的可计算框架来识别 T2I 模型输出中的细微变化。通过在 TIIF-Bench 上对主流 T2I 模型进行细致的基准测试,我们分析了当前 T2I 模型的优缺点,并揭示了当前 T2I 基准测试的局限性。项目页面:此 https URL ...