/documents/73335/
基本信息
文件基本信息
名称
Fine-grained Image Aesthetic Assessment: Learning Discriminative Scores from Relative Ranks
描述
图像美学评估(IAA)在内容创作、相册管理和推荐系统等方面有着广泛的应用。在这些应用中,通常需要从一系列具有微妙美学变化的图像中挑选出最美观的图像,我们将这个话题称为细粒度IAA。不幸的是,最先进的 IAA 模型通常是为粗粒度评估而设计的,其中具有显着审美差异的图像是在绝对规模上独立评估的。这些模型本质上在区分细粒度的审美差异方面受到限制。为了解决这个困境,我们贡献了 FGAesthetics,这是一个细粒度的 IAA 数据库,其中包含 32,217 张图像,组织成 10,028 个系列,这些图像来自不同的类别,包括自然、AIGC 和裁剪。通过每个系列内的成对比较来收集注释。我们还设计了系列细化和等级校准来确保数据和标签的可靠性。基于 FGAesthetics,我们进一步提出了 FGAesQ,这是一种新颖的 IAA 框架,它通过保留差异的标记化(DiffToken)、比较文本辅助对齐(CTAlign)和排名感知回归(RankReg)从相对排名中学习有区别的审美分数。 FGAesQ 能够在细粒度场景中实现准确的美学评估,同时在粗粒度评估中仍保持有竞争力的性能。大量的实验和比较证明了该方法的优越性 ...