arxiv Real Classification by Description: Extending CLIP's Limits of Part Attributes Recognition

名称
Real Classification by Description: Extending CLIP's Limits of Part Attributes Recognition
首页
https://yiyibooks.cn/arxiv/2412.13947v1/index.html
原始地址
https://arxiv.org/pdf/2412.13947
描述
在这项研究中,我们通过描述定义和解决零拍摄的“真实”分类,这是一个新的任务,该任务评估了视觉模型(VLMS)(例如剪辑)之类的能力,例如剪辑,仅根据描述性属性对对象进行分类,不包括对象类名称。这种方法突出了VLM在理解复杂的对象描述中的当前局限性,将这些模型推向了仅仅是对象识别。为了促进这种探索,我们引入了一个新的挑战,并发布了六个流行的细粒基准的数据,该数据省略了对象名称,以鼓励研究社区内的真正的零拍学习 ...