- 名称
- Florence-2: Advancing a Unified Representation for a Variety of Vision Tasks
- 描述
我们引入了Florence-2,这是一个新颖的建筑基础模型,具有针对各种计算机和建筑语言任务的统一的、基于提示的表示。虽然现有的大型建筑模型在迁移学习方面表现出色,但它们很难通过简单的这种指令执行各种任务,而意味着处理各种空间层次结构和语义粒度的复杂性。 Florence-2 旨在将文本提示作为任务指令,并以文本形式生成理想的结果,无论是字幕、对象检测、基础还是分割... ...