大型多模态模型(LMM)的最新进展已经认识到细粒度基础是视觉理解和对话的必要因素。然而,LMM 中这种表示的好处仅限于自然图像领域,并且这些模型在遥感 (RS) 方面表现不佳。高分辨率遥感图像中独特的俯视视角、尺度变化和小物体的存在给区域级理解带来了独特的挑战 ...

0 0 0 0 2025/01/25 arXiv:2501.13925v1 chengwenxuan7