arxiv Leveraging Large Language Models for Multimodal Search

名称
Leveraging Large Language Models for Multimodal Search
首页
https://yiyibooks.cn/arxiv/2404.15790v1/index.html
原始地址
https://arxiv.org/pdf/2404.15790
描述
多模态搜索在为用户提供自然有效的表达搜索意图的方式方面变得越来越重要。图像提供所需产品的细粒度细节,而文本则允许轻松合并搜索修改。然而,一些现有的多模式搜索系统不可靠并且无法解决简单的查询 ...