- 名称
- FORGE: Forming Semantic Identifiers for Generative Retrieval in Industrial Datasets
- 描述
语义标识符(SIDS)由于其有意义的语义可辨别性,因此在生成检索(GR)中引起了人们的关注。但是,当前对SIDS的研究面临三个主要挑战:(1)缺乏具有多模式特征的大型公共数据集,(2)对SID生成优化策略的有限调查,通常依靠昂贵的GR培训进行评估,以及(3)在工业部署中慢慢的在线融合。为了应对这些挑战,我们提出了Forge,这是通过工业数据集在生成检索中形成语义标识符的综合基准 ...