vicky的文档

vicky

vicky

个性签名 ...

Modeling Caption Diversity in Contrastive Vision-Language Pretraining

为图像添加标题的方法有一千种。另一方面，对比语言预训练 (CLIP) 的工作原理是将图像及其标题映射到单个向量 - 限制类 CLIP 模型表示描述图像的不同方式的能力。在这项工作中，我们介绍了 Llip，潜在语言图像预训练，它对可以匹配图像的字幕的多样性进行建模 ...

0 0 0 0 2024/10/11 arXiv:2405.00740v3 vicky

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您在阅读时勇敢地改正翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）

文件上传进度

0%

上传成功 0 个文件