一译 —— 文档和论文翻译、对照阅读、讨论和社区

Symmetry and Group in Attribute-Object Compositions

属性和物体可以构成各种组成。为了建模这些一般概念的组成性质，是通过转换（例如耦合和去耦）学习它们的好选择。但是，复杂的转换需要满足特定原则以确保合理性 ...

0 0 0 2025/05/04 arXiv:2004.00587v1 kkkkk

Open World Compositional Zero-Shot Learning

组成零射击学习（CZSL）需要识别训练期间看不见的状态对象组成。在这项工作中，我们没有在开放世界中运作，而不是假设对看不见的作品的先验知识，在该环境中，搜索空间包含大量未见构图，其中一些可能是不可行的。在这种情况下，我们从视觉特征和组成嵌入之间的余弦相似性开始 ...

0 0 0 2025/05/04 arXiv:2101.12609v3 kkkkk

Learning Graph Embeddings for Compositional Zero-shot Learning

在组成零射的学习中，目标是识别观察到的视觉原始态的看不见的组成（例如老狗）（e ...

0 0 0 2025/05/04 arXiv:2102.01987v3 kkkkk

Task-Driven Modular Networks for Zero-Shot Compositional Learning

人类智能的标志之一是能够将学习的知识撰写成新颖的概念，而这些知识可以在没有单个培训示例的情况下被认可。相反，当前的最新方法需要为每个可能的类别进行数百个培训示例，以构建可靠和准确的分类器。为了减轻效率的显着差异，我们提出了一个任务驱动的模块化体系结构，用于组成推理和样本有效学习 ...

0 0 0 2025/05/04 arXiv:1905.05908v1 kkkkk

Attributes as Operators: Factorizing Unseen Attribute-Object Compositions

我们提出了一种建模视觉属性的新方法。先前的工作将属性与对象相似，学习属性的潜在表示（例如， ...

0 0 0 2025/05/04 arXiv:1803.09851v2 kkkkk

Why Do Multi-Agent LLM Systems Fail?

尽管对多代理系统（MAS）的热情越来越多，在该系统中，多个LLM代理商协作完成任务，但与单个代理框架相比，它们在流行的基准测试中的性能提高仍然很小。这一差距强调了分析阻碍MAS效力的挑战的必要性。在本文中，我们介绍了对MAS挑战的首次全面研究 ...

0 0 0 2025/05/04 arXiv:2503.13657v2 zhushiyun

SCOT: Self-Supervised Contrastive Pretraining For Zero-Shot Compositional Retrieval

构图图像检索（CIR）是一项多模式学习任务，其中模型将查询图像与用户提供的文本修改结合在一起以检索目标图像。 CIR在包括产品检索（电子商务）和Web搜索在内的各个领域中找到了应用程序。现有的方法主要集中于完全监督的学习，其中在诸如FashionIQ和CIRR等标记的三胞胎数据集上培训了其中的模型 ...

0 0 0 2025/05/04 arXiv:2501.08347v1 Archer

Imagine and Seek: Improving Composed Image Retrieval with an Imagined Proxy

零射击组成的图像检索（ZSCIR）需要检索与查询图像和相对标题相匹配的图像。当前的方法着重于将查询图像投影到文本特征空间中，随后将它们与查询文本的特征结合在一起。但是，仅使用文本功能检索图像不能保证由于图像和文本之间的自然差距而详细的对齐 ...

0 0 0 2025/05/04 arXiv:2411.16752v2 Archer

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）