一译 —— 文档和论文翻译、对照阅读、讨论和社区

Leveraging LLMs for Unsupervised Dense Retriever Ranking

在本文中，我们提出了大型语言模型辅助检索模型排名（Larmor），这是一种有效的无监督方法，利用LLMS选择在测试语料库（Target）上使用哪种密集的猎犬。密集的检索器选择对于许多依赖于使用公共语料库培训的密集检索器来编码或搜索新的私人目标语料库的应用程序至关重要。这是因为当面对域移动时，下游的语料库，域或目标语料库的任务与域/任务不同，培训了密集的猎犬，其性能通常会下降 ...

0 0 0 2025/03/20 arXiv:2402.04853v2 WDD

Slim attention: cut your context memory in half without loss of accuracy -- K-cache is all you need for MHA

SLIM注意力将上下文存储器大小缩小了2倍，对于具有MHA（多头注意力）的 Transformer 模型，该模型可以加快对大上下文窗口的推理高达2倍。纤细的注意力是标准注意机制的确切，数学相同的实现，因此不会损害模型的准确性。换句话说，纤细的注意力无误地将上下文记忆压缩了2倍 ...

0 0 0 2025/03/20 arXiv:2503.05840v1 zzz111

GPL: Generative Pseudo Labeling for Unsupervised Domain Adaptation of Dense Retrieval

密集检索方法可以克服词汇差距并显着改善搜索结果。然而，它们需要大量的训练数据，而这对于大多数领域来说是不可用的。如之前的工作所示（ thakur等人... ...

0 0 0 2025/03/20 arXiv:2112.07577v3 cjwbuaa

Multimodal Mamba: Decoder-only Multimodal State Space Model via Quadratic to Linear Distillation

最近的多模式大型语言模型（MLLM）取得了出色的性能，但由于其二次计算复杂性，增长的键值缓存要求以及依赖单独的视觉编码器而面临部署挑战。我们提出了Mmmamba，这是一个框架，用于通过使用中等学术计算资源从现有的MLLM进行逐步蒸馏来开发线性复杂性本地多模式空间模型。我们的方法使只有训练有素的单位MLLM直接转换为线性复杂体系结构，而无需进行预先训练的RNN LLM或视觉编码器 ...

0 0 0 2025/03/20 arXiv:2502.13145v2 Ultra

On the power of data augmentation for head pose estimation

在过去的十年中，深入学习在预测人头构成的单眼图像中取得了令人印象深刻的成功。但是，对于野外投入，研究界主要依赖于单一的训练集，即300W-LP，具有半合成性质，没有许多选择。本文着重于逐步扩展和改进数据，以进一步探索可通过增强和合成策略实现的性能 ...

0 0 0 2025/03/20 arXiv:2407.05357v3 No_fake

Critic-V: VLM Critics Help Catch VLM Errors in Multimodal Reasoning

视觉语言模型（VLM）在多模态推理任务中显示出显着的进步。然而，由于幻觉的图像理解或不完善的推理路径等问题，它们仍然经常产生不准确或不相关的响应。为了应对这些挑战，我们引入了 Critic-V，这是一种受 Actor-Critic 范式启发的新颖框架，旨在提高 VLM 的推理能力 ...

0 0 0 2025/03/20 arXiv:2411.18203v4 ttt

Learning More Effective Representations for Dense Retrieval through Deliberate Thinking Before Search

最近的密集检索器通常在大语言模型（LLMS）的紧急功能上壮成长，使用它们将查询和文档编码为嵌入空间以进行检索。这些基于LLM的浓缩犬在各种检索方案中都表现出了有希望的表现。但是，依靠单个嵌入来表示文档，证明在捕获不同的文档视角以进行匹配方面有效 ...

0 0 0 2025/03/20 arXiv:2502.12974v1 peter0214

Attentive Reasoning Queries: A Systematic Method for Optimizing Instruction-Following in Large Language Models

我们提出了细心的推理查询（ARQ），这是一种新型的结构化推理方法，可通过域特有的推理蓝图显着改善大语言模型中的指导跟踪。尽管LLMS在各种任务中都表现出了出色的功能，但它们通常无法在多转交谈中遵守复杂的，用例的指令，从而对业务至关重要的应用提出了挑战。 ARQ通过引导LLM通过有针对性查询的系统推理步骤来解决此限制，从而恢复关键指示并促进整个完成过程中的中间推理 ...

0 0 0 2025/03/20 arXiv:2503.03669v1 leec

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）