一译 —— 文档和论文翻译、对照阅读、讨论和社区

Reducing Hallucinations of Medical Multimodal Large Language Models with Visual Retrieval-Augmented Generation

多模式的大语言模型（MLLM）在视觉和文本任务中表现出令人印象深刻的表现。但是，幻觉仍然是一个重大挑战，尤其是在细节至关重要的医疗保健领域。在这项工作中，我们展示了如何增强MLLM来支持Visual Rag（V-RAG），这是一种检索型生成框架，该框架合并了来自检索的图像的文本和视觉数据 ...

0 0 0 2025/03/27 arXiv:2502.15040v1 maomaochong

Deep Clustering: A Comprehensive Survey

聚类分析在机器学习和数据挖掘中起着必不可少的作用。学习良好的数据表示对于聚类算法至关重要。最近，深层聚类可以使用深神经网络学习聚类友好的表示，已广泛应用于各种聚类任务 ...

0 0 0 2025/03/27 arXiv:2210.04142v1 TimeXZone

M3Net: Multimodal Multi-task Learning for 3D Detection, Segmentation, and Occupancy Prediction in Autonomous Driving

自动驾驶的感知系统通常需要处理多种不同的子任务。但是，当前的算法通常会分别处理单个子任务，这在获得全面感知结果时会导致效率低。一些多任务学习方法试图将多个任务与一个模型统一，但不要解决多任务学习中的冲突 ...

0 0 0 2025/03/27 arXiv:2503.18100v1 sodalone

MoEfication: Transformer Feed-forward Layers are Mixtures of Experts

最近的工作表明，预训练 Transformer 中的前馈网络（ffn）是一个关键组件，存储各种语言和事实知识。然而，ffn的计算模式仍不清楚。在这项工作中，我们研究了ffn的计算模式，并观察到大多数输入仅激活ffn的一小部分神经元... ...

0 1 0 2025/03/27 arXiv:2110.01786v3 lockee

Agent models: Internalizing Chain-of-Action Generation into Reasoning models

传统的代理工作流程依靠外部提示来管理与工具和环境的互动，这限制了推理模型的自主权。我们定位\ emph {大型代理模型（LAMS）}，该模型内部化\ emph {emph {-Action（COA）}的生成，使模型能够自主决定何时以及如何使用外部工具。我们提出的AutoCOA框架结合了监督的微调（SFT）和增强学习（RL），使模型可以在推理和行动之间无缝切换，同时有效地管理环境交互 ...

0 0 0 2025/03/27 arXiv:2503.06580v1 yanxi

Quantum Complex-Valued Self-Attention Model

自我发挥的机制已经彻底改变了古典机器学习，但其量子对应物在充分利用量子状态的代表力方面仍未得到充满反感。当前的量子自我发场模型通过忽略量子系统中必不可少的相位信息而表现出关键的限制，而将注意力的权重压缩为实现重叠的重叠。为了解决这一基本差距，我们提出了量子复合物值的自我注意模型（QCSAM），这是第一个明确利用量子状态之间复杂值相似性来捕获幅度和相位关系的第一个框架 ...

0 0 0 2025/03/27 arXiv:2503.19002v1 oracle

Solving Capacitated Vehicle Routing Problem with Quantum Alternating Operator Ansatz and Column Generation

这项研究提出了一种混合量子古典方法，用于通过将列的生成（CG）方法与量子交替的操作员ANSATZ（Qaoansatz）整合在一起来解决电容的车辆路线问题（CVRP）。 CG方法将CVRP划分为减少的主问题，该问题找到了路由集合下的路由的最佳组合，以及一个或多个子问题，这会生成有益于添加到路由集合的路由。通过添加通过子问题识别的新路由进行迭代完善，并继续进行，直到找不到改进路线为止 ...

0 0 0 2025/03/27 arXiv:2503.17051v1 oracle

Robust agents learn causal world models

长期以来，人们一直认为因果推理在健壮和一般情报中起着基本作用。但是，尚不清楚代理是否必须学习因果模型才能概括为新领域，或者其他电感偏见是否足够。我们回答了这个问题，表明任何能够满足大量分配转移束缚的遗憾的代理都必须学会了数据生成过程的近似因果模型，该过程将其收敛到最佳代理的真实因果模型 ...

0 0 0 2025/03/27 arXiv:2402.10877v7 firefly2024

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）