一译 —— 文档和论文翻译、对照阅读、讨论和社区

GenDec: A robust generative Question-decomposition method for Multi-hop reasoning

Multi-Hop QA（MHQA）涉及逐步推理以回答复杂的问题并找到多个相关的支持事实。但是，在多跳问答中，现有的大语言模型（LLMS）推理能力仍然是探索，这在回答多跳的问题时不足。此外，尚不清楚LLM是否遵循所需的推理链来达到正确的最终答案 ...

0 0 0 2025/04/07 arXiv:2402.11166v1 jwj5452365

Rethinking End-to-End 2D to 3D Scene Segmentation in Gaussian Splatting

事实证明，将多视图2D实例分割升级到辐射率字段可有效增强3D理解。现有的方法依靠直接匹配来端到端举重，从而产生较低的结果；或采用由复杂的预处理或后处理约束的两阶段解决方案。在这项工作中，我们设计了一种新的端到端对象感知的提升方法，称为Unified-Lift，该方法基于3D高斯表示提供了准确的3D分割 ...

0 0 0 2025/04/07 arXiv:2503.14029v1 JackWang

Lightweight Self-Attentive Sequential Recommendation

现代深度神经网络（DNNS）通过在各种顺序推荐任务上实现最先进的建议性能，从而极大地促进了顺序推荐系统的开发。给定一系列相互作用的项目，现有的基于DNN的顺序推荐器通常将每个项目嵌入唯一的向量中，以支持对用户兴趣的后续计算。但是，由于潜在的项目可能大量，嵌入顺序推荐器的矩阵的过度参数已成为一种内存瓶颈，可在资源受限的环境中有效部署，e ...

0 0 0 2025/04/07 arXiv:2108.11333v1 sbjincheng

The Endoscapes Dataset for Surgical Scene Segmentation, Object Detection, and Critical View of Safety Assessment: Official Splits and Benchmark

该技术报告详细概述了内窥镜，这是腹腔镜胆囊切除术（LC）视频的数据集，其针对自动评估的安全性评估（CVS）具有高度复杂的注释。内窥镜由三个不同的临床专家组成的201 LC视频和带有分段口罩，边界盒和简历评估的201 LC视频。总的来说，有11090帧用CVS注释和1933年的框架，并用工具和解剖界面框从201个视频和解剖结合盒中注释，以及来自201个视频中的50个带有工具和解剖学片段的201个视频 ...

0 0 0 2025/04/07 arXiv:2312.12429v3 Lydia1317

QuOTE: Question-Oriented Text Embeddings

我们提出报价（面向问题的文本嵌入），这是对检索功能增强生成（RAG）系统的一种新颖的增强，旨在改善文档表示形式以进行准确和细微的检索。与依赖嵌入原始文本块的传统抹布管道不同，引用了块的提示，该问题可以通过假设的问题来回答，从而丰富了表示空间。这更好地将文档嵌入与用户查询语义相一致，并有助于解决诸如歧义和与上下文相关性之类的问题 ...

0 0 0 2025/04/07 arXiv:2502.10976v1 jwj5452365

DarwinLM: Evolutionary Structured Pruning of Large Language Models

大型语言模型（LLM）在各种NLP任务中取得了重大成功。但是，它们的巨大计算成本限制了它们的广泛使用，尤其是在实时应用中。结构化修剪通过压缩模型并直接提供端到端速度改进，无论硬件环境如何，都可以提供有效的解决方案 ...

0 0 0 2025/04/07 arXiv:2502.07780v3 zhuangxialie

Exploring the Effect of Reinforcement Learning on Video Understanding: Insights from SEED-Bench-R1

思想链（COT）生成的最新进展显着提高了大语言模型（LLMS）的推理能力，并作为一种有效的后培训方法出现了强化学习（RL）。多模式的大语言模型（MLLM）继承了这种推理潜力，但在需要感知和逻辑推理的任务中仍然没有反应。为了解决这个问题，我们介绍了Seed Bench-R1，这是一种基准，旨在系统地评估视频理解中MLLM的训练后方法 ...

0 0 0 2025/04/07 arXiv:2503.24376v1 iris

Multi-Flow: Multi-View-Enriched Normalizing Flows for Industrial Anomaly Detection

通过提出了更为良好的异常检测方法，许多单视任务已得到相对较好的程度。但是，实际生产场景通常涉及复杂的工业产品，其属性可能不会被一个图像完全捕获。虽然基于流动的方法在单摄像机方案中已经很好地工作，但他们目前却不利用多视图数据中的先验 ...

0 0 0 2025/04/07 arXiv:2504.03306v1 15261487245

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）