Multi-Hop QA(MHQA)涉及逐步推理以回答复杂的问题并找到多个相关的支持事实。但是,在多跳问答中,现有的大语言模型(LLMS)推理能力仍然是探索,这在回答多跳的问题时不足。此外,尚不清楚LLM是否遵循所需的推理链来达到正确的最终答案 ...
0 0 0 2025/04/07 arXiv:2402.11166v1 jwj5452365
事实证明,将多视图2D实例分割升级到辐射率字段可有效增强3D理解。现有的方法依靠直接匹配来端到端举重,从而产生较低的结果;或采用由复杂的预处理或后处理约束的两阶段解决方案。在这项工作中,我们设计了一种新的端到端对象感知的提升方法,称为Unified-Lift,该方法基于3D高斯表示提供了准确的3D分割 ...
0 0 0 2025/04/07 arXiv:2503.14029v1 JackWang
现代深度神经网络(DNNS)通过在各种顺序推荐任务上实现最先进的建议性能,从而极大地促进了顺序推荐系统的开发。给定一系列相互作用的项目,现有的基于DNN的顺序推荐器通常将每个项目嵌入唯一的向量中,以支持对用户兴趣的后续计算。但是,由于潜在的项目可能大量,嵌入顺序推荐器的矩阵的过度参数已成为一种内存瓶颈,可在资源受限的环境中有效部署,e ...
0 0 0 2025/04/07 arXiv:2108.11333v1 sbjincheng
该技术报告详细概述了内窥镜,这是腹腔镜胆囊切除术(LC)视频的数据集,其针对自动评估的安全性评估(CVS)具有高度复杂的注释。内窥镜由三个不同的临床专家组成的201 LC视频和带有分段口罩,边界盒和简历评估的201 LC视频。总的来说,有11090帧用CVS注释和1933年的框架,并用工具和解剖界面框从201个视频和解剖结合盒中注释,以及来自201个视频中的50个带有工具和解剖学片段的201个视频 ...
0 0 0 2025/04/07 arXiv:2312.12429v3 Lydia1317
我们提出报价(面向问题的文本嵌入),这是对检索功能增强生成(RAG)系统的一种新颖的增强,旨在改善文档表示形式以进行准确和细微的检索。与依赖嵌入原始文本块的传统抹布管道不同,引用了块的提示,该问题可以通过假设的问题来回答,从而丰富了表示空间。这更好地将文档嵌入与用户查询语义相一致,并有助于解决诸如歧义和与上下文相关性之类的问题 ...
0 0 0 2025/04/07 arXiv:2502.10976v1 jwj5452365
大型语言模型(LLM)在各种NLP任务中取得了重大成功。但是,它们的巨大计算成本限制了它们的广泛使用,尤其是在实时应用中。结构化修剪通过压缩模型并直接提供端到端速度改进,无论硬件环境如何,都可以提供有效的解决方案 ...
0 0 0 2025/04/07 arXiv:2502.07780v3 zhuangxialie
思想链(COT)生成的最新进展显着提高了大语言模型(LLMS)的推理能力,并作为一种有效的后培训方法出现了强化学习(RL)。多模式的大语言模型(MLLM)继承了这种推理潜力,但在需要感知和逻辑推理的任务中仍然没有反应。为了解决这个问题,我们介绍了Seed Bench-R1,这是一种基准,旨在系统地评估视频理解中MLLM的训练后方法 ...
0 0 0 2025/04/07 arXiv:2503.24376v1 iris
通过提出了更为良好的异常检测方法,许多单视任务已得到相对较好的程度。但是,实际生产场景通常涉及复杂的工业产品,其属性可能不会被一个图像完全捕获。虽然基于流动的方法在单摄像机方案中已经很好地工作,但他们目前却不利用多视图数据中的先验 ...
0 0 0 2025/04/07 arXiv:2504.03306v1 15261487245

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)