检索增强的生成(RAG)系统通常会被其重新播放模块瓶颈,该模块通常独立评分段落并选择固定的TOP-K大小。这种方法与需要跨多个文档合成证据的复杂多跳的查询进行斗争,从而创造了一个折衷的,其中小k值省略了关键信息,而大k值则引入了噪声。为了解决这个问题,我们介绍了动态通道选择器(DPS),这是一种新颖的重新依赖框架,将通道选择视为有监督的学习问题 ...
0 0 0 2025/09/17 arXiv:2508.09497v1 kennithli123
在本文中,我们为大型语言模型(LLM)引入了一种新的训练后压缩范例,以促进其更广泛的采用。我们深入研究了LLM权重低秩分解,发现该任务的挑战源于LLM激活中的离群现象以及各种层之间的敏感性差异。为了解决这些问题,我们提出了一种免训练的方法,称为激活感知奇异值分解(ASVD) ...
0 0 0 2025/09/17 arXiv:2312.05821v5 szfmsmdx
尽管单击准确性提高了(PASS@1),但通过增强奖励(RLVR)的微调大语言模型(LLM)的中心悖论是频繁降级(PASS@k)。这通常伴随着灾难性的遗忘,模型失去了以前获得的技能。尽管已经提出了各种方法,但差异项的选择和功能令人惊讶地尚未作为主动解决方案 ...
0 0 0 2025/09/17 arXiv:2509.07430v1 bage
大型语言模型(LLMS)在各种任务中都表现出了出色的表现。但是,它们的大量规模可导致推理期间的大量计算资源消耗,从而导致高成本。因此,Edge设备推断提出了有希望的解决方案 ...
0 0 0 2025/09/17 arXiv:2506.10443v1 yunfeng
随着对机上大语言模型(LLM)推断的需求的增长,能源效率已成为主要问题,尤其是对于电池有限的移动设备而言。我们的分析表明,有内存的LLM解码阶段占主导地位,但大多数现有作品都集中在加速预填充阶段,忽略了能源问题。我们介绍自适应能源为中心的核心选择(AEC),并将其集成到MNN中,以创建节能版本MNN-AEC,这是第一个发动机级系统解决方案,而无需进行能力效率的LLM解码的根访问或OS修改 ...
0 0 0 2025/09/17 arXiv:2506.19884v1 yunfeng
半结构化表,广泛用于现实世界应用程序(例如财务报告,医疗记录,交易订单),通常涉及灵活且复杂的布局(e ...
0 0 0 2025/09/17 arXiv:2508.18190v3 sunshine
由于需要处理的各种场景,对象和天气条件,汽车交通场景很复杂。与更受限的环境(例如自动地下火车)相反,汽车感知系统不能量身定制为特定任务的狭窄领域,但必须处理不可预见的事件的不断变化的环境。由于目前尚无单个传感器能够可靠地感知周围环境中的所有相关活动,因此传感器数据融合可用于感知尽可能多的信息 ...
0 0 0 2025/09/17 arXiv:2106.14087v1 cheslee_z
介质水平是宏观和微观世界之间的桥梁,解决了两者都忽视的差距。图像操纵定位(IML)是一种从假图像中追求真相的关键技术,长期以来一直依赖于低级(微观级别)痕迹。但是,实际上,大多数篡改旨在通过改变图像语义来欺骗观众 ...
0 0 0 2025/09/17 arXiv:2412.13753v1 sunshine3399

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)