向量量化(VQ)是一种适合硬件的DNN压缩方法,可以降低硬件加速器的存储成本和重量加载数据。但是,传统的VQ技术会导致明显的准确性损失,因为重要的权重不能很好地保存。为了解决这个问题,提出了一种称为MVQ的新方法,该方法旨在更好地近似数量有限的代码字的重要权重 ...
0 0 0 2025/04/27 arXiv:2412.10261v2 libai
在生物大脑的皮层中观察到了侧向抑制作用,并且已经在其在认知功能中的作用进行了广泛的研究。但是,在深度学习中的香草版本反向传播中,所有梯度(可以理解为信号和噪声梯度)在重量更新过程中流过网络。这可能会导致过度拟合 ...
0 0 0 2025/04/27 arXiv:2208.06918v1 libai
我们介绍了熵引导的序列加权(EGSW),这是一种新颖的方法,通过根据其优势和基于增强学习的大型语言模型微调的优势和熵将权重动态分配给生成的输出,从而增强了探索 - 探索折衷的权衡。 EGSW将熵正则和基于优势的加权整合到平衡策略更新,从而在高维状态空间中有效探索。通过在序列上采用温度尺寸的软效果加权,EGSW在保持训练稳定性的同时优先考虑高回报,高度确定的步骤 ...
0 0 0 2025/04/27 arXiv:2503.22456v2 cocoyo
在检索提升生成(RAG)中的最新进步通过将大型语言模型(LLM)与外部信息检索相结合,跨不同应用程序的准确,最新和可验证的文本生成,彻底改变了自然语言处理。但是,评估抹布系统由于结合了检索和发电组件的混合体系结构以及对LLM时代的动态知识来源的依赖而提出了独特的挑战。作为回应,本文提供了对抹布评估方法和框架的全面调查,系统地审查了传统和新兴评估方法,以实现LLM时代的系统性能,事实准确性,安全性, ...
0 0 0 2025/04/27 arXiv:2504.14891v1 kkx
图数据库在高度互连的数据域中越来越关注,并且对大数据有效查询的需求正在增加。我们注意到图形数据库查询中有重复的模式,这些模式的结果可以首先存储为实现视图,这可以加快查询速率。因此,我们在属性图上提出了实质性的视图,包括三个部分:使用视图查看创建,查看维护和查询优化,我们首次提出了一种有效的模板视图维护方法,用于包含可变长度的边缘,可以将其应用于多个图形数据库 ...
0 0 0 2025/04/27 arXiv:2411.18847v1 ifzz
前景细分对于现场理解至关重要,而视觉基础模型(VFM)的参数有效的微调(PEFT)通常在复杂的场景中(例如伪装和红外图像)失败。我们将这一挑战归因于VFMS中固有的纹理偏置,在微调和限制纹理 - 质量环境中的概括过程中,这种挑战会加剧。为了解决这个问题,我们提出了梯形偏见表示侧调(LSR-ST),这是一种轻巧的PEFT框架,通过引入形状偏见的电感先验来增强模型鲁棒性 ...
0 0 0 2025/04/26 arXiv:2504.14481v1 link.yu
随着AI生成的内容(AIGC)和移动设备的扩散的重大进展,通过无线网络提供高质量的AIGC服务正在成为未来的方向。但是,无线网络中AIGC服务提供的主要挑战在于不稳定的渠道,有限的带宽资源以及分布不均的计算资源。为此,本文提出了语义通信(SEMCOM)授权的AIGC(SEMAIGC)生成和传输框架,其中仅应使用SEMCOM生成和传输内容的内容的语义信息,而不是所有二进制位 ...
0 0 0 2025/04/26 arXiv:2310.17705v3 HaoLiu0209
近年来,已经对基于深度学习的图像denoising方法进行了广泛的研究,并在许多公共基准数据集中盛行。但是,统计数据在计算上太昂贵了,无法直接应用于移动设备上。在这项工作中,我们提出了一个轻巧,高效的基于神经网络的原始图像Denoiser,它可以在主流移动设备上平稳运行,并产生高质量的Denosing结果 ...
0 0 0 2025/04/26 arXiv:2010.06935v1 15528091895

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)