随着大型语言模型(LLM)的快速缩放,同时提供众多低级适应(LORAS)的服务变得越来越不切实际,导致了无法承受的成本,并且需要采用更有效的参数鉴定方法。在这项工作中,我们引入了部分旋转增强的低级适应(ProLora),这是一种内部共享机制,其中包括四个基本组成部分:广播降低,旋转增强,部分分发的细化和整流的初始化策略。作为洛拉(Lora)的超集,Prolora保留了其优势,并有效地避免了具有出色 ...
0 0 0 2025/05/14 arXiv:2402.16902v2 kkkrd
我们提出了一个具有可重构体系结构的Mamba加速器,该HTTP URL在本文中提出了三种新颖的方法。 (1)简化线性和元素操作的替代PE数组架构。对于线性操作,启用了连接到PE数组的还原树并执行还原操作 ...
0 0 0 2025/05/14 arXiv:2409.11440v1 wangjun
我们提出了一个神经编码器模型,该模型基于可伸缩的粗到精细的注意机制将图像转换为呈现标记。我们的方法是在图像到latex生成的上下文中评估的,我们介绍了一个新的数据集,这些数据集是现实世界中的数学表达式与乳胶标记配对的。我们表明,与使用基于CTC的模型的神经OCR技术不同,基于注意力的方法可以应对这项非标准的OCR任务 ...
0 0 0 2025/05/14 arXiv:1609.04938v2 kubileha
Panoptic图像分割是计算机视觉任务,即在图像中查找像素的组,并为其分配语义类别和对象实例标识符。由于其在机器人技术和自动驾驶中的关键应用,图像细分的研究变得越来越流行。因此,研究社区依靠公开可用的基准数据集来推动计算机视觉中的最新技术 ...
0 0 0 2025/05/14 arXiv:2206.07704v1 chenlei
自动编码器及其变体已广泛应用于异常,此HTTP URL先前的工作记忆启动的深层自动编码器提出了记忆以检测异常的记忆,但是它忽略了不同分辨率尺度之间的特征差异,因此我们在记录的多尺度上引入了尺度的特征和编码范围的多尺度,并介绍了量表的范围,并介绍了编码范围的编码,并构造了编码范围的编码范围。对于异常检测,即,此HTTP URL在相应的分辨率量表上以无监督学习过程中的原型特征更新插槽。对于异常检测,我 ...
0 1 0 2025/05/14 arXiv:2012.11113v1 18303473007
随着在电子商务等领域中大型语言模型(LLM)的使用越来越多,特定领域的概念评估基准对于评估其域功能至关重要。现有的LLM可能会在复杂的电子商务应用程序中生成事实错误的信息。因此,有必要建立电子商务概念基准 ...
0 0 0 2025/05/14 arXiv:2502.20196v1 la99
扩散模型最近在解决决策问题方面表现出了巨大的潜力,尤其是在生成行为计划(也称为扩散计划)方面。尽管许多研究表明了扩散计划的令人印象深刻的表现,但良好扩散计划者的关键组成部分背后的机制尚不清楚,并且在现有研究中,设计选择非常不一致。在这项工作中,我们通过在离线增强学习(RL)设置中进行的系统经验实验来解决这个问题,从而提供了对扩散计划的基本组成部分的实用见解 ...
0 0 0 2025/05/14 arXiv:2503.00535v1 chenlei
本课程是针对熟悉基本演算和线性代数的本科生的课程,将差分划分的延伸到更通用的矢量空间上的函数中,例如将矩阵输入矩阵并返回矩阵逆或分解的函数,并返回矩阵逆或分解,iDode solutions的衍生剂,甚至是随机函数的衍生剂,甚至是随机函数的衍生物。它强调了实用的计算应用,例如大规模优化和机器学习,必须重新构想衍生物才能通过复杂的计算来传播。该课程还讨论了导致“伴随”或“反向模式”分化的效率问题(a ...
0 0 0 2025/05/14 arXiv:2501.14787v1 SmartPig

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)