传统上,写作助理(例如,语法,微软副作用)通过采用句法和语义变化来描述图像成分,从而产生多样的图像标题 ...
0 0 0 2025/03/17 arXiv:2503.10997v1 my_lsz
尽管融合了外部知识来源,但检索增强发电(RAG)系统仍然容易受到幻觉答案的影响。我们提出了一个框架,该框架解决了现有幻觉检测方法中的两个关键局限性:(1)基于传统编码器方法的上下文窗口限制,以及(2)基于LLM的方法的计算效率低下。以Modernbert的扩展上下文功能(最高为8K Token )为基础,并在Ragtruth基准数据集上进行了培训,我们的方法的表现优于所有以前的基于编码器的模型和最 ...
0 0 0 2025/03/17 arXiv:2502.17125v1 leec
尽管诸如剪辑之类的视觉模型在开放式摄影任务中表现出了很大的成功,但他们的应用程序目前仅限于图像级任务,并且他们仍然在密集的预测中挣扎。最近的作品通常将这种缺乏症状的缺乏归因于最终区块中的自我发项层,并通过将原始查询关注的注意力修改为自我相关的关注来获得值得称赞的结果(例如, ...
0 0 0 2025/03/17 arXiv:2411.15851v1 Archer
我们研究进行对齐审核的可行性:对模型是否具有不希望的目标的调查。作为测试台,我们训练具有隐藏目标的语言模型。我们的培训管道首先向模型讲述了RLHF奖励模型(RMS)中可利用的错误,然后训练模型以利用其中一些错误 ...
0 0 0 2025/03/17 arXiv:2503.10965v1 leec
时间序列预测是在天气预测,股票市场分析,科学模拟和工业过程分析等领域的重要应用中的重要挑战。在这项工作中,我们介绍了LMS-AUTOTSF,这是一个新颖的时间序列预测体系结构,该体系结构结合了自相关,同时利用以多个尺度运行的双重编码器。与依靠预定义趋势和季节性组件的模型不同,LMS-AUTOTSF每个量表采用两个独立的编码器:一种专注于低通滤波以捕获趋势,而另一种则利用高通滤波来模型季节性变化 . ...
0 1 0 2025/03/17 arXiv:2412.06866v3 wlp
深度神经网络(DNN)容易受到模型窃取攻击的影响,该攻击允许使用训练数据集的数据限制对手,可以克服目标模型的功能,只需使用Black-box查询访问即可。这种攻击通常是通过使用从替代数据集合成生成或采样的输入来构建标记的数据集的。对手可以使用此标记的数据集来训练克隆模型,该模型可以达到与目标模型相当的分类精度 ...
0 0 0 2025/03/17 arXiv:1911.07100v1 zhanjanis
应用于权重、激活和 KV 缓存的训练后量化 (PTQ) 技术极大地减少了大型语言模型 (LLM) 的内存使用、延迟和功耗,但在存在异常值时可能会导致较大的量化误差。旋转激活或权重矩阵有助于消除异常值并有利于量化。在这项工作中,我们确定了一系列适用的旋转参数化,这些旋转参数化可以在全精度 Transformer 架构中产生相同的输出,同时提高量化精度 ...
0 0 0 2025/03/17 arXiv:2405.16406v4 冷空气
大约最近的邻居搜索(ANN)已成为数据库和AI基础架构的关键组成部分。不断增加的矢量数据集在ANN服务的性能,成本和准确性方面构成了重大挑战。没有现代的ANNS系统可以同时解决这些问题 ...
0 0 0 2025/03/17 arXiv:2409.16576v1 李大人

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)