预训练的语言模型(PLM)在培训和微调范式下的各种自然语言处理(NLP)任务中取得了巨大成功。 PLM具有大量参数,是计算密集型和渴望资源的。因此,已引入模型修剪以压缩大规模的PLM ...
0 0 0 2025/04/10 arXiv:2112.07198v1 kkkrd
预测点击率(CTR)是Web应用程序的一项基本任务,其中关键问题是为特征互动设计有效的模型。当前的方法论主要集中在单个样本中的建模特征相互作用上,同时忽略了可以用作增强预测的参考环境的潜在跨样本关系。为了弥补这种缺陷,本文开发了检索功能的 Transformer (大鼠),旨在获得样品内部和跨样品内部和跨样品中的细粒特征相互作用 ...
0 0 0 2025/04/10 arXiv:2404.02249v2 aulisa
随着在线购物、视频观看网站等在线服务中内容页面和交互按钮的增加,工业规模的推荐系统面临着多领域、多任务推荐的挑战。多任务、多领域推荐的核心是在给定多种用户行为的情况下 ...
0 1 0 2025/04/10 arXiv:2302.01115v3 ballontt
数据分析对于生成描述性统计的机器学习至关重要,支持更深入的理解和下游任务(例如数据评估和策划)。这项工作专门针对大型语言模型(Code-llms)的代码数据集进行分析,其中数据质量直接影响了诸如代码生成和摘要之类的任务。用编程语言概念来表征代码数据集可以使更好的见解和有针对性的数据策划 ...
0 0 0 2025/04/10 arXiv:2503.15571v1 李大人
在线教育平台通过提供动态和数字基础架构来大大改变了教育资源的传播。随着这种转变的进一步增强,大语言模型的出现(LLM)提高了这些平台的智能水平。但是,当前的学术基准为实际行业方案提供了有限的指导 ...
0 0 0 2025/04/10 arXiv:2409.16202v2 Dreamer
深度神经网络的最新进展已在密集的图像预测中取得了显着的跃升。但是,为简单起见,大多数现有方法的特征对齐问题仍然忽略了。 UPS采样和局部功能之间的直接像素添加导致具有未对准的上下文的特征地图,从而转化为预测中的错误分类,尤其是在对象边界上 ...
0 0 0 2025/04/10 arXiv:2108.07058v2 SGN001
在线广告是电子商务平台的主要收入来源。在当前的广告模式中,面向的目标是在线商店所有者,他们愿意支付额外费用以提高商店的位置。另一方面,品牌供应商也需要在商店中宣传其产品以提高品牌销售 ...
0 0 0 2025/04/10 arXiv:2408.09885v1 aulisa
多元时间序列数据通过利用跨多个维度的信息来确保在实际情况下的广泛适用性,为未来的预测提供了强大的框架。但是,它们的高维度和混合模式在建立历史和未来序列之间的可解释和明确映射方面以及提取长期特征依赖性方面面临着重大挑战。为了应对这些挑战,我们为多变量时间序列预测(名为MTS-Unmixer)提出了一个频道时间双重混合网络,该网络将整个系列分解为关键基础和系数,并在时间和频道维度上分解为关键基础和系数 ...
0 0 0 2025/04/10 arXiv:2411.17770v1 徐小五

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)