点击率(CTR)预测在推荐系统,在线广告和搜索引擎中起着至关重要的作用。当前的大多数方法模型通过堆叠或并行结构都具有相互作用,其中有些使用知识蒸馏进行模型压缩。但是,我们通过这些方法观察到一些局限性:(1)在并行结构模型中,明确和隐式组件是独立且同时执行的,从而导致功能集中的信息共享不足 ...
点击率 (CTR) 预测对于在线个性化平台至关重要。最近的进展表明,对丰富的用户行为进行建模可以显着提高点击率预测的性能。当前的长期用户行为建模算法主要遵循两个级联阶段 ...
在本文中,我们介绍了EdgeFace,这是一个受EdgeNext的混合体系结构启发的轻巧有效的面部识别网络。通过有效地结合了CNN和 Transformer 模型的强度,以及低级线性层,EdgeFace实现了针对边缘设备优化的出色面部识别性能。提议的边缘网络不仅保持低计算成本和紧凑的存储,而且还达到了高面识别精度,使其适合在边缘设备上部署 ...
多模式顺序推荐系统利用辅助信号(例如,文本,图像)来减轻用户项目交互中的数据稀疏性 ...
本文解决了从单个图像观察中与对象相互作用的手相互作用的3D姿势估计的任务。在对手动相互作用进行建模时,先前的作品主要利用接近性提示,同时忽略手动必须稳定地掌握对象以抵消重力的动力学性质,从而阻止对象滑动或下降。这些作品无法在估计中利用动态约束,因此通常会产生不稳定的结果 ...
实体是我们如何代表和汇总知识的核心。例如,Wikipedia等百科全书是由实体构成的(例如 ...
过多兼容的 Transformer 网络是大语言模型(LLMS)的最新体系结构。但是,这样的模型包含数十亿个参数,使大量计算是必要的,同时引起了环境问题。为了解决这些问题,我们提出了FinerCut,这是一种新形式的细粒层修剪,与在 Transformer 块级别上的先前工作相反,它考虑了所有自我注意事项和饲料前向网络(FFN)层,是个单个修剪候选者 ...
自2008年以来,在提出比特币电子现金系统的提议之后,比特币在过去十年中从根本上改变了经济体系。自2022年以来,大型语言模型(LLM)(例如GPT)在许多现实生活中都超越了人类。但是,这些大型语言模型有几个实际问题 ...