直播推荐系统是连接用户和作者之间实时交互模式的关键基础设施。与传统的工业推荐系统类似,直播推荐也依靠级联架构来支持大规模并发。生成推荐领域的最新进展将多阶段推荐过程与基于 Transformer 的架构相结合,提供了改进的可扩展性和更高的计算效率。然而,直播固有的复杂性阻碍了这些方法直接转移到直播场景,其中不断发展的内容、有限的生命周期、严格的实时约束和异构多目标引入了独特的挑战,使静态标记化和传统模型框架失效。为了解决这些问题,我们提出了OneLive,一个专为直播场景量身定制的动态统一生成推荐框架。 OneLive 集成了四个关键组件:(i) 动态分词器,通过残差量化不断编码与行为信号融合的不断演变的实时直播内容; (ii) 时间感知门控注意力机制,可明确模拟时间动态,以便及时做出决策; (iii) 高效的仅解码器生成架构,通过 Sequential MTP 和 QK Norm 增强,以实现稳定训练和加速推理; (iv) 统一的多目标调整框架加强了针对个性化偏好的政策优化 ...

0 0 0 0 2026/02/10 arXiv:2602.08612v1 zheey