/documents/68726/
基本信息
文件基本信息
名称
Cross DQN: Cross Deep Q Network for Ads Allocation in Feed
描述
电子商务平台通常会在 Feed 中显示广告和有机项目的混合列表。一个关键问题是如何分配 feed 中有限的时段,以最大化整体收入并改善用户体验,这需要一个良好的用户偏好模型。排列信号不是对单个项目对用户行为的影响进行建模,而是对项目排列的影响进行建模,并可能导致更好的分配策略。然而,大多数先前的策略无法对此类信号进行建模,因此导致性能不佳。此外,广告曝光百分比(PAE)是广告分配的重要指标。 PAE过高会损害用户体验,而PAE过低则会降低平台收入。因此,如何将PAE约束在一定范围内,同时在PAE约束下保持个性化推荐是一个挑战。在本文中,我们提出了交叉深度 Q 网络(Cross DQN),通过交叉不同项目的嵌入并通过多通道注意力对交叉序列进行建模来提取关键的排列信号。此外,我们提出了 PAE 批量级约束的辅助损失来应对上述挑战。与离线实验中最先进的基准相比,我们的模型带来了更高的收入和更好的用户体验。此外,我们的模型在线上 A/B 测试方面取得了显着改进,并已全面部署在美团 Feed 上,服务超过 3 亿客户 ...