arxiv Offline Evaluation for Reinforcement Learning-based Recommendation: A Critical Issue and Some Alternatives

名称
Offline Evaluation for Reinforcement Learning-based Recommendation: A Critical Issue and Some Alternatives
首页
https://yiyibooks.cn/arxiv/2301.00993v1/index.html
原始地址
https://arxiv.org/pdf/2301.00993
描述
在本文中,我们认为通常用于离线评估顺序推荐系统的范式不适合评估基于强化学习的推荐系统。我们发现大多数现有的基于强化学习的推荐的离线评估实践都是基于下一项预测协议,并详细说明了这种评估协议的三个缺点。值得注意的是,它无法反映强化学习 (RL) 预期带来的潜在好处,同时隐藏了某些离线 RL 代理的关键缺陷 ...