个性签名 ...
设计有效的基于模型的强化学习算法很困难,因为必须权衡数据生成的难易程度和模型生成数据的偏差。在本文中,我们从理论上和实证上研究了模型使用在政策优化中的作用。我们首先制定并分析基于模型的强化学习算法,并保证每一步的单调改进 ...
现实世界的应用程序通常将图上的学习和优化问题结合起来。例如,我们的目标可能是对图进行聚类,以检测有意义的社区(或解决其他常见的图优化问题,例如设施位置、maxcut 等)。然而,图或相关属性通常只能被部分观察到,从而引入了必须在优化之前解决的学习问题,例如链接预测 ...