Forest_Lee的文档

Forest_Lee

个性签名 ...

设计有效的基于模型的强化学习算法很困难，因为必须权衡数据生成的难易程度和模型生成数据的偏差。在本文中，我们从理论上和实证上研究了模型使用在政策优化中的作用。我们首先制定并分析基于模型的强化学习算法，并保证每一步的单调改进 ...

0 0 0 0 2024/05/04 arXiv:1906.08253v3 Forest_Lee

现实世界的应用程序通常将图上的学习和优化问题结合起来。例如，我们的目标可能是对图进行聚类，以检测有意义的社区（或解决其他常见的图优化问题，例如设施位置、maxcut 等）。然而，图或相关属性通常只能被部分观察到，从而引入了必须在优化之前解决的学习问题，例如链接预测 ...

0 0 0 0 2024/04/23 arXiv:1905.13732v3 Forest_Lee