设计有效的基于模型的强化学习算法很困难,因为必须权衡数据生成的难易程度和模型生成数据的偏差。在本文中,我们从理论上和实证上研究了模型使用在政策优化中的作用。我们首先制定并分析基于模型的强化学习算法,并保证每一步的单调改进 ...

0 0 0 0 2024/05/04 arXiv:1906.08253v3 Forest_Lee

现实世界的应用程序通常将图上的学习和优化问题结合起来。例如,我们的目标可能是对图进行聚类,以检测有意义的社区(或解决其他常见的图优化问题,例如设施位置、maxcut 等)。然而,图或相关属性通常只能被部分观察到,从而引入了必须在优化之前解决的学习问题,例如链接预测 ...

0 0 0 0 2024/04/23 arXiv:1905.13732v3 Forest_Lee

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)