arxiv Offline Imitation Learning with Model-based Reverse Augmentation

名称
Offline Imitation Learning with Model-based Reverse Augmentation
首页
https://yiyibooks.cn/arxiv/2406.12550v1/index.html
原始地址
https://arxiv.org/pdf/2406.12550
描述
在离线模仿学习(IL)中,主要挑战之一是专家观察与智能体遇到的实际分布之间的\textit{协变量偏移},因为很难确定智能体在状态之外应该采取什么行动专家演示的分发。最近,无模型解决方案引入了补充数据并识别潜在的专家相似样本,以在学习过程中增加可靠样本。基于模型的解决方案通过保守量化构建前向动态模型,然后在专家演示附近生成额外的轨迹 ...