强化学习(RL)在顺序决策任务中显示出令人印象深刻的结果。同时,出现了大型语言模型(LLM)和视觉模型(VLM),在多模式理解和推理方面表现出了令人印象深刻的能力。这些进步导致了将LLM和VLMS整合到RL的研究激增 ...

0 0 0 0 2025/04/18 arXiv:2502.15214v1 213