- 名称
- Re2LLM: Reflective Reinforcement Large Language Model for Session-based Recommendation
- 描述
大型语言模型 (LLM) 正在成为增强基于会话的推荐 (SBR) 的有前景的方法,其中基于提示和基于微调的方法都已得到广泛研究,以使 LLM 与 SBR 保持一致。然而,由于缺乏特定于任务的反馈,以前的方法难以获得最佳提示来引出 LLM 的正确推理,从而导致推荐不令人满意。尽管后一种方法试图用特定领域的知识来微调 LLM ,但它们面临着计算成本高和对开源主干的依赖等限制 ...