- 名称
- SELF-[IN]CORRECT: LLMs Struggle with Discriminating Self-Generated Responses
- 描述
LLM 能否持续改进之前的成果以获得更好的结果?要做到这一点, LLM 需要更好地区分先前生成的替代方案,而不是生成初始响应。我们在实践中探讨了这一假设的有效性。我们首先制定一个统一的框架,使我们能够比较任何模型在任何任务上的生成和判别能力 ...
LLM 能否持续改进之前的成果以获得更好的结果?要做到这一点, LLM 需要更好地区分先前生成的替代方案,而不是生成初始响应。我们在实践中探讨了这一假设的有效性。我们首先制定一个统一的框架,使我们能够比较任何模型在任何任务上的生成和判别能力 ...