通过个性化在对话代理中增强用户参与已获得重要意义,尤其是随着大型语言模型的出现,产生流利的响应。但是,个性化的对话生成是多方面的,其定义各不相同 - 从在代理中灌输角色到捕获用户的明确和隐性提示。本文旨在系统地调查个性化对话生成的最新景观,包括所采用的数据集,开发的方法和应用评估指标 ...

0 0 0 0 2025/04/06 arXiv:2405.17974v1 Cantaloupe

建立可以快速适应新环境的通才代理商是在数字和现实世界中部署AI的关键挑战。扩展当前代理体系结构是建造通才代理的最有效方法吗?我们提出了一种新颖的方法,可以在相对较小的数据集上预先培训相对较小的策略,并通过内在的学习将其调整为看不见的环境,而无需进行任何填充。我们的关键想法是,检索为快速适应提供了强大的偏见 ...

0 0 0 0 2025/03/13 arXiv:2412.04759v2 Cantaloupe

大型语言模型(LLMS)在各种NLP任务中实现最先进的性能,但由于高计算成本和内存限制,面临部署挑战。知识蒸馏(KD)是一个有前途的解决方案,将知识从大型教师模型转移到较小的学生模型。但是,现有的KD方法通常假设共享的词汇和象征器,从而限制了它们的灵活性 ...

0 0 0 0 2025/03/10 arXiv:2502.16806v3 Cantaloupe