大型语言模型(LLM)在代码生成和解决问题方面取得了重大进步。当前方法采用了基于外部工具的迭代式调试者,这些迭代式调试器使用编译器或其他基于工具的运行时反馈来完善各种方法生成的粗略程序。但是,这些方法的有效性在很大程度上依赖于初始代码生成的质量,这仍然是一个开放的挑战 ...
0 0 0 2025/04/02 arXiv:2502.05664v1 xoxoal
关系数据库驱动的数据分析(RDB-DA)报告生成旨在在查询关系数据库后生成数据分析报告,已广泛应用于财务和医疗保健等领域。通常,这些任务是由数据科学家手动完成的,使该过程非常密集,并表现出明确的自动化需求。虽然现有方法(e ...
0 0 0 2025/04/02 arXiv:2503.13269v2 liuweitang
大型语言模型(LLM)的最新进展证明了通过使用自回归模型进行预培训来学习和利用互联网规模知识的能力。不幸的是,由于缺乏对物理世界的经验,无法解释非语言观察以及对机器人可能需要的奖励或安全限制的无知,因此将这种模型应用于具有体现的代理的设置,例如机器人。另一方面,从交互数据中学习的语言条件的机器人政策可以提供必要的基础,使代理可以正确地位于现实世界中,但是由于缺乏高级语义理解,由于可用于培训它们的交 ...
0 0 0 2025/04/02 arXiv:2303.00855v2 guiguizhu
在现实环境中运行的体现的代理必须解释模棱两可的人类指示。有能力的家用机器人应认识到歧义并提出相关的澄清问题以准确推断用户意图,从而导致更有效的任务执行。为了研究此问题,我们介绍了询问任务,其中具体的代理必须在家庭环境中进行模棱两可的指导进行特定的对象实例 ...
0 0 0 2025/04/02 arXiv:2504.00907v1 蔡明方
最近的DeepSeek-R1通过加强学习(RL)和基于规则的奖励展示了LLMS推理能力的出现。在这个想法的基础上,我们是第一个探索基于规则的RL如何增强图形用户界面(GUI)操作预测任务的多模式大语言模型(MLLM)的推理功能。为此,我们策划了136个具有挑战性的任务的小型但高质量的数据集,其中包括移动设备上的五种常见动作类型 ...
0 0 0 2025/04/01 arXiv:2503.21620v2 ycliu
设备上的控制代理,尤其是移动设备上的控制代理,负责操作移动设备以满足用户的请求,从而实现无缝且直观的交互。将多模态大型语言模型 (MLLM) 集成到这些代理中可以增强它们理解和执行复杂命令的能力,从而改善用户体验。然而,由于有限的数据可用性和低效的在线培训流程,对 MLLM 进行设备端控制的微调提出了重大挑战 ...
0 1 20 2025/04/01 arXiv:2410.14803v5 sen069
近年来,在大型语言模型(LLMS)领域的重大进步驱动到近年来,AI代理商变得越来越普遍。移动GUI代理是AI代理的子集,旨在自主在移动设备上执行任务。尽管大量研究介绍了推进移动GUI代理研究的代理,数据集和基准测试,但许多现有数据集专注于静态框架评估,并且未能为评估现实世界中的野外任务的绩效提供全面的平台 ...
0 0 2 2025/04/01 arXiv:2501.01149v2 hzx719
当前的销售对话分析和转换预测方法通常依赖于大型语言模型(LLM)以及基本检索增强发电(RAG)。这些系统虽然能够回答问题,但无法准确预测转化概率或实时提供战略指导。在本文中,我们介绍了Salesragent,这是一个新颖的框架,利用专门的强化学习来预测整个销售对话的转换概率 ...
0 0 0 2025/04/01 arXiv:2503.23303v1 wanghuiyong

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)