设备上的控制代理,尤其是移动设备上的控制代理,负责操作移动设备以满足用户的请求,从而实现无缝且直观的交互。将多模态大型语言模型 (MLLM) 集成到这些代理中可以增强它们理解和执行复杂命令的能力,从而改善用户体验。然而,由于有限的数据可用性和低效的在线培训流程,对 MLLM 进行设备端控制的微调提出了重大挑战 ...
近年来,在大型语言模型(LLMS)领域的重大进步驱动到近年来,AI代理商变得越来越普遍。移动GUI代理是AI代理的子集,旨在自主在移动设备上执行任务。尽管大量研究介绍了推进移动GUI代理研究的代理,数据集和基准测试,但许多现有数据集专注于静态框架评估,并且未能为评估现实世界中的野外任务的绩效提供全面的平台 ...
当前的销售对话分析和转换预测方法通常依赖于大型语言模型(LLM)以及基本检索增强发电(RAG)。这些系统虽然能够回答问题,但无法准确预测转化概率或实时提供战略指导。在本文中,我们介绍了Salesragent,这是一个新颖的框架,利用专门的强化学习来预测整个销售对话的转换概率 ...
实现人类水平的智力需要精炼系统1和系统2思维之间的认知区别。在大型语言模型驱动的当代AI虽然表现出类似人类的特征,但它没有真正的认知。从结构化的基准过渡到现实世界情景,给视觉推动者带来了挑战,通常会导致不准确和过度自信的响应 ...
受大型语言模型(LLM)快速发展的启发,LLM代理已经演变为执行复杂的任务。现在,LLM代理在各个域中广泛应用,处理大量数据以与人类交互并执行任务。 LLM代理商的广泛应用证明了其显着的商业价值;但是,它们还暴露了安全性和隐私漏洞 ...
在各种现实世界应用中,大型语言模型(LLM)代理已经变得越来越普遍。它们通过将私人用户代理交互在存储模块中以进行演示来增强决策,从而引入了LLM代理的新隐私风险。在这项工作中,我们系统地研究了LLM代理在黑色盒子设置下对我们提出的内存提取攻击(MEXTRA)的脆弱性 ...
由大语言模型(LLM)提供支持的社会代理人可以模拟人类的社会行为,但在处理复杂的社会对话方面缺乏。直接优先优化(DPO)已被证明有效地使LLM行为与各种代理任务中的人类偏好保持一致。但是,标准DPO仅关注单个转弯,这限制了其在多转变社交互动中的有效性 ...
通过控制计算机执行人工任务的自主代理可以提高人类的生产力和应用程序的可访问性。然而,该领域的进展将由现实且可重复的基准驱动。我们展示了 AndroidWorld,这是一个功能齐全的 Android 环境,可为 20 个现实世界的 Android 应用程序中的 116 个编程任务工作流程提供奖励信号 ...