在本文中,我们调查了体现多代理合作的问题,在这个世界上只有以自我为中心的观点,分散的代理人必须合作。为了在这种情况下有效地计划,与在单一代理方案中学习世界动态相比,我们必须模拟以任意数量的代理行动为条件的世界动力学,仅在只有部分中心的世界视觉观察到世界上。为了解决该部分可观察性问题,我们首先训练生成模型,以估计以部分自我为中心的观察结果 ...
我们建议使用移动GUI任务自动化代理V-Droid。与以前利用大型语言模型(LLM)作为发电机直接生成操作的移动代理不同,V-Droid在做出最终决策之前使用LLMS作为验证者来评估候选行动。为了实现这种新颖的范式,我们介绍了一个综合框架,用于构建验证者驱动的移动剂:离散的动作空间构建,再加上仅预填充的工作流程,以加速验证过程,配对进度偏好培训,以显着增强了验证能力,可衡量的验证能力,并有效地缩放 ...
大型语言模型(LLM)代理在多域任务中表现出显着的概括能力。现有的代理调整方法通常在整个专家轨迹上采用监督的固定。但是,全面轨迹的行为限制会引入专家偏见,并削弱专家数据所涵盖的状态 ...
数据驱动的自动驾驶运动生成任务经常受到数据集大小的限制和数据集之间的域差距的影响,这阻碍了它们在现实场景中的广泛应用。为了解决这个问题,我们引入了 SMART,一种新颖的自动驾驶运动生成范例,它将矢量化地图和代理轨迹数据建模为离散序列标记。然后,这些 Token 通过仅解码器的转换器架构进行处理,以训练跨时空序列的下一个 Token 预测任务 ...
随着对大语言模型(LLM)和AI代理的需求迅速增长,为有效的LLM推理的优化系统变得至关重要。尽管重大努力针对系统级工程,但通过数学建模和排队的角度探索了很少的努力。在本文中,我们旨在开发LLM推论的排队基础,弥合排队和LLM系统社区之间的差距 ...
大语言模型(LLMS)功率的AI代理在应对医疗和医疗保健挑战方面具有很高的自主权。凭借访问各种工具的能力,它们可以在开放式动作空间内运行。但是,随着自主权和能力的提高,也出现了不可预见的风险 ...
使用大型语言模型(LLMS)提供动力的代理商的社会,在解决问题的自动化问题中取得了重大进展。在金融中,努力主要集中在单独的系统上处理特定任务或独立收集数据的多代理框架。但是,多代理系统复制现实世界贸易公司的协作动态的潜力仍然没有得到充实 ...
信息技术已深刻地改变了人类与信息互动的方式。在线创建,共享和传播的大量内容使访问相关信息变得越来越困难。在过去的二十年中,推荐系统和搜索(统称为信息检索系统)已大大发展以应对这些挑战 ...