最近的工作已将LLMs作为代理体现,允许他们访问工具,执行操作并与外部内容(例如,电子邮件或网站)进行交互 ...
大型语言模型为各种NLP任务开辟了一个可能性的世界,对未来产生了乐观。尽管有潜力,但LLM尚未被广泛用作实际移动设备的代理。主要的挑战是需要高质量的数据源 ...
本文提出了一个名为FlowReasoner的查询级元代理,以自动化查询级别多代理系统的设计,即每个用户查询一个系统 ...
大型语言模型(LLM)在自动化工作流程的生成和优化方面表现出强大的潜力和令人印象深刻的表现。但是,现有方法以有限的推理能力,高计算需求和大量资源要求为特征。为了解决这些问题,我们提出了DebFlow,该框架采用了辩论机制来优化工作流并将反射集成以根据以前的经验进行改进 ...
基于LLM的多机构系统(MAS)在解决各种任务方面具有巨大潜力。但是,为了设计有效的MAS,现有的方法在很大程度上依赖于手动配置或高级LLM的多个调用,从而导致不适当和高推理成本。在本文中,我们简化了通过将MAS重新标记为生成语言任务的过程,其中输入是用户查询,而输出是相应的MAS ...
大型语言模型(LLM)最近在建立自主代理方面引起了很多关注。但是,当前基于LLM的Web代理在长途任务中的性能远非最佳,通常会产生错误,例如反复购买不可退还的飞行票。相比之下,人类可以避免这种不可逆转的错误,因为我们对潜在结果有意识(e ...
GUI 长期以来一直是人机交互的核心,提供了一种直观且视觉驱动的方式来访问数字系统并与之交互。 LLM ,特别是多模式模型的出现,开创了 GUI 自动化的新时代。他们在自然语言理解、代码生成和视觉处理方面表现出了卓越的能力 ...
我们可以模拟用生成代理模拟人类行为的沙盒社会,从而减少对人类实际试验评估公共政策的过度依赖?在这项工作中,我们调查了使用疫苗犹豫模拟与健康相关的决策的可行性,该疫苗被定义为尽管有疫苗接种服务的可用性(Macdonald,2015年),但作为案例研究的延迟或拒绝疫苗的延迟。为此,我们介绍了100个由大语言模型(LLM)提供动力的生成代理的VACSIM框架。 VACSIM通过以下步骤模拟疫苗政策结果: ...