大型语言模型(LLM)的AI代理最近通过使用动态推理(一种自适应,多步骤过程)来展示了令人印象深刻的多功能性,该过程与外部工具协调。从静态的,单转的推断转变为代理,多转弯工作流程扩大了任务的概括和行为灵活性,但也引起了人们对系统级成本,效率和可持续性的严重关注。本文介绍了对AI代理的第一个全面的系统级分析,介绍了其资源使用情况,延迟行为,能源消耗以及范围内的数据中心范围的功耗需求,跨不同的代理设计 ...
沟通是协调多个代理,扩大对环境的看法并支持其协作的有效机制。在多代理深度强化学习(MADRL)的领域,代理可以提高整体学习绩效并通过沟通来实现其目标。代理可以将各种类型的消息传达给所有代理商或特定代理人组,或以特定的约束为条件 ...
可用性测试是一种基本而又具有挑战性的(例如,不灵活地迭代研究设计缺陷,很难招募研究参与者)用于用户体验(UX)研究人员评估网络设计的研究方法 ...
当今的AI系统具有人为设计的固定架构,无法自主,不断地改善自己。 AI的进步本身可以自动化。如果安全完成,那将加速AI的开发,并使我们能够更快地获得其收益 ...
自主代理在自动化复杂的多步骤决策任务方面表现出了巨大的潜力。然而,即使是最先进的视觉语言模型(VLM),例如 GPT-4o,仍然达不到人类水平的性能,特别是在复杂的网络环境和长期规划任务中。为了解决这些限制,我们提出了反射蒙特卡罗树搜索 (R-MCTS) 和探索性学习,为代理应用程序构建类似 o1 的模型 ...
但是,生成大语言模型(LLM)的最新进展非常出色,但是,这些模型产生的文本质量通常揭示出持续的问题。评估这些模型产生的文本质量,尤其是在开放式文本中,一直持续提出重大挑战。在解决这一问题时,最近的工作探索了使用LLM作为评估者的可能性 ...
使用大型语言模型(LLMS)提供动力的代理商的社会,在解决问题的自动化问题中取得了重大进展。在金融中,努力主要集中在单独的系统上处理特定任务或独立收集数据的多代理框架。但是,多代理系统复制现实世界贸易公司的协作动态的潜力仍然没有得到充实 ...
检索声明的语言模型(RALMS)代表了经典的范式,其中模型使用通过专用模块检索的外部知识增强生成能力。代理技术的最新进步使大型语言模型(LLMS)自主利用工具来检索,计划和推理。尽管现有的基于培训的方法显示出希望,但它们的代理能力受到培训过程中使用的任务特定数据的固有特征的限制 ...