大型语言模型(LLM)代理商在自动化任务和推动各种教育应用的创新方面表现出了显着的功能。在这项调查中,我们对教育中LLM代理的最先进研究进行了系统的审查,将其分为两个广泛的类别:(1)\ Emph {教学剂},该研究的重点是自动自动化复杂的教学任务以支持教师和学生; (2)\ emph {特定于领域的教育代理人},该}是针对科学教育,语言学习和专业发展等专业领域量身定制的。我们全面研究了这些LLM ...
本文研究了AI代理从基于规则的化身到现代复杂系统的演变,结构和实际应用,这些系统将大型语言模型与专用模块集成到感知,计划和工具的使用。本文审查了关键代理范式,讨论了当前评估基准的局限性,并提出了一个整体评估框架,以平衡任务有效性,效率,鲁棒性和安全性。分析了企业,个人援助和专业领域的应用程序,并深入了解未来的研究方向,以实现更具弹性和自适应的AI代理系统 ...
推理是一个基本的认知过程,可以实现逻辑推理,解决问题和决策。随着大语言模型(LLM)的快速发展,推理已成为一种关键功能,将高级AI系统与赋予聊天机器人能力的传统模型区分开来。在这项调查中,我们将现有方法沿两个正交维度进行了分类:(1)制度,该政权定义了实现推理的阶段(无论是在推理时还是通过专用培训); (2)确定推理过程中涉及的组件的体系结构,区分包含外部工具的独立LLM和代理复合系统以及多机构协 ...
这项调查探讨了从多代理增强学习(MARL)的角度来看,大语言模型(LLM)中元思考能力的发展。元思考的自我反思,评估和对思维过程的控制是增强LLM可靠性,灵活性和性能的重要下一步,尤其是对于复杂或高风险的任务。该调查首先分析当前的LLM限制,例如幻觉和缺乏内部自我评估机制 ...
推荐系统(RS)对于为用户过滤信息和个性化内容而变得至关重要。传统上,RS技术依赖于使用每个任务的模型来建模用户与项目之间的交互以及内容的功能。基础模型(FMS)的出现,在GPT,Llama和Clip等大量数据的大规模模型中,正在重塑建议范式 ...
分散的AI代理将很快在互联网平台上进行交互,从而在传统的网络安全和AI安全框架之外产生安全挑战。自由形式的协议对于AI的任务概括至关重要,但可以实现新的威胁,例如秘密勾结和协调的群体攻击。网络效应可以迅速传播隐私漏洞,虚假信息,越狱和数据中毒,而多代理分散和隐身优化有助于对手在系统性上逃避监督的新型持续威胁 ...
随着大语言和视觉模型的兴起,AI代理已经演变为能够感知,推理和决策的自动互动系统。随着它们在虚拟和物理领域中扩散时,互联网(IOA)已成为一种关键基础架构,以实现异质剂之间可扩展和安全的协调。这项调查对IOA系统中的安全性和隐私景观进行了全面检查 ...
大型语言模型(LLM)和引入模型上下文协议(MCP)的最新进展已大大扩展了LLM代理与外部工具和API动态交互的能力。但是,现有的工具选择框架不会集成MCP服务器,而是在很大程度上依赖于易用错误的手动更新到单片本地工具存储库中,从而导致重复,不一致和效率低下。此外,当前的方法是在调用LLM代理之前的抽象工具选择,从而限制了其在多转交互期间的自主性和阻碍动态的重新传播功能 ...