人工智能的当前演变引入了向代理AI的范式转变,该代理AI构建了多代理系统(MAS)。代理通信是MAS中有效代理相互作用的关键,因此对代理AI应用程序的性能产生了重大影响。关于代理通信的最新研究取得了令人兴奋的快速进步,从而导致了各种协议设计,其中Agentagent(A2A)协议被认为是最具代表性的协议 ...
0 0 0 2025/09/01 arXiv:2508.15819v1 astonishe
我们介绍了RSTAR2-AGENT,这是一种14B数学推理模型,该模型训练了经纪性增强学习,以实现前沿级的性能。除了目前的长床外,该模型还展示了高级认知行为,例如在使用Python编码工具之前仔细思考,并反思代码执行反馈以自主探索,验证和完善复杂问题解决中的中间步骤。通过三个关键的创新来启用此功能,从而使代理RL有效地进行了规模:(i)具有可靠的Python代码环境的有效RL基础架构,可支持高通量 ...
0 0 0 2025/09/01 arXiv:2508.20722v1 takkeri
AI代理已经越来越擅长复杂的任务,例如编码,推理和多模式理解。但是,建立通才系统需要超越各个代理人进行集体推理 - 一种范式,其中具有多样化,任务专用代理的多代理系统通过结构化的沟通和协作相互补充。如今,协调通常以不精确的临时自然语言来处理,这限制了复杂的相互作用并阻碍与域特异性药物的互操作性 ...
0 0 0 2025/09/01 arXiv:2505.14569v1 1123
大型语言模型(LLMS)在自动化代码生成和软件工程任务方面表现出了希望,但是由于上下文限制和知识差距,它们经常在复杂的多文件项目中挣扎。我们提出了一个新颖的上下文工程工作流程,该工作流程结合了多个AI组件:意图翻译器(GPT-5),以阐明用户需求,一种引起动力的语义文献检索,用于注入域知识,基于笔记本的文档综合,用于上下文理解,以及用于代码和验证的Claude多代代码系统。我们的集成方法利用了意图 ...
0 0 0 2025/09/01 arXiv:2508.08322v1 1123
人工智能(AI)正在重塑科学发现,从专门的计算工具发展成为自主研究伙伴。我们将代理科学定位为科学范式更广泛的AI中的关键阶段,在该范式中,AI系统从部分援助发展到完整的科学机构。代理AI由大语言模型(LLM),多模式系统和集成研究平台启用,显示了假设产生,实验设计,执行,分析和迭代精炼的能力 - 曾经被认为是独特的人类的行为 ...
0 0 0 2025/09/01 arXiv:2508.14111v1 KingXHJ
本文介绍了Gui-Owl,这是一种基础GUI代理模型,在台面和移动环境的十个GUI基准上,在开源端到端模型之间实现了最先进的性能,涵盖了接地,问题答案,计划,计划,决策,决策和程序知识。 GUI-OWL-7B在Androidworld上达到66.4和29 ...
0 0 0 2025/08/31 arXiv:2508.15144v1 sealaes
图形检索仪(GraphRag)通过将零散的知识组织到明确结构的图中,从而有效地增强了复杂推理中的大型语言模型。已经采取了先前的努力来孤立地改善图形构造或图形检索,从而产生次优性能,尤其是在发生域移动时。在本文中,我们提出了一个垂直统一的代理范式Youtu-Graphrag,以将整个框架共同连接为复杂的集成 ...
0 0 0 2025/08/31 arXiv:2508.19855v1 sealaes
代码生成旨在生成满足以自然语言编写的要求的代码。像chatgpt这样的大型语言模型(LLM)在这一领域表现出了有希望的有效性。但是,这些LLM通常无法确保生成代码的句法和语义正确性 ...
0 0 0 2025/08/30 arXiv:2501.07811v1 AlfredZz

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)