大型语言模型(LLMS)的兴起通过LLM驱动的GUI代理彻底改变了图形用户界面(GUI)自动化,但是他们使用有限的人类监督处理敏感数据的能力会带来明显的隐私和安全风险。该立场论文确定了GUI代理的三个关键风险,并研究了它们与传统的GUI自动化和一般自治药物的不同。尽管有这些风险,但现有的评估主要集中在绩效上,而隐私和安全评估在很大程度上没有探索 ...
0 0 0 2025/06/10 arXiv:2504.17934v2 hhhhh
最近,与计算设备的AI驱动相互作用已从基本原型工具到基于LLM的复杂,基于LLM的系统,这些系统模仿了图形用户界面中的类似人类的操作。现在,我们目睹了\ emph {Computer-Is-using Adents}(CUAS)的出现,能够自主执行诸如浏览桌面应用程序,网页和移动应用程序之类的任务。但是,随着这些试剂能力的增长,它们也引入了新颖的安全和保障风险 ...
0 0 0 2025/06/10 arXiv:2505.10924v2 hhhhh
最近的研究表明,合作的多代理深入强化学习(C-MADRL)受到后门攻击的威胁。一旦观察到后门扳机,它将执行恶意行动,导致失败或恶意目标。但是,现有的后门攻击遭受了几个问题的损失 ...
0 0 0 2025/06/10 arXiv:2501.01593v1 whfeLingYu
大语言模型(LLM)的最新进展引起了法学委员会的法官范式,展示了他们提供类似人类判断的潜力。但是,在机器翻译(MT)评估领域中,当前的LLM-AS-A-A-Gudge方法缺乏学识渊博的自动指标。在本文中,我们提出了多维多代理辩论(M-MAD),这是一个系统的基于LLM的系统多代理框架,用于高级LLM-AS-A-A-A-Gudge MT评估 ...
0 0 0 2025/06/10 arXiv:2412.20127v3 NeverSettle
大型语言模型(LLM)在代码生成任务中表现出了有效性。为了使LLMS能够应对更复杂的编码挑战,现有的研究集中在用代理工作流程制作多代理系统,其中复杂的编码任务被分解为分配给专用代理的子任务。尽管它们有效,但当前的方法在很大程度上依赖于手动拓扑和提示手动设计的手工制作的代理工作流程,这限制了它们自动适应不同类型的编码问题的能力 ...
0 0 0 2025/06/10 arXiv:2505.18646v1 leec
大型语言模型(LLM)的最新进展使代理能够自主执行复杂的开放式任务。但是,许多现有的框架在很大程度上取决于手动预定义的工具和工作流,这阻碍了它们的适应性,可扩展性和跨域的概括。在这项工作中,我们介绍了Alita,这是一种以“简单性是最终成熟的原则”设计的通才代理,通过最小的预定和最大的自我进化来促进可扩展的代理推理 ...
0 0 0 2025/06/10 arXiv:2505.20286v1 leec
大型语言模型(LLM)的AI代理最近通过使用动态推理(一种自适应,多步骤过程)来展示了令人印象深刻的多功能性,该过程与外部工具协调。从静态的,单转的推断转变为代理,多转弯工作流程扩大了任务的概括和行为灵活性,但也引起了人们对系统级成本,效率和可持续性的严重关注。本文介绍了对AI代理的第一个全面的系统级分析,介绍了其资源使用情况,延迟行为,能源消耗以及范围内的数据中心范围的功耗需求,跨不同的代理设计 ...
0 0 0 2025/06/10 arXiv:2506.04301v1 chrisxiong
沟通是协调多个代理,扩大对环境的看法并支持其协作的有效机制。在多代理深度强化学习(MADRL)的领域,代理可以提高整体学习绩效并通过沟通来实现其目标。代理可以将各种类型的消息传达给所有代理商或特定代理人组,或以特定的约束为条件 ...
0 0 0 2025/06/10 arXiv:2203.08975v2 justyn

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)