LLM代理是AI系统的一种新兴形式,其中大型语言模型(LLMS)用作中心组件,利用各种工具来完成用户分配的任务。尽管具有巨大的潜力,但LLM代理商构成了重大的安全风险。与外部世界互动时,他们可能会遇到攻击者的恶意命令,从而导致执行危险行动 ...
0 0 1 2025/04/26 arXiv:2504.11703v1 dropout
高质量的SQL语料库对于智能数据库至关重要。例如,文本到SQL需要SQL查询,并且作为培训样本的相应自然语言问题。但是,由于手动注释的高成本,在实践中收集此类查询语料库仍然具有挑战性,这突出了自动SQL生成的重要性 ...
0 0 0 2025/04/26 arXiv:2504.14837v2 ifzz
视觉语言模型(VLM)的最新进展显着增强了其处理复杂的图形用户界面(GUI)交互任务的能力。尽管有这些改进,但当前的框架通常很难在挑战性的GUI环境中产生正确的行动。最先进的商业VLM是黑盒,用于GUI任务的微调开源VLM需要大量资源 ...
0 0 0 2025/04/25 arXiv:2504.16073v1 dqyzhwk
大型语言模型(LLM)越来越多地用作多步任务的自主剂。但是,大多数现有的框架无法维持对任务状态的结构化理解,通常依靠线性提示串联或浅内存缓冲区。这会导致脆弱的性能,频繁的幻觉和远距离连贯性 ...
0 0 0 2025/04/25 arXiv:2504.08525v3 zychun
GUI代理具有巨大的潜力,可以增强人类磁场相互作用的经验和效率。但是,当前的方法在跨应用程序(应用程序)和任务概括方面面临挑战,这主要是由于现有数据集中的两个基本限制。首先,这些数据集忽略了开发人员引起的应用程序之间的结构变化,从而限制了知识在各种软件环境中的可传递性 ...
0 0 0 2025/04/25 arXiv:2503.17709v1 dqyzhwk
大型语言模型(LLM)的最新进步基于基于多代理系统(MAS),在解决复杂的决策任务方面具有巨大的潜力。但是,现有的框架不可避免地依赖于序列化执行范式,在采取行动之前,代理必须在该范围内完成顺序的LLM计划。这种基本的约束严重限制了实时响应能力和适应性,这在不断变化的情况下的动态环境中至关重要 ...
0 0 0 2025/04/25 arXiv:2503.03505v1 yang1young
通过在测试时间里利用更多的计算资源,大型语言模型(LLMS)可以在没有其他培训的情况下改进。一种常见的策略使用验证者评估候选输出。在这项工作中,我们为测试时间计算提出了一个新颖的缩放维度:缩放验证者的数量 ...
0 0 0 2025/04/25 arXiv:2502.20379v1 leec
大型语言模型(LLM)的快速发展促进了多机构系统的开发,其中多个基于LLM的代理协作以解决复杂的任务。但是,现有系统主要依赖于集中协调,该协调引入了可扩展性瓶颈,限制适应性并创建单点故障。此外,对隐私和专有知识共享的担忧阻碍了跨组织合作,从而导致了孤立的专业知识 ...
0 0 0 2025/04/25 arXiv:2504.00587v1 zychun

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)