大语言模型(LLM)驱动的代理的显着功能使复杂的系统能够处理复杂的多步骤任务,但是它们不断升级的成本威胁着可伸缩性和可访问性。这项工作介绍了现代代理系统效率效果折衷的首次系统研究,以解决对具有成本效益的设计的关键需求,而无需牺牲性能。我们研究了三个关键问题:(1)代理任务本质上需要多少复杂性? (2)其他模块何时会产生减少回报? (3)通过设计有效的代理框架可以获得多少效率?通过对GAIA基准测试 ...
0 0 0 2025/08/18 arXiv:2508.02694v1 CasperW
大型语言模型(LLM)的出现已经显着彻底改变了Web搜索。基于LLM的搜索代理的出现标志着向更深入,动态,自主信息寻求寻求的关键转变。这些代理可以理解用户意图和环境环境,并通过动态计划执行多转回检索,从而将搜索功能扩展到远远超出网络 ...
0 0 0 2025/08/17 arXiv:2508.05668v1 wozengyi
最近的研究探讨了LLM代理容易受到间接提示注射(IPI)攻击的攻击,在该攻击中,嵌入在工具退回的信息中的恶意任务可以重定向代理以采取未经授权的操作。现有针对IPI的防御能力有重大局限性:要么需要基本的模型培训资源,缺乏针对复杂攻击的有效性或损害正常公用事业。我们提出了一种新型的IPI防御,提出了瓜(蒙面的重新执行和工具比较) ...
0 0 0 2025/08/17 arXiv:2502.05174v4 hhhhh
尽管视觉语言模型(VLM)在医学成像中表现出强烈的概括,但由于超高分辨率,复杂的组织结构和细微的临床语义,病理学提出了独特的挑战。这些因素使病理学VLM容易幻觉,即 ...
0 0 0 2025/08/15 arXiv:2508.02258v2 arthur
大型语言模型(LLM)和人工智能生成的内容(AIGC)的快速发展已经加速了AI-NENATIANG应用程序,例如基于AI的故事书,可以使儿童引人入胜。然而,在改善故事吸引力,丰富讲故事的表现力以及开发开源评估基准和框架方面仍然存在挑战。因此,我们提出和开放式MM模式,该元素层,它通过精致的绘图,符合角色的图像和多频道音频创建了沉浸式的叙述性视频故事书 ...
0 0 0 2025/08/15 arXiv:2503.05242v1 huangxiang360729
大型语言模型(LLM)已经显着增强了语言智力领域,这可以证明其在一系列复杂的推理任务中的强大经验表现。此外,理论上的证据阐明了他们的紧急推理能力,在语言背景下提供了令人信服的先进认知能力。对于他们在处理复杂的推理任务方面的显着功效至关重要,LLMS利用了有趣的思想链(COT)推理技术,使他们有义务在得出答案的途中制定中间步骤 ...
0 0 0 2025/08/15 arXiv:2311.11797v1 aifei123
基于LLM的多代理系统(MAS)的安全性受到传播脆弱性的威胁,恶意代理可能会通过跨性别的消息交互来扭曲集体决策。尽管现有的监督防御方法表现出令人鼓舞的表现,但由于对标记的恶意药物来训练监督恶意检测模型,因此在现实情况下可能是不切实际的。为了实现实际且可推广的MAS防御,我们提出了BlindGuard,这是一种无监督的防御方法,不需要任何特定攻击的标签或恶意行为的先验知识 ...
0 0 0 2025/08/15 arXiv:2508.08127v1 hhhhh
这项工作表明,基于LLM的Web导航代理具有强大的自动化功能,但容易受到间接提示注射(IPI)攻击的影响。我们表明,对手可以将通用的对抗触发器嵌入网页html中,以劫持代理行为,该行为利用可访问性树来解析HTML,从而导致意外或恶意动作。使用贪婪的坐标梯度(GCG)算法和由Llama-3提供动力的浏览器健身代理 ...
0 0 0 2025/08/14 arXiv:2507.14799v1 hhhhh

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)