一译 —— 文档和论文翻译、对照阅读、讨论和社区

Top Ten Challenges Towards Agentic Neural Graph Databases

图形数据库（GDB）（例如Neo4J和Tigergraph Excel）处理互连数据，但缺乏高级推理功能。神经图数据库（NGDB）通过集成图形神经网络（GNN）来解决此问题，以进行预测分析和对不完整或嘈杂数据的推理。但是，NGDB依靠预定义的查询，缺乏自主性和适应性 ...

0 0 0 2025/07/11 arXiv:2501.14224v1 李大人

AgentRewardBench: Evaluating Automatic Evaluations of Web Agent Trajectories

Web代理使用户能够通过自然语言互动在Web浏览器上执行任务。评估Web代理轨迹是一个重要的问题，因为它可以帮助我们确定代理是否成功完成任务。基于规则的方法被广泛用于此目的，但是它们具有挑战性地扩展到新任务，并且可能并不总是识别成功的轨迹 ...

0 0 0 2025/07/11 arXiv:2504.08942v1 树叶无声

SAGE: Smart home Agent with Grounded Execution

大语模型（LLM）的常识推理能力和广泛的一般知识使它们自然地适合在智能家庭助理环境中解释用户请求。但是，LLMS缺乏有关用户及其家庭的特定知识，限制了其潜在影响。 Sage（具有接地执行的智能家居代理）通过使用一个方案来克服这些和其他限制，在该方案中，用户请求触发了LLM控制的离散操作序列 ...

0 0 0 2025/07/11 arXiv:2311.00772v2 york19840220

CAIM: Development and Evaluation of a Cognitive AI Memory Framework for Long-Term Interaction with Intelligent Agents

大型语言模型（LLM）已提高了人工智能（AI）领域，并且是交互式系统的强大推动力。但是，他们仍然在需要适应用户的长期互动中面临挑战，以及对不断变化的环境的上下文知识和理解。为了克服这些挑战，需要整体记忆建模才能有效地检索和存储相互作用会话中的相关信息以进行合适的响应 ...

0 0 0 2025/07/10 arXiv:2505.13044v1 yuxiao.swj

An Illusion of Progress? Assessing the Current State of Web Agents

随着数字化和云技术的发展，网络在现代社会中变得越来越重要。基于大语言模型（LLM）的自主网络代理具有工作自动化的巨大潜力。因此，重要的是要准确测量和监视其能力的进展 ...

0 0 0 2025/07/10 arXiv:2504.01382v3 树叶无声

SciMaster: Towards General-Purpose Scientific AI Agents, Part I. X-Master as Foundation: Can We Lead on Humanity's Last Exam?

AI代理商的快速发展激发了人们利用他们加速科学发现的长期以来的野心。实现这一目标需要深入了解人类知识的前沿。因此，人类的最后考试（HLE）为评估科学AI代理提供了极具挑战性的试金石 ...

0 0 0 2025/07/10 arXiv:2507.05241v2 OrganicWater

CyberRAG: An agentic RAG cyber attack classification and reporting tool

大型企业中的入侵检测和预防系统（IDS/IP）每小时可以产生数十万个警报，这是压倒性的安全分析师，其日志需要深层，快速发展的域专业知识。传统的机器学习探测器修剪警报量，但仍产生高阳性速率，而标准的单通行证检索生成（RAG）管道通常会检索无关的上下文，并且无法证明其预测是合理的。为了克服这些缺点，我们提出网络架，这是一个基于模块化的，基于代理的抹布框架，可为网络攻击提供实时分类，解释和结构化报告 . ...

0 0 0 2025/07/10 arXiv:2507.02424v1 feilaixiaoyu

Embodied AI Agents: Modeling the World

本文介绍了我们对以视觉，虚拟或物理形式体现的AI代理的研究，使他们能够与用户及其环境进行交互。这些试剂包括虚拟化身，可穿戴设备和机器人，旨在感知，学习和行动在周围的环境中，这使其与人类的学习方式和与环境相比的方式更为相似。我们建议，世界模型的发展对于体现的AI代理的推理和计划是至关重要的，允许这些代理人理解和预测其环境，了解用户意图和社会环境，从而增强其自动执行复杂任务的能力 ...

0 0 0 2025/07/09 arXiv:2506.22355v3 fazai001

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）