语言模型 (LM) 理解自然语言的能力使其成为将人类指令解析为自主机器人任务计划的强大工具。与依赖特定领域知识和手工规则的传统规划方法不同,语言模型从不同的数据中进行概括,并以最小的调整适应各种任务,充当压缩的知识库。然而,标准形式的语言模型面临着长期任务的挑战,特别是在部分可观察的多智能体环境中 ...
0 0 0 2025/05/12 arXiv:2407.10031v2 zhlstone
体现人工智能(体现的AI)在智能时代的高级技术的应用中起着关键作用,在智能时代,AI系统与物体集成在一起,使他们能够感知,理性和与环境相互作用。通过将传感器用于输入和执行器进行操作,这些系统可以根据现实世界的反馈来学习和适应,从而使它们可以在动态和不可预测的环境中有效地执行任务。随着深度学习(DL),增强学习(RL)和大型语言模型(LLMS)成熟的技术,体现的AI已成为学术界和行业的主要领域,其应 ...
0 0 0 2025/05/12 arXiv:2505.05108v1 attention2
随着大型语言模型 (LLM) 的出现,医学诊断领域发生了重大转变,但这些模型中的可解释性挑战在很大程度上仍未得到解决。本研究引入了诊断链(CoD)来增强基于 LLM 的医学诊断的可解释性。 CoD 将诊断过程转变为反映医生思维过程的诊断链,提供透明的推理路径 ...
0 0 0 2025/05/12 arXiv:2407.13301v2 王德发
移动设备使用的快速增加需要改善无缝任务管理的自动化。但是,由于运营知识不足,许多AI驱动的框架挣扎。手动书面知识有助于劳动密集型和效率低下 ...
0 0 0 2025/05/10 arXiv:2502.17110v2 momoom
由多模式大型语言模型(MLLM)驱动的图形用户界面(GUI)代理已经成为一种有希望的范式,可实现与数字系统的智能互动。本文提供了一个结构化的摘要,内容涉及GUI代理的最新进展,重点是增强学习(RL)增强的体系结构。我们首先将GUI代理任务形式化为马尔可夫决策过程,并讨论典型的执行环境和评估指标 ...
0 0 0 2025/05/10 arXiv:2504.20464v1 momoom
分析非结构化数据一直是数据处理中的持续挑战。大型语言模型(LLMS)在这方面表现出了希望,这导致了有关LLM驱动的非结构化数据处理的最新建议。但是,这些框架专注于在使用LLMS执行用户指定的操作时降低成本,而不是提高准确性,执行大多数操作AS-IS(在单个LLM呼叫中) ...
0 0 0 2025/05/09 arXiv:2410.12189v3 zhangxinhao
本文介绍了一个多代理应用系统,旨在提高办公室的协作效率和工作质量。该系统集成了人工智能,机器学习和自然语言处理技术,从而实现了任务分配,进度监控和信息共享等功能。系统中的代理能够根据团队成员的需求提供个性化的协作支持,并合并数据分析工具以提高决策质量 ...
0 0 0 2025/05/09 arXiv:2503.19584v3 mio
尽管看似性能的Web代理在任务完成基准测试中,但大多数现有方法还是基于预设的代理来评估代理:Web导航任务由具有标记任务完成的最终状态的线性操作序列组成。相比之下,我们的工作着重于网络导航以进行信息汇总,其中代理必须探索不同的网站以收集信息以进行复杂的查询。我们从两个不同的角度考虑Web信息聚合:(i)直接API驱动的访问依赖于网络的文本视图,利用外部工具(例如Google Search API) ...
0 0 0 2025/05/08 arXiv:2410.19054v1 arthur

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)