一译 —— 文档和论文翻译、对照阅读、讨论和社区

Acceleration for Deep Reinforcement Learning using Parallel and Distributed Computing: A Survey

在过去的几年中，深厚的加强学习导致了人工智能领域的巨大突破。随着推出经验数据的数量和用于深度强化学习的神经网络的大小，处理训练过程并使用平行和分布式计算降低时间消耗正成为紧迫而必不可少的愿望。在本文中，我们对基于平行和分布式计算的深度强化学习进行了广泛而彻底的调查，以最先进的方法和最先进的方法和指针为核心参考提供了一项全面的调查 ...

0 0 0 2025/05/27 arXiv:2411.05614v1 garming

A Survey on Explainable Deep Reinforcement Learning

深入的强化学习（DRL）在跨不同领域的序列决策任务中取得了巨大的成功，但其对黑盒神经体系结构的依赖阻碍了高风险应用程序中的可解释性，信任和部署。可解释的深入强化学习（XRL）通过通过特征级别，州级，数据集级别和模型级解释技术来提高透明度来解决这些挑战。这项调查提供了对XRL方法的全面审查，评估了其定性和定量评估框架，并探讨了它们在政策改进，对抗性鲁棒性和安全性中的作用 ...

0 0 0 2025/05/27 arXiv:2502.06869v1 garming

A Survey of Reinforcement Learning for Optimization in Automation

强化学习（RL）已成为自动化中优化挑战的关键工具，从而在多个领域取得了重大进步。这篇评论文章探讨了自动化中RL的当前景观，特别关注其在制造，能源系统和机器人技术中的作用。它讨论了最新的方法，主要挑战和即将到来的每个部门的研究途径，强调了RL解决复杂的优化挑战的能力 ...

0 0 0 2025/05/27 arXiv:2502.09417v1 garming

A Comprehensive Survey of Mixture-of-Experts: Algorithms, Theory, and Applications

人工智能（AI）在许多领域都取得了惊人的成功，尤其是在基础大型模型发展方面的最新突破。这些大型模型利用其广泛的培训数据，为各种下游任务提供了多功能解决方案。但是，随着现代数据集变得越来越多样化和复杂，大型AI模型的开发面临两个主要挑战：（1）巨大消费计算资源和部署困难，以及（2）拟合异质和复杂数据的困难，这限制了模型的可用性 ...

0 0 0 2025/05/27 arXiv:2503.07137v3 garming

A Survey on LLM-based Multi-Agent System: Recent Advances and New Frontiers in Application

自大型语言模型（LLM）兴起以来，多生成代理系统（MGAS）已成为研究热点。然而，随着新的相关作品的不断涌入，现有的评论很难全面地捕捉它们。本文对这些研究进行了全面的调查 ...

0 0 0 2025/05/27 arXiv:2412.17481v2 garming

LLM Agents for Education: Advances and Applications

大型语言模型（LLM）代理商在自动化任务和推动各种教育应用的创新方面表现出了显着的功能。在这项调查中，我们对教育中LLM代理的最先进研究进行了系统的审查，将其分为两个广泛的类别：（1）\ Emph {教学剂}，该研究的重点是自动自动化复杂的教学任务以支持教师和学生； （2）\ emph {特定于领域的教育代理人}，该}是针对科学教育，语言学习和专业发展等专业领域量身定制的。我们全面研究了这些LLM ...

0 0 0 2025/05/27 arXiv:2503.11733v1 garming

AI Agents: Evolution, Architecture, and Real-World Applications

本文研究了AI代理从基于规则的化身到现代复杂系统的演变，结构和实际应用，这些系统将大型语言模型与专用模块集成到感知，计划和工具的使用。本文审查了关键代理范式，讨论了当前评估基准的局限性，并提出了一个整体评估框架，以平衡任务有效性，效率，鲁棒性和安全性。分析了企业，个人援助和专业领域的应用程序，并深入了解未来的研究方向，以实现更具弹性和自适应的AI代理系统 ...

0 0 0 2025/05/27 arXiv:2503.12687v1 garming

Contrastive Knowledge-Augmented Meta-Learning for Few-Shot Classification

模型不可知的元学习算法旨在从几个观察到的任务中推断出先验，然后可以使用这些任务适应新任务，几乎没有例子。鉴于在现有基准中产生的任务的固有多样性，最近的方法使用单独的可学习结构（例如层次结构或图形）来实现对先验的特定任务适应。尽管这些方法产生了明显更好的元学习者，但我们的目标是在异质任务分配包含具有挑战性的分布变化和语义差异时提高其性能 ...

0 0 0 2025/05/27 arXiv:2207.12346v1 15966829631

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）