一译 —— 文档和论文翻译、对照阅读、讨论和社区

Memory based neural networks for end-to-end autonomous driving

自主驾驶的端到端控制方面的最新工作已经调查了基于视觉的外部感知感的使用。受这些结果的启发，我们提出了一种新的基于端到端内存的神经体系结构，用于机器人转向和油门控制。我们根据基于模拟测试电路的性能来描述和将这种体系结构与以前的方法和以前的方法进行比较 ...

0 0 0 2025/02/03 arXiv:2205.12124v1 fqf

Set Features for Anomaly Detection

本文建议使用设定的功能来检测样品中的异常，这些样本包括正常元素的异常组合。许多领先的方法通过检测样本的异常部分发现异常。例如，基于最新的细分方法，首先对样本的每个元素进行分类（e ...

0 0 0 2025/02/03 arXiv:2311.14773v3 Roa

AlphaViT: A Flexible Game-Playing AI for Multiple Games and Variable Board Sizes

本文介绍了基于Alphazero框架的新型游戏AI代理，通过Vision Transformer（VIT）增强：Alphavit，Alphavid和Alphavda。这些代理商旨在使用具有共同权重的单个网络来玩各种尺寸的棋盘游戏，从而克服了Alphazero对固定板尺寸约束的限制。 Alphavit仅采用 Transformer 编码器，而Alphavid和Alphavda都结合了 Transfo ...

0 0 0 2025/02/03 arXiv:2408.13871v2 wdndev

Mastering Chess with a Transformer Model

在大规模训练时， Transformer 模型表现出令人印象深刻的能力，在需要复杂的推理和合理决策的艰巨认知任务上表现出色。在本文中，我们探讨了变形金刚在国际象棋中的应用，重点是注意机制中位置表示的关键作用。我们表明，具有足够表达的位置表示的 Transformer 可以以计算成本的一小部分匹配现有的国际象棋模型 ...

0 0 0 2025/02/03 arXiv:2409.12272v2 wdndev

Fake News Detection After LLM Laundering: Measurement and Explanation

凭借其高级功能，大型语言模型（LLMS）可以产生高度令人信服且具有上下文相关的假新闻，这可以有助于传播错误信息。尽管关于人为写的文本的虚假新闻发现有很多研究，但发现LLM生成的假新闻的领域仍未探索。这项研究衡量了探测器在识别LLM参数的假新闻方面的功效，特别是确定在检测管道中添加解释步骤是否有助于或阻碍检测 ...

0 0 0 2025/02/03 arXiv:2501.18649v1 mencius

LightZero: A Unified Benchmark for Monte Carlo Tree Search in General Sequential Decision Scenarios

在经典的决策问题（例如GO和Atari）中，基于学习模型的基于树搜索计划功能的构建代理取得了巨大的成功。但是，将基于蒙特的卡洛树搜索（MCT）算法扩展到各种现实世界应用程序，尤其是当这些环境涉及复杂的动作空间和大量的模拟成本或固有的随机性时，将蒙特卡洛树搜索（MCT）算法扩展到不同的现实应用程序被认为是具有挑战性的甚至是不可行的。在这项工作中，我们介绍了LightZero，这是在一般顺序决策方案中 ...

0 0 0 2025/02/03 arXiv:2310.08348v1 wdndev

ReZero: Boosting MCTS-based Algorithms by Backward-view and Entire-buffer Reanalyze

蒙特卡洛树搜索（MCT）基于Muzero及其衍生物等基于MONTE的算法在各种决策领域都取得了广泛的成功。这些算法采用重新分析过程来提高陈旧数据的样品效率，尽管以大量的壁垒时间消耗为代价。为了解决此问题，我们提出了一种名为Rezero的通用方法，以增强基于MCTS的算法的树搜索操作 ...

0 0 0 2025/02/03 arXiv:2404.16364v5 wdndev

UniZero: Generalized and Efficient Planning with Scalable Latent World Models

学习预测世界模型对于增强加强学习（RL）代理的计划能力至关重要。最近，利用价值等效原理和蒙特卡洛树搜索（MCT）的穆泽罗风格算法在各个领域都达到了超人的性能。但是，这些方法难以在具有不同依赖性和任务变异性的异质场景中扩展 ...

0 0 0 2025/02/03 arXiv:2406.10667v2 wdndev

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）