parsifalster的文档

Topos and Stacks of Deep Neural Networks

每个已知的人工深神经网络（DNN）都对应于规范Grothendieck的拓扑中的一个物体。它的学习动态对应于此拓扑中的形态流动。层中的不变结构（例如CNNS或LSTMS）对应于Giraud的堆栈。该不变性应该是对概括属性的原因，即从约束下的学习数据中推断出来 ...

0 0 0 0 2025/09/07 arXiv:2106.14587v3 parsifalster

Category Theory in Machine Learning

在过去的二十年中，机器学习几乎渗透到技术的每个领域。同时，许多研究人员已经开始使用类别理论作为一种统一的语言，从而促进了不同科学学科之间的沟通。因此，毫不奇怪的是，将类别理论应用于机器学习存在兴趣 ...

0 0 0 0 2025/09/07 arXiv:2106.07032v1 parsifalster

Do Large Language Model Agents Exhibit a Survival Instinct? An Empirical Study in a Sugarscape-Style Simulation

随着AI系统变得越来越自治，了解新兴的生存行为对于安全部署至关重要。我们研究了大型语言模型（LLM）代理是否在没有明确编程的糖景型模拟中显示生存本能。代理商消耗能量，死亡为零，并可能收集资源，共享，攻击或繁殖 ...

0 0 0 0 2025/09/05 arXiv:2508.12920v1 parsifalster

Gödel Agent: A Self-Referential Agent Framework for Recursive Self-Improvement

大语言模型（LLM）的快速发展显着增强了人工智能驱动的代理在各种任务中的能力。然而，现有的代理系统，无论是基于固定管道算法还是预定义的元学习框架，由于人为设计组件的限制，都无法搜索整个代理设计空间，因此可能会错过全局最优的代理设计。在本文中，我们介绍了哥德尔代理，这是一个受哥德尔机启发的自我进化框架，使代理能够递归地改进自身，而不依赖于预定义的例程或固定的优化算法 ...

0 0 0 0 2025/09/05 arXiv:2410.04444v4 parsifalster

An elementary introduction to information geometry

在这项调查中，我们描述了信息歧管的基本差分几何结构，说明信息几何学的基本定理，并说明了信息科学中这些信息歧管的一些用例。该博览会是通过简单地引入差异几何形状的必要概念来独立的，但简洁地省略了证据 ...

0 0 0 0 2025/08/27 arXiv:1808.08271v2 parsifalster

A Tour of Reinforcement Learning: The View from Continuous Control

该手稿从优化和控制的角度来调查强化学习，重点是连续控制应用。它调查了强化学习的一般配方，术语和典型的实验实现，并审查了竞争解决方案范式。为了比较各种技术的相对优点，本调查介绍了具有未知动力学的线性二次调节器（LQR）的案例研究，这可能是最佳控制中最简单，最良性的问题 ...

0 0 0 0 2025/08/24 arXiv:1806.09460v2 parsifalster

Semantic Wave Functions: Exploring Meaning in Large Language Models Through Quantum Formalism

大语言模型（LLMS）在高维矢量嵌入中编码语义关系。本文探讨了LLM嵌入空间和量子力学之间的类比，认为LLMS在量化的语义空间内运行，其中单词和短语以量子状态为单位。为了捕获细微的语义干扰效应，我们将标准的实价嵌入空间扩展到复杂域，将相似之处划分为双缝实验 ...

0 0 0 0 2025/08/22 arXiv:2503.10664v2 parsifalster

Temporal Stream Logic modulo Theories (Full Version)

时间流逻辑（TSL）扩展了LTL，更新和谓词在任意函数项上。这允许指定LTL表达不够表达的数据密集型系统。在TSL的语义中，函数和谓词没有解释 ...

0 0 0 0 2025/08/22 arXiv:2104.14988v2 parsifalster

PDDL2.1: An Extension to PDDL for Expressing Temporal Planning Domains

近年来，规划界的研究越来越多地朝着将计划者应用于涉及时间和许多资源类型的现实问题上。例如，太空人社区所展示的对计划的兴趣激发了观察计划，行星漫游层和航天器控制域的工作。其他时间和资源密集型领域，包括物流规划，工厂控制和制造，也有助于将社区集中在必须面对的建模和推理问题上，以使计划技术应对应用的挑战 ...

0 0 0 0 2025/08/19 arXiv:1106.4561v1 parsifalster

Partially Observable Markov Decision Processes in Robotics: A Survey

嘈杂的传感，不完美的控制和环境变化是许多现实世界机器人任务的特征。 The partially observable Markov decision process (POMDP) provides a principled mathematical framework for modeling and solving robot decision and control tasks under uncertainty. Over the last decade, it has seen many successful applications, spanning localization and navigation, search and tracking, autonomous driving, multi-robot systems, manipulation, and human-robot interaction. ...

0 0 0 0 2025/08/18 arXiv:2209.10342v1 parsifalster