odenkkk的文档

Tactile Robotics: An Outlook

机器人研究长期以来一直致力于让机器人能够以与许多生物系统类似的方式通过触摸来感知物理世界。开发这种触觉能力对于许多需要机器人与人类共存并密切互动的新兴应用来说非常重要。因此，人们对触觉传感的兴趣日益浓厚，从而导致了各种技术的发展，包括压阻式和压电传感器、电容式传感器、磁传感器和光学触觉传感器 ...

0 0 0 0 2025/10/18 arXiv:2508.11261v1 odenkkk

MeSH: Memory-as-State-Highways for Recursive Transformers

递归 Transformer 重复使用参数并多次迭代隐藏状态，将计算深度与参数深度解耦。然而，在匹配计算下，参数较少的递归模型通常落后于非递归模型。通过探测隐藏状态，我们将这种性能差距追溯到两个主要瓶颈：无差异计算（核心被迫在每次迭代中采用类似的计算模式）和信息过载（其中长期信息和瞬态信息必须共存于单个隐藏状态中） ...

0 0 0 0 2025/10/16 arXiv:2510.07739v1 odenkkk

What Makes Looped Transformers Perform Better Than Non-Recursive Ones (Provably)

虽然循环 Transformer（称为 Looped-Attn）在复杂的推理任务上通常优于标准 Transformer（称为 Single-Attn），但这种优势的理论基础仍未得到充分探索。在本文中，我们通过损失景观几何的视角解释了这种现象，其灵感来自于对样本和 Hessian 水平上不同动态的经验观察。为了形式化这一点，我们通过区分 U 形山谷（平坦）和 V 形山谷（陡峭）来扩展河谷景观模型 ...

0 0 0 0 2025/10/16 arXiv:2510.10089v1 odenkkk

Learning Hamiltonian Dynamics at Scale: A Differential-Geometric Approach

By embedding physical intuition, network architectures enforce fundamental properties, such as energy conservation laws, leading to plausible predictions. Yet, scaling these models to intrinsically high-dimensional systems remains a significant challenge. This paper introduces Geometric Reduced-order Hamiltonian Neural Network (RO-HNN), a novel physics-inspired neural network that combines the conservation laws of Hamiltonian mechanics with the scalability of model order reduction.

0 0 0 0 2025/10/14 arXiv:2509.24627v1 odenkkk

Coevolutionary Continuous Discrete Diffusion: Make Your Diffusion Language Model a Latent Reasoner

扩散语言模型，特别是屏蔽离散扩散模型，最近取得了巨大的成功。虽然一些理论和主要实证结果显示了循环 Transformer 或连续思想链的潜在推理的优势，但连续扩散模型通常表现不佳。在本文中，我们认为扩散语言模型不一定需要位于离散空间中 ...

0 0 0 0 2025/10/14 arXiv:2510.03206v1 odenkkk

Gaussian Embeddings: How JEPAs Secretly Learn Your Data Density

联合嵌入预测架构（JEPA）学习能够立即解决大量下游任务的表示。 JEPA 结合了两个目标：(i) 潜在空间预测项，即 ...

0 0 0 0 2025/10/14 arXiv:2510.05949v1 odenkkk

Visual Odometry with Transformers

现代单目视觉里程计方法通常将预先训练的深度学习组件与优化模块结合起来，导致复杂的管道严重依赖相机校准和超参数调整，并且经常在看不见的现实场景中陷入困境。最近在大量多模态数据上训练的大型 3D 模型部分缓解了这些挑战，提供了可推广的密集重建和相机姿态估计。尽管如此，它们在处理长视频和提供准确的每帧估计方面仍然受到限制，而这是视觉里程计所需的 ...

0 0 0 0 2025/10/14 arXiv:2510.03348v1 odenkkk

Self-Adapting Language Models

大型语言模型（LLM）具有强大的功能，但静态；他们缺乏针对新任务，知识或示例来调整其权重的机制。我们介绍了自我适应LLM（密封），该框架使LLMS能够通过生成自己的固定数据和更新指令来自适应。给定新的输入，该模型会产生一个自我编辑的一代，该生成可能以不同的方式重组信息，指定优化超参数或调用用于数据增强和基于梯度的更新的工具 ...

0 0 0 0 2025/10/14 arXiv:2506.10943v2 odenkkk

Large Language Models Inference Engines based on Spiking Neural Networks

基于 Transformer 架构的基础模型目前是通用语言建模以及材料科学和气候等科学领域的最先进技术。然而，训练和部署这些模型在计算上具有挑战性，因为时间和空间复杂度与输入序列长度呈二次关系。为了解决这些限制，人们已经做出了一些努力来探索有效的计算范式和模型架构 ...

0 0 0 0 2025/10/11 arXiv:2510.00133v2 odenkkk

THINNs: Thermodynamically Informed Neural Networks

物理信息神经网络 (PINN) 是一类深度学习模型，旨在通过训练神经网络以最小化方程的残差来近似偏微分方程的解。着眼于非平衡波动系统，我们提出了一种基于物理的惩罚选择，该选择与潜在的波动结构一致，其特点是大偏差原理。这种方法产生了一种新颖的 PINN 公式，其中选择惩罚项来惩罚不太可能的偏差，而不是启发式地选择 ...

0 0 0 0 2025/10/11 arXiv:2509.19467v1 odenkkk