一译 —— 文档和论文翻译、对照阅读、讨论和社区

Reinforcement Learning with Deep Energy-Based Policies

我们提出了一种学习连续状态和行动的基于表达能量的政策的方法，这仅在以前的表格域中才是可行的。我们将我们的方法应用于学习最大的熵策略，导致了一种称为软Q学习的新算法，该算法通过Boltzmann分布来表达最佳策略。我们使用最近提出的摊销Stein变异梯度下降来学习一个随机采样网络，该网络近似于该分布中的样本 ...

0 0 0 2025/05/06 arXiv:1702.08165v2 zengyanxiang

Air-Decoding: Attribute Distribution Reconstruction for Decoding-Time Controllable Text Generation

可控文本生成（CTG）旨在生成具有所需属性的文本，而基于解码时间的方法在此任务上表现出了有希望的性能。但是，在本文中，我们首次确定了属性崩溃的现象。当控制强度超过临界值时，它会导致生成的文本的流利度迅速降低，从而使文本完全无法使用 ...

0 0 0 2025/05/06 arXiv:2310.14892v3 mgk001

Softpick: No Attention Sink, No Massive Activations with Rectified Softmax

我们介绍了在 Transformer 注意机制中的软键，这是一种纠正的，而不是总和替换，可消除注意力降低和大量激活。我们使用340m参数模型进行的实验表明，软饼在标准基准测试的同时保持了SoftMax的性能均衡，同时达到了0％的接收率。软键 Transformer 产生的隐藏状态显着较低（340 vs 33,510），并产生稀疏的注意力图（46 ...

0 0 0 2025/05/06 arXiv:2504.20966v1 odenkkk

What Can Neural Networks Reason About?

神经网络在许多推理任务中都取得了成功。从经验上讲，这些任务需要专门的网络结构，例如 ...

0 0 13 2025/05/06 arXiv:1905.13211v4 1099372147

Unified Multimodal Discrete Diffusion

可以理解和生成多种模式的多模式生成模型以自回归（AR）方法为主，这些方法从左到右或上或底部或底部或底部依次处理 Token 。这些模型共同处理图像，文本，视频和音频，以进行各种任务，例如图像字幕，问答和图像生成。在这项工作中，我们将离散的扩散模型作为联合文本和图像域中的统一生成式公式，基于它们最近在文本生成方面的成功 ...

0 0 0 2025/05/06 arXiv:2503.20853v1 X.K

Enhancing Complex Formula Recognition with Hierarchical Detail-Focused Network

分层和复杂的数学表达识别（MER）由于对公式的多种可能解释而使解析和评估复杂化。在本文中，我们介绍了以分层细节为中心的识别数据集（HDR），这是第一个专门旨在解决这些问题的数据集。它由大型培训套件，HDR-100M组成，提供了前所未有的规模和多样性，并提供了1亿个培训实例 ...

0 0 0 2025/05/06 arXiv:2409.11677v2 15800552430

TAMER: Tree-Aware Transformer for Handwritten Mathematical Expression Recognition

手写数学表达式识别（HMER）在自动评分和办公自动化方面有着广泛的应用。然而，现有的基于序列的解码方法直接预测$\LaTeX$序列，难以理解和建模$\LaTeX$固有的树结构，并且常常无法确保解码结果的语法正确性。为了应对这些挑战，我们提出了一种名为 TAMER（Tree-Aware Transformer）的新颖模型，用于手写数学表达式识别 ...

0 0 0 2025/05/06 arXiv:2408.08578v2 15800552430

Image Over Text: Transforming Formula Recognition Evaluation with Character Detection Matching

由于数学表达式的结构复杂且符号多样，公式识别面临重大挑战。尽管公式识别模型不断进步，但这些模型采用的评估指标（例如 BLEU 和编辑距离）仍然表现出明显的局限性。他们忽视了同一个公式具有不同的表示形式，并且对训练数据的分布高度敏感，从而导致公式识别评估的不公平性 ...

0 0 0 2025/05/06 arXiv:2409.03643v2 15800552430

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）