一译 —— 文档和论文翻译、对照阅读、讨论和社区

Understanding Warmup-Stable-Decay Learning Rates: A River Valley Loss Landscape Perspective

培训语言模型当前需要预先确定固定的计算预算，因为典型的余弦学习率计划取决于步骤的总数。相比之下，热身稳定 - 纪念日（WSD）的时间表使用恒定的学习率来产生迭代的主要分支，原则上可以无限期地继续没有预先指定的计算预算。然后，鉴于任何计算预算，一个人可以在适当的时候从主分支分支，并以快速衰减的学习率来产生强大的模型 ...

0 0 0 2025/07/24 arXiv:2410.05192v3 yuanzhi

SHALE: An Efficient Algorithm for Allocation of Guaranteed Display Advertising

由在保证显示广告中优化分配的问题的动机，我们开发了一种高效，轻巧的方法，用于生成紧凑型{\ em分配计划}，该方法可用于指导广告服务器的决策。该计划本身仅使用o（1）每个保证合同，对噪声具有鲁棒性，并且使我们能够（证明）几乎最佳地服务。我们开发的优化方法是可扩展的，具有小的内存足迹，并且在迭代中以线性时间工作 ...

0 0 0 2025/07/24 arXiv:1203.3619v1 stephenliu13

Extrapolating and Decoupling Image-to-Video Generation Models: Motion Modeling is Easier Than You Think

图像到视频（I2V）生成旨在根据给定的图像和条件（例如文本）合成视频剪辑 ...

0 0 0 2025/07/24 arXiv:2503.00948v1 JamesLei

Direct and Residual Subspace Decomposition of Spatial Room Impulse Responses

心理声学实验表明，直接声音，显着反射的定向特性以及声室反应的晚混响可能会对给定房间的听觉感知产生明显的影响。空间室脉冲响应（SRIRS）捕获了这些特性，因此用于方向依赖的室声分析和虚拟声学渲染。这项工作提出了一种将SRIR分解为直接部分的子空间方法，该方法包括直接声音和显着反射，以及残差，以通过提供对这些组件的个人访问来促进增强的分析和渲染方法 ...

0 0 0 2025/07/24 arXiv:2207.09733v2 wenwen

Room impulse response reconstruction with physics-informed deep learning

提出了一种方法，用于使用物理信息的神经网络估算房间内的声场。通过将一组有限的实验室冲动响应作为训练数据，这种方法结合了神经网络处理能力与声音传播的基本物理，如波动方程所示。除了声音压力之外，网络估计粒子速度和强度的能力表明了它代表声能流的能力，并且仅使用少量测量值完全表征了声场 ...

0 0 0 2025/07/24 arXiv:2401.01206v1 wenwen

Blind Identification of Binaural Room Impulse Responses from Smart Glasses

智能眼镜越来越多地被认为是增强现实的关键媒介，它提供了一个带有集成麦克风和非耳塞的扬声器的免费平台，可以将虚拟声源无缝混合到现实世界的声学场景中。为了令人信服地整合虚拟声源，虚拟来源的房间声渲染必须与现实世界的声音相匹配。但是，有关用户声学环境的信息通常不可用 ...

0 0 0 2025/07/24 arXiv:2403.19217v2 wenwen

Point Cloud Forecasting as a Proxy for 4D Occupancy Forecasting

预测世界将来如何发展对于自主系统中的运动计划至关重要。经典方法之所以受到限制，是因为它们依赖于语义类标签，边界框以及城市的轨道或高清图来计划其运动的昂贵人类注释，因此很难扩展到大型未标记的数据集。一个有希望的自我监督任务是从未注释的激光雷达序列预测的3D点云 ...

0 0 0 2025/07/24 arXiv:2302.13130v3 orangelcx

Pre-training Auto-regressive Robotic Models with 4D Representations

在大规模未标记的数据集上进行的基础模型彻底改变了自然语言和计算机视觉，表现出显着的概括功能，从而突出了预训练的重要性。然而，机器人技术的努力一直在努力取得类似的成功，这要么受到昂贵的机器人注释的需求或缺乏有效建模物理世界的代表性的限制。在本文中，我们介绍了ARM4R，这是一种自动回归机器人模型，利用从人类视频数据中学到的低级4D表示形式，以产生更好的预训练的机器人模型 ...

0 0 0 2025/07/24 arXiv:2502.13142v2 uu2222

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）