一致性模型 (CM) 是一类强大的基于扩散的生成模型,针对快速采样进行了优化。大多数现有的 CM 都是使用离散时间步长进行训练的,这会引入额外的超参数,并且容易出现离散化错误。虽然连续时间公式可以缓解这些问题,但它们的成功受到训练不稳定的限制 ...
0 0 0 2025/03/19 arXiv:2410.11081v2 wenzhanwujian
Jet-associated deuteron production in $pp$ collisions at $\sqrt{s}=13$ TeV and $p$-Pb collisions at $\sqrt{s_{NN}}=5.02$ TeV is studied in the coalescence model by using the phase-space information of ...
0 0 0 2025/03/19 arXiv:2408.01634v1 pngyuo
几乎没有射击的班级学习(FSCIL)模型旨在逐步学习稀缺样本的新课程,同时保留对旧课程的知识。现有的FSCIL方法通常会微调整个主链,从而导致过度拟合并阻碍学习新课程的潜力。另一方面,最近的基于及时的CIL方法通过在每个任务中使用足够的数据来减轻培训提示的遗忘 ...
0 0 0 2025/03/19 arXiv:2403.09857v3 lyg
基于普通微分方程(ODE)的方法被广泛用于构建时间序列的生成模型。除了明确计算隐藏状态复发的高度计算开销外,现有的基于ODE的模型在学习序列数据中以敏锐的过渡(在许多真实世界系统中常见)降低,这是由于优化过程中的数值挑战。在这项工作中,我们提出了LS4,这是一种序列的生成模型,其潜在变量根据状态空间颂歌而演变以增加建模能力 ...
0 0 0 2025/03/19 arXiv:2212.12749v3 seven_wood
最近,二次运动在空中运输和传递中引起了很大的关注。在这些情况下,对外力的准确估计与6个自由度(DOF)姿势一样必不可少,因为它对于计划和控制车辆至关重要。为此,我们提出了一个紧密耦合的视觉惯性动力学(VID)系统,该系统同时估算了与6 DOF姿势一起应用于四极管的外力 ...
0 0 0 2025/03/19 arXiv:2011.03993v2 kekeabab
基于得分的扩散模型最近已成为各种数据模式的最新生成模型。但是,尚不清楚如何适应这些模型以生成长的多元时间序列。将时间序列视为基本连续过程的离散化,我们引入了Sigdiffusion,这是一个在数据的对数签名嵌入中运行的新型扩散模型 ...
0 0 0 2025/03/19 arXiv:2406.10354v2 seven_wood
提示方法被视为几乎没有自然语言处理的关键进展之一。关于提示从基于离散 Token 的``硬提示''转移到连续``软提示''的最新研究,这些提示将可学习的向量作为伪提示,并实现更好的性能。尽管显示出有希望的前景,但观察到这些软宣传的方法在很大程度上依赖良好的初始化来生效 ...
0 0 0 2025/03/19 arXiv:2209.11486v4 15966829631
推断缩放率具有前所未有的推理能力,并以强化学习为引发复杂推理的核心技术。但是,隐藏了最先进的推理LLM的关键技术细节(例如在OpenAI O1博客和DeepSeek R1技术报告中),因此社区仍然很难重现其RL培训结果。我们建议$ \ textbf {d} $ ecoupled剪辑和$ \ textbf {d} $ ynamic s $ \ textbf {a} $ mpling $ \ text ...
0 1 0 2025/03/19 arXiv:2503.14476v1 jesson

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)