一致性模型 (CM) 是一类强大的基于扩散的生成模型,针对快速采样进行了优化。大多数现有的 CM 都是使用离散时间步长进行训练的,这会引入额外的超参数,并且容易出现离散化错误。虽然连续时间公式可以缓解这些问题,但它们的成功受到训练不稳定的限制 ...
Jet-associated deuteron production in $pp$ collisions at $\sqrt{s}=13$ TeV and $p$-Pb collisions at $\sqrt{s_{NN}}=5.02$ TeV is studied in the coalescence model by using the phase-space information of ...
几乎没有射击的班级学习(FSCIL)模型旨在逐步学习稀缺样本的新课程,同时保留对旧课程的知识。现有的FSCIL方法通常会微调整个主链,从而导致过度拟合并阻碍学习新课程的潜力。另一方面,最近的基于及时的CIL方法通过在每个任务中使用足够的数据来减轻培训提示的遗忘 ...
基于普通微分方程(ODE)的方法被广泛用于构建时间序列的生成模型。除了明确计算隐藏状态复发的高度计算开销外,现有的基于ODE的模型在学习序列数据中以敏锐的过渡(在许多真实世界系统中常见)降低,这是由于优化过程中的数值挑战。在这项工作中,我们提出了LS4,这是一种序列的生成模型,其潜在变量根据状态空间颂歌而演变以增加建模能力 ...
最近,二次运动在空中运输和传递中引起了很大的关注。在这些情况下,对外力的准确估计与6个自由度(DOF)姿势一样必不可少,因为它对于计划和控制车辆至关重要。为此,我们提出了一个紧密耦合的视觉惯性动力学(VID)系统,该系统同时估算了与6 DOF姿势一起应用于四极管的外力 ...
基于得分的扩散模型最近已成为各种数据模式的最新生成模型。但是,尚不清楚如何适应这些模型以生成长的多元时间序列。将时间序列视为基本连续过程的离散化,我们引入了Sigdiffusion,这是一个在数据的对数签名嵌入中运行的新型扩散模型 ...
提示方法被视为几乎没有自然语言处理的关键进展之一。关于提示从基于离散 Token 的``硬提示''转移到连续``软提示''的最新研究,这些提示将可学习的向量作为伪提示,并实现更好的性能。尽管显示出有希望的前景,但观察到这些软宣传的方法在很大程度上依赖良好的初始化来生效 ...
推断缩放率具有前所未有的推理能力,并以强化学习为引发复杂推理的核心技术。但是,隐藏了最先进的推理LLM的关键技术细节(例如在OpenAI O1博客和DeepSeek R1技术报告中),因此社区仍然很难重现其RL培训结果。我们建议$ \ textbf {d} $ ecoupled剪辑和$ \ textbf {d} $ ynamic s $ \ textbf {a} $ mpling $ \ text ...