(DST)对于确保在面向任务的对话系统中准确跟踪用户目标和系统操作至关重要。gpt3和chatgpt等大型语言模型(LLM)的出现引发了人们对评估其在不同应用程序中的有效性的极大兴趣。在本研究中,我们对chatgpt在dst方面的功能进行了初步检查 ...
整流激活单元(整流器)对于最新的神经网络至关重要。在这项工作中,我们研究了整流器神经网络,用于从两个方面进行图像分类。首先,我们提出了一个参数整流的线性单元(PRELU),该单元(PRELU)概括了传统的整流单元 ...
使用drell-yan事件在质子 - 质量中心能量的质子 - 质子碰撞中测量基础事件(UE)活性在数据样本中进行的drell-yan事件,该数据样本对应于2.2的2.2逆向femtobarns,并由LHC的CMS实验收集。在Muonic最终状态(Q Q-bar至相位符号插座)中测得的活性被校正为粒子水平,并与各种蒙特卡洛发生器和强膦模型的预测进行了比较 ...
一致性模型 (CM) 是一类强大的基于扩散的生成模型,针对快速采样进行了优化。大多数现有的 CM 都是使用离散时间步长进行训练的,这会引入额外的超参数,并且容易出现离散化错误。虽然连续时间公式可以缓解这些问题,但它们的成功受到训练不稳定的限制 ...
Jet-associated deuteron production in $pp$ collisions at $\sqrt{s}=13$ TeV and $p$-Pb collisions at $\sqrt{s_{NN}}=5.02$ TeV is studied in the coalescence model by using the phase-space information of ...
几乎没有射击的班级学习(FSCIL)模型旨在逐步学习稀缺样本的新课程,同时保留对旧课程的知识。现有的FSCIL方法通常会微调整个主链,从而导致过度拟合并阻碍学习新课程的潜力。另一方面,最近的基于及时的CIL方法通过在每个任务中使用足够的数据来减轻培训提示的遗忘 ...
基于普通微分方程(ODE)的方法被广泛用于构建时间序列的生成模型。除了明确计算隐藏状态复发的高度计算开销外,现有的基于ODE的模型在学习序列数据中以敏锐的过渡(在许多真实世界系统中常见)降低,这是由于优化过程中的数值挑战。在这项工作中,我们提出了LS4,这是一种序列的生成模型,其潜在变量根据状态空间颂歌而演变以增加建模能力 ...
最近,二次运动在空中运输和传递中引起了很大的关注。在这些情况下,对外力的准确估计与6个自由度(DOF)姿势一样必不可少,因为它对于计划和控制车辆至关重要。为此,我们提出了一个紧密耦合的视觉惯性动力学(VID)系统,该系统同时估算了与6 DOF姿势一起应用于四极管的外力 ...