过去几十年来,时间序列预测的深度学习取得了重大进展。然而,尽管大规模预训练在语言和视觉领域取得了成功,但预训练时间序列模型的规模仍然有限,并且运行成本很高,阻碍了在实际应用中开发更强大的预测模型。为此,我们引入了 Time-MoE,这是一种可扩展且统一的架构,旨在预训练更大、能力更强的预测基础模型,同时降低推理成本 ...
0 0 0 2025/02/21 arXiv:2409.16040v3 zn0912_sdf
为了降低用于资源受限设备的使用卷积神经网络(CNN)的计算成本,结构化的修剪方法显示出令人鼓舞的结果,大大降低了浮点操作(拖船),而准确的准确性下降了。但是,最近的方法需要进行微调或特定的培训程序,以在保留准确性和降低失败之间取决于合理的权衡。这引入了计算开销形式的额外成本,需要培训数据可用 ...
0 0 0 2025/02/21 arXiv:2309.17211v1 Daenerays
推荐系统(RSS)经常患有反馈回路现象,例如,RSS受到其建议偏见的数据培训 ...
0 0 0 2025/02/21 arXiv:2502.13539v1 5cm83721srh
半监督语义分割(SSS)旨在从廉价的未标记图像中学习丰富的视觉知识,以增强语义分割能力。在最近的著作中,Unimatch通过扩大弱到Strong一致性正规化的实践来大大提高其先例。随后的作品通常遵循类似的管道并提出各种精致的设计 ...
0 0 0 2025/02/21 arXiv:2410.10777v2 zhifeiji
在这项工作中,我们重新审视了由fixMatch从半监督分类中推广的弱到强一致性框架,其中弱扰动图像的预测充当其强扰动版本的监督。有趣的是,我们观察到,当转移,当转移到我们的分割场景时,这样一个简单的管道已经取得了与最近的先进作品相比的竞争结果。它的成功在很大程度上依赖于强大数据增强的手动设计,然而,这可能是有限的并且不足以探索更广泛的扰动空间... ...
0 0 0 2025/02/21 arXiv:2208.09910v2 zy123
尽管生成的视频的内容通常包括不自然的运动或变形,反向播放和一动不动的场景,但文本到视频扩散模型的显着进度使人可以逼真的世代。最近,一个对齐问题引起了极大的关注,我们根据一定数量的数量来指导扩散模型的输出。由于沿着框架方向有一个很大的改善感知质量的空间,因此我们应该解决我们应该优化的指标以及如何在视频生成中优化它们 ...
0 0 0 2025/02/21 arXiv:2501.19252v1 alex666
大多数最先进的天气和气候建模方法都是基于基于物理的大气数值模型。这些方法旨在对非线性动力学和多个变量之间的复杂相互作用进行建模,这很难进行近似。,这很难进行近似。此外,许多此类数值模型的计算量很大,尤其是在以细粒度的空间和时间分辨率对大气现象进行建模时... ...
0 0 0 2025/02/21 arXiv:2301.10343v5 vchou
一个人如何代表行动?如何描述我们从未见过的动作?此类问题是由零射击学习范式解决的,其中模型仅在一部分课程上训练,并根据其正确对以前从未见过的班级正确分类的示例进行评估。在这项工作中,我们提出了一个基于身体姿势的零射击动作识别网络,并在NTU RGB-D数据集上演示了其性能。我们的模型学会了根据动作表演者的姿势特征以及在看不见的动作类名称的自然语言描述中共同封装视觉相似性 ...
0 0 0 2025/02/20 arXiv:1911.11344v1 Xiaoxia_3

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)