时间序列预测是实际应用中的一项至关重要且具有挑战性的任务。预测时间序列的预训练基础模型的最新进展引起了人们的重大兴趣。但是,当前的方法通常忽略了时间序列的多尺度性质,这对于准确的预测至关重要 ...
0 0 0 2025/06/09 arXiv:2401.05012v2 Whatsup888
随着对生成AI(Genai)推断的前所未有的需求,主导Genai(例如一般矩阵 - 矢量乘法(GEMV))的原语的加速度引起了很大的关注。 GEMV的挑战是原始需求的高内存带宽。多个存储器供应商提出了在内存中可行的可行处理(PIM)原型,该原型通过通过计算功能增强内存库并将相同命令广播到所有银行,从而使带宽超过了处理器 ...
0 0 0 2025/06/09 arXiv:2403.20297v2 wangjun
时间序列预测对于理解和预测各个领域的复杂动态至关重要,从金融和经济学到气候和医疗保健。基于 Transformer 体系结构,一种方法涉及将从相同时间戳的多个变量编码为单个时间 Token 以建模全局依赖性。相反,另一种方法将单个序列的时间点嵌入到单独的变量 Token 中 ...
0 0 0 2025/06/09 arXiv:2405.13810v1 Whatsup888
当今的AI系统具有人为设计的固定架构,无法自主,不断地改善自己。 AI的进步本身可以自动化。如果安全完成,那将加速AI的开发,并使我们能够更快地获得其收益 ...
0 0 0 2025/06/09 arXiv:2505.22954v1 dropout
DeepSeek R1对于大型语言模型(LLM)具有显着高级的复杂推理。尽管最近的方法试图在多模式设置中复制R1的推理能力,但它们面临局限性,包括推理和最终答案之间的矛盾,在长链探索过程中模型不稳定性和崩溃,以及数据学习效率低。为了应对这些挑战,我们提出了炸玉米饼,这是一种新颖的强化学习算法,用于视觉推理 ...
0 0 0 2025/06/09 arXiv:2505.20777v1 dm616703
链接预测是图形结构数据的基本问题(例如,社交网络,药物副作用网络等 ...
0 0 0 2025/06/09 arXiv:2206.12004v1 xixiaixixi
推理模型已在许多涉及数学,代码和科学的基准上取得了迅速的进步。然而,关于推理的最佳培训食谱仍然存在许多公开问题,因为最先进的模型通常依赖于几乎没有可用信息的专有数据集。为了解决这个问题,Openthight项目的目标是创建用于培训推理模型的开源数据集 ...
0 0 0 2025/06/09 arXiv:2506.04178v2 lianzhepku
时间序列预测是各种领域的重要应用,例如能源管理,交通计划,金融市场,气象和医学。但是,实时序列数据通常呈现出复杂的时间变异性和急剧波动,这对时间序列预测构成了重大挑战。以前依赖1D时间序列表示的模型通常会因复杂的时间变化而挣扎 ...
0 0 0 2025/06/09 arXiv:2504.00118v1 Whatsup888

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)