复杂非线性功能的准确近似是许多科学和工程领域的基本挑战。传统的神经网络体系结构,例如多层感知器(MLP),通常很难有效地捕获高维功能中存在的复杂模式和不规则性。本文介绍了Chebyshev Kolmogorov-Arnold网络(Chebyshev Kan),这是一种新的神经网络架构,灵感来自Kolmogorov-Arnold代表定理,并结合了Chebyshev多项式的强大近似功能 ...
0 0 0 2025/05/13 arXiv:2405.07200v3 做自己的光
ML和HPC应用程序越来越多地结合了密集和稀疏的内存访问计算,以最大程度地提高存储效率。但是,现有的CPU和GPU努力以始终高的计算效率灵活地处理这些异质工作负载。我们介绍了Occamy,一个432核,768-DP-GFLOP/S,Dual-HBM2E,双芯片RISC-V系统,具有耐潜力的层次结构互连和核内流媒体(SUS),旨在加速FP8至FP8至FP8至FP64 mL和HPC和HPC的工作量 . ...
0 0 0 2025/05/13 arXiv:2501.07330v1 odenkkk
视力大型语言模型(LLM)的最新发展取得了显着的进步,但仍遇到对多模式通才的挑战,例如粗粒度的实例级别的理解,对图像和视频的统一支持缺乏统一的支持,以及在各种视觉任务中的覆盖范围不足。在本文中,我们介绍了Vivron,这是一种通用像素级视觉LLM,旨在全面理解,生成,分割和编辑静态图像和动态视频。 Votron在LLM主链的基础上建立在其前端模块内的图像,视频和像素级区域视觉效果的编码器,同时采用 ...
0 0 0 2025/05/13 arXiv:2412.19806v1 mjtree
最近的进步将基于频率的技术逐渐融入深度学习模型,从而显着提高了时间序列分析任务的准确性和效率。然而,现实世界中的频谱频谱差距序列序列,其中能量集中在低频区域,而中频频段则可以忽略不计,这阻碍了现有深度学习模型提取关键频率信息的能力。此外,多变量时间序列中的共享键频率(不同的时间序列共享难以区分的频率模式)很少被现有文献所利用 ...
0 0 0 2025/05/13 arXiv:2502.16890v2 guoyubo
时间序列预测是统计和机器学习中的长期问题。关键挑战之一是通过长期依赖性处理序列。为此,最近的工作线应用了短时傅立叶变换(STFT),该变换将序列分配为多个子序列,并分别应用傅立叶变换 ...
0 0 0 2025/05/13 arXiv:2502.19983v1 guoyubo
低级别适应性(LORA)由于其效率和模块化而广泛用于将大型语言模型(LLM)调整为特定领域。同时,香草·洛拉(Vanilla Lora)在多任务场景中与任务冲突斗争。最近的作品通过将每个Lora模块视为专家来采用专家(MOE)的混合物,从而通过多个专业的Lora模块来减轻任务干扰 ...
0 0 0 2025/05/13 arXiv:2501.15103v1 jackson118
3D场景的生成力求综合空间结构,语义上有意义的和逼真的环境,例如沉浸式媒体,机器人技术,自动驾驶和体现的AI。基于程序规则的早期方法提供了可伸缩性,但多样性有限。深层生成模型的最新进展(e ...
0 0 0 2025/05/13 arXiv:2505.05474v1 LoongCL
知识追踪( kt)是根据学生与智能辅导系统的历史交互来预测学生未来表现的问题。最近的研究应用了多种类型的深度神经网络来解决kt问题。然而,现实世界的教育数据中有两个重要因素没有得到很好的体现... ...
0 0 0 2025/05/13 arXiv:2302.07942v1 smallz

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)