一译 —— 文档和论文翻译、对照阅读、讨论和社区

Chebyshev Polynomial-Based Kolmogorov-Arnold Networks: An Efficient Architecture for Nonlinear Function Approximation

复杂非线性功能的准确近似是许多科学和工程领域的基本挑战。传统的神经网络体系结构，例如多层感知器（MLP），通常很难有效地捕获高维功能中存在的复杂模式和不规则性。本文介绍了Chebyshev Kolmogorov-Arnold网络（Chebyshev Kan），这是一种新的神经网络架构，灵感来自Kolmogorov-Arnold代表定理，并结合了Chebyshev多项式的强大近似功能 ...

0 0 0 2025/05/13 arXiv:2405.07200v3 做自己的光

Occamy: A 432-Core Dual-Chiplet Dual-HBM2E 768-DP-GFLOP/s RISC-V System for 8-to-64-bit Dense and Sparse Computing in 12nm FinFET

ML和HPC应用程序越来越多地结合了密集和稀疏的内存访问计算，以最大程度地提高存储效率。但是，现有的CPU和GPU努力以始终高的计算效率灵活地处理这些异质工作负载。我们介绍了Occamy，一个432核，768-DP-GFLOP/S，Dual-HBM2E，双芯片RISC-V系统，具有耐潜力的层次结构互连和核内流媒体（SUS），旨在加速FP8至FP8至FP8至FP64 mL和HPC和HPC的工作量 . ...

0 0 0 2025/05/13 arXiv:2501.07330v1 odenkkk

Vitron: A Unified Pixel-level Vision LLM for Understanding, Generating, Segmenting, Editing

视力大型语言模型（LLM）的最新发展取得了显着的进步，但仍遇到对多模式通才的挑战，例如粗粒度的实例级别的理解，对图像和视频的统一支持缺乏统一的支持，以及在各种视觉任务中的覆盖范围不足。在本文中，我们介绍了Vivron，这是一种通用像素级视觉LLM，旨在全面理解，生成，分割和编辑静态图像和动态视频。 Votron在LLM主链的基础上建立在其前端模块内的图像，视频和像素级区域视觉效果的编码器，同时采用 ...

0 0 0 2025/05/13 arXiv:2412.19806v1 mjtree

ReFocus: Reinforcing Mid-Frequency and Key-Frequency Modeling for Multivariate Time Series Forecasting

最近的进步将基于频率的技术逐渐融入深度学习模型，从而显着提高了时间序列分析任务的准确性和效率。然而，现实世界中的频谱频谱差距序列序列，其中能量集中在低频区域，而中频频段则可以忽略不计，这阻碍了现有深度学习模型提取关键频率信息的能力。此外，多变量时间序列中的共享键频率（不同的时间序列共享难以区分的频率模式）很少被现有文献所利用 ...

0 0 0 2025/05/13 arXiv:2502.16890v2 guoyubo

Efficient Time Series Forecasting via Hyper-Complex Models and Frequency Aggregation

时间序列预测是统计和机器学习中的长期问题。关键挑战之一是通过长期依赖性处理序列。为此，最近的工作线应用了短时傅立叶变换（STFT），该变换将序列分配为多个子序列，并分别应用傅立叶变换 ...

0 0 0 2025/05/13 arXiv:2502.19983v1 guoyubo

Each Rank Could be an Expert: Single-Ranked Mixture of Experts LoRA for Multi-Task Learning

低级别适应性（LORA）由于其效率和模块化而广泛用于将大型语言模型（LLM）调整为特定领域。同时，香草·洛拉（Vanilla Lora）在多任务场景中与任务冲突斗争。最近的作品通过将每个Lora模块视为专家来采用专家（MOE）的混合物，从而通过多个专业的Lora模块来减轻任务干扰 ...

0 0 0 2025/05/13 arXiv:2501.15103v1 jackson118

3D Scene Generation: A Survey

3D场景的生成力求综合空间结构，语义上有意义的和逼真的环境，例如沉浸式媒体，机器人技术，自动驾驶和体现的AI。基于程序规则的早期方法提供了可伸缩性，但多样性有限。深层生成模型的最新进展（e ...

0 0 0 2025/05/13 arXiv:2505.05474v1 LoongCL

Enhancing Deep Knowledge Tracing with Auxiliary Tasks

知识追踪（ kt）是根据学生与智能辅导系统的历史交互来预测学生未来表现的问题。最近的研究应用了多种类型的深度神经网络来解决kt问题。然而，现实世界的教育数据中有两个重要因素没有得到很好的体现... ...

0 0 0 2025/05/13 arXiv:2302.07942v1 smallz

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）