一译 —— 文档和论文翻译、对照阅读、讨论和社区

Scaling Vision Transformers to 22 Billion Parameters

变形金刚的缩放为语言模型带来了突破性的功能。目前，最大的大型语言模型（LLMS）包含100b以上参数。 Vision Transformers（VIT）将相同的架构引入了图像和视频建模，但这些架构尚未成功地缩放到几乎相同的程度。最大的密集vit包含4b参数（陈 ...

0 0 0 2025/08/25 arXiv:2302.05442v1 Dai_Junwei

NIPS-2015-a-recurrent-latent-variable-model-for-sequential-data-Paper

0 0 0 2025/08/25 YoshuaBengio

Manifold_mixup_Better_representations_by_interpolating_hidden_states

0 0 0 2025/08/25 YoshuaBengio

An_empirical_investigation_of_catastrophic_forgetting_in_gradient-based_neural_networks

0 0 0 2025/08/25 YoshuaBengio

SCOREQ: Speech Quality Assessment with Contrastive Regression

在本文中，我们提出了Scoreq，这是一种新颖的语音质量预测方法。 ScoreQ是对比度回归的三胞胎损失函数，该函数解决了最先进的无引用语音质量指标所表现出的领域概括缺点。在本文中，我们：（i）说明了L2损失训练的问题未能捕获平均意见分数（MOS）标签的连续性； （ii）通过跨多个语音领域的基准评估证明缺乏概括； （iii）概述我们的方法，并通过渐进评估探索建筑设计决策的影响； （iv）评估针对各 ...

0 0 0 2025/08/25 arXiv:2410.06675v2 sja

N-BEATS_Neural_basis_expansion_analysis_for_interpretable_time_series_forecasting

0 0 0 2025/08/25 YoshuaBengio

Visualizing_higher-layer_features_of_a_deep_network

0 0 0 2025/08/25 YoshuaBengio

On_the_spectral_bias_of_neural_networks

0 0 0 2025/08/25 YoshuaBengio

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）