蛋白质结构对于理解其功能和相互作用很重要。当前,许多蛋白质结构预测方法正在丰富结构数据库。区分结构的起源对于区分实验解析和计算预测结构,评估预测方法的可靠性以及指导下游生物学研究至关重要 ...
0 0 0 2025/04/20 arXiv:2410.15592v2 DECEM
我们建议使用新型的多模式联合训练框架MMAUDIO合成视频和可选文本条件,以合成高质量和同步音频。与仅在(有限)视频数据的情况下进行的单模式训练相反,MMAUDIO是通过更大尺寸,容易获得的文本原告数据共同培训的,以学会生成语义上一致的高质量音频样本。此外,我们通过条件同步模块改善了视听同步,该模块将视频条件与框架级别的音频潜在的条件保持一致 ...
0 0 0 2025/04/20 arXiv:2412.15322v2 Harry3790
机器学习(ML)取得了巨大的进步,但其环境足迹仍然是一个令人担忧的问题。认识到ML的环境影响不断增长,本文研究了绿色ML,研究了培训和推理阶段中的各种模型架构和超参数,以识别节能实践。我们的研究利用基于软件的功率测量值,以便于跨不同配置,模型和数据集的复制 ...
0 0 0 2025/04/20 arXiv:2406.14328v1 胖河豚
当前用于多元时间序列预测(MTSF)的 Transformer 方法均基于常规注意机制。它们涉及嵌入序列并执行Q,K和V的线性投影,然后在此潜在空间内计算注意力。我们从未深入研究注意机制,以探索这种映射空间是否最适合MTSF ...
0 0 0 2025/04/20 arXiv:2407.13806v1 wang123123
微调预培训的基础模型在各个研究领域都广受欢迎。现有的微调方法可以大致分为两类,即参数有效的微调和高性能微调。前者旨在提高效率,而后者则侧重于提高性能 ...
0 0 0 2025/04/20 arXiv:2312.15681v1 19396386025
卷积神经网络(CNN)已被广泛用于有效的图像超分辨率。但是,对于基于CNN的方法,性能提高通常需要更深层的网络和更大的特征图,从而增加复杂性和推理成本。受洛拉(Lora)在微调大语模型中的成功启发的启发,我们探索了其对轻量级模型的应用,并提出了蒸馏措施的卷积低级别适应性(DSCLORA),从而改善了模型性能而不会提高建筑复杂性或推荐成本 ...
0 0 0 2025/04/20 arXiv:2504.11271v1 19396386025
双曲神经网络已成为一种强大的工具,用于建模各种方式跨不同方式。最近的研究表明,基础模型中的 Token 分布表现出无尺度的特性,这表明双曲线空间比欧几里得空间更合适,用于许多前训练和下游任务。但是,现有工具缺乏建立双曲线基础模型的重要组成部分,因此很难利用最近的进步 ...
0 0 0 2025/04/20 arXiv:2504.08912v1 19396386025
深度神经网络容易受到各种模型中可传递性的对抗性示例的影响。提出了许多方法来增强对抗性示例的可传递性,包括高级优化,数据增强和模型修改。但是,这些方法仍然显示出有限的可传递性,尤其是在跨架构方案中,例如从CNN到VIT ...
0 0 0 2025/04/20 arXiv:2501.01015v1 19396386025

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)