我们提出了通用目标音频分离(UNISEP),以解决不同类型音频的任意混合物的分离任务。与以前的研究区别开来,Unisep是在无限的源域和无限源源编号上进行的。我们将分离任务作为序列到序列问题提出,并使用大型语言模型(LLM)在离散潜在空间中对音频序列进行建模,从而利用LLM在使用大规模数据的复杂混合物中的功率来建模 ...
0 0 0 2025/04/20 arXiv:2503.23762v1 melo_0925
尽管大型语言模型(LLMS)具有支持众多现实世界应用并产生积极的社会影响的巨大潜力,但就隐私泄漏,幻觉输出和价值错误的固有风险而言,它们仍然面临重大挑战,可用于恶意用于产生有毒内容和囚禁后的有毒内容和不可思议的目的。因此,在这项调查中,我们对旨在减轻这些问题的最新进展进行了全面的综述,这些进步是在LLM开发和用法的四个阶段组织的:数据收集和培训,微调和调整,促进和推理,及时和推理,以及后处理和审核 ...
0 0 0 2025/04/20 arXiv:2501.09431v1 CiTY-GO
每千瓦时在电网上排放的CO $ _2 $的数量随着一天中的时间而变化,由于发电类型而差异很大。仓库比例计算机的联网收集有时称为高档计算,如果在不考虑这些碳强度的这些变化的情况下,发出的碳比需要更多的碳。本文介绍了Google用于碳智能计算管理系统,该系统通过延迟时间灵活的工作量来积极地最大程度地减少基于电力的碳足迹和电力基础设施成本 ...
0 0 0 2025/04/20 arXiv:2106.11750v1 胖河豚
几次学习的目的是学习一个可以从有限的支持数据中识别出具有标签的有限支持数据的分类器。该任务的一种常见实践是首先训练基础集上的模型,然后通过微调转移到新的类别(此处微调程序定义为将知识从基础转移到新数据,即,即 ...
0 0 0 2025/04/20 arXiv:2102.03983v1 19396386025
卷积神经网络(CNN)和视觉 Transformer (VIT)在生物医学图像分段中一直是关键的,但是它们管理长期依赖性的能力仍然受到固有的位置和计算开销的限制。为了克服这些挑战,在这份技术报告中,我们首先提出了XLSTM-UNET,这是一个UNET结构化的深度学习神经网络,它利用Vision-LSTM(XLSTM)作为医疗图像分割的骨干。 XLSTM是最近提议的长期记忆(LSTM)网络的继任者, ...
0 0 0 2025/04/20 arXiv:2407.01530v2 zfk666
卷积神经网络(CNN)已成为医疗图像分割任务的共识。但是,由于卷积操作的性质,它们在建模长期依赖性和空间相关性时受到限制。尽管最初开发了 Transformer 来解决这个问题,但它们未能捕获低级功能 ...
0 0 0 2025/04/20 arXiv:2207.08518v2 flyaway
差异化私有(DP)合成数据是用于启用私人数据分析的多功能工具。大型语言模型(LLM)的最新进展激发了许多用于改善DP合成数据生成的算法技术。一种方法在基础型号的权重上使用DP登录;但是,最新模型的模型权重可能不公开 ...
0 0 0 2025/04/20 arXiv:2502.06555v1 CiTY-GO
本文从整体角度,跨越数据,算法和系统硬件探讨了AI超级线性增长趋势的环境影响。我们通过检查跨行业规模的机器学习用例,同时考虑系统硬件的生命周期来表征AI计算的碳足迹。进一步迈出一步,我们捕获了AI计算的运营和制造碳足迹,并对硬件软件设计和尺度优化的方法以及如何有助于减少AI的整体碳足迹进行了端到端分析 ...
0 0 0 2025/04/20 arXiv:2111.00364v2 胖河豚

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)