自然而富有表现力的人体动作生成是计算机动画的圣杯。由于可能的运动的多样性、人类对运动的感知敏感性以及准确描述运动的难度,这是一项具有挑战性的任务。因此,当前的生成解决方案要么质量低下,要么表达能力有限... ...
0 0 0 2025/09/02 arXiv:2209.14916v2 parsifalster
追求可推广的立体声匹配模型,能够在没有数据集特定的微调的情况下在不同的决议和差异范围内表现出色,这表明了基本的权衡。迭代局部搜索方法在受限的基准上获得了很高的分数,但是它们的核心机制固有地限制了真正概括所需的全局一致性。但是,从理论上讲,全球匹配的体系结构在历史上虽然更强大,但由于计算和记忆成本而言,这是不可行的 ...
0 0 0 2025/09/02 arXiv:2507.13229v3 maxzheng
尽管大型语言模型(LLMS)在各个领域取得了巨大的成功,但它们的规模却需要大量的计算资源,因此在资源受限的环境中对部署构成了重大挑战。将修剪作为一种简单但有效的压缩方法直接去除模型的层,从而减少了计算开销。但是,在LLMS中修剪层的最佳实践是什么?复杂的层选择指标是否真的有效?洛拉(低级别近似)家族是否被广泛认为是修剪模型进行微调的主要方法,在应用于后期的微调时真正满足期望?为了回答这些问题,我们 ...
0 0 0 2025/09/02 arXiv:2411.15558v1 youkbok
缩放定律预测,大型语言模型的性能会随着模型大小和数据大小的增加而提高。实际上,预培训一直依赖于大规模的网络爬网,到目前为止,几乎所有数据源都使用了所有数据源。但是,这种自然数据库的增长率与计算供应量的速度并不相同 ...
0 0 0 2025/09/02 arXiv:2506.04689v2 lianzhepku
培训最先进的大语言模型需要大量的干净和多样化的文本数据。但是,构建合适的多语言数据集仍然是一个挑战。在这项工作中,我们介绍了HPLT V2,这是一系列高质量的多语言单语言和平行语料库 ...
0 0 0 2025/09/02 arXiv:2503.10267v3 lianzhepku
数十年来广泛用于制造或机械行业的扫描管道和仪器图(P&ID)的数字化已成为动态库存管理和与最新CAD工具兼容的智能P&ID的关键瓶颈。从历史上看,P&ID表是在设计阶段手动生成的,然后被扫描并存储为PDF。当前的数字化计划涉及手动处理,因此非常耗时,劳动力密集,这是图像处理,机器和深度学习技术进步的HTTP URL,有关于P&ID数字化的新兴作品 ...
0 0 0 2025/09/02 arXiv:2109.03794v1 DoubleSails
我们提出了一个神经网络结构FramePack,以训练视频生成的下一框架(或下一框架)预测模型。 FramePack压缩输入帧,使 Transformer 上下文长度成为固定数字,而不论视频长度如何。结果,我们能够使用与图像扩散相似的计算瓶颈来处理大量帧 ...
0 0 0 2025/09/02 arXiv:2504.12626v2 xiewende
各种应用程序中对大语言模型(LLM)的需求不断增长,导致深度学习服务系统的设计发生了重大变化。部署LLM,尤其是在多租户环境中,由于其高度计算和内存需求而提出了重大挑战。我们介绍了BlockLlm,这是一种服务系统,该系统利用零件共享的LLM模型之间的组件共享为LLM工作负载提供有效且灵活的解决方案 ...
0 0 0 2025/09/02 arXiv:2404.18322v2 gigi

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)