大规模扩散模型在从文本描述中产生高质量的图像方面取得了巨大的成功,在各种应用程序中都广受欢迎。但是,分层内容的产生,例如带有前景和背景层的透明图像,仍然是一个不足的区域。分层的内容生成对于图形设计,动画和数字艺术等领域的创意工作流程至关重要,在这些领域中,基于层的方法对于灵活的编辑和组成至关重要 ...
0 0 0 2025/07/09 arXiv:2412.04460v1 wonglliam
从人类行为中推断出奖励功能是价值一致性的中心 - 将AI目标与我们的人类真正想要的目标保持一致。但是这样做依赖于人类对目标的行为方式的模型。经过数十年的认知科学,神经科学和行为经济学的研究,获得了准确的人类模型仍然是一个开放的研究主题 ...
0 0 0 2025/07/09 arXiv:2212.04717v2 zhuzhuoning
天气预报是预期和减轻气候变化影响的基本问题。最近,基于深度学习的天气预报的数据驱动方法表现出了巨大的希望,实现了与操作系统竞争的准确性。但是,这些方法通常在没有足够消融分析的情况下采用复杂的,定制的体系结构,因此很难理解真正有助于其成功的原因 ...
0 0 0 2025/07/09 arXiv:2312.03876v2 yyh
因果链推理(CCR)是许多决策AI系统的重要能力,该系统要求该模型通过连接因果对建立可靠的因果链。但是,CCR遇到了两个主要的传递问题:阈值效应和场景漂移。换句话说,要剪接的因果对可能具有冲突的阈值边界或场景 ...
0 0 0 2025/07/09 arXiv:2212.08322v1 xuexizhanghao
“ Deepfake”技术的最新进步为产生各种媒体伪造铺平了道路。为了应对这些媒体伪造的潜在危害,许多研究人员参与了探索检测方法,从而增加了对高质量媒体伪造数据集的需求。尽管如此,现有数据集还是有一定的局限性 ...
0 0 0 2025/07/09 arXiv:2401.11764v2 wuyi
近年来,在多模式理解模型和图像产生模型中都取得了显着的进步。尽管取得了各自的成功,但这两个领域还是独立发展的,导致了独特的建筑范式:尽管基于自动进程的架构占多模式的理解,但基于扩散的模型已成为图像生成的基石。最近,人们对开发整合这些任务的统一框架的兴趣越来越大 ...
0 0 0 2025/07/09 arXiv:2505.02567v4 fazai001
金融是深入加强学习的特别困难游乐场。但是,由于三个主要因素,即财务数据的信噪比低,历史数据的幸存者偏见以及模型过于适当的阶段。在本文中,我们提出了一个公开访问的Finrl-Meta库,该图书馆已由AI4FINANCE社区积极维护 ...
0 0 0 2025/07/09 arXiv:2211.03107v1 651106682
本文提出了一种新型的可区分奖励优化(DIFFRO)方法,旨在增强基于文本到语音的神经编解码语言模型的性能。与适用于TTS的人类反馈(RLHF)方法中的常规加固学习相反,DIFFRO直接基于神经编解码器 Token 来计算奖励,而不是依靠合成的音频。此外,我们采用Gumbel-Softmax技术来使奖励功能可区分,从而简化RLHF培训过程 ...
0 0 0 2025/07/09 arXiv:2507.05911v1 luffy

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)