因果链推理(CCR)是许多决策AI系统的重要能力,该系统要求该模型通过连接因果对建立可靠的因果链。但是,CCR遇到了两个主要的传递问题:阈值效应和场景漂移。换句话说,要剪接的因果对可能具有冲突的阈值边界或场景 ...
“ Deepfake”技术的最新进步为产生各种媒体伪造铺平了道路。为了应对这些媒体伪造的潜在危害,许多研究人员参与了探索检测方法,从而增加了对高质量媒体伪造数据集的需求。尽管如此,现有数据集还是有一定的局限性 ...
近年来,在多模式理解模型和图像产生模型中都取得了显着的进步。尽管取得了各自的成功,但这两个领域还是独立发展的,导致了独特的建筑范式:尽管基于自动进程的架构占多模式的理解,但基于扩散的模型已成为图像生成的基石。最近,人们对开发整合这些任务的统一框架的兴趣越来越大 ...
金融是深入加强学习的特别困难游乐场。但是,由于三个主要因素,即财务数据的信噪比低,历史数据的幸存者偏见以及模型过于适当的阶段。在本文中,我们提出了一个公开访问的Finrl-Meta库,该图书馆已由AI4FINANCE社区积极维护 ...
本文提出了一种新型的可区分奖励优化(DIFFRO)方法,旨在增强基于文本到语音的神经编解码语言模型的性能。与适用于TTS的人类反馈(RLHF)方法中的常规加固学习相反,DIFFRO直接基于神经编解码器 Token 来计算奖励,而不是依靠合成的音频。此外,我们采用Gumbel-Softmax技术来使奖励功能可区分,从而简化RLHF培训过程 ...
(llm)((llm)最近的趋势是增加模型大小(又名参数数量)和数据集的规模,以实现更好的生成能力,这已经被许多工作所证明,例如著名的 ...
基于专家的混合物(MOE)大型语言模型(LLMS)的不断升级的大小提出了重大的计算和记忆挑战,因此需要创新的解决方案以提高效率而不会损害模型的准确性。结构化的稀疏性是一种令人信服的策略,可以通过利用新兴的稀疏计算硬件来解决这些挑战。先前的工作主要集中在模型参数中的稀疏性,忽略了激活中固有的稀疏模式 ...
全球中期天气预报对于许多社会和经济领域的决策至关重要。传统的数值天气预报使用增加的计算资源来提高预报精度,但不能直接使用历史天气数据来改进底层模型。我们引入了一种基于机器学习的方法,称为,“ Graphcast”,它可以直接从再分析数据中进行训练... ...