一译 —— 文档和论文翻译、对照阅读、讨论和社区

ReCo: Reliable Causal Chain Reasoning via Structural Causal Recurrent Neural Networks

因果链推理（CCR）是许多决策AI系统的重要能力，该系统要求该模型通过连接因果对建立可靠的因果链。但是，CCR遇到了两个主要的传递问题：阈值效应和场景漂移。换句话说，要剪接的因果对可能具有冲突的阈值边界或场景 ...

0 0 0 2025/07/09 arXiv:2212.08322v1 xuexizhanghao

Identity-Driven Multimedia Forgery Detection via Reference Assistance

“ Deepfake”技术的最新进步为产生各种媒体伪造铺平了道路。为了应对这些媒体伪造的潜在危害，许多研究人员参与了探索检测方法，从而增加了对高质量媒体伪造数据集的需求。尽管如此，现有数据集还是有一定的局限性 ...

0 0 0 2025/07/09 arXiv:2401.11764v2 wuyi

Unified Multimodal Understanding and Generation Models: Advances, Challenges, and Opportunities

近年来，在多模式理解模型和图像产生模型中都取得了显着的进步。尽管取得了各自的成功，但这两个领域还是独立发展的，导致了独特的建筑范式：尽管基于自动进程的架构占多模式的理解，但基于扩散的模型已成为图像生成的基石。最近，人们对开发整合这些任务的统一框架的兴趣越来越大 ...

0 0 0 2025/07/09 arXiv:2505.02567v4 fazai001

FinRL-Meta: Market Environments and Benchmarks for Data-Driven Financial Reinforcement Learning

金融是深入加强学习的特别困难游乐场。但是，由于三个主要因素，即财务数据的信噪比低，历史数据的幸存者偏见以及模型过于适当的阶段。在本文中，我们提出了一个公开访问的Finrl-Meta库，该图书馆已由AI4FINANCE社区积极维护 ...

0 0 0 2025/07/09 arXiv:2211.03107v1 651106682

Differentiable Reward Optimization for LLM based TTS system

本文提出了一种新型的可区分奖励优化（DIFFRO）方法，旨在增强基于文本到语音的神经编解码语言模型的性能。与适用于TTS的人类反馈（RLHF）方法中的常规加固学习相反，DIFFRO直接基于神经编解码器 Token 来计算奖励，而不是依靠合成的音频。此外，我们采用Gumbel-Softmax技术来使奖励功能可区分，从而简化RLHF培训过程 ...

0 0 0 2025/07/09 arXiv:2507.05911v1 luffy

PanGu-$π$: Enhancing Language Model Architectures via Nonlinearity Compensation

（llm）（（llm）最近的趋势是增加模型大小（又名参数数量）和数据集的规模，以实现更好的生成能力，这已经被许多工作所证明，例如著名的 ...

0 0 0 2025/07/09 arXiv:2312.17276v1 wwwyuanstar

Samoyeds: Accelerating MoE Models with Structured Sparsity Leveraging Sparse Tensor Cores

基于专家的混合物（MOE）大型语言模型（LLMS）的不断升级的大小提出了重大的计算和记忆挑战，因此需要创新的解决方案以提高效率而不会损害模型的准确性。结构化的稀疏性是一种令人信服的策略，可以通过利用新兴的稀疏计算硬件来解决这些挑战。先前的工作主要集中在模型参数中的稀疏性，忽略了激活中固有的稀疏模式 ...

0 0 0 2025/07/09 arXiv:2503.10725v1 Daenerays

GraphCast: Learning skillful medium-range global weather forecasting

全球中期天气预报对于许多社会和经济领域的决策至关重要。传统的数值天气预报使用增加的计算资源来提高预报精度，但不能直接使用历史天气数据来改进底层模型。我们引入了一种基于机器学习的方法，称为，“ Graphcast”，它可以直接从再分析数据中进行训练... ...

0 0 0 2025/07/09 arXiv:2212.12794v2 zn0912_sdf

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）