一译 —— 文档和论文翻译、对照阅读、讨论和社区

GPTCast: a weather language model for precipitation nowcasting

这项工作介绍了GPTCast，这是一种基于雷达的降水集合的生成深度学习方法，灵感来自大型语言模型（LLMS）的进步。我们采用GPT模型作为预报器，使用 Token 化雷达图像学习时空沉淀动力学。 Token 仪基于量化的变异自动编码器，其具有针对降水量偏斜分布量身定制的新型重建损失，从而促进了忠实的高降雨量重建 ...

0 0 0 2025/09/15 arXiv:2407.02089v2 zhangyuanwang

Ban&Pick: Achieving Free Performance Gains and Inference Speedup via Smarter Routing in MoE-LLMs

稀疏的专家混合物（MOE）已成为有效缩放大语言模型（LLM）的关键结构。最近的细元素萌设计每层引入数百名专家，每个 Token 被激活，使得更强的专业化。但是，在预训练期间，路由器主要是为了稳定性和鲁棒性而进行了优化：它们过早地收敛并实施平衡的用法，从而限制了模型性能和效率的全部潜力 ...

0 0 0 2025/09/15 arXiv:2509.06346v1 zhangqi

Multi-Task Multi-Agent Reinforcement Learning via Skill Graphs

多任务多项式增强学习（MT-MARL）最近因其在多个任务中增强MARL的适应性的潜力而引起了人们的关注。但是，对于现有的多任务学习方法来处理复杂问题，这是一项挑战，因为它们无法处理无关的任务并具有有限的知识转移功能。在本文中，我们提出了一种分层方法，可以有效解决这些挑战 ...

0 0 0 2025/09/15 arXiv:2507.06690v1 Langston

Glimpse: Enabling White-Box Methods to Use Proprietary Models for Zero-Shot LLM-Generated Text Detection

先进的大型语言模型（LLMS）可以生成文本几乎与人写的文本几乎没有区别，从而强调了LLM生成的文本检测的重要性。但是，当前的零击技术面临挑战，因为白盒方法仅限于使用较弱的开源LLM，而黑盒方法受到更强的专有LLM的部分观察的限制。似乎不可能启用白色框方法使用专有模型，因为对模型的API级访问均未提供完整的预测分布或内部嵌入 ...

0 0 0 2025/09/15 arXiv:2412.11506v2 15966829631

RAPHAEL: Text-to-Image Generation via Large Mixture of Diffusion Paths

文本到图像的一代最近目睹了非凡的成就。我们介绍了一种称为拉斐尔（Raphael）的文本条件图像扩散模型，以生成高度艺术的图像，该图像准确地描绘了文本提示，涵盖了多个名词，形容词和动词。这是通过堆叠数十种Experts（Moes）层的混合物来实现的 ...

0 0 0 2025/09/15 arXiv:2305.18295v5 jingxi

A Methodology to Select Topology Generators for WANET Simulations (Extended Version)

许多关于Wanets的学术和工业研究工作依赖于模拟，至少在第一阶段，以获得初步结果，以随后在实际环境中进行验证。拓扑生成器（TG）通常用于在发生这些模拟的人造拓扑中产生节点的初始放置。这些实验的重要性在很大程度上取决于人工拓扑的代表性 ...

0 0 0 2025/09/15 arXiv:1908.09577v1 s_75san

LLaSO: A Foundational Framework for Reproducible Research in Large Language and Speech Model

大型语音语言模型（LSLMS）的发展因碎片结构和缺乏透明度而减慢，阻碍了研究的系统比较和可重复性。与视觉语言域不同，LSLM字段遭受了释放模型权重的共同实践，而无需其相应的训练数据和配置。为了解决这些关键的差距，我们介绍了LLASO，这是第一个用于大规模语音建模的完全开放的端到端框架 ...

0 0 0 2025/09/15 arXiv:2508.15418v1 CJY1018

Leveraging OS-Level Primitives for Robotic Action Management

端到端的模仿学习框架（例如VLA）在机器人技术中越来越突出，因为它们可以通过直接从感知学习到控制来快速任务转移，从而消除了对复杂的手工制作的功能的需求 ...

0 0 0 2025/09/15 arXiv:2508.10259v1 yunfeng

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）