收集和注释用于安全至关重要的物理AI系统(例如自动驾驶汽车(AV))的现实数据是耗时且昂贵的。捕获稀有边缘案例尤其具有挑战性,稀有边缘案例在AV系统的训练和测试中起着至关重要的作用。为了应对这一挑战,我们介绍了Cosmos-Drive-Dreams-综合数据生成(SDG)管道,旨在生成具有挑战性的场景,以促进下游任务,例如感知和驱动政策培训 ...
0 0 0 2025/08/29 arXiv:2506.09042v3 waitsop
专家(MOE)大语言模型(LLM)的稀疏混合物逐渐成为超大规模模型的主流方法。现有的MOE模型优化工作主要集中在粗粒的MOE架构上。随着DeepSeek模型的出现,细粒度的Moe模型正在越来越受欢迎,但是对它们的研究仍然有限 ...
0 0 0 2025/08/29 arXiv:2505.03531v1 gigi
我们提出Wawver,这是一种用于统一图像和视频生成的高性能基础模型。 Waver可以直接生成视频,其持续时间为5到10秒,其本机分辨率为720p,随后将其升级为1080p。该模型同时支持单个集成框架中文本对视频(T2V),图像到视频(I2V)和文本对图像(T2I)的生成 ...
0 0 0 2025/08/29 arXiv:2508.15761v2 waitsop
现代工业推荐系统会遇到多阶段优化错位的核心挑战:在排名阶段广泛使用的多目标优化范式与在检索阶段中广泛使用的单目标建模之间存在一个显着的语义差距。尽管主流行业解决方案通过平行的多路单目标检索实现了多目标覆盖范围,但这种方法可导致培训和提供目标数量的培训和服务资源的线性增长,并且在处理松散耦合目标方面具有固有的限制。本文提出了MPFormer,这是一种动态的多任务 Transformer 框架,该框架 ...
0 0 0 2025/08/29 arXiv:2508.20400v1 huxh
时间序列预测在支持各种关键应用程序(包括能源,医疗保健和金融)的决策方面起着至关重要的作用。尽管有最近的进步,但由于将历史数字序列与上下文特征相结合的挑战,预测准确性仍然有限,这通常包含非结构化的文本数据。为了应对这一挑战,我们提出了Tokencast,这是一个由LLM驱动的框架,它利用基于语言的符号表示作为上下文感知时间序列预测的统一中介 ...
0 0 0 2025/08/29 arXiv:2508.09191v1 cheungch
生成AI的最新突破已通过端到端一代改变了推荐系统。 Onerec将建议重新定义为自回归的生成任务,从而实现了高模型的利用。尽管Onerec-V1在现实部署中显示出显着的经验成功,但两个关键的挑战阻碍了其可扩展性和性能:(1)效率低下的计算分配,其中97 ...
0 0 0 2025/08/29 arXiv:2508.20900v1 adgwr
现有的视频头像模型可以产生流畅的人类动画,但它们努力超越单纯的身体形象,以捕捉角色的真实本质。他们的动作通常与低级线索等低级线索同步,例如音频节奏,缺乏对情感,意图或背景的更深入的语义理解。为了弥合这一差距,\ textbf {我们提出了一个框架,旨在生成角色动画,不仅在物理上是合理的,而且在语义上是连贯和表现力的 ...
0 0 0 2025/08/29 arXiv:2508.19209v1 yanghedada
大型推理模型(LRMS)在复杂的推理任务上表现出色,但通常会产生冗长的顺序链,从而导致很长的推理时间,然后才能到达最终答案。为了应对这一挑战,我们介绍了Sprint,这是一种新颖的培训和推理时间框架,旨在使LRM在推理过程中动态识别和利用并行化的机会。 Sprint结合了创新的数据策展管道,将自然语言推理轨迹重新组织为长马计划和平行执行的结构化回合 ...
0 0 0 2025/08/29 arXiv:2506.05745v1 ktka_kaka_ka

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)