视频生成领域的最新进展极大地影响了个人和行业的日常生活。然而,领先的视频生成模型仍然是闭源的,导致行业能力与公众可用的能力之间存在显着的性能差距。在本报告中,我们介绍了HunyuanVideo,这是一种创新的开源视频基础模型,其视频生成性能可与领先的闭源模型相媲美甚至超越 ...
0 0 0 2025/02/12 arXiv:2412.03603v4 wuyangecit
在天气预报的领域,传统模型经常应对离散的错误和时间依赖的源差异,从而限制了其预测性能。在本文中,我们提出了一种新型的单阶段,物理驱动的普通微分方程(ODE)模型,旨在提高天气预测精度。通过利用波动方程理论并整合了时间依赖的源模型,Weatherode有效地解决了与时间散布误差和动态大气过程相关的挑战 ...
0 0 0 2025/02/12 arXiv:2410.06560v1 maxwill
传统上,气候和天气预测依赖于大气物理学的复杂数值模拟。深度学习方法(例如变形金刚)最近通过复杂的网络预测提出了模拟范式的挑战。但是,它们通常充当数据驱动的黑盒模型,忽略了基本物理学,并且缺乏不确定性量化 ...
0 0 0 2025/02/12 arXiv:2404.10024v1 maxwill
Steel-LLM是一种从头开始开发的中文语言模型,目的是尽管计算资源有限,但仍可创建高质量的开源模型。该项目于2024年3月启动,旨在在大型数据集上培训一项10亿参数模型,优先考虑透明度和共享实用见解,以帮助社区中的其他人。培训过程主要集中在中国数据上,其中包括一小部分英语数据,通过提供对模型构建旅程的更详细且实用的说明,从而解决了现有的开源LLMS中的差距 ...
0 0 0 2025/02/12 arXiv:2502.06635v1 liuweitang
在这项工作中,我们构建了一个大型数据集,用于地面至意义的人搜索,名为G2APS,其中包含31,770张260,559个带注释的界限的图像,用于在无人机和接地监视摄像机中出现的2,644个身份。据我们所知,这是第一个用于跨平台智能监视应用程序的数据集,无人机可以作为地面监视摄像机的有力补充。为了更现实地模拟实际的跨平台地面至意见监视场景,监视摄像机在地面上方约2米处固定,而无人机捕获了不同位置的人的 ...
0 0 0 2025/02/12 arXiv:2308.12712v1 19396386025
一组人中的偏好不是统一的,而是遵循分布。尽管现有的对齐方式(例如直接偏好优化(DPO))试图引导模型以反映人类的偏好,但它们努力捕获一个组内的分布多元化偏好。这些方法通常偏向于主导偏好,忽略了观点的多样性,尤其是在发生冲突的偏好时 ...
0 0 0 2025/02/12 arXiv:2412.20299v1 zaq
直接偏好优化(DPO)及其变体已变得越来越流行,以使语言模型具有人类偏好。这些方法旨在教授模型以更好地区分所选(或首选)和拒绝(或分配)响应的方法。但是,先前的研究已经确定,所选反应的概率通常会在训练过程中降低,而这种现象被称为可能性位移 ...
0 0 0 2025/02/12 arXiv:2502.07599v1 zaq
视觉语言模型(VLM)的快速发展促进了人工智能方面的重大进步,扩大了包括地球观察(EO)在内的各个学科的研究。尽管VLM在EO内增强了图像理解和数据处理,但它们的应用程序主要集中在图像内容描述上。这个有限的重点忽略了它们在地理和科学回归任务中的潜力,这对于各种EO应用至关重要 ...
0 0 0 2025/02/12 arXiv:2412.16583v1 maxwill

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)