我们引入了一个基于 Transformer 的神经网络,以从地球静止卫星图像大规模生成高分辨率(3km)合成雷达反射率。这项工作旨在增强对高影响天气事件的短期对流尺度预测,并有助于对美国的数值天气预测进行数据同化。与卷积方法有限的卷积方法相比,我们的结果表明,各种复合反射率阈值的清晰度和更高精度的提高 ...
在许多领域,从医疗保健和经济学到公共政策,从观察数据中估算治疗效果(TE)是一项关键但复杂的任务。尽管机器学习和因果推断的最新进展已经产生了强大的估计技术,但由于需要深入的因果假设,调整策略和模型选择,其采用仍然有限。在本文中,我们介绍了CATE-B,这是一种开源的副驾驶系统,该系统在代理框架内使用大型语言模型(LLM),以指导用户完成治疗效果估算的端到端过程 ...
While controllable generative models for images and videos have achieved remarkable success, high-quality models for 3D scenes, particularly in unbounded scenarios like autonomous driving, remain unde ...
就像面临艰苦考试问题的学生一样,大型语言模型有时会猜测不确定的时候,产生合理但不正确的陈述,而不是承认不确定性。这种“幻觉”即使在最先进的系统和破坏信任中也存在。我们认为语言模型幻觉是因为培训和评估程序奖励猜测不确定性,并且我们分析了现代培训管道中幻觉的统计原因 ...
语义文本表示是自然语言处理领域的基本任务。现有的文本嵌入(例如 ...
我们提出了Galaxea Open-World数据集,这是一个大规模的,多样化的机器人行为集合,记录在真实的人类生活和工作环境中。所有示范均使用一致的机器人实施例收集,并与精确的子任务级别注释配对,以促进培训和评估。在此数据集的基础上,我们介绍了G0,这是一个双层系统框架,该框架将视觉模型(VLM)与视觉语言行动(VLA)模型(VLA)模型相结合,以进行细粒度执行 ...
这本书是为了帮助学生将量子力学的所有概念转变为具体的计算机表示,这些量子可以在更深层次的水平上构建,评估,分析和希望在更深层次的水平上理解。它是为瑞士巴塞尔大学每年举行的硕士和博士学位演讲而撰写的。目的是给学生提供一种语言,在该语言中可以更详细地谈论量子物理,并以这种语言的流利性开始学生 ...
长期的视频生成从根本上是一个漫长的上下文记忆问题:模型必须保留和检索远距离的显着事件,而不会崩溃或漂移。但是,将扩散 Transformer 缩放为生成长篇小说视频的缩放量受到自我注意的二次成本的限制,这使得记忆和计算很难进行,并且难以为长序列进行优化。我们将长篇小说视频生成重新铸造为内部信息检索任务,并提出了一个简单,可学习的稀疏注意路由模块,上下文(MOC)的混合物,作为有效的长期内存检索引擎 ...
 
                  
                 
                  
                 
                  
                 
                  
                 
                  
                 
                  
                 
                  
                