我们介绍infinigen,一个自然世界逼真3d场景的程序生成器。infinigen:从形状到纹理:从形状到纹理,每项资源都是通过随机数学规则从头开始生成的,不使用外部源并允许无限的变化和组合。infinigen广泛覆盖自然世界中的物体和场景 ...
知识蒸馏(KD)是借助训练有素的教师模型来训练轻量级学生模型的典型方法。但是,大多数KD方法都需要访问教师的培训数据或模型参数,这是不现实的。为了解决这个问题,最近的Works在无数据和黑色盒子设置下研究KD ...
统一模型的图像理解和产生的最新进展令人印象深刻,但是大多数方法仍然限于以多种方式为条件的单模式生成。在本文中,我们提出了Mogao,这是一个统一的框架,通过因果方法来实现交织的多模式生成来推动这一范式。 Mogao整合了建筑设计中的一系列关键技术改进,包括深融合设计,双重视觉编码器,交织的旋转位置嵌入以及多模式的无分类器指导,可以利用它来利用两种自动性模型的文本生成模型和扩散模型的优势,以实现高素 ...
在开放式方案中,操作机器人具有不同的任务,是机器人技术中的至关重要的研究和应用方向。尽管自然语言处理和大型多模型模型的最新进展增强了机器人理解复杂说明的能力,但机器人操纵仍然面临着程序技能困境和开放环境中声明性的技能困境。现有方法通常会损害认知和执行能力 ...
端到端的自主驾驶(E2E-AD)已迅速成为实现完全自治的有前途的方法。但是,现有的E2E-AD系统通常采用传统的多任务框架,通过单独的特定任务负责人来解决感知,预测和计划任务。尽管接受了完全可区分的培训,但他们仍然会遇到任务协调的问题,并且系统的复杂性仍然很高 ...
FP4精度中的训练前 Transformer 正在成为一种有前途的方法,以获得大幅加速,但准确性丧失。显微镜(MX)数据格式提供了一种细粒度的每组量化方法,以提高FP4格式的表示能力,并由下一代Blackwell GPU体系结构支持。但是,使用MXFP4数据格式的培训仍然会导致大量降级,并且缺乏对原因的系统研究 ...
这些讲义是为18.657课程编写的,在麻省理工学院的高维统计数据。他们建立在2013 - 14年普林斯顿大学准备的一套笔记的基础上,这些票据多年来经过了修改(并希望得到改善) ...
本讲座旨在为数据科学的早期硕士和博士学位学生准备与机器学习中的基本思想相关的学科。它从现代机器学习中的基本想法开始,分类为主要目标任务。这些基本思想包括损失配方,反向传播,随机梯度下降,概括,模型选择以及人工神经网络的基本块 ...