大型语言模型(LLMS)在解决跨不同领域的复杂任务方面表现出了巨大的潜力,通常通过采用遵循详细说明和操作序列的代理工作流程。但是,构建这些工作流程需要大量的人类努力,限制可伸缩性和可推广性。最近的研究试图自动化这些工作流的生成和优化,但是现有方法仍然依赖于初始手动设置,而无法实现完全自动化和有效的工作流程生成 ...
近年来,生成人工智能(AI)在各个领域取得了重大进展。 4d Generation以2D,视频和3D内容生成领域的快速发展为基础,成为一个新颖而快速发展的研究领域,引起了人们日益增长的关注。 4d Generation专注于基于用户输入的时空一致性创建动态3D资产,提供更大的创意自由和更丰富的沉浸式体验 ...
我们提出Free4D,这是一个从单个图像中为4D场景生成的新颖无调框架。现有的方法要么关注对象级生成,使场景级别的生成不可行,要么依靠大规模的多视频视频数据集进行昂贵的培训,并且由于4D场景数据的稀缺性而具有有限的概括能力。相比之下,我们的主要见解是将预先训练的基础模型提取为一致的4D场景表示,该模型具有有希望的优势,例如效率和概括性 ...
大型语言模型(LLMS)表现出了出色的功能,以高度计算要求。最近的研究表明,LLMS中的中间层可以被删除或重新排序而无需大量准确性损失。但是,尚未利用这种见解来提高推论效率。利用观察到的层独立性,我们提出了一种新颖的方法,该方法将连续的层分为并联评估的对,有效地重组计算图以增强并行性 ...
语言模型校准是指模型的置信度与其响应的实际性能之间的一致性。虽然之前的研究指出了大型语言模型 (LLM) 中的过度自信现象,并表明经过人类反馈强化学习 (RLHF) 训练的 LLM 对更尖锐的输出概率过于自信,但在本研究中,我们发现 RLHF 往往会领先于模型表达对自己的反应的言语上的过度自信。我们调查了这种过度自信的根本原因,并证明用于近端策略优化(PPO)的奖励模型表现出对高置信度分数的固有偏 ...
光流随着时间的推移捕获图像序列中像素的运动,提供有关运动,深度和环境结构的信息。飞行的昆虫利用这些信息来导航并避免障碍,即使在复杂的环境中,它们也可以执行高度敏捷的动作。尽管具有潜力,但自主飞行机器人尚未充分利用此运动信息来达到可比的敏捷性和鲁棒性水平 ...
大型推理语言模型(LRLMS)的最新进展依赖于测试时间缩放,这扩展了长期的经营链(COT)生成以解决复杂的任务。但是,长期以来,长期以来的思考不仅会减慢解决问题的效率,而且由于非常详细或冗余的推理步骤而导致的准确性损失有风险。我们提出了一种简单而有效的方法,该方法允许LLMS通过生成期间的早期出口来自我截断COT序列 ...
最近的研究表明,学习有意义的内部表示既可以加速生成训练,又可以提高扩散 Transformer 的发电质量。但是,现有方法需要引入其他复杂的表示培训框架,或者依靠大规模的,预先训练的代表基础模型来在原始生成培训过程中提供代表指导。在这项研究中,我们认为扩散 Transformer 固有的独特判别过程使他们能够提供此类指导而无需外部表示组件 ...