我们引入元提示,这是一种有效的脚手架技术,旨在增强语言模型(LM)的功能。这种方法将单个 LM 转变为多面预测,擅长管理和集成多个独立的 LM 查询。通过使用高级指令,元提示引导 LM 将复杂的任务分割为更小、更容易管理的子任务…… ...

0 0 0 0 2024/11/15 arXiv:2401.12954v1 smallz

尽管思想链在增强语言模型推理方面取得了成功,但其基本过程仍然不太为人所知。尽管逻辑上合理的推理对于思维链来说本质上至关重要,但先前的研究令人惊讶地表明,当使用无效的演示时,影响最小。此外,传统的思维链并没有告知语言模型要避免哪些错误,这可能会导致更多错误 ...

0 0 0 0 2024/09/09 arXiv:2311.09277v1 smallz

随着大规模视频数据集的可用性和扩散模型的进步,文本驱动的视频生成取得了实质性进展。然而,现有的视频生成模型通常在有限数量的帧上进行训练,导致在推理过程中无法生成高保真长视频。此外,这些模型仅支持单文本条件,而现实生活场景通常需要多文本条件,因为视频内容随时间变化 ...

0 0 0 0 2025/08/17 arXiv:2310.15169v3 smallz

这项工作旨在通过利用预训练的文本到图像(T2I)模型作为基础来学习高质量的文本到视频(T2V)生成模型。这是一项非常理想但具有挑战性的任务,同时 a) 完成视觉逼真和时间连贯的视频的合成,同时 b) 保留预训练 T2I 模型强大的创意生成性质。为此,我们提出了 LaVie,一种集成视频生成框架,可在级联视频潜在扩散模型上运行,包括基本 T2V 模型、时间插值模型和视频超分辨率模型 ...

0 0 0 0 2025/08/17 arXiv:2309.15103v2 smallz

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)