扩散模型是图像和视频合成进步的主要驱动力,但推理速度慢。蒸馏方法,例如最近引入的对抗扩散蒸馏(ADD),旨在将模型从多次推理转变为单步推理,尽管由于其依赖于固定的预训练 DINOv2 判别器,因此代价昂贵且难以优化。我们引入潜在对抗扩散蒸馏(LADD),这是一种克服 ADD 局限性的新颖蒸馏方法 ...

0 0 0 0 2024/03/19 arXiv:2403.12015v1 richardson

LLM 在不同领域表现出了值得称赞的表现。然而,制定高质量的提示来有效指导 LLM 对非人工智能专家提出了挑战。提示工程的现有研究提出了一些分散的优化原则,并设计了依赖于经验的提示优化器 ...

0 0 0 0 2024/03/17 arXiv:2402.16929v1 richardson

随着深度学习技术的出现,智能手机应用程序现在嵌入了设备上的人工智能功能,可以实现语音翻译等高级任务,以吸引用户并提高市场竞争力。良好的交互设计对于使人工智能功能可用且易于理解非常重要。然而,人工智能功能有其独特的挑战,如对输入的敏感性、动态行为和输出的不确定性 ...

0 0 1 3 2024/03/05 arXiv:2307.00756v1 richardson

快速工程已成为扩展大型语言模型(LLM)和视觉语言模型(VLM)功能底座的技术。这种方法利用特定于任务的指令(称为提示)来增强模型功效,并刷新核心模型参数提示不是更新模型参数,而只是根据给定的提示引发所需的模型行为,从而将预先训练的模型无缝集成到下游任务中... ...

0 1 0 0 2024/10/25 arXiv:2402.07927v1 richardson

多模式人工智能系统可能会在我们的日常生活中暗示。使这些系统增加交互性的一个有前景的方法使得它们体现为物理和虚拟环境中的代理。目前,系统利用现有的基础模型作为创建实体代理的基本构建块... ...

0 6 2 4 2024/11/01 arXiv:2401.03568v2 richardson

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)