文本到图像生成(T2I)是指高质量图像的文本引导产生。在过去的几年中,T2I引起了广泛的关注,并且出现了许多作品。在这项调查中,我们全面审查了2021年至2024年进行的141件作品 ...
我们研究了一个路径计划问题,其中可能的移动动作被表示为与环境的网格表示相一致的有限运动原语。也就是说,每个原始词都对应于药物的短动力学运动运动,并表示为网格的扫掠细胞的序列。通常,启发式搜索,我 ...
作为视频生成的基本支柱,扩散模型由于去噪的顺序性质而受到推理速度低的挑战。以前的方法通过以统一选择的时间步长缓存和重用模型输出来加速模型。然而,这种策略忽略了模型输出之间的差异在时间步上不均匀的事实,这阻碍了选择合适的模型输出进行缓存,导致推理效率和视觉质量之间的平衡不佳 ...
使用大语言模型(LLM)进行个性化,标准化任务的自主权提高了人类效率。自动化网络任务(例如在预算内预订酒店)越来越受到追捧。满足实际需求,Web代理也是各种代理接地方案的重要概念验证示例,并在许多未来的应用程序中都取得了成功的进步 ...
LLM具有生成计划的巨大潜力,将最初的世界国家转变为期望的目标状态。大量研究探索了LLM在各种计划任务中的使用,从网络导航到旅行计划和数据库查询。但是,其中许多系统是针对特定问题量身定制的,因此将它们进行比较或确定新任务的最佳方法具有挑战性 ...
以全身方式对类人生物机器人进行远程操作,这标志着发展通用机器人智能的基本步骤,人类运动为控制所有自由程度提供了理想的界面。然而,大多数当前的类人动物远距离系统无法实现协调的全身行为,通常将自己限制在孤立的运动或操纵任务上。我们介绍了通过全身运动模仿的人形动物近视系统的远程工作全身模仿系统(Twist) ...
虽然动态卷积(DY-CONV)通过通过多个平行重量与注意机制相结合的自适应重量选择来表现出令人鼓舞的性能,但这些权重的频率响应往往表现出很高的相似性,从而导致高参数成本,但适应性有限。在这项工作中,我们引入了频率动态卷积(FDCONV),这是一种新颖的方法,通过在傅立叶域中学习固定参数预算来减轻这些局限性。 FDCONV将该预算分为具有频率傅立叶指数的基于频率的组,从而在不增加参数成本的情况下构建 ...
人工智能在金融行业取得了长足的进步,彻底改变了数据的处理和解释。在这些技术中,大型语言模型(LLMS)通过自动化复杂的任务,增强客户服务并提供详细的财务分析来证明转型金融服务的巨大潜力。首先,我们介绍了Idea-Finbench,这是一种评估基准,专门针对评估大语模型(LLMS)中的财务知识的量身定制 ...