伪装的物体试图将其质地掩盖到背景中,并将它们与背景区分开,即使对于人类来说,也很难。本文的主要目的是探索伪装的对象分割问题,即,为给定图像分割伪装的对象。尽管存在广泛的潜在应用,包括保存野生动物,并发现新物种,监视系统,搜索和救援任务,例如地震,洪水或飓风等自然灾害,但该问题尚未得到很好的研究 ...
类人动物机器人从超dex骨的全身运动中获得了许多灵巧性,从而实现了需要大型操作工作空间的任务:例如从地面上拾取对象。但是,由于其高度自由度(DOF)和非线性动态,因此在真实类人动物上实现这些能力仍然具有挑战性。我们提出了自适应运动优化(AMO),该框架将SIM到现实的增强学习(RL)与轨迹优化集成在一起,以实时,自适应的全身控制 ...
中国语法误差校正(CGEC)是自然语言处理中的一项关键任务,可以解决对第二语言(L2)和本地(L1)中文写作中对自动写作援助的不断增长的需求。尽管L2学习者努力掌握复杂的语法结构,但L1用户在学术,专业和正式环境中也从CGEC中受益,在学术,专业和正式环境中,写作精度至关重要。这项调查提供了对CGEC研究的全面综述,涵盖了数据集,注释方案,评估方法和系统进步 ...
最近的研究表明,学习有意义的内部表示既可以加速生成训练,又可以提高扩散 Transformer 的发电质量。但是,现有方法需要引入其他复杂的表示培训框架,或者依靠大规模的,预先训练的代表基础模型来在原始生成培训过程中提供代表指导。在这项研究中,我们认为扩散 Transformer 固有的独特判别过程使他们能够提供此类指导而无需外部表示组件 ...
在人类视觉系统中,自上而下的注意力在感知中起着至关重要的作用,其中大脑最初执行整体但粗糙的场景分析以提取显着提示(即首先概述),然后进行更精确的检查以做出更准确的判断(i ...
我们提出了扩散模型预测控制(D-MPC),这是一种新型的MPC方法,它使用扩散模型学习了多步操作建议和多步动力学模型,并将它们结合在一起用于在线MPC。在流行的D4RL基准测试中,我们显示的性能要比现有的基于模型的离线计划方法使用MPC明显好,并与最先进的ART(SOTA)基于模型和无模型的增强加固学习方法竞争。我们还说明了D-MPC在运行时优化新型奖励功能并适应新型动态的能力,并强调了其与现有基 ...
文本到图像生成(T2I)是指高质量图像的文本引导产生。在过去的几年中,T2I引起了广泛的关注,并且出现了许多作品。在这项调查中,我们全面审查了2021年至2024年进行的141件作品 ...
我们研究了一个路径计划问题,其中可能的移动动作被表示为与环境的网格表示相一致的有限运动原语。也就是说,每个原始词都对应于药物的短动力学运动运动,并表示为网格的扫掠细胞的序列。通常,启发式搜索,我 ...