稀疏的基质矩阵乘法(SPMM)和采样致密的矩阵乘法(SDDMM)是科学计算和深度学习中的重要稀疏操作员。张量核心单元(TCUS)以优越的计算能力增强了现代加速器,这有望提高矩阵操作员的性能较高。但是,由于非结构化稀疏数据的不规则性,很难在TCU上提供实用的加速 ...
大规模数据集已连续证明了它们在几个研究领域的基本重要性,尤其是对于一些新兴主题的早期进展。在本文中,我们专注于视觉识别的问题,也称为唇读,近年来引起了人们的兴趣。我们提出了一个自然分布的大规模基准,用于野外唇读,名为LRW-1000,其中包含1,000堂课,其中包括来自2,000多名单独演讲者的718,018个样品 ...
我们探讨了三种策略,以增强各种图像编辑任务的性能:监督微调(SFT),增强学习(RL)和经过思考链(COT)推理。为了在一个一致的框架中研究所有这些组件,我们采用自回归的多模型模型,该模型以统一的方式处理文本和视觉 Token 。我们发现RL与大型多模式LLM验证仪相结合是这些策略中最有效的 ...
事实证明,合成异常样品是自我监视的2D工业异常检测的有效策略。但是,这种方法在多模式异常检测中很少探索,尤其是涉及3D和RGB图像的方法。在本文中,我们提出了一种用于3D异常合成的新型双模式增强方法,该方法简单并且能够模仿3D缺陷的特征 ...
计算机辅助设计(CAD)生成建模正在推动工业应用的重大创新。最近的作品在从各种输入(例如点云,网格和文本描述)中创建固体模型方面显示出了显着的进步。但是,这些方法从根本上与传统的工业工作流程不同,这些工业工作流程从2D工程图纸开始 ...
AI代理在与人类用户和工具的互动中越来越自治,从而增加了互动安全风险。我们提出了海科系统,这是一个框架,研究了各种各样且复杂的社交互动中的AI代理安全性。 Haicosystem具有模块化的沙盒环境,该环境模拟了人类用户与AI代理之间的多转交互作用,其中AI代理配备了各种工具(e ...
对于空中集群,在各种场景中广泛采用规定编队导航。然而,相关的规划策略通常缺乏在杂乱环境中避开障碍物的能力。为了解决这一缺陷,我们提出了一种基于优化的方法,可确保编队飞行的无碰撞轨迹生成... ...
文本到图像生成中对可控输出的需求不断增长,促进了多个实体生成(MIG)的重大进步,从而使用户能够定义实例布局和属性。当前,MIG中最新的方法主要基于适配器。但是,每次发布更高级模型时,这些方法都需要重新培养一个新的适配器,从而导致大量资源消耗 ...