后门学习是研究深度神经网络脆弱性(DNNS)的新兴而重要的话题。在快速武器竞赛的状态下,正在提出许多开创性的后门攻击和防御方法。但是,我们发现,新方法的评估通常是验证其主张和准确绩效的不可思议的,这主要是由于快速发展,不同的环境以及实施和可重复性的困难 ...
有效的张量计算是现代深度学习(DL)工作负载的基石,但是现有的方法难以实现灵活的性能设计和张量布局的实现 - 逻辑张量和硬件资源之间的映射。 DL算法和硬件的复杂性日益增加,需要采取一种通用和系统的方法来处理张量。在这项工作中,我们介绍了线性布局,这是一种新颖的方法,该方法使用线性代数在$ \ mathbb {f} _2 $上模拟张量布局 ...
异常检测(AD)对于工业检查和医学诊断至关重要,但是现有的方法通常依赖于``比较''测试图像与培训集中的正常参考。但是,外观和定位的变化通常会使这些参考文献与测试图像的比对复杂化,从而限制了检测准确性。我们观察到大多数异常表现为局部变化,这意味着即使在异常图像中,有价值的正常信息仍然存在 ...
对于2D图像和视频,大型多模型(LMM)的快速发展促使这些模型扩展了这些模型以了解3D场景,旨在旨在实现人类的视觉空间智能。然而,实现与人类能力相当的深层空间理解在模型编码和数据获取方面构成了重大挑战。现有方法经常取决于外部深度传感器的几何捕获或利用现成的算法预先构造3D地图,从而限制了它们的可扩展性,尤其是在普遍的单眼视频输入和时间敏感的应用程序中 ...
长期以来,需要使用扩散模型生成准确的多语言文本,但仍然具有挑战性。最近的方法在用单语言渲染文本方面取得了进展,但是渲染任意语言仍然是未开发的领域。本文介绍了PaseText,这是一个基于DIT(扩散 Transformer )的文本渲染框架,该框架将denoto的潜伏期与编码为字符 Token 编码的多语言字符 Token 连接起来 ...
基础模型(FMS)提供社会福利,但也会放大风险。政府,公司和研究人员提出了监管框架,可接受的使用政策和安全基准。但是,现有的公共基准通常基于以前的文献,直觉或常识来定义安全类别,从而导致近期法规和政策规定的风险脱节类别集,这使得在这些基准测试中评估和比较FMS方面具有挑战性 ...
文本到语音综合的最新进展在为单个演讲者产生高质量的简短话语方面取得了显着的成功。但是,这些系统在将其功能扩展到长时间,多扬声器和自发对话时仍然面临挑战,这是播客等现实世界情景的典型代表。这些限制来自两个主要挑战:1)长语音:播客通常跨越几分钟,超过了大多数现有工作的上限; 2)自发性:播客的标志是它们的自发性,口头性质,与正式的书面背景形成鲜明对比;现有作品通常在捕捉这种自发性方面缺乏 ...
AI驱动的编码助手的兴起信号表明软件构建方式的基本转变。尽管AI编码助理已集成到现有的集成开发环境(IDE)中,但其全部潜力仍然很大程度上尚未开发。一个关键的挑战是,这些AI助手可能会遭受幻觉的困扰,导致开发人员拒绝AI不应决定的决策路径,有时即使没有用户的意识或同意 ...