用于网格细节的最新方法主要利用生成对抗网络(GAN)来生成粗糙的网格。这些方法通常会为每个类别或类似类别学习特定的样式代码,而无需在不同级别的细节(LOD)上执行几何监督。因此,这种方法通常无法跨越更广泛的类别,并且无法确保在整个详细过程中形成一致性 ...
基于UNET的扩散模型(例如ControlNET和IP-Ap-Ap-Adapter)的最新进展已引入有效的空间和主题控制机制。但是,DIT(扩散 Transformer )体系结构仍在高效且灵活的控制方面挣扎。为了解决这个问题,我们提出了EasyControl,这是一个新型框架,旨在统一具有高效率和灵活性的条件引导的扩散 Transformer ...
扩散模型已被证明在生成高质量图像方面非常有效。然而,随着这些模型变得越来越大,它们需要更多的内存并遭受更高的延迟,给部署带来了巨大的挑战。在这项工作中,我们的目标是通过将扩散模型的权重和激活量化为 4 位来加速扩散模型 ...
ODDN: Addressing Unpaired Data Challenges in Open-World Deepfake Detection on Online Social Networks
尽管在深层检测方面取得了重大进展,但处理不同的图像质量,尤其是由于在线社交网络(OSN)的不同压缩所致,仍然具有挑战性。当前方法通过利用配对图像之间的相关性,无论是原始图像还是压缩。但是,在开放世界的方案中,配对数据很少,并且很容易获得压缩图像,但很难获得相应的原始版本 ...
本文介绍了Augraphy,这是一个用于构建数据增强管道的Python库,这些库会产生在现实世界文档图像数据集中常见的扭曲。 Augraphy除了提供许多不同的策略来产生增强版本的清洁文档图像,这些策略看起来像是通过标准办公室操作所改变的,例如打印,扫描和通过旧机器或肮脏的机器,墨水降低,随着时间的推移和手写标记,它们似乎已被标准的办公室操作(例如打印,扫描和传真),以及诸如标准办公室操作(例如打 ...
持续学习旨在逐步获得数据流中的新概念,同时抵制忘记以前的知识。随着强大的预训练模型(PTM)的兴起,使用这些基础模型而不是从头开始学习的培训增量学习系统越来越兴趣。现有的作品通常将PTM视为强的初始点,并在第一个会话中直接应用参数效率调整(PET)以适应下游任务 ...
大型语言模型(LLM)的最新进步将它们定位为临床决策的强大工具,并在医疗保健中迅速扩展了应用。但是,对偏见的担忧仍然是LLM临床实施的重大挑战,尤其是在性别和种族方面。这项研究调查了适用于复杂临床病例的LLM中偏见的评估和缓解,重点是性别和种族偏见 ...
当提示语言模型完成任务时,用户通常会忽略重要的方面。虽然提出问题可以解决这种歧义(GATE;Li 等人,2023),但模型通常很难提出好的问题 ...