基于文本的人物检索(TPR)是一项具有挑战性的任务,涉及根据文本描述检索特定的个人。尽管为弥合视觉和语言之间的差距付出了巨大努力,但这些模式之间的显着差异仍然构成挑战。以前的方法试图在模态共享空间中对齐文本和图像样本,但由于两种模态的可移动特征以及未能考虑模态共享空间中图像文本对的一对多关系,它们在优化方向上面临不确定性。 TPR 数据集 ...
蛋白质的自监督预训练方法最近引起了人们的关注,大多数方法都关注蛋白质序列或结构,而忽略了对其联合分布的探索,而这对于通过整合共同进化信息和信息来全面理解蛋白质功能至关重要。结构特点。在这项工作中,受到生成任务中去噪扩散模型成功的启发,我们提出了 DiffPreT 方法,通过序列结构联合扩散建模来预训练蛋白质编码器。 DiffPreT引导编码器沿着联合扩散轨迹从扰动的蛋白质序列和结构中恢复出天然的蛋白质序列和结构,从而获得序列和结构的联合分布 ...
近年来,去噪扩散模型在为图像生成建模生成语义上有价值的像素级表示方面取得了显着的成功。在这项研究中,我们提出了一种新颖的端到端框架,称为 Diff-UNet,用于医学体积分割。我们的方法将扩散模型集成到标准 U 形架构中,以有效地从输入体积中提取语义信息,从而为医学体积分割提供出色的像素级表示 ...
扩散模型已经证明了它们在各种生成任务中的有效性。然而,当应用于医学图像分割时,这些模型遇到了一些挑战,包括大量的资源和时间要求。他们还需要多步骤逆向过程和多个样本才能产生可靠的预测 ...
随着深度学习(DL)技术的快速发展,医学图像分割取得了显着的进步。现有的基于深度学习的分割模型通常具有区分性; IE ...
扩散模型在图像生成方面取得了巨大成功,其骨干网从 U-Net 发展到 Vision Transformers。然而,Transformers 的计算成本与 Token 数量成二次方,这导致在处理高分辨率图像时面临重大挑战。在这项工作中,我们提出了 Diffusion Mamba (DiM),它将基于状态空间模型 (SSM) 的序列模型 Mamba 的效率与扩散模型的表达能力相结合,以实现高效的高分辨率图像合成 ...
在医学图像分割领域,基于CNN和Transformer的模型已经得到了深入的研究。然而,CNN 对远程依赖关系的建模能力有限,这使得充分利用图像中的语义信息具有挑战性。另一方面,二次计算复杂度对 Transformers 提出了挑战 ...
状态空间模型 (SSM),尤其是 Mamba,由于能够以线性计算复杂性对远程依赖性进行建模,因此在医学图像分割方面显示出了巨大的前景。然而,准确的医学图像分割需要有效学习多尺度详细特征表示和全局上下文依赖性。尽管现有的工作试图通过整合CNN和SSM以发挥各自的优势来解决这个问题,但他们没有设计专门的模块来有效捕获多尺度特征表示,也没有充分解决Mamba应用于2D图像时的方向敏感性问题数据 ...
医学图像分割在诊断、治疗计划和医疗保健中至关重要,深度学习提供了有希望的进步。值得注意的是,卷积神经网络(CNN)擅长捕获局部图像特征,而视觉变换器(ViT)则通过多头自注意力机制熟练地建模远程依赖关系。尽管 CNN 和 ViT 各有优势,但它们在有效处理医学图像中的远程依赖性方面都面临着挑战,通常需要大量的计算资源 ...
基于深度学习 (DL) 的方法最近在双时态变化检测 (CD) 方面显示出了巨大的前景。现有的基于卷积神经网络(CNN)和 Transformer 的判别方法依靠判别表示学习来进行变化识别,同时努力探索本地和远程上下文依赖性。因此,在不同的地面场景中获得细粒度和鲁棒的 CD 地图仍然具有挑战性 ...