我们提出了一个用于分析和比较分布的框架,使我们能够设计统计测试来确定两个样本是否来自不同的分布。我们的测试统计量是再生核希尔伯特空间(RKHS)的单位球中函数的最大期望差异。我们提出了两个基于检验统计量大偏差界限的检验,而第三个检验则基于该统计量的渐近分布 ...

0 0 0 0 2024/11/14 arXiv:0805.2368v1 sweet

多实例学习 (MIL) 是监督学习的一种变体,其中将单个类标签分配给一组实例。在本文中,我们将 MIL 问题描述为学习包标签的伯努利分布,其中包标签概率由神经网络完全参数化。此外,我们提出了一种与注意力机制相对应的基于神经网络的排列不变聚合算子 ...

0 0 0 0 2024/11/10 arXiv:1802.04712v4 sweet

扩散概率模型最近在生成图像建模中表现出了卓越的性能,引起了计算机视觉界的广泛关注。然而,虽然大量基于扩散的研究都集中在生成任务上,但很少有研究将扩散模型应用于一般医学图像分类。在本文中,我们提出了第一个基于扩散的模型(名为 DiffMIC),通过消除医学图像中的意外噪声和扰动并稳健地捕获语义表示来解决一般医学图像分类问题 ...

0 0 0 0 2024/11/09 arXiv:2303.10610v3 sweet

交叉熵损失与 softmax 一起可以说是卷积神经网络 (CNN) 中最常用的监督组件之一。尽管该组件简单、流行且性能出色,但它并没有明确鼓励特征的判别性学习。在本文中,我们提出了一种广义的大裕度softmax(L-Softmax)损失,它明确鼓励学习特征之间的类内紧凑性和类间可分离性 ...

0 0 0 0 2024/10/31 arXiv:1612.02295v4 sweet

在本文中,我们提出了一种混合 X 形视觉 Transformer,名为 Xformer,它在图像去噪任务上表现出色。我们探索加强不同范围 Token 的全球代表性。具体来说,我们采用两种类型的 Transformer 块 ...

0 0 0 0 2024/10/27 arXiv:2303.06440v2 sweet

本文提出了一种改进的二元神经网络训练算法,其中权重和激活都是二进制数。当前最先进的 XNOR-Net 方法的一个关键但相当被忽视的特征是使用分析计算的实值缩放因子来重新加权二进制卷积的输出。我们认为这些因素的分析计算不是最优的 ...

0 0 0 0 2024/10/27 arXiv:1909.13863v1 sweet

随着视觉变换器 (ViT) 的日益普及和尺寸的不断增大,人们越来越有兴趣使其在计算资源有限的边缘设备上部署时更加高效且计算成本更低。当权重和激活为二进制时,使用 popcount 运算,二值化可帮助显着减小 ViT 模型的大小及其计算成本。然而,当直接应用卷积神经网络(CNN)二值化方法或现有的二值化方法对 ViT 进行二值化时,与 ImageNet-1k 等具有大量类别的数据集上的 CNN 相比,ViT 的性能下降更大 ...

0 0 0 0 2024/10/27 arXiv:2306.16678v1 sweet

从分子图预测分子构象是化学信息学和药物发现中的一个基本问题。最近,机器学习方法,特别是深度生成模型取得了重大进展。受经典非平衡热力学中受热粒子从原始状态扩散到噪声分布的扩散过程的启发,我们提出了一种名为 GeoDiff 的新型生成模型,用于分子构象预测 ...

0 0 0 0 2024/10/21 arXiv:2203.02923v1 sweet

Gatys等人最近推出了一种神经算法,可以将一幅内容图像渲染为另一幅图像的风格,实现所谓的风格迁移。然而,他们的框架需要缓慢的迭代优化过程,这限制了其实际应用 ...

0 0 0 0 2024/10/17 arXiv:1703.06868v2 sweet

扩散模型在图像生成建模方面表现出了令人印象深刻的性能。在本文中,我们提出了一种基于扩散模型的新颖语义分割方法。通过修改训练和采样方案,我们表明扩散模型可以执行医学图像的病变分割 ...

0 0 0 0 2024/10/17 arXiv:2112.03145v2 sweet

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)