深度学习模型在准确描绘前列腺以诊断和治疗前列腺疾病方面表现出了显着的功效,但在不同医疗中心实现稳健的泛化仍然存在挑战。无源域适应(SFDA)是一种很有前途的技术,它可以调整深度分割模型来解决隐私和安全问题,同时减少源域和目标域之间的域转移。然而,最近的文献表明,由于不可预测的领域差距,国家食品药品监督管理局的表现仍远未令人满意 ...
主动学习被认为是缓解基于深度学习的分割方法对标注数据的高度依赖与医学图像昂贵的像素级标注成本之间矛盾的可行解决方案。然而,大多数现有方法都存在不可靠的不确定性评估以及难以平衡多样性和信息量的问题,导致分割任务的性能不佳。为此,我们提出了一种有效的基于预测精度的主动学习(PAAL)方法用于医学图像分割,首先引入预测精度来定义不确定性 ...
高性能科学模拟对于理解复杂系统很重要,但它会遇到计算挑战,尤其是在探索广泛的参数空间时。人们对开发深度神经网络(DNN)作为能够加速模拟的替代模型越来越感兴趣。然而,训练这些 DNN 代理的现有方法依赖于大量的模拟数据,这些数据是通过昂贵的计算启发式选择和生成的——这是文献中尚未探索的挑战 ...
主动学习(AL)旨在通过迭代选择信息最丰富的样本来构建高质量的标记数据集。这种采样很大程度上依赖于数据表示,而最近预训练在鲁棒特征学习中很流行。然而,由于预训练利用缺乏注释的低级借口任务,直接使用 AL 中的预训练表示不足以确定采样分数 ...
卷积神经网络 (CNN) 已使用通用方法成功应用于许多识别和学习任务;在非常大的监督示例数据集上训练深度模型。然而,这种方法在实践中相当有限制,因为收集大量标记图像非常昂贵。缓解这个问题的一种方法是提出智能方法,从一个非常大的集合中选择要标记的图像(即 ...
尽管联邦学习取得了令人惊叹的进步,但大多数研究都假设客户的数据是完全标记的。然而,在现实场景中,每个客户端都可能有大量未标记的实例。在利用未标记数据的各种方法中,联合主动学习框架已成为一种有前景的解决方案 ...
对大型注释数据集的需求限制了深度卷积神经网络(CNN)在许多实际应用中的使用。这个问题可以通过使用主动学习(AL)技术来缓解,该技术在给定的注释预算下,允许选择在微调时产生最大准确度的数据子集。最先进的 AL 方法通常依赖于视觉多样性或预测不确定性的测量,这无法有效地捕获空间背景的变化 ...
从噪声标记数据中学习对于现实世界的应用至关重要。传统的噪声标签学习(NLL)方法根据训练样本的损失分布将训练数据分类为干净集和噪声集。然而,他们经常忽视干净的样品,尤其是那些具有复杂视觉图案的样品,也可能会产生巨大的损失 ...
有偏见的数据可能会导致不公平的机器学习模型,这凸显了在数据分析开始时嵌入公平性的重要性,特别是在数据集管理和标记期间。作为回应,我们提出了 Falcon,一个可扩展的公平主动学习框架。 Falcon 采用以数据为中心的方法,通过战略样本选择来提高机器学习模型的公平性 ...
增量视图维护长期以来一直是数据库理论的中心问题。针对有限类别的数据库语言(例如关系代数或 Datalog),提出了许多解决方案。这些技术并不能自然地推广到更丰富的语言 ...