我们提出了一种直接但高效的几次微型微调策略,以将任何细分(SAM)调整为医学图像中的解剖分段任务。我们的新方法围绕着对SAM内的面具解码器进行重新介绍,该方法利用了从有限的标记图像(少数弹出集合)中得出的几个嵌入,作为查询图像嵌入中捕获的解剖对象的提示。这种创新的重新印度大大减少了对标记体积图像标记的耗时的在线用户互动的需求,例如详尽的标记点和边界框,以通过切片提供提示 ...
0 0 0 2025/03/27 arXiv:2407.04651v1 虞梦泽的小狮子
结直肠癌(CRC)是与癌症相关死亡的主要原因,结肠镜检查期间早期的息肉检测和去除对于预防至关重要。虽然深度学习方法在息肉细分中表现出了希望,但诸如高计算成本,小小的或低对比度息肉的难度以及整个数据集的概括性持续存在之类的挑战持续存在。为了解决这些问题,我们提出了LGP,这是一个基于轻量的GAN基于息肉的息肉框架 ...
0 0 0 2025/03/27 arXiv:2503.18294v1 虞梦泽的小狮子
无监督的域适应性(UDA)旨在将知识从标记的源域中学到的知识转移到未标记的目标域。在UDA的背景下,对比度学习(CL)可以帮助更好地在特征空间中分开类。但是,在图像分割中,由于计算像素对比度损失而引起的大型内存足迹使其使用效率很高 ...
0 0 0 2025/03/27 arXiv:2206.03888v1 虞梦泽的小狮子
做出可解释和自我解释决策的能力对于开发负责任的机器学习系统至关重要。在这项工作中,我们研究了在归纳逻辑编程范围(ILP)范围中解释问题的学习。我们提出了神经逻辑归纳学习(NLIL),这是一种有效的可区分ILP框架,它学习了可以解释数据中模式的一阶逻辑规则 ...
0 0 0 2025/03/27 arXiv:1910.02481v3 xuexizhanghao
对3D视觉模型(3D-VLM)的研究正在越来越多,这对于在3D场景中开发体现的AI至关重要,例如视觉导航和体现的问题回答。由于视觉特征的密度很高,尤其是在大型3D场景中,因此准确地找到与任务相关的视觉信息是具有挑战性的。现有作品试图将所有对象细分并将其特征视为场景表示 ...
0 0 0 2025/03/27 arXiv:2412.01292v2 李德栋
我们提出Echoscene,这是一种交互式和可控的生成模型,在场景图上生成3D室内场景。 Echoscene利用双分支扩散模型,该模型动态适应场景图。由于节点,多个边缘组合和操纵器诱导的节点边缘操作,现有方法难以处理场景图 ...
0 0 0 2025/03/27 arXiv:2405.00915v2 orangelcx
多模式的大语言模型(MLLM)在2D视觉理解中表现出色,但在推理3D空间的能力方面仍然有限。在这项工作中,我们利用带有开放设定注释的大规模高质量3D场景数据来介绍1)新型监督的微调数据集和2)一个新的评估基准,重点是室内场景。我们将任何VQA(CA-VQA)数据的内容涵盖了各种空间任务,包括空间关系预测,度量大小和距离估计以及3D接地 ...
0 0 0 2025/03/27 arXiv:2503.13111v1 李德栋
共形预测是不确定性定量的流行无分配框架。在本文中,我们提出了一种新型的时间序列的保形预测方法,我们称之为基于内核的最佳加权共形预测间隔(KOWCPI)。具体而言,Kowcpi适应了经典的重新加权Nadaraya-Watson(RNW)估计器,以根据依赖数据进行分位数回归,并学习最佳数据自适应权重 ...
0 0 0 2025/03/27 arXiv:2405.16828v1 Peter302

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)