一译 —— 文档和论文翻译、对照阅读、讨论和社区

Zero-Shot Styled Text Image Generation, but Make It Autoregressive

风格的手写文本生成（HTG）最近从计算机视觉和文档分析社区中受到了关注，这些社区开发了几种基于gan-或扩散的解决方案，这些解决方案取得了令人鼓舞的结果。但是，这些策略未能推广到新型样式并具有技术限制，尤其是在最大产出长度和训练效率方面。为了克服这些局限性，在这项工作中，我们提出了一个新颖的文本图像生成框架，称为Emuru ...

0 0 0 2025/03/27 arXiv:2503.17074v2 虞梦泽的小狮子

Self-Guided Robust Graph Structure Refinement

最近的研究表明，GNN容易受到对抗攻击的影响。为了防御此类攻击，可靠的图形结构改进（GSR）方法旨在最大程度地减少基于节点特征，图形结构或外部信息的对抗边缘的影响。但是，我们发现现有的GSR方法受到狭窄量的限制，例如假设干净的节点功能，中等结构攻击以及外部清洁图的可用性，从而在现实世界中限制了适用性 ...

0 0 0 2025/03/27 arXiv:2402.11837v2 slices

Texture-Aware StarGAN for CT data harmonisation

计算机断层扫描（CT）在医学诊断中起关键作用；但是，重建内核的变异性会阻碍数据驱动的方法，例如深度学习模型，无法实现可靠和广义的性能。为此，通过在不同来源或条件上标准化数据来最大程度地降低此类非生物方差的有希望的解决方案。在这种情况下，事实证明，生成的对抗网络（GAN）是协调的强大框架，将其作为样式转移问题 ...

0 0 0 2025/03/27 arXiv:2503.15058v1 虞梦泽的小狮子

SAM Fewshot Finetuning for Anatomical Segmentation in Medical Images

我们提出了一种直接但高效的几次微型微调策略，以将任何细分（SAM）调整为医学图像中的解剖分段任务。我们的新方法围绕着对SAM内的面具解码器进行重新介绍，该方法利用了从有限的标记图像（少数弹出集合）中得出的几个嵌入，作为查询图像嵌入中捕获的解剖对象的提示。这种创新的重新印度大大减少了对标记体积图像标记的耗时的在线用户互动的需求，例如详尽的标记点和边界框，以通过切片提供提示 ...

0 0 0 2025/03/27 arXiv:2407.04651v1 虞梦泽的小狮子

LGPS: A Lightweight GAN-Based Approach for Polyp Segmentation in Colonoscopy Images

结直肠癌（CRC）是与癌症相关死亡的主要原因，结肠镜检查期间早期的息肉检测和去除对于预防至关重要。虽然深度学习方法在息肉细分中表现出了希望，但诸如高计算成本，小小的或低对比度息肉的难度以及整个数据集的概括性持续存在之类的挑战持续存在。为了解决这些问题，我们提出了LGP，这是一个基于轻量的GAN基于息肉的息肉框架 ...

0 0 0 2025/03/27 arXiv:2503.18294v1 虞梦泽的小狮子

ConFUDA: Contrastive Fewshot Unsupervised Domain Adaptation for Medical Image Segmentation

无监督的域适应性（UDA）旨在将知识从标记的源域中学到的知识转移到未标记的目标域。在UDA的背景下，对比度学习（CL）可以帮助更好地在特征空间中分开类。但是，在图像分割中，由于计算像素对比度损失而引起的大型内存足迹使其使用效率很高 ...

0 0 0 2025/03/27 arXiv:2206.03888v1 虞梦泽的小狮子

Learn to Explain Efficiently via Neural Logic Inductive Learning

做出可解释和自我解释决策的能力对于开发负责任的机器学习系统至关重要。在这项工作中，我们研究了在归纳逻辑编程范围（ILP）范围中解释问题的学习。我们提出了神经逻辑归纳学习（NLIL），这是一种有效的可区分ILP框架，它学习了可以解释数据中模式的一阶逻辑规则 ...

0 0 0 2025/03/27 arXiv:1910.02481v3 xuexizhanghao

LSceneLLM: Enhancing Large 3D Scene Understanding Using Adaptive Visual Preferences

对3D视觉模型（3D-VLM）的研究正在越来越多，这对于在3D场景中开发体现的AI至关重要，例如视觉导航和体现的问题回答。由于视觉特征的密度很高，尤其是在大型3D场景中，因此准确地找到与任务相关的视觉信息是具有挑战性的。现有作品试图将所有对象细分并将其特征视为场景表示 ...

0 0 0 2025/03/27 arXiv:2412.01292v2 李德栋

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）