一译 —— 文档和论文翻译、对照阅读、讨论和社区

2D Gaussian Splatting with Semantic Alignment for Image Inpainting

高斯脱落（GS）是一种将离散点转换为连续空间表示的技术，它在3D场景建模和2D图像超分辨率中显示出令人鼓舞的结果。在本文中，我们探讨了其未开发的图像覆盖潜力，这既需要局部连贯的像素合成和全球一致的语义恢复。我们提出了基于2D高斯脱落的第一个图像介绍框架，该框架将不完整的图像编码为2D高斯Splat系数的连续字段，并通过可区分的栅格化过程重建了最终图像 ...

0 0 0 2025/09/22 arXiv:2509.01964v1 Zhiyu_Yin

Graph Contrastive Learning with Adaptive Augmentation

最近，对比度学习（CL）已成为无监督图表学习的成功方法。大多数图CL方法首先在输入图上执行随机增强，以获得两个图表，并最大化两种视图中表示的一致性。尽管图CL方法的发展繁荣，但图形增强方案的设计 -  CL中的关键组成部分 - 仍然很少探索 ...

0 0 0 2025/09/22 arXiv:2010.14945v3 saya

Bailando: 3D Dance Generation by Actor-Critic GPT with Choreographic Memory

由于编舞规范对姿势的空间限制，驾驶3D角色在一段音乐之后跳舞是高度挑战的。此外，产生的舞蹈序列还需要与不同的音乐流派保持时间连贯性。为了应对这些挑战，我们提出了一个新颖的音乐到舞蹈框架Bailando，其中有两个强大的组成部分：1）舞蹈记忆，学会学会总结从3D姿势序列到量化的代码书到量化的代码书到量化的有意义的舞蹈单元，2）一个参与者 - 批判性生成的预培养的预培养的预训练的预训练器（GPT），将 ...

0 0 0 2025/09/22 arXiv:2203.13055v2 flugel

AdaThinkDrive: Adaptive Thinking via Reinforcement Learning for Autonomous Driving

尽管思想链（COT）之类的推理技术在视觉语言动作（VLA）模型中已被广泛采用，但它在端到端的自主驾驶中表现出了有希望的能力。但是，在简单的情况下，最近努力整合COT推理的努力通常不足，从而引入了不必要的计算间接费用而不提高决策质量。为了解决这个问题，我们提出了Adathinkdrive，这是一个新颖的VLA框架，其双重模式推理机制受到快速和缓慢思考的启发 ...

0 0 0 2025/09/22 arXiv:2509.13769v1 jane88

Rotation-Equivariant Self-Supervised Method in Image Denoising

近年来，自我监督的图像denoisising方法引起了大量的研究关注，因为这种方法减少了大型培训数据集的需求。与受监督的方法相比，自我监督的方法更多地依赖于深网本身中的先验嵌入。结果，大多数自我监督的方法都是使用卷积神经网络（CNN）体系结构设计的，这些方法很好地捕获了先前最重要的图像，即翻译等效的先验之一 ...

0 0 0 2025/09/22 arXiv:2505.19618v1 chitose

LEAP: LLM Inference on Scalable PIM-NoC Architecture with Balanced Dataflow and Fine-Grained Parallelism

大型语言模型（LLM）推论一直是日常生活和行业的普遍需求。 LLMS中的大张量尺寸和计算复杂性为内存，计算和数据库带来了挑战。本文提出了一个计算/内存/通信共同设计的非VON Neumann Accelerator，通过汇总内存处理（PIM）和计算网络芯片（NOC）（NOC），称为LEAP ...

0 0 0 2025/09/22 arXiv:2509.14781v1 jane88

AttenCraft: Attention-guided Disentanglement of Multiple Concepts for Text-to-Image Customization

随着文本对图像（T2I）扩散模型实现前所未有的性能，T2I定制进一步使用户有能力将扩散模型定制为预训练数据集中不存在的新概念，称为受试者驱动的生成。此外，从单个图像中提取几个新概念使该模型能够学习多个概念，并同时减少了训练数据准备的困难，敦促对多个概念的解开是一个新的挑战。但是，现有的分离模型通常需要预先确定的掩码或保留背景元素 ...

0 0 0 2025/09/22 arXiv:2405.17965v1 SOOKIE

RefDrop: Controllable Consistency in Image or Video Generation via Reference Feature Guidance

对于使用扩散模型控制多个生成的图像的一致性的兴趣迅速增强。在各种方法中，最近的作品发现，通过从多个参考图像中串联特征来操纵注意力模块提供了一种有效的方法来增强一致性而无需进行微调。尽管它的知名度和成功，但很少有研究阐明了促进其有效性的基本机制 ...

0 0 0 2025/09/22 arXiv:2405.17661v1 SOOKIE

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）