源代码作者归属对于软件取证、抄袭检测和保护软件补丁完整性非常重要。现有技术通常依赖于监督机器学习,由于需要大型标记数据集,因此很难在不同编程语言和编码风格之间进行泛化。受使用大型语言模型 (LLM) 的自然语言作者分析的最新进展的启发,该模型在无需特定于任务的调整的情况下表现出卓越的性能,本文探讨了使用 LLM 进行源代码作者归属。我们提出了一项全面的研究,证明最先进的 LLM 可以成功地归属不同语言的源代码作者。 LLM 可以通过零样本提示确定两个代码片段是否由同一作者编写,马修斯相关系数 (MCC) 为 0.78,并且可以通过少样本学习从一小组参考代码片段中归属代码作者,实现 0.77 的 MCC。此外, LLM 对错误归因攻击表现出一定的对抗鲁棒性。尽管有这些功能,我们发现由于输入 Token 的限制,LLM 的天真提示无法很好地适应大量作者。为了解决这个问题,我们提出了一种锦标赛式的大规模归因方法。在 GitHub 上的 C++(500 位作者,26,355 个样本)和 Java(686 位作者,55,267 个样本)代码数据集上评估这种方法,我们仅使用每位作者一篇参考文献,C++ 的分类准确率高达 65%,Java 的分类准确率高达 68.7%。这些结果为将 LLM 应用于网络安全和软件工程中的代码作者归属开辟了新的可能性 ...

0 0 0 0 2026/01/22 arXiv:2501.08165v1 hss

模态补全,即生成被遮挡对象的不可见部分,对于图像编辑和 AR 等应用至关重要。先前的方法面临着数据需求、泛化或渐进式管道中的错误累积的挑战。我们提出了一个基于前期协作推理的协作多智能体推理框架来克服这些问题。我们的框架使用多个代理来协作分析遮挡关系并确定必要的边界扩展,从而生成用于修复的精确掩模。同时,代理生成细粒度的文本描述,从而实现细粒度的语义指导。这确保了准确的对象合成并防止遮挡物或其他不需要的元素的再生,尤其是在大的修复区域内。此外,我们的方法直接生成由扩散 Transformer 的可见掩模和注意力图引导的分层 RGBA 输出,从而消除了额外的分割。广泛的评估表明我们的框架实现了最先进的视觉质量 ...

0 0 0 0 2026/01/22 arXiv:2509.17757v1 wonglliam

我们提出了 \textbf{LightOnOCR-2-1B},这是一种 1B 参数端到端多语言视觉语言模型,可以将文档图像(例如 PDF)转换为干净、自然有序的文本,而无需脆弱的 OCR 管道。 LightOnOCR-2 经过大规模、高质量蒸馏混合物的训练,具有强大的扫描、法语文档和科学 PDF 覆盖范围,在 OlmOCR-Bench 上实现了最先进的结果,同时比之前性能最佳的模型小 9 倍,速度快得多。我们进一步扩展输出格式以预测嵌入图像的归一化边界框,通过恢复策略在预训练期间引入本地化,并使用基于 IoU 的奖励通过 RLVR 对其进行细化。最后,我们通过检查点平均和任务算术合并来提高鲁棒性。我们在 Apache 2.0 下发布模型检查点,并在各自的许可下公开发布数据集和 \textbf{LightOnOCR-bbox-bench} 评估 ...

0 0 0 0 2026/01/22 arXiv:2601.14251v1 moshmode

非刚性运动结构 (NRSfM) 是一个经典的 3D 视觉问题,其中以 2D 序列作为输入来估计相应的 3D 序列。最近,深度神经网络极大地推进了 NRSfM 的任务。然而,现有的深度 NRSfM 方法在处理与 NRSfM 问题相关的固有序列属性和运动模糊性方面仍然存在局限性。在本文中,我们从两个角度重新审视深度 NRSfM,以解决当前深度 NRSfM 方法的局限性:(1)规范化和(2)序列建模。我们提出了一种易于实现的按序列标准化方法,而不是以前的按数据集标准化方法。考虑到这一点,我们提出了一种结合时间信息和子空间约束的序列建模方法。因此,与之前的工作相比,我们实现了更优化的 NRSfM 重建流程。通过在几个常用数据集上使用相应的正则化模块测试序列到序列深度 NRSfM 管道,验证了我们方法的有效性 ...

0 0 0 0 2026/01/22 arXiv:2412.07230v1 GAX

尽管非刚性运动结构(NRSfM)已被广泛研究并取得了巨大进展,但仍然存在阻碍其广泛实际应用的关键挑战:1)固有的运动/旋转模糊性需要具有额外约束的显式相机运动恢复或复杂的 Procrustean 对齐; 2) 现有的全局形状的低阶建模可能会过度惩罚 3D 形状序列中的剧烈变形。本文提出从时空建模的角度来解决上述问题。首先,我们提出了一种新颖的时间平滑 Procrustean 对齐模块,该模块可估计 3D 变形形状并通过连续对齐 3D 形状序列来调整相机运动。我们的新对准模块弥补了对准过程中复杂参考3D形状的要求,这更有利于非各向同性变形建模。其次,我们提出了一种空间加权方法,在不同位置自适应地强制执行低秩约束,以更好地适应剧烈的空间变化变形重建。我们的建模优于现有的基于低秩的方法,并且跨不同数据集的广泛实验验证了我们方法的有效性 ...

0 0 0 0 2026/01/22 arXiv:2405.04309v3 GAX

非刚性运动结构(NRSfM)是一种解决单目视觉可变形同步定位和建图(SLAM)中建图挑战的有前景的技术,引起了越来越多的关注。我们引入了一种称为 Con-NRSfM 的新方法,用于共形变形下的 NRSfM,其中包含等距变形作为子集。我们的方法使用通过基于图形的框架优化的 2D 选择图像扭曲来执行逐点重建。与依赖严格假设(例如局部平面或局部线性变形)并且无法恢复共形尺度的现有方法不同,我们的方法消除了这些约束并准确计算局部共形尺度。此外,我们的框架解耦了深度和共形尺度的约束,这在其他方法中是不可分割的,从而实现更精确的深度估计。为了解决所制定问题的敏感性,我们采用并行可分离迭代优化策略。此外,还结合了利用编码器-解码器网络的自监督学习框架来生成具有纹理的密集 3D 点云。使用合成数据集和真实数据集的模拟和实验结果表明,我们的方法在重建精度和鲁棒性方面超越了现有方法。所提议方法的代码将在项目网站上公开:此 https URL ...

0 0 0 0 2026/01/22 arXiv:2510.01665v1 GAX

小物体检测一直是物体检测领域的一个具有挑战性的问题。已经有一些工作提出了对该任务的改进,例如添加几个注意力块或改变特征融合网络的整体结构。然而,这些模型的计算成本很大,这使得部署实时目标检测系统不可行,同时还有改进的空间。为此,提出了一种改进的YOLOv5模型:HIC-YOLOv5来解决上述问题。首先,添加一个针对小物体的额外预测头,以提供更高分辨率的特征图,以实现更好的预测。其次,在backbone和neck之间采用involution block来增加特征图的通道信息。此外,在主干网末端应用了一种名为 CBAM 的注意力机制,与之前的工作相比,不仅降低了计算成本,而且还强调了通道和空间域中的重要信息。我们的结果表明,HIC-YOLOv5 在 VisDrone-2019-DET 数据集上将 mAP@[.5:.95] 提高了 6.42%,将 mAP@0.5 提高了 9.38% ...

0 0 0 0 2026/01/22 arXiv:2309.16393v2 AIBILI

变形金刚在大语言模型的内部运作中起着核心作用。我们开发了一个数学框架,用于分析变形金刚的解释为相互作用的粒子系统,该框架揭示了长期出现的簇。我们的研究探讨了基本理论,并为数学家和计算机科学家提供了新的观点 ...

0 0 1 8 2026/01/22 arXiv:2312.10794v5 hwrabbit

本研究研究了各种大型语言模型(LLM)在中文零样本端到端关系提取(RE)方面的性能,这是一项集成实体识别和关系提取而无需注释数据的任务。虽然 LLM 在 RE 方面表现出了希望,但大多数先前的工作都集中在英语或假设预先注释的实体上,而它们在中文 RE 中的有效性很大程度上尚未得到探索。为了弥补这一差距,我们根据准确性、效率和适应性来评估 ChatGPT、Gemini 和 LLaMA。 ChatGPT 展示了最高的整体性能,平衡了精度和召回率,而 Gemini 实现了最快的推理速度,使其适合实时应用。 LLaMA 在准确性和延迟方面均表现不佳,凸显了进一步调整的必要性。我们的研究结果深入了解了零样本中国 RE 的 LLM 的优势和局限性,揭示了准确性和效率之间的权衡。这项研究为未来旨在提高 LLM 对中文自然语言处理复杂语言任务的适应性的研究奠定了基础 ...

0 0 0 0 2026/01/22 arXiv:2502.05694v1 zyn

由于严重的结构信息丢失和噪声损坏,在极暗图像中恢复细粒度细节仍然具有挑战性。现有的增强方法通常无法保留复杂的细节和锐利的边缘,从而限制了它们在文本和边缘检测等下游应用中的有效性。为了解决这些缺陷,我们提出了一种以暗图像细节恢复为中心的高效双阶段方法。在第一阶段,我们引入了残余傅立叶引导模块(RFGM),可以有效地恢复频域中的全局照明。 RFGM 通过残差连接捕获级间和通道间依赖性,为高保真频率处理提供强大的先验,同时减轻不可靠先验带来的错误累积风险。第二阶段采用专门为纹理结构细化而设计的互补 Mamba 模块:(1) Patch Mamba 在通道级联的非下采样补丁上运行,精心建模像素级相关性,以增强细粒度细节而不损失分辨率。 (2) Grad Mamba 明确关注高梯度区域,减轻状态空间模型中的状态衰减,并优先考虑锐利边缘和边界的重建。对多个基准数据集和下游应用程序的广泛实验表明,我们的方法在保持效率的同时显着提高了细节恢复性能。至关重要的是,所提出的模块是轻量级的,可以以最小的计算开销无缝集成到现有的基于傅立叶的框架中。代码可从此 https URL 获取 ...

0 0 0 0 2026/01/22 arXiv:2508.03336v1 Roa