本文探讨了当前一代大型语言模型在通用编程语言中进行程序综合的局限性。我们在两个新基准(MBPP(MATHQA-PYTHON)244M到137B之间),同时采用了少样本和微调机制。我们的基准测试旨在衡量这些模型从自然语言描述合成简短python程序的能力... ...
0 0 1 2025/03/27 arXiv:2108.07732v1 seumi
我们解决了开放世界对象检测(OWOD)的具有挑战性的问题,在该问题中,对象检测器必须从已知类别中识别对象,同时还必须识别并不断学习检测新的对象。先前的工作导致探测器的检测能力相对较低,并且很可能将新颖对象归类为已知类别之一。我们通过确定OWOD提出的三个主要挑战,并引入OW-RCNN(一个开放世界的对象检测器)来解决问题,该挑战解决了这三个挑战中的每一个 ...
0 0 0 2025/03/27 arXiv:2303.14930v1 18804024672
现有的方法在图像除尘方面取得了显着性能,尤其是在合成数据集上。但是,由于域的转移,他们经常在现实世界中的朦胧图像中挣扎,从而限制了它们的实际适用性。本文介绍了HazeClip,这是一个语言引导的适应框架,旨在增强预训练的飞行网络的现实性能 ...
0 0 0 2025/03/27 arXiv:2407.13719v2 jiajia233
辐射场的最新突破已显着高级3D场景重建和自主驾驶中的新型视图合成(NVS)。然而,临界局限性持续存在:基于重建的方法在训练轨迹的显着偏差下表现出很大的性能恶化,而基于世代的技术则与时间连贯性和精确场景可控性抗争。为了克服这些挑战,我们提出了MUDG,这是一个创新的框架,将多模式扩散模型与高斯碎片(GS)集成在一起,以进行城市场景重建 ...
0 0 0 2025/03/27 arXiv:2503.10604v1 zsh231264
阻碍当前深度伪造视频检测发展的三个关键挑战:(1)时间特征可能复杂多样:我们如何识别一般时间伪影以增强模型泛化? (2)时空模型通常严重依赖一种类型的工件而忽略另一种:我们如何确保从两者中平衡学习? (3) 视频本质上是资源密集型的:我们如何在不影响准确性的情况下解决效率问题?本文试图共同应对这三个挑战。首先,受到使用图像级混合数据进行图像伪造检测的显着普遍性的启发,我们研究了视频级混合是否以及如 ...
0 0 0 2025/03/27 arXiv:2408.17065v2 dddd
全局多对象跟踪(MOT)系统可以考虑相互作用,遮挡和其他``Visual Blur''场景,以确保长视频中有效的对象跟踪。其中,基于图形的划分跟踪范式实现了令人惊讶的性能。但是,它们完全连接的性质提出了挑战算法处理长视频的存储空间要求 ...
0 0 0 2025/03/27 arXiv:2312.08951v1 gonghaibin
近年来,关于聚类算法的许多研究主要集中在提高其准确性和效率上,通常以牺牲可解释性为代价。但是,由于这些方法越来越多地应用于医疗保健,金融和自治系统等高风险领域,因此对透明和可解释的聚类结果的需求已成为一个关键问题。这不仅是获得用户信任的必要条件,而且对于满足这些领域不断增长的道德和监管要求是必要的 ...
0 0 0 2025/03/27 arXiv:2409.00743v1 TimeXZone

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)