姿势回归网络可以预测查询图像相对于已知环境的相机姿势。在这种方法家族中,绝对姿势回归(APR)最近显示出有望的精度,在几厘米的位置误差的范围内。 APR网络在其权重中隐含地编码场景几何形状 ...
0 0 0 2025/02/25 arXiv:2404.09884v1 lucian_p
点云完成旨在从部分3D点云中重建完整的3D形状。随着深度学习技术的进步,已经开发了各种用于点云完成的方法。尽管取得了令人鼓舞的结果,但仍然存在一个重要的问题:这些方法通常忽略从单个3D对象表面采样的点云中的可变性 ...
0 0 0 2025/02/25 arXiv:2501.10966v1 liushibo
包装的源代码存储库记录了软件包的开发历史记录,为包装的使用和风险监视提供了必不可少的信息。但是,由于软件包的开发平台与其分销平台分开,包装版本通常会错过其源代码存储库。现有工具从其元数据中检索发行版的存储库信息,这有两个限制:元数据可能不包含或包含错误的信息 ...
0 0 0 2025/02/25 arXiv:2404.16565v1 15966829631
本文全面回顾了异常合成方法。现有的调查专注于有限的技术,缺少整体现场视图和理解方法互连。相比之下,我们的研究提供了统一的综述,涵盖了基于手工制作的,基于分布的生成模型(GM)的基于手工制作的,基于视觉模型和基于视觉模型(VLM)基于基于的综合的代表性方法 ...
0 0 0 2025/02/25 arXiv:2502.16412v1 鸡腿堡
了解人类的行为和社会是社会科学中的一个核心重点,生成的社会科学的兴起标志着范式的重大转变。通过利用自下而上的模拟,它可以用可扩展,可复制和系统的计算方法来代替昂贵和逻辑上挑战的传统实验,以研究复杂的社会动态。大型语言模型(LLM)的最新进展进一步改变了这一研究范式,从而创造了类似人类的生成社会代理人和社会现实的模拟 ...
0 2 0 2025/02/25 arXiv:2502.08691v1 luckystar1992
人们的演讲是一个免费的30,000小时的免费销售,并且在CC-BY-SA(带有CC-BY子集)下获得了用于学术和商业用法许可的监督对话英语语音识别数据集。数据是通过搜索Internet以获取具有现有转录的适当许可的音频数据来收集的。我们描述了我们的数据收集方法,并在Apache 2下发布我们的数据收集系统 ...
0 0 0 2025/02/25 arXiv:2111.09344v1 ygsx
图形神经网络是图形机器学习的流行体系结构,基于通过一系列不变转换的输入图的节点表示的迭代计算。一大批图形神经网络遵循标准消息范围的范式:在每一层,每个节点状态都基于其附近的消息的汇总进行更新。在这项工作中,我们提出了一个用于培训图形神经网络的新颖框架,在该框架中,每个节点都被视为可以选择“听”,“广播”,“听和广播”或“孤立”的玩家 ...
0 0 0 2025/02/25 arXiv:2310.01267v2 Jasper1
分裂学习(SL)已成为传统联邦学习的实践和有效替代方案。尽管以前攻击SL的尝试通常依赖于过于强大的假设或易于利用的模型,但我们试图开发更有能力的攻击。我们介绍了SDAR,这是一个针对SL的新型攻击框架,并使用诚实但有趣的服务器 ...
0 0 0 2025/02/25 arXiv:2310.10483v5 hwrabbit

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)