本文提出了一种用于目标检测的基于快速区域的基质网络方法(Fast R-CNN)。Fast R-CNN建立在之前的工作基础上,利用深度网络对目标目标进行有效的分类。相比之前的工作,Fast R-CNN采用了创新来提高了训练和测试速度,同时也提高了检测精度... ...

0 0 0 0 2024/11/19 arXiv:1504.08083v2 KingXHJ

根据规范的PASCAL VOC数据集测量的目标检测性能在过去几年中已趋于稳定。性能最好的方法是复杂的集成系统,通常将多个低级图像特征与高级上下文相结合。在论文中,我们提出了一种简单且可扩展的检测算法,与之前 VOC 2012 上的最佳结果相比,该算法将平均精度 (mAP) 提高了 30% 以上,mAP 达到 53 ... ...

0 0 1 3 2024/11/19 arXiv:1311.2524v5 KingXHJ

You Only Look Once (YOLO) 系列检测器已成为实用的工具。然而,它们对预定义和训练的对象类别的依赖限制高效,它们在开放场景中的适用性。为了解决这一限制,我们引入了YOLO-World,这是一种创新方法,通过视觉语言建模和大规模数据集的预来训练增强YOLO的开放词汇检测功能... ...

0 0 0 0 2024/11/18 arXiv:2401.17270v3 KingXHJ

YOLO已经成为机器人、无人驾驶汽车和视频监控应用的中央实时目标检测系统。我们对YOLO的演变进行了全面分析,捕捉了从原始YOLO到YOLOv8、YOLO-NAS和YOLO with Transformers的每次迭代的创新和贡献。我们首先描述标准指标和后期处理;然后,我们每个人讨论模型的网络架构和训练技巧的主要变化... ...

0 1 0 0 2024/12/16 arXiv:2304.00501v7 KingXHJ

我们提出了一种基于训练幂等神经网络的生成建模新方法。幂等运算符是一种可以连续应用而不改变初始应用之外的结果的运算符,即 $f(f(z))=f(z)$。所提出的模型 $f$ 经过训练以映射源分布(例如, ...

0 0 0 0 2024/03/04 arXiv:2311.01462v1 KingXHJ

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)