本文提出了一种用于目标检测的基于快速区域的基质网络方法(Fast R-CNN)。Fast R-CNN建立在之前的工作基础上,利用深度网络对目标目标进行有效的分类。相比之前的工作,Fast R-CNN采用了创新来提高了训练和测试速度,同时也提高了检测精度... ...
根据规范的PASCAL VOC数据集测量的目标检测性能在过去几年中已趋于稳定。性能最好的方法是复杂的集成系统,通常将多个低级图像特征与高级上下文相结合。在论文中,我们提出了一种简单且可扩展的检测算法,与之前 VOC 2012 上的最佳结果相比,该算法将平均精度 (mAP) 提高了 30% 以上,mAP 达到 53 ... ...
You Only Look Once (YOLO) 系列检测器已成为实用的工具。然而,它们对预定义和训练的对象类别的依赖限制高效,它们在开放场景中的适用性。为了解决这一限制,我们引入了YOLO-World,这是一种创新方法,通过视觉语言建模和大规模数据集的预来训练增强YOLO的开放词汇检测功能... ...
YOLO已经成为机器人、无人驾驶汽车和视频监控应用的中央实时目标检测系统。我们对YOLO的演变进行了全面分析,捕捉了从原始YOLO到YOLOv8、YOLO-NAS和YOLO with Transformers的每次迭代的创新和贡献。我们首先描述标准指标和后期处理;然后,我们每个人讨论模型的网络架构和训练技巧的主要变化... ...
我们提出了一种基于训练幂等神经网络的生成建模新方法。幂等运算符是一种可以连续应用而不改变初始应用之外的结果的运算符,即 $f(f(z))=f(z)$。所提出的模型 $f$ 经过训练以映射源分布(例如, ...