本篇论文由Joseph Redmon, S. Divvala, Ross B. Girshick和Ali Farhadi四位学者发表于2015年。
摘要:我们提出了 YOLO,一种新的目标检测方法。先前关于对象检测的工作将分类器重新用于执行检测。相反,我们将对象检测框架为空间分离的边界框和相关类概率的回归问题。单个神经网络在一次评估中直接从完整图像预测边界框和类别概率。由于整个检测管道是一个单一的网络,因此可以直接在检测性能上进行端到端的优化。我们的统一架构非常快。我们的基础 YOLO 模型以每秒 45 帧的速度实时处理图像。该网络的较小版本 Fast YOLO 每秒处理惊人的 155 帧,同时仍实现其他实时检测器的两倍 mAP。与最先进的检测系统相比,YOLO 会产生更多的定位错误,但不太可能预测背景上的误报。最后,YOLO 学习了对象的非常一般的表示。当从自然图像推广到艺术品等其他领域时,它优于其他检测方法,包括 DPM 和 R-CNN。
You Only Look Once-Unified, Real-Time Object Detection.pdf
(5.05 MB, 需要: 200 个论坛币)


雷达卡




京公网安备 11010802022788号







