在这篇文章中,我将说明对象检测和各种算法,例如Faster R-CNN,YOLO,SSD。我们将从初学者的水平开始,直到了解对象检测的最新技术,了解每种方法的直觉,方法和显着特征。
什么是图像分类?
图像分类拍摄图像并预测图像中的对象。
识别图像中对象(给定类别)的位置的问题称为定位。但是,如果不知道对象类别,则我们不仅必须确定位置,还必须预测每个对象的类别。
与类一起预测对象的位置称为对象检测。 代替从图像预测对象的类别,我们现在必须预测该类别以及包含该对象的矩形(称为边界框)。它需要4个变量来唯一标识一个矩形。因此,对于图像中对象的每个实例,我们将预测以下变量:
班级名称,
bounding_box_top_left_x_coordinate,
bounding_box_top_left_y_coordinate,
bounding_box_width,
bounding_box_height
本文介绍了以下技术:
使用猪功能进行物体检测
基于区域的卷积神经网络(R-CNN)
空间金字塔合并(SPP-net)
快速R-CNN
更快的R-CNN和基于回归的检测器
YOLO(只看一次)
单发检测器(SSD)
关注 CDA人工智能学院 ,回复“录播”获取更多人工智能精选直播视频!