摘要:行人检测技术由于应用的广泛性使其在计算机视觉领域成为一个重要分支,对视频监控、车辆辅助驾驶、智能机器人等多个领域提供了重要的技术支持。比如视频监控中关注的主要是行人的运动轨迹和行为,要实现对行人跟踪和行为分析首先要做的就是检测出视频中的行人。然而现实生活中由于行人在衣着上的多样性、形态变化的多样性、所处背景的多样性、光照强弱的多样性、行人之间相互遮挡使得行人检测存在着诸多需要解决的问题。 如何设计一个与其他类别之间差异大,行人之间的类内差异小并且不受光照等多样性因素影响的特征,以及如何训练一个区分力强的分类器是行人检测领域的研究重点。2005年梯度方向直方图(HOG特征)的提出是这个领域一个重要的突破,此后大多数行人检测特征都是基于梯度方向直方图特征进行改进的。一般来说专家设计优秀的特征即使对于有扎实专业基础知识的研究人员也是很困难的,深度学习算法能很好地解决这个难题,它能自动地结合不同的分类任务从数据中学习并提取特征。近几年来,深度学习在大规模图像分类方面取得的了重大突破,表明深度学习可以从多媒体内容中提取具有很强表达能力的特征,从而有效地解决语义鸿沟的问题。 本文在对行人检测和深度学习相关技术进行充分调研的基础上,总结了行人检测主要难点和现有方法存在的问题,重点研究了基于深度学习的行人检测方法,取得的主要研究成果如下。 (1)针对传统行人检测需要专家设计特征以及特征存在的鲁棒性不强的问题,本文结合深度学习方法进行行人检测,该方法能够利用深度卷积神经网络框架自动的从行人数据库中学习行人的特征。但是通常深度学习网络的层次较深,需要学习参数非常多,只有在训练样本充足时才能有效地避免网络训练过拟合。对此本文采用基于内容的图像检索方法进行数据扩充,该方法在进行数据库扩充时充分考虑到原数据库的行人分辨率,背景分布等因素,使扩充后的数据库仍然保持INRIA数据库原有的数据分布,从而有利于训练对INIRIA数据库检测效果更佳的深度学习网络。 (2)针对行人检测窗口选择过程中使用滑动窗口产生冗余窗口较多且质量不高的问题,本文提出了一种多策略窗口选择的方法,该方法先利用选择性搜索算法提取质量高的预选区域,然后结合图像中行人特性和二值规范化梯度算法对预选区域进行过滤去除大量冗余窗口。最终产生了数目少、质量高的窗口,为后续的特征提取及分类提供了很好的保障。 (3)基于上述研究,本文设计了一套基于深度学习的行人检测系统,利用这套系统我们完成了通过多组对比实验。实验结果表明:利用基于内容的图像检索方法进行数据扩充后训练的基于深度学习的行人检测系统,在保持误检率为10%的情况下,漏检率仅为38%,比传统HOG特征的46%降低8%;在此基础上结合本文提出的窗口选择策略,漏检率降为23%,比使用HOG特征大幅降低了23%。
原文链接:http://d.wanfangdata.com.cn/Thesis/Y2916617
送人玫瑰,手留余香~如您已下载到该资源,可在回帖当中上传与大家共享,欢迎来CDA社区交流学习。(仅供学术交流用。)