行人检测2(行人检测的发展历史)

自作多情 提交于 2019-12-10 05:32:52

  行人检测在计算机视觉领域的许多应用中起着至关重要的作用,例如视频监控、汽车驾驶员辅助系统、人体的运动捕捉系统等.图像的行人检测方法可以分成两大类:轮廓匹配和表观特征.表观特征又被定义成图像特征空间(也叫做描述算子),它可以分为整体法、局部法、特征点对法.

  在整体法中,Papageorgiou和Poggio[1]提出了Haar小波(HWs)特征,并用SVM训练行人,其中包括了行人的正面和背面.Viola和Jones[2, 3]采用级联AdaBoost学习算法(即选择超过一定阈值的弱分类器组成强分类器的算法)提取基本Haar-like特征和扩展的两个Haar-like特征,用于视频监控的行人检测.Levi和Weiss[4]则提出边缘方向直方图(edge orientation histograms,简称EOHs)进行人脸检测.EOHs先计算图像梯度强度,然后按梯度方向等分成K个区间,而特征的表示是通过方向间的统计比得到的一个实数值.Haar-like和EOHs都可以通过图像积分图方法加快运算速度.

  Dalal和Triggs等人[5]提出了梯度方向直方图特征(histogram of oriented gradient,简称HOG).HOG基于梯度信息并允许块间相互重叠,因此对光照变化和偏移不敏感,能有效地刻画人体的边缘特征.然而,HOG也有其缺点:特征维度高,大量的重叠和直方图统计,使得特征的计算速度慢,进而影响实时性;遮挡处理能力较差;未利用颜色、形状和纹理等特征.针对这些缺点,近年来一些研究者提出了更多[6, 7, 8, 9]的行人特征,有COV,Integral Channel Feature,ACF,GGP等.

  Chen等人[10]提出韦伯特征(Weber local descriptor,简称WLD).WLD由两部分组成:激励(differential excitation)和方向(orientation),其充分利用人类视觉机制韦伯定理,对明暗变化和噪声干扰有一定的鲁棒性,缺点是方向部分计算复杂.

  局部法的主要思想是将人体看成是部位的组合,该方法要解决两个问题:构造有效的部位检测器和建模部位间的几何关系.Mohan等人[11]将人体划分为头、下半身、左右胳膊这4个部位,取各个部位分类器的响应值作为支持向量机的输入,构建一个组合的多层次分类器来检测行人.

  Edgelet特征描述的是人体的轮廓特征,但是它描述的是人体局部轮廓的特征,包括的形状有直线、弧线等.它将人体分为几个部分来训练,比如全身、头肩部、腿部和躯干部等,每个部分都使用adaboost算法训练一个强分类器;在分类时,利用4个部分的联合概率进行决策.该算法采用的是人体的局部特征,所以在出现遮挡的情况下仍然有很好的表现,缺点是特征的计算比较复杂.

  Wu[12]提取图像的edgelet特征用于检测静态图像中的人体,对组成人体的各个部分分别建立模型,每一个edgelet描述人体的某个部位的轮廓,然后再用adaboost算法筛选出最有效的一组edgelet来描述人的整体.

  Wu定义了3种edgelet,包括直线型、弧形和对称型.每一个edgelet由一组边缘点构成,是一条具有一定形状和位置的线段.对于图像中任意的位置,根据该位置是否具有和某edgelet形状相似的边缘得到一个响应值.如果边缘的形状与edgelet越相似,那么响应值就越高.

  这类方法分别检测窗口的局部区域,然后再综合这些区域的检测结果来做最终的判决.优点在于能更好地处理遮挡以及行人姿势的多样性,主要问题在于如何定义局部以及如何整合来自多个部位检测器的信息.

  特征点对法是将行人检测问题视为一个广义的霍夫变换:首先,通过局部特征检测器来寻找关键点;然后,在关键点的周围选取一个固定大小的图像块,通过聚类、随机森林或者最大间隔等方法建立图像块的空间分布模式;最后,通过霍夫投票方式寻找图像中的行人位置.典型的方法是David Lowe提出的SIFT特征[13].

  无论是整体、局部还是特征点对法,核心的问题是如何有效表示行人的整体特征、部位特征或者局部块特征.方向梯度直方图特征是目前广泛使用的行人特征表示,但是方向梯度无法刻画人眼视觉敏感度,信息冗余度大.本文针对这一缺点,在中心变换直方图[14]特征(census transform histogram,简称CENTRIST)的基础上,提出一种显著性纹理结构特征,与CENTRIST类似于局部二值模式直方图不同,该特征融合了人眼视觉的心理物理学规律,能更好地实现光照波动、背景杂乱等道路环境下的行人检测.  

[1] Papageorgiou C, Poggio T. A trainable system for object detection. Int’l Journal of Computer Vision, 2000,38(1):15-33 .

[2] Viola P, Jones MJ, Snow D. Detecting pedestrians using patterns of motion and appearance. In: Proc. of the Int’l Conf. on Computer Vision. 2003. 734-741 .

[3] Jones MJ, Snow D. Pedestrian detection using boosted features over many frames. In: Proc. of the IEEE Conf. Computer Vision and Pattern Recognition. 2008. 1-4 .

[4] Levi K, Weiss Y. Learning object detection from a small number of examples: The importance of good features. In: Proc. of the IEEE Conf. on Computer Vision and Pattern Recognition. 2004.53-60 .

[5] Dalal N, Triggs B. Histograms of oriented gradients for human detection. In: Proc. of the IEEE Conf. on Computer Vision and Pattern Recognition. 2005.886-893 .

[6] Tuzel O, Porikli F, Meer P. Pedestrian detection via classification on riemannian manifolds. IEEE Trans. on PAMI, 2008,30(10): 1713-1727 .

[7] Dollar P, Tu Z, Perona P, Belongie S. Integral channel features. In: Proc. of the British Machine Vision Conf. 2009. 1-11.

[8] Gao W, Ai H, Lao S. Adaptive contour features in oriented granular space for human detection and segmentation. In: Proc. of the IEEE Conf. on Computer Vision and Pattern Recognition. 2009. 1786-1793 .

[9] Liu YZ, Shan SG, Zhang WC, Chen XL, Gao W. Granularity-Tunable gradients partition (GGP) descriptors for human detection. In: Proc. of the IEEE Conf. on Computer Vision and Pattern Recognition. 2009.1255-1262 .

[10] Chen J, Shan SG, He C, Zhao GY. WLD: A robust local image descriptor. IEEE Trans. on Pattern Analysis and Machine Intelligence, 2010, 32(9):1705-1720 .

[11] Mohan A, Papageorgiou C, Poggio T. Example-Based object detection in images by components. IEEE Trans. on Pattern Analysis and Machine Intelligence, 2001,23(4):349-361

[12] Wu B, Nevatia R, Li Y. Segmentation of multiple, partially occluded objects by grouping, merging, assigning part detection responses. Int’l Journal of Computer Vision, 2009,82:185-204 .

[13] Lowe DG. Distinctive image features from scale-invariant keypoints. Int’l Journal of Computer Vision, 2004,60(2):91-l10 .

[14] Wu JX, Rehg JM. CENTRIST: A visual descriptor for scene categorization. IEEE Trans. on Pattern Analysis and Machine Intelligence, 2011,33(8):1489-1501

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!