⾏⼈检测概述
最近毕设选题的时候看到刘西洋教授有这样⼀个题⽬,⾃⼰在⽹上查了⼀下,看到⼀篇好⽂章,收藏⼀下。
PART I
⾏⼈检测具有极其⼴泛的应⽤:智能辅助驾驶,智能监控,⾏⼈分析以及智能机器⼈等领域。从2005年以来⾏⼈检测进⼊了⼀个快速的发展阶段,但是也存在很多问题还有待解决,主要还是在性能和速度⽅⾯还不能达到⼀个权衡。近年,以⾕歌为⾸的⾃动驾驶技术的研发正如⽕如荼的进⾏,这也迫切需要能对⾏⼈进⾏快速有效的检测,以保证⾃动驾驶期间对⾏⼈的安全不会产⽣威胁。
1  ⾏⼈检测的现状
⼤概可以分为两类
1.1    基于背景建模
利⽤背景建模⽅法,提取出前景运动的⽬标,在⽬标区域内进⾏特征提取,然后利⽤分类器进⾏分类,判断是否包含⾏⼈;背景建模⽬前主要存在的问题:
1)必须适应环境的变化(⽐如光照的变化造成图像⾊度的变化);
2)相机抖动引起画⾯的抖动(⽐如⼿持相机拍照时候的移动);
3)图像中密集出现的物体(⽐如树叶或树⼲等密集出现的物体,要正确的检测出来);
4)必须能够正确的检测出背景物体的改变(⽐如新停下的车必须及时的归为背景物体,⽽有静⽌开始移动的物体也需要及时的检测出来)。
5)物体检测中往往会出现Ghost区域,Ghost区域也就是指当⼀个原本静⽌的物体开始运动,背静差检测算法可能会将原来该物体所覆盖的区域错误的检测为运动的,这块区域就成为Ghost,当然原来运动的物体变为静⽌的也会引⼊Ghost区域,Ghost区域在检测中必须被尽快的消除。
1.2    基于统计学习的⽅法
这也是⽬前⾏⼈检测最常⽤的⽅法,根据⼤量的样本构建⾏⼈检测分类器。提取的特征主要有⽬标的灰度、边缘、纹理、颜⾊、梯度直⽅图等信息。分类器主要包括神经⽹络、SVM、adaboost以及现在被计算机视觉视为宠⼉的深度学习。
统计学习⽬前存在的难点:
1)⾏⼈的姿态、服饰各不相同、复杂的背景、不同的⾏⼈尺度以及不同的光照环境。
2)提取的特征在特征空间中的分布不够紧凑;
3)分类器的性能受训练样本的影响较⼤;
4)离线训练时的负样本⽆法涵盖所有真实应⽤场景的情况;
⽬前的⾏⼈检测基本上都是基于法国研究⼈员Dalal在2005的CVPR发表的HOG+SVM的⾏⼈检测算法。HOG+SVM作为经典算法也集成到opencv⾥⾯去了,可以直接调⽤实现⾏⼈检测
为了解决速度问题可以采⽤背景差分法的统计学习⾏⼈检测,前提是背景建模的⽅法⾜够有效(即效果好速度快),⽬前获得⽐较好的检测效果的⽅法通常采⽤多特征融合的⽅法以及级联分类器。(常⽤的特征有Harry-like、Hog特征、LBP特征、Edgelet特征、CSS特征、COV特征、积分通道特征以及CENTRIST特征)。
2    综述类的⽂章
2.1    ⾏⼈检测⼗年回顾
Ten Years of Pedestrian Detection, What Have We Learned?
⼀篇2014年ECCV的⽂章,是对pedestrian detectiond过去⼗年发展的回顾,从dataset,main approaches的⾓度分析了近10年的40多篇论⽂提出的⽅法,并对提⾼feature复杂度的影响进⾏了评估
2.2    P.Dollar  PAMI 2012上的综述
P.Dollar, C. Wojek,B. Schiele, et al. Pedestrian detection: an evaluation of the state of the art [J].
IEEE Transactions on Pattern Analysis and Machine Intelligence, 2012, 34(4): 743-761.
2012年PAMI上发表的⼀篇关于⾏⼈检测的综述性⽂章,PDF格式,共20页,对常见的16种⾏⼈检测算法进⾏了简单描述,并在6个公开测试库上进⾏测试,给出了各种⽅法的优缺点及适⽤情况。另外,指出了未来⾏⼈检测的发展⽅向和趋势。
2.3    CVPR2010 HOF和CSS
New Features and Insights for Pedestrian Detection
⽂中使⽤改进的HOG,即HOF和CSS(color self similarity)特征,使⽤HIK SVM分类器。 本⽂的作者是德国⼈:Stefen
Walk。⽬前Stefan Walk在苏黎世联邦理⼯⼤学任教。
2.4    Integral Channel Features
加州理⼯学院2009年⾏⼈检测的⽂章:Integral Channel Features(积分通道特征)
这篇⽂章与2012年PAMI综述⽂章是同⼀作者。作者:Piotr Dollar
2.5    The Fastest Pedestrian Detector in the West
Dollar 在 2010 年 BMVC 的 《The fastest pedestrian detector in the west》 ⼀⽂中提出了⼀种新的思想,这种思想只需要训练⼀个标准 model,检测 N/K(K ≈10) 然后其余的 N-N/K 种⼤⼩的图⽚的特征不需要再进⾏这种复杂的计算,⽽是跟据这 N/K 次的结果, 由另外⼀种简单的算法给估计出来,这种思想实现的 基础是⼤⼩相近的图像的特征可以被⾜够精确的估计出来
2.6    DPM算法做⽬标检测
CVPR2008:A Discriminatively Trained, Multiscale, Deformable Part Model
PAMI2010:Object Detection with Discriminatively Trained Part Based Models
CVPR2010:Cascade Object Detection with Deformable Part Models
以上三篇⽂章,都是作者研究DPM算法做⽬标检测的⽂章,有源代码可以下载。
2.7    利⽤DPM模型,检测粘连
Detection and Tracking of Occluded People
IJCV2014年的⽂章,利⽤DPM模型,检测粘连情况很严重的⾏⼈,效果很好。
2.8    UDN算法
ICCV2013:
1)Joint Deep Learning for Pedestrian Detection
2)Multi-Stage Contextual Deep Learning for Pedestrian Detection
简 称UDN算法,从⽂中描述的检测效果来看,该⽅法是所有⽅法中最好的,并且,效果远超过其他⽅法。经过对论⽂和该算法源码的研究,该算法是与作者另外⼀篇 论⽂的⽅法 ,另外的论⽂算法做图⽚扫描,得到矩形框,然后⽤该⽅法对矩形框进⾏进⼀步确认,以及降低误警率和漏警率。另外的论⽂是:Multi-Stage Contextual Deep Learning for Pedestrian Detection。
这篇⽂章是⽤深度学习的CNN做candidate window的确认。⽽主要的⾏⼈检测的算法还是HOG+CSS+adaboost。
2.9    Monocular pedestrian detection
Enzweiler, and D.Gavrila. Monocular pedestrian detection: survey and experiments [J].
IEEE Transactions on Pattern Analysis and Machine Intelligence, 2009,  31(12): 2179-2195.
2.10      Survey of pedestrian detection for advanced driver assistance systems
Geronimo, A. M.Lopez and A. D. Sappa, et al. Survey of pedestrian detection for advanced driver
assistance systems [J].  IEEE Transactionson Pattern Analysis and Machine Intelligence,  2010, 32(7): 1239-1258.
2.11      Vision-based Pedestrian Protection Systems for Intelligent Vehicles
Geronimo, and A. M.Lopez. Vision-based Pedestrian Protection Systems for Intelligent Vehicles, BOOK, 2014.
2.12      ⾏⼈检测技术综述
苏松志, 李绍滋, 陈淑媛等. ⾏⼈检测技术综述[J]. 电⼦学报, 2012, 40(4): 814-820.
下载:
2.13      车辆辅助驾驶系统中基于计算机视觉的⾏⼈检测研究综述
贾慧星, 章毓晋.车辆辅助驾驶系统中基于计算机视觉的⾏⼈检测研究综述[J], ⾃动化学报, 2007, 33(1): 84-90.
下载:
2.14      ⾏⼈检测系统研究新进展及关键技术展望
许⾔午, 曹先彬,乔红. ⾏⼈检测系统研究新进展及关键技术展望[J], 电⼦学报, 2008, 36(5): 368-376.
下载:
2.15      基于视觉的⼈的运动识别综述
图片下载站源码杜友⽥; 陈峰;徐⽂⽴; 李永彬;基于视觉的⼈的运动识别综述, 电⼦学报,  2007. 35(1): 84-90.
下载:
2.16      基于机器学习的⾏⼈检测关键技术研究
朱⽂佳. 基于机器学习的⾏⼈检测关键技术研究[D]. 第⼀章, 硕⼠学位论⽂, 上海交通⼤学. 2008. 指导教师: 戚飞虎.
PART II
这是⾏⼈检测相关资源的第⼆部分:源码和数据集。考虑到实际应⽤的实时性要求,源码主要是C/C++的。源码和数据集的⽹址,经过测试都可访问,并注明了这些⽹址最后更新的⽇期,供学习和研究进⾏参考。(欢迎补充更多的资源)
1        Source Code
1.1    INRIA Object Detection and Localization Toolkit
Dalal于2005年提出了基于HOG特征的⾏⼈检测⽅法,⾏⼈检测领域中的经典⽂章之⼀。HOG特征⽬前也被⽤在其他的⽬标检测与识别、图像检索和跟踪等领域中。
更新:2008
1.2    Real-time Pedestrian Detection.
Jianxin Wu实现的快速⾏⼈检测⽅法。
Real-Time Human Detection Using Contour Cues:
更新:2012
1.3    霍夫变换实现的多⽬标检测
Olga Barinova, CVPR 2010 Paper: On detection of multiple object instances using Hough Transforms
源码:C++
更新:2010
1.4    HIKSVM
Classification Using Intersection Kernel SVMs is efficient
HOG+LBP+HIKSVM, ⾏⼈检测的经典⽅法.
源码:C/C++
更新:2012
1.5    GroundHOG
GPU-based Object Detection with Geometric Constraints, In: ICVS, 2011.  CUDA版本的HOG+SVM,
源码:C/C++
更新:2011
1.6    doppia code
这是⼀个代码集合,包含如下:
Pedestrian detection at 100 frames per second, R. Benenson.  CVPR, 2012. 实时的
Stixels estimation without depth map computation
Fast stixels estimation for fast pedestrian detection
Seeking the strongest rigid detector
Ten years of pedestrian detection, what have we learned?
Face detection without bells and whistles
源码:C/C++
更新:2015
1.7    Multiple camera pedestrian detection.
POM: Occupancy map estimation for people detection
Paper:
源码:?
更新:2014
1.8    Pitor Dollar Detector.
Piotr’s Computer Vision Matlab Toolbox
The toolbox is divided into 7 parts, arranged by directory:
channels Robust image features, including HOG, for fast object detection.
classify Fast clustering, random ferns, RBF functions, PCA, etc.
detector Aggregate Channel Features (ACF) object detection code.
filters Routines for filtering images.
images Routines for manipulating and displaying images.
matlab General Matlab functions that should have been a part of Matlab.
videos Routines for annotating and displaying videos.
源码:matlab
更新:2014
2        DataSets
2.1    MIT数据库
介绍:该数据库为较早公开的⾏⼈数据库,共924张⾏⼈图⽚(ppm格式,宽⾼为64×128),肩到脚的距离约80象素。该数据库只含正⾯和背⾯两个视⾓,⽆负样本,未区分训练集和测试集。Dalal等采⽤“HOG+SVM”,在该数据库上的检测准确率接近100%。
更新:2000
2.2    INRIA Person Dataset

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。