基于统计模型的人脸检测方法
人脸图像本身的复杂性,决定了描述人脸特征的困难度,因此基于统计模型的方法越来越受到重视,此类方法将人脸区域看作一类模式,即模板特征,使用大量的“人脸”与“非人脸”样本训练、构造分类器,通过判别图象中所有可能区域属于哪类模式的方法实现人脸的检测。实际上,人脸检测问题被转化为统计模式识别的二分类问题。
1. 神经网络方法[13]
神经网络具有很好的记忆功能,训练样本比较全面时候,神经网络可以处理比较复杂的人脸检测问题,因此许多的人脸检测算法采用神经网络方法来做。人脸模式、眼睛模式和嘴巴模式等都有比较明显的特点,因此可以采用神经网络的识别方法。
多层感知器(MLP)早就被用于人脸模式的分类,Burel和Carel先用Kohonen 网络对原始训练集进行粗分类,然后用MLP网络进行精确分类。检测效果比较理想。Vincent用一个分级的特征检测系统定位眼睛和嘴巴,降低分辩率后的图像
输入四个已被训练过的多层感知器,能对左右眼睛、嘴巴和人脸中心进行粗定位,然后再经过处理定位出比较精确的眼睛的上下左右四个眼角定点并分割嘴巴区域。该方法对光照变换、人脸倾斜角度较大或遇到训练集里没有的较大的眼睛时,定位效果会变差。
Rowley等使用BP网络进行人脸检测,(可见下图2-4)网络具有的隐节点,分别对应于输入图像的局部特征。该算法在训练过程中自动生成“非人脸样本”,其方法是输入不含人脸的场景图像,将被误判为人脸的子图像作为“非人脸”样本。为了提高正确率,系统还同时对几个网络分别处理出来的结果进行综合调整。
图2-4  Rowley 的基于人工神经网的人脸检测框架
Juell 和Marsh 使用分层网络,该网络由四个BP 子网组成,分别检测人脸。预处理时先对原图进行边缘增强。网络分为两层,“子层”网有三个,分别检测眼睛、鼻子和嘴巴。“父层”网判断“子层”能否构成一张人脸。
其他使用神经网络方法的还有Lin 等用图像高频分量作为特征子空间,用一个概率决策神经网络(PDBNN )进行人脸检测。Viennet 和Soulie 等用小波多尺度和延时神经网络(TDNN )进行人脸检测,TDNN 只将超出阈值的误差反向传播。
神经网络方法能够适应较为复杂的人脸检测,准确性也比较高,所以使用神经网络进行人脸检测的算
法比较多。但是,由于人脸属于高维矢量,导致网络中训练节点众多,算法往往需要大量的训练样本,因此,神经网络方法的研究着重于系统的优化训练。
神经网络的结构模型如图2-5所示,是现在最实用的多主分量提取算法即自适应主分量提取的神经网络算法来提取人脸图像的主分量特征。
图2-5  多主元提取神经网络结构
2. 基于特征空间的方法[17]
此类方法将人脸区域图象变换到某一特征空间,根据其在特征空间中的分布规律划分“人脸”与“非人脸”两类模式。
主分量分析(PCA, Principal-Component Analysis)是一种常用的方法。它根据图象的统计特性进行的正交变换(K-L变换),以消除原有向量各个分量间的相关性。变换得到对应特征值依次递减的特征向量,即特征脸。Moghaddam等发现人脸在特征脸空间的投影聚集比较紧密,因此利用前若干张特征脸将人脸向量投影到主元子空间F和与其正交的补空间F,相应的距离度量分别称为
DIFS(Distance In Feature Space)和DFFS(Distance From Feature Space)。对于人脸检测问题,由于没有考虑“非人脸”样本的分布,需要同时使用DIFS 和DFFS才能取得较好的效果。
Sung等提出了基于事例学习的方法,同时使用了19×19象素分辨率的“人脸”和“非人脸”样本。样本预处理后按行列顺序展开为样本向量进行主分量分解。采用k-均值聚类方法在特征空间中建立6个“人脸”簇(Clusters),同时建立包围“人脸”簇的六个“非人脸”簇,以使“人脸”与“非人脸”模式的边界更为清晰。Sung等使用样本到各个簇中心的距离训练一个多层感知器进行分类。需要指出的是,人脸检测中“非人脸”样本的选取是一个较为困难的问题。Sung等使用了“自举”(bootstrap)方法加以解决:首先建立一个仅使用“人脸”簇的初始分类器对一组图象进行检测,将所有的错误报警(不是人脸而被错检为“人脸”的
结果)加入“非人脸”样本库,构造新的使用“人脸”与“非人脸”簇的分类器重新检测。以上过程不断迭代,直到收
集了足够的“非人脸”样本。属于特征空间方法的还有因子分解方法(Factor Analysis,FA)
和Fisher准则方法(Fisher Linear Discriminant,FLD)。Yang等在混合线性子空间(Mixtures of Linear Subspaces)中对“人脸”和“非人脸”样本的分布进行建模,分别使用基于EM算法的扩
展FA方法和基于自组织映射(Self-Organizing Map,SOM)的FLD方法构造检测器。此外,
小波变换也被用于人脸检测,如和中使用了小波变换提取人脸的多分辨率特征作为分类的依据。
3. 基于概率模型的方法[10]
基于概率模型方法的一种思路是计算输入图像区域region属于人脸模式object的后验概率p(object|region),据此对所有可能的图像窗口进行判别。CMU的Schneideman等提出一种基于后验概率估计的人脸检测方法。该方法利用贝叶斯原理将后验概率估计转化为一个似然度求解问题:将难以估计的先验概率P object用一个比率参数 代替,作为调节检测器敏感度的参量。()
bootstrap检验方法P object和()
Schneiderman等采用64*64像素的模式区域,将其分为16个子区域,通过子区域独立性等假设降低“人脸”和“非人脸”模式分布表达式(|)
P region object和
P region object的复杂性,最后转化为稀疏编码的直方图,通过计算训练样本(|)
的频度求得两种模式的概率分布。 Schneiderman 等还将概率估计的方法用于检测正面旋转人脸和侧面人脸,同时使用多分辨率信息复用和由粗到精搜索的策略提高检测的速度。属于这一类的还有Weber等提出的视点不变性学习的方法等。
另一种概率模型是用于描述信号统计特性的隐马尔可夫模型(Hidden markov model,HMM),目前也被应用于人脸检测与识别。 Nefian等根据正面人脸由上到下各个区域(头发、额头、双眼、鼻子、嘴) 具有自然不变的顺序这一事实,使用一个包含五个状态的一维连续HMM加以表示。将头部图像按照这五个区域划分为互有重叠的条块,对各块进行K-L变换,选取前若干个变换系数作为观测向量训练HMM。 Nefian等还提出了基于嵌入式HMM的人脸检测方法。该方法同时考虑到人脸由左到右各个特征的自然顺序,使用了二维HMM ,并且采用二维DCT 变换的系数作为观察向量。此外还有Meng等使用HMM 描述人脸的小波特征中不同级间的相关性等方法。基于HMM 的方法一般只使用“人脸”样本进行训练,主要针对用于人脸识别的头肩部图像。
4. 基于支持向量机的方法
支持向量机(Support Vector Machines,SVM)是 Vapnik等提出的基于结构风险最小化原理(Structural Risk Minimization Principle, SRM)的统计学习理论,用于分类与回归问题。SRM使VC(Vapnik Cherovnenkis)维数的上限最小化,这使得SVM方法比基于经验风险最小化(Empirical Risk Minimization Principle, ERM)的人工神经网方法具有更好的泛化能力。Osuna等将SVM方法用于人脸检测,取得了较好的实验结果。该方法的基本思路是对每一个19×19象素的检测窗口使用SVM进行分类,以区分“人脸”和“非人脸”窗口。SVM的训练使用了大量人脸样本和“自举”方法收集的“非人脸”样本,并且使用逼近优化的方法减少支持矢量的数量。需要说明的是,长期以来SVM的训练需要求解计算复杂度极高的二次规划问题,限制了该方法的应用。Platt提出的SMO (Sequential Minimal Optimization)算法解决了SVM训练困难的问题。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。