×
工业控制 > 工业自动化 > 详情

基于多个特征分块贝叶斯分类器融合策略的人脸识别方法

发布时间:2021-01-06 发布时间:
|


引言

人脸识别是指利用计算机对人脸图像进行分析,从中提取有效的识别信息,用来鉴别身份的一种技术,具有直接、友好、方便等优点。基于奇异值特征的人脸识别方法是由 Hong[1][4]首先提出来的。该方法将人脸特征分为视觉特征、统计特征、变换系数特征以及代数特征四类,代数特征反映了图像的本质属性。因为图像本身的灰度分布描述了图像的内在信息,故可以将图像作为矩阵看待,进行各种代数和矩阵变换后提取的代数特征是人脸的表征。

由于人脸图像往往受到表情、角度、光照、背景等细微变化的影响,于是,能否精确而有效地提取人脸特征成为人脸识别技术的关键所在。奇异值分解(Singular Value Decomposition, SVD)是一种有效的代数特征提取方法。奇异值特征被认为是人脸图像的本质特征,并且具有转置不变性、旋转不变性、位移不变性、镜像不变性等诸多重要的性质,因此采用奇异值来描述人脸特征是一种有效的方法。

由于整体图像的奇异值向量反映的是图像整体的统计特征,对细节的描述还不够深入,本文模拟人类识别人脸的模式,在分块和加权的基础上,重建突出待识别人脸的骨骼特征描述的矩阵,近似于人类在识别人脸时自动剔除同一人脸的变化部位的差异能力。

人脸识别在本质上是要区分两幅人脸图像表观上的差别是类内变化(同一人的不同图像)还是类间变化(不同人的不同图像)。因此,如何对类内变化以及类间变化精确的建模和分类就成为人脸识别研究领域的重要内容之一。在众多的建模、分类方法中,统计模型是一种主流方法,其中Moghaddam[8]提出的贝叶斯分类器得到了广泛的认可。

奇异值分解

对于任何一个矩阵A∈Rm×n,利用奇异值分解将其转化为对角矩阵。

定理(SVD)

设A∈Rm×n(不失一般性,设m≥n),且rank(A)=k,则存在两个酉矩阵(所谓酉矩阵就是其逆矩阵等于共轭转置矩阵)Um×m和Un×n及广义对角阵Dm×m使下式成立:

其中,U的列向量是AAT的特征向量,V的列向量是ATA的特征向量,式中T表示转置。


(i=1,2,…,k,…,n)称为矩阵A的奇异值,是AAT同时也是ATA的k个非零特征值,lk+1=lk+2=...=lm=0为AAT的m-k个零特征值,而lk+1=lk+2=...=ln=0为ATA的ri-k个零特征值。uivi(i=1,2,…,k)分别是AAT和ATA的非零特征值li对应的特征向量,ui(i=k+1,…,m)是AAT对应于li=0的特征向量,vi(i=k+1,…,n)是ATA对应于li=0的特征向量。将式A=UDVT写成乘积的形式为:,如果矩阵A代表一幅人脸图像,则式表示对该人脸图像进行了正交分解,将矩阵中主对角线上的奇异值元素si连同中Dm×n剩余的(ri-k)个0组合构成一个n维列向量Xn×1:Xn×1=Dn×n e=(s1,...sk,0,...,0)T其中Dn×n为矩阵D中的第1个n阶子式,列向量(e=1,1,...,1)Tn×n,则称Xn×1为矩阵A的奇异值特征向量。

由于任何实矩阵A对应唯一的奇异值对角阵,因此,其对应的奇异值特征向量也是唯一的,即一幅人脸图像对应于唯一的奇异值特征向量。
人脸特征提取方法

为了解决小样本甚至单样本识别问题,国内外研究者将奇异值方法与其它方法相结合,提出了组合人脸特征提取方法,具有代表性的有Hong[1]等人提出的基于奇异值特征和统计模型的人脸识别方法, Wang[2]提出的基于奇异值分解和神经网络的人脸鉴别方法等,这些方法使得在人脸库上的小样本识别率达到了90%以上。但是Tian[3]等人发现,直接对整幅人脸图像进行奇异值分解,并没有考虑人脸的局部和细节特征,而且提取的奇异值特征中包含了大量冗余信息。

本文提出的人脸特征提取方法实现的流程如下:(1)从人脸数据库选择人脸作为识别训练集→(2)将被选入训练集的人脸图像几何归一→(3)将被选入训练集的人脸图像灰度归一→(4)将预处理过的人脸图像分为32*32的九个子块→(5)将每一幅图像变为一个列向量(先分别将每一个子块所有向量排成一列,再将九个子块按顺序排成一列);然后以子块为单位进行(6)计算全部人脸图像的均值→(7)计算每一类人脸图像的平均脸同时将人脸图像列向量与类内平均脸做差。

样本图像几何归一化和灰度均衡化处理

本文采用双线性插值方法对图像进行尺度归一化。

设变换后图像内的一点在原图中的对应位置为(u,v),(u,v)周围的四个点(i,j),(i,j+1),(i+1,j),(i+1,j+1)的值已知,(u,v)与点(i,j)的横坐标距离为a,纵坐标距离为b,则变换后图像内对应于原图像内点(u,v)的点的灰度值为g=f(u,v)

首先我们对上端进行线性插值可得f(u,j)=f(i,j)+a[f(i+1,j)-f(i,j)]xa0xa0(2)

类似,对地端两个顶点的线性插值有f(u,j+1)=f(i,j+1)+a[f(i+1,j)-f(i,j)]xa0(3)

最后,我们做垂直方向的线性插值,有f(u,v)=f(u,j)+b[f(u,j+1)-f(u,j)]xa0(4)

具体结果如图1所示。


图1人脸图像几何归一化处理结果

几何归一后的图像再经灰度均衡化处理,人脸图像的直方图均衡化是实现图像增强一种有效途径。

获取特征脸的算法

根据图1中的人脸图像的分块处理,按照从左到右,从上到下的顺序将一张人脸上脸分为九个部分,依次标注为1、2、3、4、5、6、7、8、9。研究发现人脸的不同特征在识别过程中所起的作用是不相同的,基于面部骨骼特征、眼睛的分布、鼻子的形状等结构特征,往往是鉴别人脸的主要依据。将整个人脸分成九小部分时,原来需要计算962×962维矩阵的特征值与特征向量,现在只需要计算9个322×322维的矩阵的特征值与特征向量,减少了计算量和计算时间。具体实现方法描述如下。

设本实验所用人脸可以用矩阵描述为:

xa0(5)

将矩阵分为3×3的九个子块,每个子块分别为32×32的矩阵A1…A9,过程如下:

xa0(6)

xa0(7)

将每一幅人脸图像所形成的矩阵按此方法进行划分。将A1…A9九个二维矩阵分别降维为322×1的列向量。

以将人脸划分后的第一块为例,求训练集中所有这一子块的平均值, 其中M为训练集中人脸图像总数,1表示第一子块:;再对每一类样本中的所有第一子块求平均,;对每一子块进行样本规范化,;并求协方差矩阵:
从矩阵Q1的特征值和特征向量中,取 m 个较大特征值对应的特征向量,构成第一子块的特征脸空间W1,即W1=[w11,w12,…, w1m]T。再对训练样本进行规范化处理,投影到特征脸空间,获得投影特征为:

对任一测试样本的第一子块X1的规范化,即然后得到投影特征y1,即。

用同上述相同方法逐一对其它八个子块进行同样处理。得到y2 ,y3 ,…,y9。再根据划分的9个子块的重要性不同,在识别时给它们分别赋予不同的权值。

将人脸分成的A1…A9这九个部分分别给以a1,… a9这九个权值,设b1,… b9是A1…A9这九个块的权重,则有:,其中,根据人类识别人脸的思维特点,可以把变化较大的嘴部的b8块的权重定义为0,利用人脸骨骼特征明显、结构稳定的小块获得人脸图像的训练集并计算特征脸,节省训练时间;也可以在识别阶段通过权值分配剔除变动较大的部位(如图2)。


图2人脸图像分块处理结果

基于特征分块的贝叶斯分类器设计

每个基于特征分块的贝叶斯分类器,利用了所对应的图像块包含的判别信息,为得到性能更好的分类器,需要将这些分类器融合给出最终的判别结果。每个贝叶斯分类器实际上是一个子分类器。可以有多种办法实现分类器融合,比如加权求和、相乘等。本文采取加权求和的方法:

xa0(8)


其中S(Ii,Ij)表示两幅图像Ii与Ij的相似度,L是贝叶斯分类器(FBBC)的总数(这里是9),是Ii与Ij的第b个特征块之间的差值。是由第b个贝叶斯分类器计算出的类条件概率密度。wb是第b个贝叶斯分类器对应的权值。

不同的特征块对应的贝叶斯分类器对最终判别结果贡献是不相同的,本文采取的是基于子分类器分类准确率分配权值的方法:将各子分类器重新放回其训练集,计算其在训练集上的识别率,利用这些识别率,采用如下式计算第b个子分类器的权值:

xa0(9)

实验结果及分析

下面是利用在Yale人脸库中的人脸图像,分以下4种分块加权的情况进行实验:

1、b1=b3=4; b5=2; b8=2; b2=b4=b6=b7=b9=1
2、b1=b3=4; b5=3; b8=2; b2=b4=b6=b7=b9=1
3、b1=b3=4; b5=2; b8=0; b2=b4=b6=b7=b9=1
4、b1=b3=4; b5=2; b8=0; b2=b4=b6=b7=b9=1

表中的实验结果表明,基于面部骨骼特征、眼睛的分布、鼻子的形状等结构特征,往往是鉴别人脸的主要依据,被赋以50%的权重,识别效果较好,这与人类识别人脸时主要依据面部骨骼等稳定特征,而对嘴部和皮肤折皱等表情变化部分特征给予弱化或剔除这一特点非常相似。而且对人脸图像进行分块,减小了计算量,在样本数量很大、维数很高的情况下,避免了计算量的猛增。


表1xa0 第1、2种分块加权方法的识别结果


表2xa0 第3、4种剔除嘴部分块加权方法的识别结果

结论

本文在分析基于人脸图像分块与SVD压缩对于提取人脸特征的应用基础上,结合基于特征分块的贝叶斯分类器的设计,提出了基于奇异值分解和贝叶斯决策的人脸识别方法,模拟人类识别人脸时剔除同一人脸变化部位的差异能力,在用不同子块单独进行人脸识别之后,根据识别效果人工进行权值分配,通过对Yale标准人脸图像库的实验仿真及对比数据结果表明,本文方法在降维和识别率方面均取得良好的效果,在正面人脸部位(尤其是嘴部)变化较大时,具有良好的鲁棒性。不过,该方法的不足是在人脸角度发生较大变化和眼部有饰物的情况下,识别效果将变差,识别方法有待进一步改进。


『本文转载自网络,版权归原作者所有,如有侵权请联系删除』

热门文章 更多
谈交互式虚拟三维环境的设计