基于视频的人脸识别研究进展
882
计算
机学报
方法,把原来的矢量空间映射到高维非线性空间
RKHS(ReproducingKernel
Hilbert
很好地处理人脸的大规模旋转时的识别和跟踪问题.文献[21]首先对所有的人脸利用LLE(Locally
Linear
Space)中计算
概率分布之间的距离.
3.2.4动态模型
Embedding)降维后建立整体分段线性模型,
根据到各个分段子流形的距离采用贝叶斯推理的方法计算最大后验概率.在文献[45]中作者通过实验结果指出,利用时空结构的HMM[73大于一定长度时要优于基于静止图像的多数投票方法,但是当视频的长度过短时则不一定.这说明时间长短对动态模型的识别率会有一定影响.
3.2.5流形
无论是矢量、矩阵和概率都没有利用时间连续的信息,所以可以自然地推广到多幅人脸图像(时间上不必连续)作为输入时的人脸识别问题.而动态模型则利用了人脸的时间和空间连续变化的信息,能够更好地刻画人脸的动态变化特性.数据库通常的描述方式可以是矩阵、动态模型、流形.
文献[103中采用3.1节中介绍的概率模型,通过自动选择人脸视频中的示例(在线K均值聚类),把人脸示例的索引也作为状态变量,采用SIS的方法估计出联合概率密度分布,最后通过边缘化求出身份变量的分布进行人脸识别.文献E73中对数据库中的每段人脸视频采用PCA变换建立了特征子空间,在特征子空间中建立一个自适应隐马尔可夫模型
(HiddenMarkov
人脸在不同的光照、姿态变化下会构成一个的低维空间的流形[39’删.所以利用流形作为输入描述可以更好地描述人脸的分布.一般对数据库中的人脸采用同样的描述方法.比较输入和数据库中流形的相似性作为度量.
文献[47—493使用流形来解决基于视频的人脸识别问题,首先建立了一个多视角动态人脸模型,包含了一个3D模型,一个和形状姿态无关的纹理模型,一个仿射变化模型.其基本思想是基于分析的合成,通过最小化损失函数,求解出模型的参数.在视频序列中该问题可以进一步简化,利用Kalman滤波求解出形状和纹理.人脸纹理通过KDA(Kernel
Discriminant
Model,HMM),识别阶段就可以计
算每个识别序列的后验概率作为相似性度量,并且当满足一定条件时对HMM模型进行更新.文献[12]把运动人脸建模成一个ARMA(Auto-Regressive
and
MovingAverage)模型(用姿态作为状态量,采用外
观作为观测量),采用ARMA子空间之间的夹角作为相似性度量.
文献[8—9]和文献Elo]的想法类似,认为应该把跟踪和识别结合起来,减少跟踪的误配准对识别的影响.对不同姿态下的人脸构造一个低维分段线性流形.为了引进时间信息,采用贝叶斯推理的方法,建立了不同姿态之间的转移矩阵,该文的算法能够
Analysis)降维后对单个人脸序列建立
一个分段的线性流形(特征矢量随着姿态的变化).接着就可以通过比较轨迹的匹配程度进行人脸识别.但是要进行3D模型的估计需要大量的多视角图像,计算复杂度较大.
现有文献中的典型算法总结如表3所示.
表3典型的“视频一视频”人脸识别的方法
万方数据