基于视频的人脸识别研究进展
5期严严等:基于视频的人脸识别研究进展
3.3小结
综上可以看出“视频一图像(多幅图像)”人脸识别和“视频一视频”人脸识别研究的主要问题包括:
(1)如何对高维的人脸图像降维;(2)如何对降维后的人脸序列进行描述;(3)如何刻画描述方式之间的度量;
人脸数据降维的目的是得到表达性特征(如主成分分析等)或鉴别性特征(如线性鉴别分析等)以降低高维人脸数据的计算复杂度和减弱噪声、表情、光照等因素的影响¨….对各种常见线性和非线性的降维方法研究的介绍可参考文献E5G.
现阶段对降维后的人脸序列描述方式包括矢量、矩阵、概率、动态模型、流形等.其中采用概率和流形的方法需要大量反映人脸分布的样本才能更准确地刻画人脸的分布,达到较好的性能.利用动态模型能够很好地利用时间和空间的信息,但是方法相对比较复杂,计算量一般都比较大.而利用矢量作为输入描述方式的主要缺点是样本选取的随机性.矩阵方式最为简单,并且可以应用到时间上不连续的多幅图像情况,但如何更好地刻画矩阵之间的度量是一个值得研究的内容.
4常用的视频人脸数据库及
一些实验结果
目前基于视频的人脸识别常用的视频人脸数据库包括Mobo(Motion
of
body)数据库[52]和Honda/
UCSD数据库阻91.Mobo数据库最初是CMU为了
Human
ID计划进行步态识别而采集的数据库.整
个数据库包含25个人在跑步机上以四种不同的方式行走的视频序列.行走的方式包括慢速行走、快速行走、斜面行走和拿球行走.正面角度拍摄的视频序列共99段(一段丢失).UCSD/Honda数据库包含20个人的共52段视频.数据库中的人脸视频包含了大规模的2D(平面内)和3D(平面外)的头部旋转.另外还有DXM2VTS数据库[5引.
这些视频人脸数据库普遍的缺点是没有考虑到各种条件的变化.大部分都是姿态的变化,其他的如光照、表情的变化等考虑较少,并且数据库的人偏少(<50个人),无法进行大规模有效的实验来评价各种算法的优劣.
目前大部分的文献中采用的数据库以及训练,测试方法都不尽相同.但为了对目前典型方法的实验结果有一个直观的认识,表4汇集了在视频人脸数据库上一些典型方法的实验结果.
万
方数据表4视频人脸数据库上典型方法的实验结果
5总结和展望
本文介绍了现阶段基于视频的人脸识别研究进展.在对人脸识别不同情况分类的基础上,重点介绍了现阶段基于视频的人脸识别的主要方法,分析和讨论了各种方法的优缺点,还介绍了常用的视频人脸数据库及一些典型方法的实验结果.
现阶段基于视频的人脸识别一般都是把人脸视频看成一个整体来克服分辨率低的问题【35‘.对于光照或者姿态的单独变化可以通过矩阵、概率或者流形的方式部分解决[9’1引,但是需要不同条件下的大
量的训练样本.对于遮挡问题可以采用鲁棒统计学[1u或者对脸部的分块处理口4]来解决.
随着研究的深入,基于视频的人脸识别需要进一步研究的工作包括:
(1)人脸特征的准确定位
本文假设已经得到了图像或者视频中人脸的位置,并且人脸的特征已经准确定位.但是在实际应用中,人脸视频的分辨率过低常会使得人脸的检测和准确的特征定位存在一定的困难.人脸的误配准也会严重影响人脸识别的结果.作为人脸识别的基础,准确和快速的人脸检测和特征定位方法是必不可
少的.
(2)人脸的超分辨率重建和模糊复原
视频序列中的人脸由于采集条件和运动的影响,人脸图像分辨率低且人脸模糊.需要研究人脸图像超分辨率技术[踟和图像复原技术‘56]以得到清晰的人脸图像也是未来需要重点解决的问题.
(3)人脸的3D建模
现阶段基于二维的人脸识别方法可以在一定程