基于欧拉核的岭回归模型及其在图像稳健识别中的应用
研究背景
随着计算机计算能力的提升和科技的发展,通过人脸识别进行身份确认的应用越来越多,如社区出入管理、人脸门禁考勤、车站人脸闸机等。人脸识别一直是模式识别和计算机视觉领域的研究热点,过去二十年里FR技术已经取得了显著进展,但在实际情境中仍然存在许多难以克服的困难,如光照影响、遮挡、姿势变化等,给人脸识别任务带来诸多挑战。
新冠疫情期间,面对戴口罩的人脸,几乎所有人脸识别系统都无法正常工作。因此,消除面部遮挡部分对人脸识别产生的影响,是亟需的问题,也是推进人脸识别技术走向成熟关键所在。
研究现状
人脸识别在模式识别和计算机视觉领域的研究占有很重要的地位。尽管各种基于神经网络的算法不断刷新在各种数据集上的识别率,但遮挡情况人脸识别问题依旧没能很好地解决。现实情况中,遮挡的类型具有多样性,包括:光照遮挡、物体遮挡、姿态变化引起的遮挡和混合遮挡等。近年来国内外研究者对有遮挡的人脸识别技术进行了大量研究,提出了许多有效的方法。传统方法主要包括稀疏表示法、对遮挡字典的处理方法和遮挡的误差编码方法。
稀疏表示算法常见的一种形态是回归模型。Senjian An[1]等提出了基于核岭回归(Kernel Ridge Regression, KRR)的人脸识别算法。鉴于正则单纯性点有最高的对称度,KRR建立图像向量到这些点的回归模型,使用这些点作为识别中区分个体的目标,确保分类目标分的足够的开,从而提升分类性能。其次,该方法构造了基于岭回归人脸识别的算法流程,并使用核函数充分挖掘非线性特征以提高数据的可分性。核岭回归人脸识别算法在CMU PIE和Extended Yale Face Database数据集上都表现出了稳定的性能指标。I. Naseem等[2]提出了一种线性回归人脸识别器(Linear Regression Classifier, LRC)。事实上,先前的最近特征线方法[3],最近特征面法、最近特征空间法[4]以及上面的岭回归法[1]都是基于线性回归方法的变体。为解决遮挡问题,I. Naseem等[2]提出了基于距离的证据融合算法(Distance-based Evidence Fusion, DEF),将人脸图像分割成多个小块,选取一个可信度最高的块作为最终分类依据,并在多种遮挡情况下取得了令人满意的识别效果。
Lasso模型被广泛用于稀疏表示,它在线性回归模型中添加了范数作为正则项,可以有效抑制过拟合。J. Wright等[5]提出了基于稀疏表示的人脸识别算法SRC(sparse representation based classification)。其基本思想是:直接使用所有类别的训练样本作为字典对测试人脸图像进行编码,并通过评估哪个类别导致的最小重构误差来对人脸图像进行分类。SRC假设表示系数是稀疏的,那么稀疏非零表示系数将会集中在和测试样本具有相同类别的训练样本上。A. Wagner等[6]、Deng等[12]和Huang等[13]分别针对SRC模型的缺点提出改进方案。A. Wagner等[6]进一步扩展了SRC模型,将脸部对齐和识别整合进了一个框架。Deng等[12]提出了一种扩展SRC(extended SRC),主要思想是同一个人的类内变异可以被其他人共享。即一个人带有遮挡的面部测试图像可以通过此人的面部训练图像加上另一个人的变异图像而近似得到,进而构建类内变异字典以表示训练图像和测试图像之间可能存在的变异。此方法的优点是即使在训练样本很少的情况下,也可以达到很高的识别精度。Huang等[13]发现经典SRC无法合并标签信息,所以提出了一种利用标签信息对图像进行有效分类的稀疏编码方法,使投影矩阵在每次迭代中都包含标签信息。Zhu等[17]提出了一种改进的主成分分析算法IPCA(Improved principal component analysis),他们用PCA降维后的数据进行LRC,在Yale B、CMU_PIE、JAFFE三个数据集上取得了SOTA的性能。范数和范数对离群值都比较敏感,Chen等[18]采用范数作为距离衡量指标,提出了基于范数的回归模型DRR,实验结果表明了算法的优越性。
稀疏表示被广泛用于遮挡和光照变化情况下人脸识别问题,但SRC算法性能的提升的本质原因是否来源于稀疏表示受到了一定的关注和研究。Zhang等[11]针对这个问题展开了探讨,并发现协同表示相对于稀疏表示也能够带来算法性能的提升。基于这个结论,他们提出了基于协同表示的正则化最小二乘分类算法(CR based classification with regularized least square, CRC_RLS),在减轻计算量的同时性能较SRC有所提升。
稀疏表示法假设人脸图像是线性可分的,但人脸空间不一定存在超平面可以把空间分为n类,分别属于n个人。对这样的问题,可以把样本从一个原始空间映射到一个更高维的特征空间,使得在这个特征空间内线性可分。[14]中介绍了核函数在各种机器学习算法中的应用,选择适当的核函数,可以充分利用非线性特征,改善模型的性能。常见的核函数有高斯核[15]、拉普拉斯核[16]等,尽管这些核函数可以改善分类器性能,但其计算量较大成本高。欧拉核[7]是一种显式核,近些年被广泛使用,其可以在不增加计算成本的前提下充分利用非线性特征。如图 1所示,欧拉表示可以扩大不同类别样本之间的距离。
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。