基于深度学习的人脸表情识别文献综述

 2022-11-18 04:11

文 献 综 述

【摘要】本文主要介绍了表情识别研究相关的基本概念,对当前表情识别的基本方法进行了总结,在此基础上对现有的方法进行分析,并提出了基于深度学习的表情识别方法作为本课题的研究对象。

【关键词】 表情识别 ;归一化 ;特征提取 ;深度学习

1 人脸表情识别介绍

人脸表情识别作为情感识别的一个方面,在人际交流中起到重要的作用,不仅是展示情绪,更是传播情感信息与协调双方关系的重要方式。据心理学家Mehrabiadu的研究表明,在人类的日常交流中,通过人脸表情传递的信息高达信息总量的 55%,而通过声音、语言传递的信息分别占信息总量的 38%和7%。通过识别人脸表情可以获取大量有价值的信息。因此基于人类视觉特征,采用计算机技术,对人脸表情特征进行归类的人脸表情识别成为人机交互、情感计算、智能控制、机器视觉、图像处理与模式识别等领域的重要研究课题。现有的识别方法可以分为三类,基于几何的方法,基于外观的方法和基于混合式的方法。基于几何的方法使用人脸特征点的位置,特征点间的距离,网格中三角形的角度等等。基于外观的方法使用全局图像或者特征点周围局部块来提取各种二维图像特征。本课题将采用基于深度学习的方法来对人脸表情进行识别。

2 人脸归一化

无约束人脸的归一化通常是真实世界人脸表情识别的第一步,它通常包括几个现有的人脸预处理算法,人脸特征点检测,人脸对齐和光照归一化。一个无约束的人脸图像包含不同姿势的零个或多个人脸和任意的光照条件。

(1)基于方向梯度直方图(HOG) 线性分类器 图像金字塔 滑窗方法[1]检测包围盒的方法。采用基于回归的特征点检测器[2]来检测包围盒里的人脸特征点,人脸的3D形状被估计,人脸对齐到预定义的3D模型。包围盒检测器和特征点检测器在iBUG 300-W人脸数据集上由king[3]等人预训练得到。对齐模型由Hassner等人在LFW[4]数据集上预训练得到。

(2)基于卷积神经网络的人脸检测和对齐方法:比如MTCNN(Multi-task- convolutional neural networks)。该MTCNN[5]由3个网络结构组成(PNet,RNet,ONet)。

Proposal Network (P-Net):该网络结构主要获得了人脸区域的候选窗口和边界框的回归向量。并用该边界框做回归,对候选窗口进行校准,然后通过非极大值抑制NMS来合并高度重叠的候选框。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。