伴随着人工智能的发展和(hé)普及,人机交(jiāo)互在我们的(de)生(shēng)活中也扮演着越(yuè)来越重要的作(zuò)用。人们(men)总(zǒng)是觉得机器(qì)冷(lěng)冰冰的,不食人间烟火,而情绪情感识别(bié)则(zé)真正为人们搭建起(qǐ)了与他人沟通的桥梁。如果机器能识别面对对象当下的情(qíng)绪,就能更好(hǎo)地做(zuò)出反应。情绪识别也是人工智能领域里的热门研(yán)究课(kè)题(tí)。
portant;" />
想必大家对假笑男孩的表情包都不陌生,那怎么样才能识别出图片中的小男孩(hái)的真实表情呢(ne)?相较于(yú)较为常见的图(tú)片分类模型(xíng),我(wǒ)们今天来聊一(yī)聊一种(zhǒng)基于(yú)AU(人脸运动单元(yuán))的(de)情绪识别方法。
我们一般将常见的表(biǎo)情分(fèn)为7种,即平静(jìng)、惊讶、愤怒、悲伤(shāng)、开心、恐惧(jù)、厌恶(恶心)。在美国心(xīn)理学家Paul Ekman提出(chū)的面部行为编码系统中,又(yòu)将(jiāng)人们的各种情绪与许多的人(rén)脸运(yùn)动单元(yuán)(AU)进行关联。
portant;" />
这(zhè)里介绍的方法选择了其中(zhōng)几组关联度较高的AU(0~5),作(zuò)为情绪评判的(de)标注。其中,AU0表示抬起上(shàng)嘴唇和(hé)人(rén)中(zhōng)区域的肌肉,AU1表示(shì)颔部(bù)下降,AU2表示嘴角拉伸,AU3表示眉毛压低并聚拢,AU4表示嘴角拉动向下倾斜,AU5表示抬起眉毛(máo)外角。
portant;" />
上图可以看到,这个男生不同的(de)情绪,对应(yīng)各个AU的数值也各(gè)不相同(tóng)。而本方法也是利用这6种AU的数值作为输(shū)入,对最终情绪(xù)做一个准确的判断。具体(tǐ)模(mó)型如(rú)下图所见:
portant;" />
如图中所(suǒ)示,输入的6种AU的(de)数值经过一(yī)层隐含层,再经过一层全链接,最后利用softmax作(zuò)为(wéi)输出(chū),选择(zé)一种情绪标签作(zuò)为最终的结果。当然,各个AU数值的计算其实(shí)也是一个较(jiào)为前沿的研(yán)究课(kè)题,当前也有许多的(de)深(shēn)度学习模型(xíng),比如(rú)DRML、EAC-Net,可以再后(hòu)续与大家分享。
最后,我想,男孩的假笑应(yīng)该会(huì)被归(guī)于disgust吧,你们觉得呢?