伴随着(zhe)人(rén)工智能的(de)发展和普(pǔ)及,人机交互在(zài)我们的(de)生活中也扮(bàn)演着(zhe)越来越重要的(de)作用。人们总(zǒng)是觉得机(jī)器冷冰冰的,不食人间烟火,而情绪情(qíng)感识别则真正为(wéi)人们搭建起(qǐ)了与他人(rén)沟通的桥梁。如果机器能识(shí)别面对对(duì)象当下的情绪,就能更好地做出(chū)反应。情(qíng)绪识(shí)别(bié)也是人工智能领域里的热门研究课(kè)题。
portant;" />
想必(bì)大家对假笑男(nán)孩的表(biǎo)情包都不陌生,那怎么样才能识别出图片中(zhōng)的小(xiǎo)男孩的(de)真实表(biǎo)情呢?相较于较为常见的图(tú)片分类模型,我们(men)今天来聊一聊一种基(jī)于AU(人脸运动单元)的情绪识别方(fāng)法。
我们一(yī)般(bān)将常见的表情(qíng)分为7种,即(jí)平静、惊讶、愤怒(nù)、悲伤、开心(xīn)、恐惧、厌恶(恶心)。在美国心理学家Paul Ekman提出的(de)面部行为编码系统中,又将人们的各种(zhǒng)情绪与许(xǔ)多的人脸(liǎn)运(yùn)动单元(AU)进行关联。
portant;" />
这里介绍(shào)的(de)方法选(xuǎn)择了其中几组关联(lián)度(dù)较高的AU(0~5),作为情绪(xù)评判的标注。其中,AU0表示抬起(qǐ)上嘴唇和人中区域的(de)肌肉,AU1表示颔部下(xià)降,AU2表示嘴角拉伸,AU3表示眉(méi)毛压低并聚(jù)拢(lǒng),AU4表示嘴角拉动向下倾斜(xié),AU5表示抬起(qǐ)眉毛外角。
portant;" />
上(shàng)图可以看(kàn)到,这个男生(shēng)不同的情绪,对应各个AU的数值也各不相(xiàng)同(tóng)。而本(běn)方(fāng)法(fǎ)也是利用(yòng)这6种(zhǒng)AU的数值(zhí)作(zuò)为输入,对最终情绪做一个准确的(de)判断。具体模(mó)型如下图所见:
portant;" />
如(rú)图中所(suǒ)示,输入的6种AU的数值(zhí)经过一层隐含层,再经过一层(céng)全链接(jiē),最后利用(yòng)softmax作为输(shū)出(chū),选择一种情绪标签作(zuò)为(wéi)最终的结果(guǒ)。当(dāng)然,各个AU数值的计算其实也(yě)是一个较(jiào)为前沿的(de)研(yán)究课题,当前也有许多的深度学习模型,比如(rú)DRML、EAC-Net,可以再后续与大家(jiā)分享。
最后,我想,男孩的假笑应(yīng)该会被归于(yú)disgust吧,你们觉得(dé)呢?