至少(shǎo)从柏拉图这样的探究者时(shí)代开始(shǐ),什(shí)么东西会让(ràng)人感(gǎn)到好笑,这一问题(tí)一直(zhí)让哲(zhé)学(xué)家(jiā)和(hé)科学家感到困惑(huò)。希(xī)腊人认为,以他人为代价的优(yōu)越感(gǎn)是幽默的来源。德(dé)国心理(lǐ)学家西格蒙德-弗洛伊德(dé)(Sigmund Freud)认为幽默是一种发泄压抑能量的手段。为了让人们发笑,美国喜剧(jù)演员(yuán)罗宾-威廉姆斯挖掘了他对(duì)荒诞事物的愤怒。
对(duì)于"有什么(me)好笑的?"这个问题的答案,似乎没有人能够达成一致。因此,想象一下(xià)试图训练一个机器人笑的场景。但通过创建一个(gè)从共享笑声系统中获取信(xìn)号的(de)人(rén)工智能,日(rì)本京(jīng)都大学的一个研究小组正试图(tú)做到这一点。研究人员在(zài)《机器人(rén)学和人工(gōng)智能前沿》杂志上描述了他们为日本机器(qì)人"Erica"创(chuàng)造(zào)笑这一表(biǎo)情的(de)新技术。
这并(bìng)不是说机器人不能理解,甚(shèn)至不能对一个(gè)糟糕的笑话发出(chū)笑声。相(xiàng)反,困难在于(yú)为人(rén)工智能(néng)系(xì)统开发人类幽默的微妙之处(chù),以增强机器人和人类之间(jiān)的普通(tōng)对话。
研究人员与Erica之间的对话实例。资料来(lái)源(yuán):Inoue等人
"我们认为对(duì)话式人工智能的(de)重要功能(néng)之一是转移情(qíng)感(gǎn),"主(zhǔ)要作者(zhě)井上浩二博(bó)士解(jiě)释说,他是(shì)京都(dōu)大学信息学研究生院智能科学和技(jì)术系的(de)助理教(jiāo)授。"当然(rán),对话是多模态的(de),不仅(jǐn)仅(jǐn)是正(zhèng)确(què)的回应。因此,我(wǒ)们决定(dìng),机(jī)器人(rén)能够与用户产生共鸣的一种方式是分享(xiǎng)他(tā)们的笑声,而这是基(jī)于(yú)文本的聊天机器(qì)人无法做到的。"
在分享笑声(shēng)的模(mó)式中,人类(lèi)最(zuì)初会(huì)笑,而人工(gōng)智(zhì)能系统则以笑(xiào)声作为移情(qíng)反应。这种方法需要设计三个子系统--一个用于检(jiǎn)测笑声(shēng),第二个用于(yú)决定是(shì)否笑,第三个用于选择适当的笑(xiào)声类型(xíng)。
科学(xué)家们通过注释80多(duō)段来(lái)自速配的(de)对(duì)话来收集(jí)训练数据,速配(pèi)是一(yī)种社会场景,大群人在(zài)短暂的时(shí)间内(nèi)一对一地互(hù)动(dòng)。在这种(zhǒng)情况(kuàng)下,涉(shè)及京都大(dà)学学生(shēng)的(de)"相亲马拉松"活动让Erica加(jiā)入其中,由几个(gè)业余女(nǚ)演员(yuán)远(yuǎn)程操作。
"我们在这项工作中最大(dà)的(de)挑战是确定共享(xiǎng)笑声(shēng)的(de)实际案(àn)例,这(zhè)并不(bú)容(róng)易,因为如你所知(zhī),大多数(shù)笑(xiào)声实际上根本没有共享,"Inoue说。"我们必须仔细分(fèn)类(lèi),到(dào)底哪些笑(xiào)声(shēng)可以用于我(wǒ)们的分析,而不(bú)是仅仅假(jiǎ)设(shè)任(rèn)何笑声都可以被回应。"
笑声的类型也很重(chóng)要(yào),因为在(zài)某些情况(kuàng)下(xià),礼貌的笑声(shēng)可(kě)能(néng)比(bǐ)响亮的嗤(chī)笑声更合适。实验仅限于社(shè)交性的笑(xiào)声与(yǔ)欢(huān)快的笑声(shēng)。
研究小(xiǎo)组最终通过在一个人(rén)和(hé)Erica之间用她的新分享式笑(xiào)声系统创造四段两(liǎng)到三分钟的简短对话来测试Erica新学会的幽默感。在(zài)第一个场景中,她只(zhī)发出了社交性的笑声,随后在第二和第三个交流中只发出了欢笑声,在最后一个对话中两种笑(xiào)声结合起来。该小组(zǔ)还创建了另外两组类(lèi)似的对话作为基线模(mó)型。在(zài)第一组中,Erica从未笑过。在第二个中,Erica每次检测到人类的笑(xiào)声时都会发出社交性(xìng)的(de)笑声(shēng),而不使用(yòng)其(qí)他两(liǎng)个子系统(tǒng)来过滤背(bèi)景和反应。
研(yán)究(jiū)人员共召集了130多人听取了三种不同条件下的每个(gè)场景(jǐng)--共享笑声(shēng)系统(tǒng)、无笑声、所有笑声(shēng)--并根据移情、自然、人类相似性和理解来(lái)评估互动。共享笑声系统(tǒng)的表现(xiàn)优于任何(hé)一种(zhǒng)基线。
"这篇论文(wén)最重要的结果是(shì),我们(men)已(yǐ)经展示(shì)了我(wǒ)们如(rú)何将所(suǒ)有(yǒu)这三(sān)项任务结合到一个机器人中。我们相信,这种类型的组合系统(tǒng)对(duì)于正确的笑(xiào)的(de)行(háng)为是必要的,而不(bú)仅仅是检测到笑并对其做出反应,"Inoue说(shuō)。
在Erica准备好(hǎo)参加脱(tuō)口秀(xiù)表演之前,还有很多其他的笑声方(fāng)式(shì)需要建模(mó)和训练。"还有许多其他的笑的功能和类(lèi)型(xíng)需要考虑,这不是(shì)一(yī)项(xiàng)容易的任务。我们甚至(zhì)还(hái)没有(yǒu)尝试对不共(gòng)享的(de)笑声(shēng)进行建模(mó),尽管它们(men)是最常见的,"Inoue指出。
当然,笑(xiào)声只是与(yǔ)机器人进行类似人类自然对(duì)话的一个方面。
"机器人(rén)实际上应该有一个独(dú)特(tè)的性(xìng)格,我们认(rèn)为他们可(kě)以通过他们(men)的对话行为(wéi)来显示这(zhè)一点(diǎn),例(lì)如笑、眼睛(jīng)注视、手势和说话风格,"Inoue补充(chōng)说。"我们(men)认(rèn)为这根本(běn)不是一(yī)个(gè)简单(dān)的问题,很(hěn)可能需要10到20年以上的时间,我们才能最终与机(jī)器(qì)人像与朋友一样(yàng)进行休闲聊天。"