至(zhì)少从(cóng)柏拉图这(zhè)样的探究(jiū)者时(shí)代开始,什么东西会让人感到好笑,这一问题一直让哲学家和科学家感到困惑。希腊人认为(wéi),以他(tā)人为代价的优越(yuè)感是幽默(mò)的来(lái)源。德国(guó)心理学家西格(gé)蒙德-弗洛伊德(Sigmund Freud)认(rèn)为幽默是(shì)一种发泄压(yā)抑能量的手段。为了让人们(men)发笑,美国喜剧(jù)演(yǎn)员(yuán)罗宾-威廉姆斯挖掘(jué)了他对荒(huāng)诞事物的愤怒。
对于"有什么(me)好笑的?"这个问题的答案,似(sì)乎没(méi)有人能够达成一致。因此,想象一下试(shì)图训(xùn)练一个机器人笑(xiào)的(de)场景。但(dàn)通过(guò)创(chuàng)建一个从(cóng)共(gòng)享笑声系统中获取(qǔ)信号的(de)人工智能,日(rì)本京都大学的一个研究小组正试(shì)图做到这一点。研究人员在《机器人学和人工智能前(qián)沿》杂志上描述了他们为日本机器人"Erica"创造(zào)笑这(zhè)一表情(qíng)的新技术。
这并不是说机器(qì)人不能理(lǐ)解,甚至不能对一个糟糕的笑(xiào)话发出笑声。相反,困难在于为人(rén)工(gōng)智能系统开(kāi)发人类幽默的微妙(miào)之(zhī)处(chù),以增强机器(qì)人(rén)和人类之间的普(pǔ)通对话。
研究人员(yuán)与Erica之间的对话实例(lì)。资料来源:Inoue等人
"我们认为对话式人工智能的(de)重(chóng)要功能之一是转移(yí)情感,"主要作者井上浩(hào)二博士(shì)解释说,他是京(jīng)都大学(xué)信息学研究生院(yuàn)智能科学和(hé)技术系的(de)助理教(jiāo)授。"当然,对话是多(duō)模态的,不仅仅是(shì)正确的回应。因(yīn)此,我们决(jué)定,机器人能够与(yǔ)用户(hù)产生共鸣的一种方(fāng)式是分享他们(men)的笑声(shēng),而这是(shì)基于文本的聊(liáo)天机器人无法做到的。"
在分享(xiǎng)笑声的模式中(zhōng),人类最(zuì)初会笑(xiào),而(ér)人工智能系统则以笑声作为移情反(fǎn)应。这种方法需(xū)要设(shè)计(jì)三个子系(xì)统--一个用于(yú)检测笑(xiào)声,第二个用于决定是(shì)否笑,第三(sān)个用于选择适当的(de)笑声类(lèi)型。
科学家们通过注(zhù)释80多段来(lái)自(zì)速配的对话(huà)来收集训练数(shù)据,速配(pèi)是一种社会场(chǎng)景,大群(qún)人(rén)在短(duǎn)暂的时间(jiān)内一(yī)对一地互动。在这种情况下(xià),涉(shè)及京都(dōu)大学(xué)学生的"相(xiàng)亲马拉松"活(huó)动(dòng)让(ràng)Erica加入其中(zhōng),由几个业(yè)余(yú)女演员远程操作。
"我们在这项(xiàng)工作中最大的(de)挑(tiāo)战是确定共享笑声的实际案例,这并不容易,因(yīn)为如你所知(zhī),大多数(shù)笑声实际上根本没(méi)有共(gòng)享,"Inoue说。"我们必须仔细分类,到底哪些笑声可以用于(yú)我们的分析,而不是仅(jǐn)仅假设任(rèn)何笑声都(dōu)可以被回应。"
笑声的类型(xíng)也(yě)很重要(yào),因为在某些情况下,礼貌的笑声可能比响亮的嗤笑声更合适。实验(yàn)仅(jǐn)限于(yú)社(shè)交性的笑声与欢快的笑声。
研(yán)究小组最终(zhōng)通过在一个(gè)人和Erica之(zhī)间用她的新分享式(shì)笑声(shēng)系统(tǒng)创造四段两到(dào)三分钟的简短对话(huà)来测试Erica新学会的幽默感。在第(dì)一个(gè)场景中,她只发(fā)出了社交性的笑声,随后在(zài)第二和第三个交流中只发出了欢(huān)笑声(shēng),在最后一个(gè)对(duì)话中两种笑声结(jié)合起来。该小组还创建了另外两组类似(sì)的对(duì)话作(zuò)为基线模型。在(zài)第一组中,Erica从未笑(xiào)过(guò)。在第二个中,Erica每次检测到人类的笑(xiào)声时(shí)都(dōu)会发出社交性的笑(xiào)声,而不使用其他两个子系(xì)统来过滤背(bèi)景(jǐng)和(hé)反应(yīng)。
研究人员共召集了130多(duō)人听取了三种(zhǒng)不同条件下的每个场景--共享笑声系统、无笑(xiào)声、所有笑声(shēng)--并根据移情、自然、人类相似性和理解来评估互动。共(gòng)享(xiǎng)笑声系统的表现优于(yú)任何一种基(jī)线。
"这篇论文最重要的结果是,我们已经展示了我们如何将所有这三项任务结合到(dào)一个机器人中(zhōng)。我们相(xiàng)信,这种类型的组合系统对于正确的笑的行为(wéi)是必要的,而不仅仅是检测到笑并对其做出反应,"Inoue说(shuō)。
在Erica准备好参加脱口秀表演之前,还有很多(duō)其他的笑声方式需要(yào)建模和训练。"还有许多其他的笑(xiào)的功能(néng)和类型需要(yào)考虑,这不是一(yī)项容易的任(rèn)务。我们甚至还没有(yǒu)尝试对不共享的笑(xiào)声进行建模,尽管它们是最常见的,"Inoue指出(chū)。
当(dāng)然,笑声只(zhī)是与(yǔ)机器人进行(háng)类似人类自然对话的一个方面。
"机器人实际(jì)上应该有一个独特(tè)的性格,我(wǒ)们认(rèn)为他们可以(yǐ)通过他们的对话行为来显(xiǎn)示这一(yī)点(diǎn),例如笑、眼(yǎn)睛注视、手(shǒu)势(shì)和说话风格,"Inoue补充(chōng)说(shuō)。"我(wǒ)们认为这根本不是一个(gè)简(jiǎn)单(dān)的问(wèn)题,很可能需要10到20年以上的(de)时间(jiān),我们才能(néng)最终与机器人像与朋友一样进行休闲(xián)聊(liáo)天。"