至少从柏(bǎi)拉图这样的(de)探究者时代开(kāi)始,什么东西会让人感到好笑,这一问题(tí)一(yī)直(zhí)让哲(zhé)学家(jiā)和科学家(jiā)感到困惑(huò)。希腊人认为,以他人为代(dài)价的优越感是幽默的来源。德(dé)国心理学家西(xī)格蒙德-弗洛伊德(Sigmund Freud)认为幽默是一种发泄压抑能量的手段。为了让人们发笑,美国喜剧演员(yuán)罗宾(bīn)-威廉姆(mǔ)斯挖掘了他对荒(huāng)诞事物的(de)愤怒。
对于"有什么好笑(xiào)的?"这个问(wèn)题的答案,似乎没有人能够达成(chéng)一致。因(yīn)此(cǐ),想象(xiàng)一下试(shì)图训练一个(gè)机器人(rén)笑(xiào)的场景。但通过(guò)创建(jiàn)一个从共享笑声系统中获取信(xìn)号的人工(gōng)智能,日本京都大学的(de)一(yī)个研究小组(zǔ)正试(shì)图做到这(zhè)一点。研究人员在《机器人学和人工智能前沿》杂志上描述(shù)了他们为日本机(jī)器人"Erica"创造笑这一表(biǎo)情的新技术。
这并不是说机器人不(bú)能(néng)理解,甚至不(bú)能对一个糟糕(gāo)的笑话发出笑声。相反,困难在于(yú)为人工智能系统开发人(rén)类幽(yōu)默的微妙之处,以增强机器人(rén)和人类之间的普(pǔ)通(tōng)对话。
研究人员与(yǔ)Erica之间(jiān)的对(duì)话实例。资料来源:Inoue等人
"我(wǒ)们认为(wéi)对话式人工智能(néng)的重要功能之一是转移情感,"主要作者井上浩二博士解释说,他是京都大学信息学研究生院智能科(kē)学和技(jì)术系的助理教授。"当然,对话是多模态的,不仅(jǐn)仅是正确的(de)回(huí)应。因此,我们决定(dìng),机器人能够与用户产生共鸣的一种(zhǒng)方式是分享他们(men)的笑声(shēng),而这是基于文本的聊天(tiān)机器(qì)人无法做到的。"
在分享笑(xiào)声的模式中(zhōng),人类最初会笑,而人工智能系统则以(yǐ)笑声(shēng)作为移情反(fǎn)应。这种方法(fǎ)需要(yào)设计(jì)三个子(zǐ)系统--一个用于检测笑声,第二个用(yòng)于(yú)决定(dìng)是否笑,第三(sān)个用于选择适当(dāng)的笑声类型。
科学家们通过(guò)注(zhù)释80多段来自速配的对话来收集训练数据,速配是一种社会场景,大群人(rén)在短(duǎn)暂的时间内一对一地互动(dòng)。在这种情况下,涉及京都大学(xué)学生的"相亲马拉松"活动让(ràng)Erica加入其中,由几个(gè)业余女演员远程操作。
"我(wǒ)们在这项工作中最(zuì)大的挑战是确定共享笑声的实(shí)际案例,这并(bìng)不容易,因(yīn)为如你所知,大多数笑声实际上根本没有共享,"Inoue说。"我们(men)必须仔细分类,到底(dǐ)哪些笑声可以用于我们的分析(xī),而(ér)不是(shì)仅仅假设任何笑声都可以被回(huí)应。"
笑声的类型也(yě)很重要(yào),因(yīn)为在某些情况下,礼貌的笑声可能(néng)比(bǐ)响(xiǎng)亮的嗤笑声更合适。实验(yàn)仅限于社交性的笑声与欢快的笑声。
研究小组最终通过在一个人和Erica之间用她的新分享(xiǎng)式笑(xiào)声系统创造四段两到三分钟的(de)简短对话来测试Erica新(xīn)学会的幽默(mò)感(gǎn)。在(zài)第(dì)一个场景(jǐng)中,她只发出了社交性的笑声(shēng),随后(hòu)在第二(èr)和第(dì)三个(gè)交(jiāo)流中只发出了欢笑声(shēng),在最(zuì)后(hòu)一个对话中两种笑声结合起来。该小组还创建了另外两组类(lèi)似(sì)的对(duì)话作为基线模型。在第一组中,Erica从未笑过(guò)。在(zài)第二个中,Erica每(měi)次检测到人类的笑声时(shí)都(dōu)会(huì)发出社交性的笑声(shēng),而不使用其他两个子系统来过滤背景和反应。
研究人员共召(zhào)集了130多人听(tīng)取了三种(zhǒng)不同条(tiáo)件下的每个场景--共享笑声系统、无笑(xiào)声、所有笑声--并根据移情、自然、人类相(xiàng)似性和理解来评(píng)估互动。共享笑(xiào)声系统(tǒng)的(de)表现优于(yú)任(rèn)何一种(zhǒng)基线。
"这篇(piān)论文最重要(yào)的结果是,我们已经展示了(le)我(wǒ)们如(rú)何(hé)将所有这三(sān)项(xiàng)任务结合到一个机器人(rén)中。我们(men)相信,这种类(lèi)型的组(zǔ)合系统对于正(zhèng)确的笑(xiào)的行为是(shì)必要的,而(ér)不仅仅是(shì)检测到(dào)笑(xiào)并对其做出(chū)反(fǎn)应,"Inoue说。
在Erica准备好参加脱(tuō)口(kǒu)秀表演之前(qián),还有很多其他(tā)的笑声方式需要(yào)建模和(hé)训练。"还有(yǒu)许多其他的笑(xiào)的功能(néng)和类型需要考虑,这不是一项容易的任务。我们甚至还没有(yǒu)尝试对不共(gòng)享的笑声进(jìn)行(háng)建模,尽管它们是最(zuì)常(cháng)见(jiàn)的,"Inoue指出。
当然,笑声只是与机器人进行类似人类(lèi)自(zì)然对话的一个方面。
"机器人实际上应该有一(yī)个独特的性格,我们(men)认为(wéi)他们(men)可以通过他(tā)们的对话行为来显示这(zhè)一点(diǎn),例如笑、眼(yǎn)睛注(zhù)视、手势(shì)和说话风格,"Inoue补充说。"我们认为这(zhè)根本(běn)不是一个简单的问题,很可能需(xū)要10到20年以上(shàng)的时间,我们(men)才能最终与机器人像与(yǔ)朋友一样进行休闲聊天。"