算力说
人工智能已经可以自动生成以(yǐ)假乱真(zhēn)的人(rén)像照片(piàn)“忽悠”人类了。凭借“对(duì)抗神经网络”,人工(gōng)智能从(cóng)“学(xué)习”和“识别”进化到了“创造”。清华(huá)大学(xué)计算机系教(jiāo)授、博士生导师邓(dèng)志(zhì)东(dōng)将此技术与深度(dù)卷(juàn)积(jī)神经网(wǎng)络、AlphaGo并称为人工智能的(de)三大发(fā)展。当然,基于大数据和大计算的人工智能也存在着“先天不足”,至少在(zài)理解(jiě)和“举一反三”方面还有很(hěn)长(zhǎng)的路要走。
一个颇为无聊(liáo)的国外网站最近火了。
这(zhè)一名为(wéi)“此人不存(cún)在”(ThisPersonDoesNotExist)的(de)网站没有任何(hé)界(jiè)面设(shè)计,输入(rù)网址后显示的(de)只有一(yī)张人像大(dà)头(tóu)照。新奇之处就在于(yú),每次打开或刷新页(yè)面,显示(shì)的(de)照片都(dōu)不同,并且都不是真实存在的人物照(zhào)片(piàn)。
换言(yán)之,所有照片都是随(suí)机“生成”的,而其背后(hòu)正是人工(gōng)智能的(de)支撑。可以(yǐ)看(kàn)出,人工智能已(yǐ)经从“学习”和“识别”,开始进化(huà)到“想象”和“创造”。从网站(zhàn)上的(de)照片来看,不仅(jǐn)实现(xiàn)了无限(xiàn)“生成(chéng)”,而且还生成(chéng)得(dé)不(bú)错——人物有男(nán)有女,有老有少,不同(tóng)人种(zhǒng)、不同角(jiǎo)度、不同表情,甚至还有眼镜和佩饰,可谓以假乱真。
事实上,赋予人工智能想(xiǎng)象力(lì)和创造力的,正(zhèng)是(shì)被《MIT科技评论》评为2018十大科技(jì)突破之一的“对抗神经网络”。
据《MIT科技评(píng)论》介绍,“对抗”是指两个神(shén)经网络使(shǐ)用同一个数(shù)据(jù)集进(jìn)行训练。其中一个(gè)神经(jīng)网络叫生成网络(the generator),它的任务(wù)就(jiù)是依照所见过的图片来生成新的图片,而另外(wài)那个神经网络叫(jiào)判别网络(the discriminator),它的任(rèn)务则是判断它所见(jiàn)得(dé)图片(piàn)是(shì)否与训练时的(de)图片相似。
慢慢地(dì),生成网(wǎng)络创造图片(piàn)的能力会强到(dào)无法被判别(bié)网络(luò)识破的程度。经(jīng)过(guò)训练的生成网络学会了识别并创(chuàng)造看起来十分真实的(de)图片。这项技术已成为过去10年(nián)最具(jù)潜力(lì)的人工智能突(tū)破,帮助机器产生可(kě)以“忽悠(yōu)”人类的成果。
portant;" width="469" height="469" align="" />
生成式对(duì)抗(kàng)网(wǎng)络“创造”出的人像(现实中不存(cún)在此人(rén))具有(yǒu)十足(zú)“迷惑性”
更令人惊(jīng)叹的是,这样的(de)“生(shēng)成”还不限于图像。清华大学计(jì)算机系教授(shòu)、博士生导师邓志东近日在上海“张江(jiāng)·2019未来产业峰(fēng)会”上提到:“两个(gè)卷(juàn)积神经网络(luò)通过相互对抗,生(shēng)成超分辨率真实感的原创图像、声(shēng)音、3D物体或自然时序数据,这给AI带来(lái)一种类似于(yú)人类的(de)想象力。”
AI的三大(dà)主义与(yǔ)三(sān)大发(fā)展
令人叹为观止的人像“创造”背后(hòu),必然是对海量原始照片的学习。
邓志东认为,生物智能的一个主(zhǔ)要特(tè)征就是学(xué)习,而新(xīn)一轮人工智能的(de)鲜明特点就是学习能力。无论是生物智能还是人工智能,智(zhì)能的主(zhǔ)要特点就是感知能力、认知能力和行动能力。
追本溯源,智能的这三大特(tè)点源自连(lián)接主义(yì)、行为主义和符号主义。连接主义是生物智能(néng)的解剖学基(jī)础(chǔ),即生物神经系统所包含(hán)的神经元、神(shén)经元(yuán)的活性(xìng)及其相互(hù)作用。在此(cǐ)之(zhī)上(shàng),行为(wéi)主义通过奖励/惩罚进行(háng)自主学习,强化学习也是人类和动植物行为学习的主要方(fāng)式。最后,符号主义极(jí)大促进了人类(lèi)的智力发育,尤(yóu)其是语言的发明成为了(le)人类智能(néng)远(yuǎn)超其他生物(wù)智能的分水岭。
以“三大(dà)主义”为(wéi)基础,人工(gōng)智能(néng)在最近五六年取得了(le)飞速发展。目(mù)前来看,在大数(shù)据(jù)和大计算的驱(qū)动下,深度学习已成为计算(suàn)机视觉、语音识别(bié)与合(hé)成、自(zì)然语言处(chù)理和(hé)大数据分析等(děng)的主流方法。以深度卷积(jī)神经网(wǎng)络(luò)为基础的新(xīn)一代(dài)人(rén)工智能确实带来了更接近于人类视听觉的感(gǎn)知能力。
因此,数(shù)据驱动的方法已被视为继实验科学、理论模型、模拟仿(fǎng)真之后的第四科学研究范式——数据驱动的科学范(fàn)式,其(qí)如同网络技术,已逐渐变革(gé)为一种通(tōng)用赋能工具。从“互(hù)联网(wǎng)+”到“人(rén)工智能+”,新一(yī)代人工(gōng)智能已经远(yuǎn)远超出了计算机(jī)科(kē)学技术(shù)的范畴。
大数据和大计算让(ràng)人工智能迎(yíng)来了大发(fā)展(zhǎn),邓(dèng)志东总结了人工智能的三大进展。
首先(xiān)是深(shēn)度卷积神经网络令大(dà)数据感知智能取得突破性进展。人工智能已经能获得更加接近于人类水平(píng)的视听觉感知能力和对文本自然语言的模式分(fèn)类能力,从而赋能产品(pǐn)、流程和服务体验,引发(fā)了技术变革和产业革命(mìng)。
这一领域最(zuì)为人(rén)熟(shú)知的(de)例子就(jiù)是自(zì)动(dòng)驾驶,以全球首个自动驾驶商用服务(wù)Waymo One为例,其估值已超千亿(yì)美元。另外,在医(yī)学影像领域,谷(gǔ)歌(gē)的人工智能深度卷积神经网络已经可(kě)以(yǐ)根(gēn)据视网(wǎng)膜影像(xiàng)来准确判断一个人的年(nián)龄(líng)、性(xìng)别、血压(yā)、是否吸烟(yān)等,甚至可(kě)预测肺癌、乳腺癌(ái)等(děng),达到了国际顶(dǐng)级医生的诊断水(shuǐ)平。
其次是超人类水(shuǐ)平的AlphaGo引发全社会强烈关注,在此(cǐ)基础上进化而来的AlphaZero更是带来(lái)了无需大数据(jù)就(jiù)可自主学习的棋类通(tōng)用人(rén)工智能。AlphaZero经过8小时16.5万次训练(liàn),就(jiù)击败了(le)AlphaGo战胜(shèng)李世石的(de)版本。
第三大(dà)进展(zhǎn)是对抗性神经(jīng)网络(luò)带(dài)来了超真实感的想象能力,也就(jiù)是(shì)上述人(rén)工智能“创造”人像的案例所(suǒ)表(biǎo)现的。邓志东(dōng)表示,生成式对抗网络(GAN)是目前最为成功的生成(chéng)式神经(jīng)网络模(mó)型,通过与强化学(xué)习及蒙特卡洛搜索等的结合,推动了(le)半(bàn)监督与无监督学习方(fāng)法的发展(zhǎn)。
portant;" />
清华大(dà)学计算机系教授、博士生导师邓志东
大数据AI的(de)先天不足
邓志(zhì)东坦言,以大数据(jù)为燃(rán)料,喂(wèi)食越多,人工(gōng)智能越能(néng)获得更好的感知直觉。但问题随之(zhī)而来,首先是对大数据的清洗(xǐ)和标签需要付出(chū)很高代价。
其次,在(zài)落地应用中,在开放环境下,实际(jì)是不存在(zài)完备的大数据(jù)的。对于各种应用场(chǎng)景(jǐng),大数据人工(gōng)智能均(jun1)只能获得较接近于人类水平的视听觉等感知能力,这与(yǔ)各种基于公开(kāi)测评数(shù)据(jù)集(jí)得到(dào)的性能指标是完全不同的。简言之,人(rén)工(gōng)智能(néng)或许在测试状态下表现良好,但在实际落(luò)地应(yīng)用中的(de)表现却(què)可能差强人(rén)意。
此外,基于深度学习的计算机视听觉感知方法不仅依赖大数据的(de)驱(qū)动(dòng),也缺乏(fá)人(rén)类(lèi)举一反三的,基于小样(yàng)本的学习能(néng)力和(hé)对目标的认(rèn)知水平的(de)理解能力,并(bìng)且缺乏记忆、没有常识、不(bú)能运用经验,缺乏技巧和知识学习能力。
比如,人们(men)开车转弯(wān)或掉头(tóu)就是过程性经验。大脑记住后,每当转(zhuǎn)弯就不需(xū)要再思(sī)考,而(ér)是(shì)可以条(tiáo)件反射地做出(chū)动(dòng)作。
人(rén)类的思维方式(shì)并不完全依(yī)靠特征(zhēng)提(tí)取,很多(duō)时(shí)候是靠理解和(hé)推理,但目前人(rén)工智能并不具(jù)备(bèi)这样的能(néng)力,也就(jiù)不(bú)具有规划(huá)决策和(hé)思考能力(lì)。
邓(dèng)志东把大数据(jù)人工智能面(miàn)临的挑(tiāo)战归结(jié)为(wéi):人(rén)工智能(néng)缺乏自己的语言。相比之(zhī)下,语(yǔ)言却是人类的“制胜法(fǎ)宝”。他表示,人类高层认知能力其实是(shì)通过记忆(yì)语言(yán)去思考和推理的。记忆以及知识的运用,都是基于(yú)语言的。
另外(wài),大(dà)数据(jù)人(rén)工智(zhì)能的发展,还会带来法律、伦理、隐私安全和失业等方面的挑战。
尽管当下的人工智(zhì)能(néng)还非常弱(ruò),“落地”也只能在特定(dìng)应用领域发挥作(zuò)用,还极度依(yī)赖大数据。但随着人工智能的进一步发展,也就是认知智(zhì)能和通用人(rén)工智能(néng)的发(fā)展,或(huò)许会(huì)对技术(shù)与产业带来变(biàn)革,甚(shèn)至威胁到人类的安(ān)全。
“但总体(tǐ)来说,现在的弱人工智能对于人(rén)类是(shì)赋能和(hé)有益的(de)”,邓志东(dōng)表(biǎo)示(shì)。
拥(yōng)有自己语言(yán)的下一代人工智(zhì)能
对于(yú)人工智能的(de)未来突破点,邓志东(dōng)认为,关键就在于从感知智能(néng)向认知智能的进化。目前人工智能(néng)主要追求看清、听清(qīng),能够识别但(dàn)没(méi)有理(lǐ)解,属于感知智能(néng)范畴。未来人工智能的发展目标将是(shì)如何看懂、听懂和读懂,从而(ér)具(jù)备基本的认知智能,这也是从弱人工智能向通用(yòng)或强人工智(zhì)能进化的(de)方向。
所谓认知智能(néng),就是指对目标或实(shí)体具有理解能力(lì),理解事(shì)物的内涵和外延。其发展趋势就是(shì)要探索举一反(fǎn)三的认知智能,即以(yǐ)大(dà)数据感知(zhī)智能+图模型/知识(shí)图谱为基础,利用图卷积(jī)神经网(wǎng)络从特征学习拓展到(dào)知识学习。
而通用(yòng)人工智能则包含(hán)了多任务的自主学习、自(zì)适应与(yǔ)自(zì)组织能力。其发展趋势是基于连接主义的深(shēn)度神经网络,通过与行为主(zhǔ)义(yì)的强化学习(xí),特别是与具有学习(xí)能力的符号主(zhǔ)义的(de)有机结合,从AlphaZero这样的新起点出发,发展出具有更宽垂(chuí)直领域(yù)的通(tōng)用人工(gōng)智能。
总之,通过深度学习与无监督学习、概(gài)率或模糊图(tú)模型知识图谱进行深度融合,让(ràng)下一代人工智能拥有自己(jǐ)的(de)语言,并能根据数据和常识自主学习,是探索认知能力与(yǔ)通(tōng)用人工智能的关键路径之一。