人工智(zhì)能是一个很(hěn)宽泛的概念,概括而言是对人的意识和(hé)思维过(guò)程的模拟(nǐ),利用机器学(xué)习和数据分析方(fāng)法赋(fù)予(yǔ)机 器类人的能力。人(rén)工智(zhì)能将提升社会(huì)劳动生(shēng)产(chǎn)率(lǜ),特别是在有效降低劳(láo)动成本、优化产品和服务、创造新市(shì)场和 就业等(děng)方(fāng)面为人类的(de)生产和生活(huó)带来(lái)革命性的(de)转变。
据(jù)Sage预测,到2030年人工智能的出现将为全球GDP带(dài)来(lái)额 外14%的提升,相当(dāng)于15.7万亿(yì)美元的增长。全球范围内越来越(yuè)多的政府和企业组织(zhī)逐渐认识到(dào)人工智能(néng)在经济(jì) 和战略上的重要性,并从(cóng)国家(jiā)战略和商业(yè)活(huó)动上涉足人工智能。全球人工智能市场将在未来(lái)几年(nián)经历现象(xiàng)级的增 长。
据中国(guó)产(chǎn)业信(xìn)息网和中国信息通信研究院数(shù)据(jù),世界(jiè)人工智能市(shì)场将(jiāng)在2020年达到6800亿元人民币,复合增 长率达(dá)26.2%,而中(zhōng)国人工智(zhì)能市场也将在2020年(nián)达到710亿元人(rén)民币,复合增长率达(dá)44.5%。
我(wǒ)国发展人工智能具(jù)有(yǒu)多个方面的优势(shì),比如开放的市场环境、海量(liàng)的数据(jù)资源、强有力的战略引(yǐn)领和(hé)政策支 持、丰富的应用(yòng)场景等,但仍存在基础研究和原创算(suàn)法薄弱、高端元器件缺乏、没有(yǒu)具(jù)备国(guó)际影响力的人工智能 开放(fàng)平台等短板。
此(cǐ)份报(bào)告(gào)不但对人工智能关键技术(计算机(jī)视觉技术、自(zì)然语言处理技术、跨媒体分析推理技 术、智适应学习技术、群(qún)体智能技(jì)术、自主(zhǔ)无人(rén)系(xì)统技术、智(zhì)能芯片技术(shù)、脑机接口技术等)、人工智能典型应 用产业与场景(安防、金融、零(líng)售、交通、教育(yù)、医疗、制造、健康等)做(zuò)出了梳(shū)理。
八大人工智能关键技术
1.计算机视觉(jiào)技术
计算机视觉(Computer Vision)是一门研究如何使机器“看”的科学, 更进一步地说,是指用摄影机和电脑代替(tì)人(rén)眼对目标进行识别(bié)、跟踪和 测量的科学。近几年(nián)计算(suàn)机视觉技术实现了快速发展,其主要学术原因 是2015年基于(yú)深度学习的(de)计算机(jī)视觉算法在ImageNet数据(jù)库上的识别(bié) 准确率首次(cì)超过人类,同(tóng)年Google也(yě)开源了自己(jǐ)的(de)深(shēn)度学(xué)习算法。计 算机视(shì)觉系统的(de)主(zhǔ)要功能有图像获(huò)取、预处理、特征提取、检(jiǎn)测/分割 和高级处理。
2.自然语言处理技(jì)术
自然语言处理(Natural Language Processing)是一门通过建立(lì)形式化的 计算(suàn)模型来分(fèn)析、理(lǐ)解和处理自然语言的学(xué)科,也(yě)是一(yī)门横跨语言学、计算 机科(kē)学、数(shù)学等(děng)领域的交叉(chā)学科。自然语(yǔ)言处理,是指用计算机(jī)对自然语言(yán) 的形、音(yīn)、义等信息进行处理,即对(duì)字(zì)、词、句(jù)、篇(piān)章的输入、输出、识别、 分析、理解、生成等的操作和(hé)加工(gōng)。自然(rán)语(yǔ)言处理的具(jù)体(tǐ)表现形式包括机器 翻译、文本摘要、文本分(fèn)类、文本校对、信息抽取、语音合(hé)成、语音识(shí)别等。可以(yǐ)说,自然语言处理就是要计算机(jī)理(lǐ)解自然语言,自然语言处理机制涉及 两(liǎng)个流程,包括自然语言(yán)理解和自(zì)然语言生成,自然语言理解是让计算机把 输入的语言变成有意思的(de)符号和关(guān)系,然后根据(jù)目的再处理;自然语言生(shēng)成 则是(shì)把计(jì)算机数据转化为自然语言。实现人机间的(de)信息交流,是(shì)人(rén)工智能 界、计算机(jī)科学(xué)和(hé)语言学界所共同关注的重要问题(tí)。
3.跨媒体分析推(tuī)理技术
以往的媒体信息处理模(mó)型往往(wǎng)只(zhī)针对某(mǒu)种单一形式的媒体数据进行(háng)推理分析,比如(rú)图像识(shí)别、语音识别、文本识(shí)别等,而(ér)越(yuè)来越多的任务需要像人一(yī)样能(néng)够协(xié) 同综合处理多种形式(文本、音(yīn)频、视频、图像等)的信息(xī),这(zhè)就是跨媒体分析与推理。跨媒体(tǐ)是一个比较广义的概(gài)念,既(jì)表现(xiàn)为包括网络文本、图像、音频(pín)、 视频等复杂媒体对象混合并(bìng)存,又表现为各类媒体(tǐ)对象形成复杂的关联(lián)关系和(hé)组织结构(gòu),还表现在具有(yǒu)不同模(mó)态(tài)的媒体对象跨越媒介或(huò)平台高度交(jiāo)互融合。通 过“跨媒体(tǐ)”能(néng)从各自的侧面表达相(xiàng)同的语义(yì)信(xìn)息,能比(bǐ)单一的(de)媒(méi)体对象及其特定的模态更加全面(miàn)地反映特定(dìng)的内容信息(xī)。相同的内容信息跨越(yuè)各类媒体对象 交叉传播(bō)与(yǔ)整合,只有对这些多模态媒体(tǐ)进行(háng)融合分析,才能(néng)尽(jìn)可能全(quán)面(miàn)、正确地理解(jiě)这(zhè)种跨(kuà)媒体综合体所蕴涵的内容信(xìn)息(xī)。跨媒体分析推理技术主要包括跨媒(méi)体检索、跨媒体推(tuī)理、跨(kuà)媒体存储(chǔ)几(jǐ)个研究(jiū)范畴,可应(yīng)用于网络内容监管(guǎn)、舆情分析(xī)、信息检索、智慧医疗、自动驾驶、智(zhì) 能穿(chuān)戴设备等场景。
4.智适应学习技术
作为教育领域最(zuì)具突破性(xìng)的技(jì)术,智(zhì)适应 学习(xí)技术(Intelligent Adaptive Learning) 模拟了老(lǎo)师对(duì)学生一对一教学 的过程,赋予了学习系统个性化教学(xué)的能 力(lì)。和传统千人一(yī)面的教(jiāo)学方式(shì)相比,智 适应学习系统带给了学生(shēng)个(gè)性(xìng)化的学习体(tǐ) 验,提升了学生的学习投入度和(hé)学(xué)习(xí)效 率。采用了(le)智适应(yīng)学习技术的学习系统能 够(gòu)针对学生的具体学(xué)习情况提供个性化学(xué) 习解决方案,包括定位学生的知识(shí)漏洞、 持续(xù)性地(dì)评估学生的学习能力水平和知识(shí) 状态、实时动态提供个性化学习内容。智 适应学习(xí)技(jì)术让教育(yù)领域一直困(kùn)扰的(de)质 量、成本、可获取性三大(dà)矛盾因素变成了(le) 历史。
5.群体智能技(jì)术
群(qún)体智能(collective intelligence)也称(chēng)集体(tǐ)智能、群(qún)智。群体智能(néng)是(shì)一种(zhǒng)共享的(de)智能,是(shì)集结(jié)众人的意见(jiàn)进而(ér)转化(huà)为决策的一种过程,用(yòng)来对单一(yī)个体做(zuò)出随机 性决策的风险。对群体智能的研究(jiū),实际上可以(yǐ)被认为是一个属于社会学、商业、计(jì)算机科学、大众传媒和大众行为(wéi)的分支学科(kē),研究从夸(kuā)克层次(cì)到细菌、植 物、动物以及人类社会层次(cì)的群体行为的一个领(lǐng)域。
6.自主(zhǔ)无人系统技术
自(zì)主无人系统是能够通过(guò)先进的技术进行(háng)操作或管(guǎn)理(lǐ)而不需要人(rén)工干预的(de)系统(tǒng),是由机械、控(kòng)制、计算机、通信、材料等多种技术融合而成的复杂(zá)系统(tǒng)。自主 无人系统可(kě)应用到无(wú)人驾驶车(chē)辆、无人机、服务型机器人(15.130, -0.10, -0.66%)、空间机器(qì)人、海洋(yáng)机器人、无(wú)人车间、智能工(gōng)厂等场景中,并实现降本增效(xiào)的作用。自主性和(hé)智能性(xìng)是(shì)自主无人系统最重要的两(liǎng)个(gè)特征。人工(gōng)智能(néng)无疑(yí)是发(fā)展智能无人自主系(xì)统的关键技术之一。利用(yòng)人工智能的各种技术,如图像识别、人机(jī)交 互、智(zhì)能决策、推理和学习,是实现和不断提高(gāo)系(xì)统这两个特征的最有效(xiào)的方法。
7.智能芯片技术
目前,关于智能芯片的定(dìng)义并没有一个严格和(hé)公认的标准。一般来说,运用了人工智能技术的芯(xīn)片都(dōu)可以称(chēng)为智能芯片,但是狭义上的智能芯片(piàn)特指针(zhēn)对人工 智能算(suàn)法(fǎ)做了特殊加速设计的(de)芯片,现(xiàn)阶段(duàn),这些人工智能算法一般以深度(dù)学习(xí)算法为主,也可以包括其它机器学(xué)习算法。智能(néng)芯片可按技术架(jià)构、功能(néng)和应 用(yòng)场景等维度分成多种类别(bié)。
8.脑机接(jiē)口技术
脑机接口(Brain-Computer Interface,BCI)是在人或动物脑(或者脑细胞(bāo)的培养物)与外部设备间建(jiàn)立的直接连接通路。通过单向脑机(jī)接口技术,计算机可 以接受脑传来的命令,或者发送信号到脑(nǎo),但(dàn)不能同时发(fā)送和接(jiē)收信(xìn)号。而(ér)双向脑机(jī)接口(kǒu)允(yǔn)许脑和外部设备(bèi)间的双向信息交换。2013年(nián),自美国首(shǒu)次宣布启动(dòng) “脑计划”以来,欧(ōu)洲、日本、韩国等陆(lù)续参(cān)与“脑科技”竞赛(sài)项目,据(jù)已公开数据表明,全球(qiú)在脑机接口相关领(lǐng)域的研发支持已经超过200亿美元(yuán)。
人工(gōng)智(zhì)能赋(fù)能(néng)产业与应用场(chǎng)景
人工智能技术渗透各(gè)产业——从产品成熟(shú)度视角来看
在人工智(zhì)能技术向各行(háng)各(gè)业渗透的(de)过(guò)程中(zhōng),不同(tóng)产品由(yóu)于(yú)使用场景复杂度的不(bú)同、技(jì)术发展水平的不同(tóng),而导致其成熟度也不同。比(bǐ)如,教育和音响行业的(de)核(hé) 心(xīn)环节已有成熟产品,技术成(chéng)熟度和(hé)用户心理(lǐ)接受度都较(jiào)高;个人助(zhù)理和医疗行业在核心环(huán)节已出(chū)现试验(yàn)性的(de)初步成熟产品,但由于场(chǎng)景复杂(zá),涉(shè)及(jí)个人隐私 和生命健康问题,当前用户心理接受度(dù)较低;自动驾驶和咨询(xún)行(háng)业在核心环(huán)节则(zé)尚未出(chū)现成熟产品,无论是(shì)技(jì)术方(fāng)面还是用户心理接受度方面都还没有达到足 够成(chéng)熟的(de)程度。
人工智能技术渗(shèn)透各产业——从行业使用率视角来看
在人(rén)工智能技术向各行各业渗透的过程中,安(ān)防和金融行业的人工智能(néng)使用率最高,零售(shòu)、交通、教育、医疗、制造、健康(kāng)行业次之。安防行业一(yī)直围(wéi)绕着视 频监控在不断改革升级,在政府的大力支持下,我国已建成集数据(jù)传(chuán)输和控制与一体的自动化监控平台,随着计算机视觉技术出(chū)现(xiàn)突破,安防行(háng)业便迅速向智 能化前进(jìn)。金融行业拥(yōng)有良好的数据积累,在自动化的工作流(liú)与(yǔ)相(xiàng)关技术的运用上有不错的成(chéng)效,组织机构的战略与文(wén)化(huà)也(yě)较为先进,因此人工智能技术也得(dé) 到(dào)了良好(hǎo)的应用。零售行(háng)业在数据积累、人工智(zhì)能应用基(jī)础、组织(zhī)结构方面均有一(yī)定基础。交通行业(yè)则在(zài)组织基础与(yǔ)人工智能应用(yòng)基(jī)础上优势明显,并(bìng)已经开(kāi) 始布局自动驾驶技(jì)术。教育行业的数据积累(lèi)虽然(rán)薄弱(ruò),但行业整体对人工智能持(chí)重点关注的(de)态度(dù),同时也开始(shǐ)在实际业(yè)务(wù)中(zhōng)结合(hé)人工智能技术,因(yīn)此未来发展 可期。医疗与健康行业拥有(yǒu)多年的医(yī)疗数据积累与流程化的数据使用过程(chéng),因此在数据与技(jì)术基础上有着很(hěn)强的优势(shì)。制(zhì)造行业虽(suī)然在组织机构上的(de)基础(chǔ)相对 薄(báo)弱(ruò),但拥有大量高质量(liàng)的数据(jù)积累以及自动(dòng)化的工作流,为人工智能技术的介入提供了良好的技术铺垫。
……
报告节选:










































