新型冠状病毒(dú)肺(fèi)炎疫情(qíng)牵动人心,如何在春节假期结(jié)束后确保疫情得到有效防控,也(yě)成(chéng)为各地政府面临的头(tóu)等大事。新型冠状病毒肺炎有典型的人传(chuán)人特征,加之(zhī)潜伏期长和隐匿性强,为防疫工作带(dài)来很大(dà)困(kùn)难。除(chú)了要加强农村和(hé)社区的基层管控力度,还(hái)需要更好地利用大数据(jù)、人工智(zhì)能等新兴信(xìn)息(xī)技术,让数据多跑腿(tuǐ),并服务于(yú)精准防疫和决策支(zhī)持。
在搜寻和定位感染者和密切接触者方(fāng)面,大数据技术已经发挥(huī)了巨大作用,对此中国(guó)工程(chéng)院院(yuàn)士、国(guó)家卫健委高级(jí)别专家组成员李兰娟多次提到。
1月28日,她接受(shòu)央视(shì)《新(xīn)闻1+1》专(zhuān)访,指出要利用大数据技术来应对无症状感(gǎn)染者(zhě)和无(wú)意识(shí)的(de)密(mì)集接触者。她指(zhǐ)出,“这个事情给我们预防(fáng)带来很大难度,但现在我们有一(yī)种非常好的解决方法,就是利用(yòng)大(dà)数据的信(xìn)息化(huà)手段,就是你本人(rén)不知道你周围的(de)人是(shì)感染者,但是大数据它(tā)会(huì)告诉(sù)你(nǐ),你作为接触的人可能是疫情感染者。……现在大数据互联网(wǎng)时代把每一个人的流(liú)动(dòng)情况可以摸(mō)得很清(qīng)楚,所以我们现在同SARS时不一(yī)样了,有(yǒu)这样好的现代化技术(shù)和(hé)手段,应该得(dé)到(dào)充分的(de)利用,发挥它的作用来更好的发现传(chuán)染(rǎn)源,控制传染(rǎn)源。”
1月(yuè)29日,李兰娟在(zài)受(shòu)访时再次指出,“现在社区力量的发挥力度(dù)很大,我们现在(zài)提(tí)倡借助大数据(jù)信息化(huà)的手段,进行(háng)信息收集,帮助找到传染源。”1月31日,她对海南连线受(shòu)访时强调,“要利用信息化和大数据(jù)监控手段,把有疫区接触史的人,包括他(tā)周围有过接触史的(de)人,通过大数据(jù)的调查进行明确。”
无论是(shì)政府部门(mén)还是普(pǔ)通民众,都希望获得有关新型冠状病毒肺炎(yán)疫情的全面信息。当(dāng)公共卫(wèi)生专家指出新(xīn)型冠(guàn)状病毒肺炎(yán)可能来(lái)自武汉(hàn)市华南(nán)海鲜市场时(shí),人们都在关注2019年12月曾经(jīng)逗留该市(shì)场(chǎng)的人员有多少,他们去了哪里(lǐ)。当武汉市长周兴旺透露春节(jiē)期间有(yǒu)500万人离开武汉时,人们想知道这些人去(qù)了(le)哪里,其中有多少(shǎo)感染者和密切接(jiē)触者(zhě)。当湖北省以外的(de)省份出现疑似和(hé)确诊患(huàn)者时,人们希望了解这些患者去了哪些小区(qū)和(hé)场所,哪(nǎ)些人可能同他们无(wú)意识(shí)地(dì)密切(qiē)接触了。
来自铁路、航(háng)空、电信、搜索引擎、社(shè)交媒体等方面汇聚的(de)大数据,为搜索和定位来自武汉特别是华南海(hǎi)鲜市场的感染者(zhě)和密(mì)切接(jiē)触者提供了决策支持,并在(zài)很大程度上(shàng)打消了民众的顾虑心理和恐(kǒng)慌情绪。在1月(yuè)30日国家卫健委新(xīn)闻发布会上,中(zhōng)国铁路集(jí)团客运部主任黄欣表(biǎo)示,“铁路部门一(yī)直高度重视提供旅客的信息,我(wǒ)们为了(le)提供这些信(xìn)息(xī),专门(mén)成立(lì)了数据分析的团队,向各级政府的防控部门依(yī)法(fǎ)规(guī)范提供信息(xī)。”显然,这些方面的数据(jù)为各地区摸排流动人口并缩小搜索范(fàn)围提(tí)供了(le)精准指南,也(yě)为有效提高(gāo)疫情防控效率提(tí)供了技(jì)术支(zhī)撑。与此同时,阿(ā)里巴(bā)巴等电(diàn)子商务企业(yè)利用平(píng)台数据和计算能(néng)力,为医疗(liáo)物资调配(pèi)等(děng)提供(gòng)技术支持(chí),大大(dà)助(zhù)力疫(yì)区(qū)医疗物资(zī)短(duǎn)缺问(wèn)题(tí)的破(pò)解。
大数(shù)据助力“互联网+防疫”模式
同(tóng)17年前(qián)的非典相比,我(wǒ)们(men)这次在面对新型冠状病毒肺炎(yán)疫情时,虽然仍(réng)然有面对未知问题(tí)的同样紧张(zhāng),但是大(dà)数据、人工智能等信息技术(shù)的迅猛发展和(hé)广(guǎng)泛普(pǔ)及(jí),则为我们开启了“互联网+防(fáng)疫”模式(shì),使我们在防控疫(yì)情时的效率(lǜ)和效果(guǒ)都得到(dào)了空前(qián)增(zēng)强。
我(wǒ)们(men)看到浙江(jiāng)省(shěng)政府(fǔ)利用手机App“浙里办”,很(hěn)快就(jiù)建立(lì)了新型病毒公共(gòng)服务管理平(píng)台,凸显了当(dāng)地(dì)“互联网+政务服(fú)务(wù)”的(de)能(néng)力。该平台(tái)包(bāo)括主动申报与疫情线(xiàn)索提供、互联网医院新型肺炎通道(dào)、居家医学观察服务与管理、集中医学观察服务与管理、信息发布与(yǔ)健康教育、网(wǎng)上智能问诊与人工服务等功能模块,使人(rén)们可以“一个平台”搞定防疫。
我们看到江苏省无锡市民卡(kǎ)服务微信公众号开(kāi)通了无锡“疫情防控(kòng)一(yī)点通”服务(wù)平台,实(shí)现了(le)“疫(yì)情(qíng)防控一点通”,使当地居民做(zuò)到“疫情有(yǒu)数,防控有术”。从该平台可以看到自(zì)我申报和疫情线(xiàn)索(suǒ)等功能模块(kuài),居民还可以查询无锡本地的实时疫(yì)情地(dì)图。
我们看到(dào)微信公众号“丁香医生”开(kāi)发了中国疫情动态地图(tú),而(ér)“蔚蓝地图”将其精细(xì)化(huà)到地级(jí)市层面,使每一个关心疫(yì)情的人(rén)可以准确定位和(hé)及时查(chá)看疫情动态。1月(yuè)29日,中国疾病预防控制中(zhōng)心联(lián)合易智(zhì)瑞公司推出(chū)新型冠(guàn)状病毒感染(rǎn)的肺炎疫情分(fèn)布系统,为人们(men)查询信息提供了权(quán)威(wēi)来(lái)源(yuán)。
当人们在担忧自己(jǐ)所(suǒ)乘坐的航班(bān)和列车是否存在病毒感染风险时,可以登录无(wú)糖信息开发(fā)的新(xīn)型冠状病毒肺炎确诊(zhěn)患者相同(tóng)行程查询工(gōng)具。只(zhī)需要输入(rù)自己乘坐的(de)交通工具和时(shí)间,就可(kě)以精准查(chá)询自己所乘坐的交通工具(jù)是否有确诊患者,并可以据此及时自我隔离医学观察。这些查询信息(xī)都来自权威的官方媒(méi)体(tǐ)报道,想了(le)解(jiě)详情的可以点击链接确认新闻报道(dào)。
我们看到腾讯较真辟谣专设(shè)疫情防控专题,对涉及疫情防控的相(xiàng)关谣言进行权威辟(pì)谣。
如何更好地利用大数据(jù)技术(shù)的防疫(yì)价(jià)值
虽然(rán)大数据技术在此(cǐ)次疫情防控方面已经发挥了(le)很(hěn)大作(zuò)用,但是还有很大的空间值得(dé)挖(wā)掘。为了进一步提升(shēng)大数据技术的应(yīng)用和普及(jí),使之更好地助力疫情(qíng)防控,需要在如下方面加强大数(shù)据的(de)采集、共享、挖掘、利用和增值。
首先(xiān),大数据(jù)要实(shí)现跨部(bù)门的共享共用,才能(néng)最大化其潜在价值。但是,我们看(kàn)到(dào)一些(xiē)政府部门(mén)和基层(céng)组织(zhī)并没有充分利用大数据技(jì)术,在采集疫(yì)情相(xiàng)关(guān)数据方面仍然采取(qǔ)的(de)是手工作坊式的人海战术(shù)。比如,通(tōng)过打(dǎ)电话(huà)、微信群(qún)等方(fāng)式(shì)填报数据并逐级(jí)上(shàng)报。这(zhè)使不同部门之间的数(shù)据“打架”,跨地(dì)区(qū)、跨层级和(hé)跨部门的数据共享也难以实现。很多(duō)部门为了获得数据经常需(xū)要重复(fù)采集和多(duō)次返工,大大(dà)降(jiàng)低了防疫效率。
《新华每(měi)日电讯(xùn)》记者调查发现,疫(yì)情防控(kòng)一线(xiàn)的基层干部(bù)饱受形式主义的困扰,各个部门要求重复报送各类表格。有(yǒu)受(shòu)访者(zhě)坦言,“明明是同(tóng)一件事(shì),却有六七个部门要(yào)求报六(liù)七个不同的(de)表(biǎo)格”。这反映出(chū)不(bú)同部门之间没有共享数(shù)据,既增加了基层负担和干部空耗,也使数(shù)据(jù)不对称和不一(yī)致的风险加大。如果能(néng)够像浙江(jiāng)省等(děng)地那样采用一张表单(dān)进行数据采集,并为各级各部门提供数据采集和使(shǐ)用权限,那(nà)么就可以解决跨部门的“数据烟囱”问(wèn)题。
其次(cì),大数(shù)据的(de)核心在于互联互通,即通过个人识别(bié)码将不同(tóng)部门和领域的数据加以互联(lián),从而更加精准(zhǔn)地对人群进行“画像”。比如(rú),一个人乘坐网约车、使(shǐ)用搜索引(yǐn)擎和社交媒体(tǐ),并乘坐了火车或飞机,那么就(jiù)需(xū)要将这些不同(tóng)来源的数据(jù)联结起来,才能(néng)对(duì)其进行精准画像和定位。但是,不同(tóng)企业(yè)和(hé)政府(fǔ)部门(mén)提供的数据(jù)是割裂和分(fèn)散的,并没有加以有(yǒu)效整合并用于疫情防(fáng)控。比如,很多铁路旅客(kè)提供的实名信息并不(bú)包括住(zhù)址和(hé)联系方式等信(xìn)息(xī),这使(shǐ)其提供数据的可用(yòng)性(xìng)大(dà)打折扣,即便知道谁感(gǎn)染了病毒或(huò)密切接触了患者也无济(jì)于事。直(zhí)到2月1日,铁(tiě)路部(bù)门才要求购(gòu)票人(rén)在购票时提(tí)供每(měi)名旅(lǚ)客的手机号码,以便于及时取得联系(xì)。
过(guò)去我们经常说(shuō)政(zhèng)府掌(zhǎng)握了(le)八成的数据,但(dàn)是(shì)这个说法(fǎ)需要进行修正了。与企业存储的数据相比(bǐ),政府掌握(wò)的数据“小巫见大巫(wū)”。目前大数据主要掌握在电网公司、铁(tiě)路集团、电信公司以(yǐ)及各类互联(lián)网公司,而政府部门掌(zhǎng)握的数据(jù)无论在量级、更新频(pín)次和复杂性方面都无法(fǎ)比拟(nǐ)。对(duì)于(yú)这些(xiē)企业采集的个人数(shù)据,在所(suǒ)有(yǒu)权和使用权方面仍(réng)然还有争议。但(dàn)是,如(rú)何推动(dòng)互联网公司和公(gōng)用事业企(qǐ)业为政府部门、科(kē)研机构和公(gōng)益组织提供支持(chí),使(shǐ)其能够(gòu)开展数据采集、数据存(cún)储和(hé)数(shù)据分析,是大数(shù)据(jù)助力防疫(yì)特别需(xū)要关注的问题。
再次,政(zhèng)府部门掌(zhǎng)握的(de)数据要向社会公开,使企业(yè)可以据此开发更多的应(yīng)用功能(néng),并将其同其(qí)他数据联(lián)结(jié)后创(chuàng)造更大的商业价值和社会(huì)福祉。与此同时,民众也能够(gòu)通过政(zhèng)府部门(mén)开放(fàng)的数据,更加及时了解(jiě)讯息并避免恐(kǒng)慌情绪。
在公开(kāi)的目的、形式和用途(tú)等方面,数据(jù)开放与(yǔ)信息公开不同。信息(xī)公开主要(yào)是为了(le)增强政府透明和问责,而数据(jù)开放则(zé)意(yì)在通(tōng)过政府数据创造商业和公(gōng)共价值。数据开放意(yì)味着政府开(kāi)放的(de)数据是细(xì)颗粒度和可(kě)机读的,并能够同其他数(shù)据集互联(lián)互通,从而(ér)进一步开(kāi)发(fā)利用数据价值(zhí)。但是(shì),目前政府(fǔ)数据开放方(fāng)面(miàn)还(hái)有很大提升空间,同防疫需求有很大差距。
复(fù)旦大学数字与移动治(zhì)理实验室的研究显(xiǎn)示,目前各地卫(wèi)健委在发布疫情相关数据(jù)方面还有提升空间。同(tóng)政府(fǔ)部门格式化的信(xìn)息发布相比,企业和民众(zhòng)更希望获(huò)得定制化的、及时的、细颗(kē)粒度(dù)的和(hé)可编辑的(de)数(shù)据(jù)。这一方面可以降低企业采集和利(lì)用政府数据的(de)成(chéng)本和难度(dù),另一方面也有助于民众获得同自己最相关(guān)的信(xìn)息。为此,同疫情防控相(xiàng)关的(de)政(zhèng)府部门(mén)应结合政府数据开放要(yào)求,尽快改进信息公开方(fāng)式和形式,使之更好地服(fú)务于防疫工作。
此外,大(dà)数据是(shì)一把“双(shuāng)刃剑(jiàn)”,一面是数据利用的价值(zhí),另一(yī)方面则是(shì)数据泄露的风(fēng)险。此前已有报道,部分(fèn)地区采集了新型冠状病毒肺炎患者的信(xìn)息,但是却没有有效保护,致使这(zhè)些敏感的个人隐私信息外流。特别是(shì)来自武汉市和湖北省的(de)人员,因为信息泄露而受到人身攻击和“污(wū)名化”。因此,政府部门和企业在为(wéi)了防疫而利用大数据时(shí),要将保护患者和密切接触者的个(gè)人(rén)隐(yǐn)私放在首位,避(bì)免因(yīn)为隐私(sī)信(xìn)息泄露而导致的各种问题。
最后,大数据(jù)不(bú)是万(wàn)能的,我们还需要同时采取其(qí)他常(cháng)规(guī)措施,双管齐(qí)下地将大数(shù)据的(de)潜能进一步释(shì)放。大(dà)数据看似精准,实则仍(réng)然是概率(lǜ)估计,至于密切接触者是否感染病毒(dú),仍然需要线下人员(yuán)的排查和追(zhuī)踪。比如,浙江省和杭州市(shì)充分运用“大数据+网格化(huà)”等手段,精准(zhǔn)滚动排摸相(xiàng)关人(rén)员,严防疫情跨界输入,就是这(zhè)方面的(de)典型应用案例。
除了大数据,我们(men)还(hái)需要(yào)挖掘(jué)和利用“深数据(jù)”。大数(shù)据覆盖人(rén)群广,数据量大,但是采集的数据可能是(shì)表面的(de)肤浅(qiǎn)信息。深(shēn)数据是通过观察、访谈等定(dìng)性方式(shì)获取(qǔ)的非结构化数据(jù),涉及的人(rén)少,但是(shì)掌握的信息却更丰(fēng)富。城(chéng)市社区是(shì)典型的陌生人社会,一些家庭甚至门到门都(dōu)彼此(cǐ)不认(rèn)识,需要大数据定位和社区摸排。农村地(dì)区则是典(diǎn)型(xíng)的熟人社会,左邻右舍相互熟悉,小数据(jù)就可以一清(qīng)二楚(chǔ)。将(jiāng)大数据与深数(shù)据结合起(qǐ)来使用,对于提高防疫决策的(de)精准(zhǔn)度和(hé)有效(xiào)性大有裨益。