大数据背景下,如果几十亿(yì)人脸照(zhào)片被泄露(lù),会带来什么样的后果?如果只是(shì)你参加一个聚(jù)会(huì)发了(le)一盏(zhǎn)给照片(piàn)在社保媒体(tǐ)上(shàng),随后就有人知道了你(nǐ)家(jiā)庭,住(zhù)址,家人,公司等你的隐私(sī)信息,你又该如何面对?想想就(jiù)非常(cháng)害怕(pà),这是个很严肃的问题。
现在是互联网时代,网络信息都很发达,很多人会使用手(shǒu)机(jī),摄像机等拍摄工具,拍自(zì)己的或者同游(yóu),聚会场(chǎng)所(suǒ)等照片上传到(dào)微信,微博等社交(jiāo)媒(méi)体上(shàng),让周围的人(rén)所了解你的想(xiǎng)法,活动(dòng)等,但开(kāi)心(xīn)的同时也给自(zì)己(jǐ)带来(lái)的风险,有些(xiē)不法(fǎ)分子(zǐ)回去窥探,用来做违法的(de)事情,也有人会利(lì)用(yòng)相片来通过(guò)一款APP快速锁定你的姓名、联(lián)系方式(shì)和(hé)家庭住址,让我们(men)的隐(yǐn)私无所隐藏,你就想(xiǎng)是一个透明人,所有(yǒu)信息都被别(bié)人掌控,这时,你是否会觉得不寒而(ér)栗?
seline; -webkit-font-smoothing: antialiased; word-break: break-word; box-sizing: border-box; max-width: 690px; display: block; border-radius: 5px;">
近日,人(rén)工智能初创公司Clearview 因侵犯(fàn)用户隐私而被推上风口浪尖的AI被黑(hēi),平台上超过2000家客(kè)户数据(jù)暴露(lù)在(zài)黑客的野心下,其中不乏美(měi)国移民局、司法部、FBI等重要执(zhí)法机构。
Clearview AI数据库中涵盖了(le)约30亿(yì)张人脸(liǎn)数据(jù),仅靠一张脸部照(zhào)片(piàn),就(jiù)可以(yǐ)检(jiǎn)索出全(quán)网所有的相关图片(piàn),包括照片的地(dì)址链接。但是,关于(yú)更具体的个人信息数(shù)据集,诸如姓名、联系方式和家庭住址,Clearview AI还(hái)没有向C端(duān)公(gōng)众开放。
2 月 27 日,成立于 2016 年(nián)面部识别应用服务公司 Clearview AI 向美国(guó)福克斯新闻网证实,公(gōng)司所(suǒ)有的客户列表、账户数量以及客户进行的(de)相关(guān)搜索数据遭遇了未经(jīng)授权的入侵。
2 月 28 日(rì),Clearview AI 律师 Tor Ekeland 表示,公司的系统跟(gēn)网络并没有受到破坏,目(mù)前已修复了相关漏洞(dòng),并保证类似(sì)事件(jiàn)不会再次发(fā)生。根据 Clearview AI 声明(míng),黑客入侵者获得了未经授权的客户访问列表,其客户包括美国执(zhí)法机构。
目(mù)前,苹果已禁用 Clearview AI 的(de)开发者帐户与其 ioses 应用程序(xù),称其违反(fǎn)了(le)该(gāi)科技(jì)巨头与企业开发者协议(yì)的(de)条款。
根(gēn)据 BuzzFeed 披(pī)露,Clearview AI 的面部识(shí)别(bié)应用客户包括了美国(guó)移民局、司法部、银行,FBI,ICE,梅西百货,沃尔玛、NBA、阿拉伯联合酋长国的主权财富(fù)基金等 2228 多家机构和公司;此外还有更多的私人公司(sī)正在通过 30 天(tiān)免费试(shì)用来(lái)测试该(gāi)技术。
这其中(zhōng)至少(shǎo)有(yǒu) 600 家美国执法机构使(shǐ)用了 Clearview AI 最新的面部识别系统,数据涵盖了(le) Facebook、Instagram、Twitter 和 YouTube 等(děng)社交(jiāo)媒(méi)体平台上(shàng)抓取(qǔ)的超过 30 亿张(zhāng)照片,来完善自家的(de)数据库资(zī)源(yuán)。
Clearview AI所(suǒ)拥有的数据量级已远远超过了(le)美国联邦政府或者(zhě)任何一家硅谷巨头的数(shù)据(jù)体量,即使(shǐ)像(xiàng)FBI这(zhè)样(yàng)的(de)机构,其数据库(kù)也仅仅是(shì)收集了4.11 亿张照片。
seline; -webkit-font-smoothing: antialiased; word-break: break-word; box-sizing: border-box; max-width: 690px; display: block; border-radius: 5px;">
单(dān)从应用的角度来看,Clearview AI所具有的能力与服务潜力非常巨大(dà)。如抗议游行、暴动中个别激(jī)进分子的身份识别,寻找街上(shàng)偶(ǒu)遇到(dào)的心仪对象等,不仅可以搜出他们的名字,甚至还能知道(dào)住所、工(gōng)作单位和社(shè)交关(guān)系网络,可谓细思极快!
比如,只需一张照片(piàn)就能从 30 亿张(zhāng)图像中锁定你的姓名(míng)、联系方式和家庭住址,Clearview AI 基于自身的面部识别系统和数据库协(xié)助 FBI 在内的数百家美国(guó)执法机构用面部(bù)识别技术抓捕罪犯。
一 早有(yǒu)前(qián)科
2020 年刚(gāng)刚(gāng)过去两个月,这家创办(bàn)了(le)四年的公司就上了两次热搜(sōu)。一次(cì)是 1 月份因侵犯隐私(sī)权引发争议,另一次就是此次数(shù)据被黑引发了极大的关注(zhù)。
今年(nián) 1 月,Clearview AI 因随意抓取网上照片引(yǐn)发争议。据《纽约时报》当时的调(diào)查显示,Clearview AI 允许执法机构使用(yòng)其识别技术将未知面(miàn)孔的照片与人们的(de)在(zài)线(xiàn)图(tú)像进(jìn)行匹配,从而搜寻潜在罪犯。随即,Twitter 向 Clearview AI 发(fā)出了一封勒令停止通知(zhī)函。
seline; -webkit-font-smoothing: antialiased; word-break: break-word; box-sizing: border-box; max-width: 690px; display: block; border-radius: 5px;">
仅靠一张脸(liǎn)部照片,Clearview AI就可以检索出(chū)全网所有的相关图(tú)片,包括(kuò)照片的(de)地址链接。但是,关于更具体的个人信息数据集,诸如姓名、联系方(fāng)式和(hé)家庭住址,Clearview AI还没有向C端(duān)公众开(kāi)放(fàng)。
2 月 5 日,YouTube 向 Clearview AI 发出了一封勒令停止通知函,要求这家公司停止从其视频中收集人脸,并删除已经收集的数(shù)据。2 月 7,Facebook 向人脸(liǎn)识别公司 Clearview AI 发出了一封(fēng)勒(lè)令停止通知函,要求其停止(zhǐ)从 Facebook 和 Instagram 上获取数(shù)据。
Clearview AI 的做法违反了数据科技公(gōng)司的服务条款,在这些公(gōng)司(sī)不知情的情况下获(huò)取了用户数据(jù),因此得罪了一(yī)干科技巨头。
两个月的(de)时(shí)间里(lǐ),Clearview AI 已收到来(lái)自微软、Google、YouTube、Venmo、linkedIn 和 Twitter 的停止与禁止(zhǐ)公函。还将面临 500 万美元的(de)集体诉讼索(suǒ)赔(péi)。
二 600多家执法机构在用,「爆款」如何炼(liàn)成?
月初,Clearview AI 创始人(rén)兼首席执行官 Hoan Ton-That 在接受(shòu)采访(fǎng)时并没有表现出太多对其技(jì)术的担忧(yōu)。
他(tā)想以「最(zuì)好的意图(tú)建立一家(jiā)伟大的美国公司」,并表示不会(huì)将产品出售给伊(yī)朗、俄罗斯或中国。Hoan Ton-That 认(rèn)为这项(xiàng)技术(shù)正在挽救孩子,解决犯罪(zuì)问题。
seline; -webkit-font-smoothing: antialiased; word-break: break-word; box-sizing: border-box; max-width: 690px; display: block; border-radius: 5px;">
Clearview AI首席执(zhí)行官Hoan Ton接受CBS采(cǎi)访,图源 | CBS视(shì)频截(jié)图
这位越南裔(yì)澳大利(lì)亚人三次创(chuàng)业、自学 AI,想建立(lì)一家「伟大的美国公司」。
2016 年,Hoan Ton-That 和 60 多(duō)岁、时任纽约市市长 Rudolph W.Giuliani 助(zhù)手的 Richard Schwartz 合作,着手(shǒu)研究面部识别工具,这就是(shì) Clearview AI 雏形(xíng)。
2019 年,Clearview AI 开始向美国的执法(fǎ)机构推广(guǎng)其(qí)服(fú)务(wù),借助 30 天免(miǎn)费试用(yòng)鼓励警察购买。
2019 年(nián) 2 月,印第安(ān)纳州警察局对(duì) Clearview AI 的应用工(gōng)具进(jìn)行测试,仅用 20 分(fèn)钟就通过围观群众(zhòng)拍摄的视频找到(dào)了犯罪嫌疑人(rén)的社交网站,解(jiě)决了这起(qǐ)打架斗殴事件。
2019 年底,Clearview AI 爆火,被私家侦探广(guǎng)泛(fàn)使用。新泽西州克利夫顿的一名(míng)侦(zhēn)探(tàn)甚至在(zài)邮件中敦(dūn)促老板购买(mǎi)这款软件,因为它「能够在几(jǐ)秒钟(zhōng)内识别出嫌疑人」。
Clearview 数据(jù)库的(de)规模让执法(fǎ)部门(mén)使用的其(qí)他数据库相形见绌(chù),据《纽约时报》,Clearview AI 的应用已(yǐ)被包括(kuò)联邦调查(chá)局和美国国(guó)土安全局(jú)在内的 600 多家执法机构使用,包括加拿大(dà)皇家骑(qí)警(jǐng)在内的一些执法部门也(yě)在(zài)使用(yòng),该(gāi)公司声称(chēng)其技(jì)术(shù)在识别个人(rén)身份(fèn)方面的(de)准确率达到 99.6%。
目前,Clearview AI 已经(jīng)渗透到联邦政府的多个部门。美国司法部(bù)的(de)多(duō)个部门在使(shǐ)用 Clearview AI 的产品,政府组织(zhī)名单中包括美国特(tè)勤局的多(duō)个办公室(搜索(suǒ)次数约为 5600 个(gè)),禁(jìn)毒署(shǔ)(约 2000 次搜寻(xún));酒、烟、火器和(hé)炸药局(搜索超过 2100)和(hé) FBI(至少 20 个不同(tóng)的总部外办事处进行了 5700 次搜索)。目前,这些(xiē)机构(gòu)的(de)发言人(rén)对此事要么拒(jù)绝置评,要么未(wèi)回应置评请求(qiú)。
执法(fǎ)部门认可、私家侦探力荐,成为「爆款」之后的 Clearview AI 也招致了数据(jù)黑色(sè)产业链的关注,这一(yī)过程花了不(bú)到半年的时间,轰(hōng)然变天(tiān)的速度出乎(hū)意料(liào)。
三 越「火」越危(wēi)险,细思极恐的(de)数据黑色产业链(liàn)
据了解,Clearview AI 所具有(yǒu)的能力与服务潜力(lì)非常(cháng)巨大。如抗议游(yóu)行、暴(bào)动中个别激进(jìn)分子的身份识(shí)别(bié),人(rén)肉路上遇到的心仪对象等。一张照片不仅可以搜出他们的名字,甚至(zhì)还能(néng)知道住所、工作单位和社交关系网络(luò)。
Clearview AI 拥(yōng)有 30 亿人脸(liǎn)数据,一旦数(shù)据(jù)隐私(sī)泄露将(jiāng)带来无法(fǎ)估量(liàng)的损(sǔn)失。事实(shí)上,层出不(bú)穷(qióng)的数(shù)据泄露(lù)事(shì)件(jiàn)对个人、企业、社会(huì)的都是一种巨大(dà)的威胁。
在我国,仅 2017 年在黑(hēi)市(shì)上(shàng)被泄露的个人信息就高达 65 亿条(tiáo)次,由(yóu)数据(jù)泄露(lù)而衍(yǎn)生(shēng)出来的(de)黑灰(huī)色产业链年(nián)获利已(yǐ)超百亿元。买卖公(gōng)民(mín)个(gè)人隐私数据(jù)为小贷公(gōng)司的(de)「套(tào)路贷(dài)」犯(fàn)罪(zuì)、暴(bào)力催收大开方(fāng)便之门。
2018 年 3 月曝光的 Facebook 数(shù)据(jù)泄露事件(jiàn)中,有 5000 万(wàn)用户的个人资料,一直被用作向其(qí)精准投放政(zhèng)治广告的重要(yào)参(cān)考(kǎo),而这些人占(zhàn)据(jù)着美国选民人数的四分之一。同年,万豪发布公告称旗下酒店(diàn)喜达屋(wū) 5 亿房客信(xìn)息被泄露;社交(jiāo)平台陌陌的 3000 万用户数据(jù)在暗网被销售;问答网站鼻祖 Quora 的 1 亿用户数(shù)据被窃……
2019 年(nián) 2 月,国(guó)内专注于安防领域的人工智能企业深网视界超过 250 万人的数据被非(fēi)法(fǎ)获取,680 万条数据疑似泄露,包括身份证信(xìn)息、人脸识别图像及图像拍摄地点等(děng)。
2019 年 5 月(yuè),一名(míng)自称 GnosticPlayers 的黑客声称窃取了(le)澳大(dà)利亚网(wǎng)站 Canva 的 1.39 亿用户数(shù)据,包括用(yòng)户姓名、用户名、电子(zǐ)邮件地址(zhǐ)、城(chéng)市国家信息。
2019 年(nián) 9 月,17 万条「人脸数据」在国内的网上被公(gōng)开兜售(shòu),涵盖 2000 人的肖像(xiàng),每个(gè)人(rén)约有 50 到 100 张(zhāng)照片,每(měi)张照片还(hái)搭配有一份数据(jù)文件,除了人脸位置的信息外,还(hái)有人脸(liǎn)的 106 处关键点,如眼睛(jīng)、耳朵、鼻(bí)子、嘴、眉毛等的轮廓(kuò)信息等。数据中还(hái)能(néng)提(tí)供人(rén)物性别、表情情绪、颜值、是(shì)否戴眼镜(jìng)等信息。
2019 年 12 月(yuè) 4 日(rì),一个包(bāo)括 27 亿个电子邮件地(dì)址的(de) Elasticsearch 数据库泄露(lù),其中 10 亿(yì)个密码都(dōu)是(shì)以简单的明文存储。据悉,大多数被盗邮件域名来自中(zhōng)国邮件提(tí)供商,涵盖腾讯、新浪、搜(sōu)狐和网易等(děng)。
动辄亿级,数据内容极其详细(xì),此类触目惊心的(de)数据隐私泄(xiè)露(lù)事(shì)件一直在发生。
据(jù)统(tǒng)计(jì),在所有的数据泄露事(shì)件中(zhōng),科技行业因其(qí)信息化、数(shù)字化程度最高,颗(kē)粒(lì)度(dù)更(gèng)细、价值更大,发生的数据泄露事(shì)件最多,占比为 37%。其(qí)次分别是政府机构、金融(róng)和医疗机构。
对于任何规(guī)模(mó)的公(gōng)司来(lái)说,网络安全都不是小事,受众多执法部门青睐的 AI 公司更是如此。
四 合法(fǎ)合(hé)规获取(qǔ)数据将(jiāng)成为行业大势
Clearview AI 此(cǐ)次数据的泄露,将数据风险和数据隐私的讨(tǎo)论再次推上(shàng)风口浪(làng)尖。长(zhǎng)期(qī)以来,数据面临(lín)着三(sān)种风险:黑客攻击、明文存储使(shǐ)得数据可以轻易被复(fù)制(zhì)、越权访问(wèn)带来数据(jù)泄露问题。
对于侵犯用户隐(yǐn)私(sī)权,Clearview AI 声(shēng)称拥(yōng)有对公共(gòng)信息的美国(guó)宪法第一修正案权利,并将其做(zuò)法与 Google.com 搜索引擎进行参(cān)照比较(jiào),但(dàn)这一说法并没(méi)有得到广泛「买账」。
据路透社报(bào)道,加拿(ná)大当局正在对 Clearview AI 进行调查(chá)判断其是否违反用户隐(yǐn)私法。在(zài)美国(guó)伊利(lì)诺伊州,Clearview AI 被诉讼指(zhǐ)控侵犯了州居民的隐私权。新(xīn)泽西州这样的部分美国(guó)地区(qū)甚(shèn)至还颁布了州(zhōu)禁令(lìng),禁止执(zhí)法机(jī)构使用 Clearview AI 的应用工具服务。
技(jì)术用(yòng)于执法、维护(hù)社(shè)会正常秩(zhì)序自然(rán)是好(hǎo)的,但(dàn)一旦被黑产盯上后果便不堪设想。涉及用户隐私的问(wèn)题需要企业自身强化数据管理、保护数据隐私,同时,法律法规的颁布施行也有利于遏制数(shù)据泄露的频频发生。
目前,我国「两高」司法已经对公民隐私数据问(wèn)题有了解释:泄露用户通信内容五百条(tiáo)即(jí)可入罪。等级保(bǎo)护法以(yǐ)及有公民隐私数据的企业必须过等(děng)保安检(jiǎn)的(de)规定也对公民数据隐私问(wèn)题有了法律(lǜ)层面的保护。
数(shù)据有价值,管理(lǐ)、技术(shù)有(yǒu)漏洞,数据就会有泄(xiè)露的可能。目前侵犯(fàn)用户隐私的行为受到越来越多的诟(gòu)病,合法合规的获取数据也将成为行业大势,同时,日(rì)后更加完善的法(fǎ)律(lǜ)法(fǎ)规也有利(lì)于遏(è)制(zhì)数据泄(xiè)露的频频发(fā)生(shēng)。
大数据背景下,AI人(rén)工智能企业如何利用和保护好这些数(shù)据(jù)?如何确(què)保(bǎo)隐(yǐn)私数(shù)据在开发应用(yòng)中不被非法使用?如何才能确(què)保这(zhè)些栓(shuān)全,不被泄露出去?现在这些问题已经(jīng)是摆(bǎi)在(zài)面前急(jí)需要解决。
希(xī)望未(wèi)来发(fā)展中,人工(gōng)智能企业度个人隐私的保护安全方面进一步提(tí)升,向着(zhe)安全稳定的脚步向前(qián)发展(zhǎn)。