开云

大数据背景下，如果几十亿（yì）人脸照（zhào）片被泄露（lù），会带来什么样的后果？如果只是（shì）你参加一个聚（jù）会（huì）发了（le）一盏（zhǎn）给照片（piàn）在社保媒体（tǐ）上（shàng），随后就有人知道了你（nǐ）家（jiā）庭，住（zhù）址，家人，公司等你的隐私（sī）信息，你又该如何面对？想想就（jiù）非常（cháng）害怕（pà），这是个很严肃的问题。

现在是互联网时代，网络信息都很发达，很多人会使用手（shǒu）机（jī），摄像机等拍摄工具，拍自（zì）己的或者同游（yóu），聚会场（chǎng）所（suǒ）等照片上传到（dào）微信，微博等社交（jiāo）媒（méi）体上（shàng），让周围的人（rén）所了解你的想（xiǎng）法，活动（dòng）等，但开（kāi）心（xīn）的同时也给自（zì）己（jǐ）带来（lái）的风险，有些（xiē）不法（fǎ）分子（zǐ）回去窥探，用来做违法的（de）事情，也有人会利（lì）用（yòng）相片来通过（guò）一款APP快速锁定你的姓名、联（lián）系方式（shì）和（hé）家庭住址，让我们（men）的隐（yǐn）私无所隐藏，你就想（xiǎng）是一个透明人，所有（yǒu）信息都被别（bié）人掌控，这时，你是否会觉得不寒而（ér）栗？
最为轰动的AI公司数据泄露案：客户含（hán）600多（duō）家执法机构，30亿人脸（liǎn）数（shù）据库（kù）远超FBI seline; -webkit-font-smoothing: antialiased; word-break: break-word; box-sizing: border-box; max-width: 690px; display: block; border-radius: 5px;">

近日，人（rén）工智能初创公司Clearview 因侵犯（fàn）用户隐私而被推上风口浪尖的AI被黑（hēi），平台上超过2000家客（kè）户数据（jù）暴露（lù）在（zài）黑客的野心下，其中不乏美（měi）国移民局、司法部、FBI等重要执（zhí）法机构。

Clearview AI数据库中涵盖了（le）约30亿（yì）张人脸（liǎn）数据（jù），仅靠一张脸部照（zhào）片（piàn），就（jiù）可以（yǐ）检（jiǎn）索出全（quán）网所有的相关图片（piàn），包括照片的地（dì）址链接。但是，关于（yú）更具体的个人信息数（shù）据集，诸如姓名、联系方式和家庭住址，Clearview AI还（hái）没有向C端（duān）公（gōng）众开放。

2 月 27 日，成立于 2016 年（nián）面部识别应用服务公司 Clearview AI 向美国（guó）福克斯新闻网证实，公（gōng）司所（suǒ）有的客户列表、账户数量以及客户进行的（de）相关（guān）搜索数据遭遇了未经（jīng）授权的入侵。

2 月 28 日（rì），Clearview AI 律师 Tor Ekeland 表示，公司的系统跟（gēn）网络并没有受到破坏，目（mù）前已修复了相关漏洞（dòng），并保证类似（sì）事件（jiàn）不会再次发（fā）生。根据 Clearview AI 声明（míng），黑客入侵者获得了未经授权的客户访问列表，其客户包括美国执（zhí）法机构。

目（mù）前，苹果已禁用 Clearview AI 的（de）开发者帐户与其 ioses 应用程序（xù），称其违反（fǎn）了（le）该（gāi）科技（jì）巨头与企业开发者协议（yì）的（de）条款。

根（gēn）据 BuzzFeed 披（pī）露，Clearview AI 的面部识（shí）别（bié）应用客户包括了美国（guó）移民局、司法部、银行，FBI，ICE，梅西百货，沃尔玛、NBA、阿拉伯联合酋长国的主权财富（fù）基金等 2228 多家机构和公司；此外还有更多的私人公司（sī）正在通过 30 天（tiān）免费试（shì）用来（lái）测试该（gāi）技术。

这其中（zhōng）至少（shǎo）有（yǒu） 600 家美国执法机构使（shǐ）用了 Clearview AI 最新的面部识别系统，数据涵盖了（le） Facebook、Instagram、Twitter 和 YouTube 等（děng）社交（jiāo）媒（méi）体平台上（shàng）抓取（qǔ）的超过 30 亿张（zhāng）照片，来完善自家的（de）数据库资（zī）源（yuán）。

Clearview AI所（suǒ）拥有的数据量级已远远超过了（le）美国联邦政府或者（zhě）任何一家硅谷巨头的数（shù）据（jù）体量，即使（shǐ）像（xiàng）FBI这（zhè）样（yàng）的（de）机构，其数据库（kù）也仅仅是（shì）收集了4.11 亿张照片。

最为轰动的AI公（gōng）司（sī）数（shù）据泄露案：客（kè）户含600多家执法机构，30亿人脸数据库（kù）远（yuǎn）超FBI seline; -webkit-font-smoothing: antialiased; word-break: break-word; box-sizing: border-box; max-width: 690px; display: block; border-radius: 5px;">

单（dān）从应用的角度来看，Clearview AI所具有的能力与服务潜力非常巨大（dà）。如抗议游行、暴动中个别激（jī）进分子的身份识别，寻找街上（shàng）偶（ǒu）遇到（dào）的心仪对象等，不仅可以搜出他们的名字，甚至还能知道（dào）住所、工（gōng）作单位和社（shè）交关（guān）系网络，可谓细思极快！

比如，只需一张照片（piàn）就能从 30 亿张（zhāng）图像中锁定你的姓名（míng）、联系方式和家庭住址，Clearview AI 基于自身的面部识别系统和数据库协（xié）助 FBI 在内的数百家美国（guó）执法机构用面部（bù）识别技术抓捕罪犯。

一早有（yǒu）前（qián）科

2020 年刚（gāng）刚（gāng）过去两个月，这家创办（bàn）了（le）四年的公司就上了两次热搜（sōu）。一次（cì）是 1 月份因侵犯隐私（sī）权引发争议，另一次就是此次数（shù）据被黑引发了极大的关注（zhù）。

今年（nián） 1 月，Clearview AI 因随意抓取网上照片引（yǐn）发争议。据《纽约时报》当时的调（diào）查显示，Clearview AI 允许执法机构使用（yòng）其识别技术将未知面（miàn）孔的照片与人们的（de）在（zài）线（xiàn）图（tú）像进（jìn）行匹配，从而搜寻潜在罪犯。随即，Twitter 向 Clearview AI 发（fā）出了一封勒令停止通知（zhī）函。

最为轰动的AI公司数（shù）据（jù）泄露案（àn）：客户含600多家执法机构，30亿人脸（liǎn）数（shù）据（jù）库远（yuǎn）超FBI seline; -webkit-font-smoothing: antialiased; word-break: break-word; box-sizing: border-box; max-width: 690px; display: block; border-radius: 5px;">

仅靠一张脸（liǎn）部照片，Clearview AI就可以检索出（chū）全网所有的相关图（tú）片，包括（kuò）照片的（de）地址链接。但是，关于更具体的个人信息数据集，诸如姓名、联系方（fāng）式和（hé）家庭住址，Clearview AI还没有向C端（duān）公众开（kāi）放（fàng）。

2 月 5 日，YouTube 向 Clearview AI 发出了一封勒令停止通知函，要求这家公司停止从其视频中收集人脸，并删除已经收集的数（shù）据。2 月 7，Facebook 向人脸（liǎn）识别公司 Clearview AI 发出了一封（fēng）勒（lè）令停止通知函，要求其停止（zhǐ）从 Facebook 和 Instagram 上获取数（shù）据。

Clearview AI 的做法违反了数据科技公（gōng）司的服务条款，在这些公（gōng）司（sī）不知情的情况下获（huò）取了用户数据（jù），因此得罪了一（yī）干科技巨头。

两个月的（de）时（shí）间里（lǐ），Clearview AI 已收到来（lái）自微软、Google、YouTube、Venmo、linkedIn 和 Twitter 的停止与禁止（zhǐ）公函。还将面临 500 万美元的（de）集体诉讼索（suǒ）赔（péi）。

二 600多家执法机构在用，「爆款」如何炼（liàn）成？

月初，Clearview AI 创始人（rén）兼首席执行官 Hoan Ton-That 在接受（shòu）采访（fǎng）时并没有表现出太多对其技（jì）术的担忧（yōu）。

他（tā）想以「最（zuì）好的意图（tú）建立一家（jiā）伟大的美国公司」，并表示不会（huì）将产品出售给伊（yī）朗、俄罗斯或中国。Hoan Ton-That 认（rèn）为这项（xiàng）技术（shù）正在挽救孩子，解决犯罪（zuì）问题。

最为轰动的AI公（gōng）司数据泄露案：客（kè）户含600多家执法机（jī）构，30亿人脸数（shù）据库远超FBI seline; -webkit-font-smoothing: antialiased; word-break: break-word; box-sizing: border-box; max-width: 690px; display: block; border-radius: 5px;">

Clearview AI首席执（zhí）行官Hoan Ton接受CBS采（cǎi）访，图源 | CBS视（shì）频截（jié）图

这位越南裔（yì）澳大利（lì）亚人三次创（chuàng）业、自学 AI，想建立（lì）一家「伟大的美国公司」。

2016 年，Hoan Ton-That 和 60 多（duō）岁、时任纽约市市长 Rudolph W.Giuliani 助（zhù）手的 Richard Schwartz 合作，着手（shǒu）研究面部识别工具，这就是（shì） Clearview AI 雏形（xíng）。

2019 年，Clearview AI 开始向美国的执法（fǎ）机构推广（guǎng）其（qí）服（fú）务（wù），借助 30 天免（miǎn）费试用（yòng）鼓励警察购买。

2019 年（nián） 2 月，印第安（ān）纳州警察局对（duì） Clearview AI 的应用工（gōng）具进（jìn）行测试，仅用 20 分（fèn）钟就通过围观群众（zhòng）拍摄的视频找到（dào）了犯罪嫌疑人（rén）的社交网站，解（jiě）决了这起（qǐ）打架斗殴事件。

2019 年底，Clearview AI 爆火，被私家侦探广（guǎng）泛（fàn）使用。新泽西州克利夫顿的一名（míng）侦（zhēn）探（tàn）甚至在（zài）邮件中敦（dūn）促老板购买（mǎi）这款软件，因为它「能够在几（jǐ）秒钟（zhōng）内识别出嫌疑人」。

Clearview 数据（jù）库的（de）规模让执法（fǎ）部门（mén）使用的其（qí）他数据库相形见绌（chù），据《纽约时报》，Clearview AI 的应用已（yǐ）被包括（kuò）联邦调查（chá）局和美国国（guó）土安全局（jú）在内的 600 多家执法机构使用，包括加拿大（dà）皇家骑（qí）警（jǐng）在内的一些执法部门也（yě）在（zài）使用（yòng），该（gāi）公司声称（chēng）其技（jì）术（shù）在识别个人（rén）身份（fèn）方面的（de）准确率达到 99.6%。

目前，Clearview AI 已经（jīng）渗透到联邦政府的多个部门。美国司法部（bù）的（de）多（duō）个部门在使（shǐ）用 Clearview AI 的产品，政府组织（zhī）名单中包括美国特（tè）勤局的多（duō）个办公室（搜索（suǒ）次数约为 5600 个（gè）），禁（jìn）毒署（shǔ）（约 2000 次搜寻（xún））；酒、烟、火器和（hé）炸药局（搜索超过 2100）和（hé） FBI（至少 20 个不同（tóng）的总部外办事处进行了 5700 次搜索）。目前，这些（xiē）机构（gòu）的（de）发言人（rén）对此事要么拒（jù）绝置评，要么未（wèi）回应置评请求（qiú）。

执法（fǎ）部门认可、私家侦探力荐，成为「爆款」之后的 Clearview AI 也招致了数据（jù）黑色（sè）产业链的关注，这一（yī）过程花了不（bú）到半年的时间，轰（hōng）然变天（tiān）的速度出乎（hū）意料（liào）。

三越「火」越危（wēi）险，细思极恐的（de）数据黑色产业链（liàn）

据了解，Clearview AI 所具有（yǒu）的能力与服务潜力（lì）非常（cháng）巨大。如抗议游（yóu）行、暴（bào）动中个别激进（jìn）分子的身份识（shí）别（bié），人（rén）肉路上遇到的心仪对象等。一张照片不仅可以搜出他们的名字，甚至（zhì）还能（néng）知道住所、工作单位和社交关系网络（luò）。

Clearview AI 拥（yōng）有 30 亿人脸（liǎn）数据，一旦数（shù）据（jù）隐私（sī）泄露将（jiāng）带来无法（fǎ）估量（liàng）的损（sǔn）失。事实（shí）上，层出不（bú）穷（qióng）的数（shù）据泄露（lù）事（shì）件（jiàn）对个人、企业、社会（huì）的都是一种巨大（dà）的威胁。

在我国，仅 2017 年在黑（hēi）市（shì）上（shàng）被泄露的个人信息就高达 65 亿条（tiáo）次，由（yóu）数据（jù）泄露（lù）而衍（yǎn）生（shēng）出来的（de）黑灰（huī）色产业链年（nián）获利已（yǐ）超百亿元。买卖公（gōng）民（mín）个（gè）人隐私数据（jù）为小贷公（gōng）司的（de）「套（tào）路贷（dài）」犯（fàn）罪（zuì）、暴（bào）力催收大开方（fāng）便之门。

2018 年 3 月曝光的 Facebook 数（shù）据（jù）泄露事件（jiàn）中，有 5000 万（wàn）用户的个人资料，一直被用作向其（qí）精准投放政（zhèng）治广告的重要（yào）参（cān）考（kǎo），而这些人占（zhàn）据（jù）着美国选民人数的四分之一。同年，万豪发布公告称旗下酒店（diàn）喜达屋（wū） 5 亿房客信（xìn）息被泄露；社交（jiāo）平台陌陌的 3000 万用户数据（jù）在暗网被销售；问答网站鼻祖 Quora 的 1 亿用户数（shù）据被窃……

2019 年（nián） 2 月，国（guó）内专注于安防领域的人工智能企业深网视界超过 250 万人的数据被非（fēi）法（fǎ）获取，680 万条数据疑似泄露，包括身份证信（xìn）息、人脸识别图像及图像拍摄地点等（děng）。

2019 年 5 月（yuè），一名（míng）自称 GnosticPlayers 的黑客声称窃取了（le）澳大（dà）利亚网（wǎng）站 Canva 的 1.39 亿用户数（shù）据，包括用（yòng）户姓名、用户名、电子（zǐ）邮件地址（zhǐ）、城（chéng）市国家信息。

2019 年（nián） 9 月，17 万条「人脸数据」在国内的网上被公（gōng）开兜售（shòu），涵盖 2000 人的肖像（xiàng），每个（gè）人（rén）约有 50 到 100 张（zhāng）照片，每（měi）张照片还（hái）搭配有一份数据（jù）文件，除了人脸位置的信息外，还（hái）有人脸（liǎn）的 106 处关键点，如眼睛（jīng）、耳朵、鼻（bí）子、嘴、眉毛等的轮廓（kuò）信息等。数据中还（hái）能（néng）提（tí）供人（rén）物性别、表情情绪、颜值、是（shì）否戴眼镜（jìng）等信息。

2019 年 12 月（yuè） 4 日（rì），一个包（bāo）括 27 亿个电子邮件地（dì）址的（de） Elasticsearch 数据库泄露（lù），其中 10 亿（yì）个密码都（dōu）是（shì）以简单的明文存储。据悉，大多数被盗邮件域名来自中（zhōng）国邮件提（tí）供商，涵盖腾讯、新浪、搜（sōu）狐和网易等（děng）。

动辄亿级，数据内容极其详细（xì），此类触目惊心的（de）数据隐私泄（xiè）露（lù）事（shì）件一直在发生。

据（jù）统（tǒng）计（jì），在所有的数据泄露事（shì）件中（zhōng），科技行业因其（qí）信息化、数（shù）字化程度最高，颗（kē）粒（lì）度（dù）更（gèng）细、价值更大，发生的数据泄露事（shì）件最多，占比为 37%。其（qí）次分别是政府机构、金融（róng）和医疗机构。

对于任何规（guī）模（mó）的公（gōng）司来（lái）说，网络安全都不是小事，受众多执法部门青睐的 AI 公司更是如此。

四合法（fǎ）合（hé）规获取（qǔ）数据将（jiāng）成为行业大势

Clearview AI 此（cǐ）次数据的泄露，将数据风险和数据隐私的讨（tǎo）论再次推上（shàng）风口浪（làng）尖。长（zhǎng）期（qī）以来，数据面临（lín）着三（sān）种风险：黑客攻击、明文存储使（shǐ）得数据可以轻易被复（fù）制（zhì）、越权访问（wèn）带来数据（jù）泄露问题。

对于侵犯用户隐（yǐn）私（sī）权，Clearview AI 声（shēng）称拥（yōng）有对公共（gòng）信息的美国（guó）宪法第一修正案权利，并将其做（zuò）法与 Google.com 搜索引擎进行参（cān）照比较（jiào），但（dàn）这一说法并没（méi）有得到广泛「买账」。

据路透社报（bào）道，加拿（ná）大当局正在对 Clearview AI 进行调查（chá）判断其是否违反用户隐（yǐn）私法。在（zài）美国（guó）伊利（lì）诺伊州，Clearview AI 被诉讼指（zhǐ）控侵犯了州居民的隐私权。新（xīn）泽西州这样的部分美国（guó）地区（qū）甚（shèn）至还颁布了州（zhōu）禁令（lìng），禁止执（zhí）法机（jī）构使用 Clearview AI 的应用工具服务。

技（jì）术用（yòng）于执法、维护（hù）社（shè）会正常秩（zhì）序自然（rán）是好（hǎo）的，但（dàn）一旦被黑产盯上后果便不堪设想。涉及用户隐私的问（wèn）题需要企业自身强化数据管理、保护数据隐私，同时，法律法规的颁布施行也有利于遏制数（shù）据泄露的频频发生。

目前，我国「两高」司法已经对公民隐私数据问（wèn）题有了解释：泄露用户通信内容五百条（tiáo）即（jí）可入罪。等级保（bǎo）护法以（yǐ）及有公民隐私数据的企业必须过等（děng）保安检（jiǎn）的（de）规定也对公民数据隐私问（wèn）题有了法律（lǜ）层面的保护。

数（shù）据有价值，管理（lǐ）、技术（shù）有（yǒu）漏洞，数据就会有泄（xiè）露的可能。目前侵犯（fàn）用户隐私的行为受到越来越多的诟（gòu）病，合法合规的获取数据也将成为行业大势，同时，日（rì）后更加完善的法（fǎ）律（lǜ）法（fǎ）规也有利（lì）于遏（è）制（zhì）数据泄（xiè）露的频频发（fā）生（shēng）。

大数据背景下，AI人（rén）工智能企业如何利用和保护好这些数（shù）据（jù）？如何确（què）保（bǎo）隐（yǐn）私数（shù）据在开发应用（yòng）中不被非法使用？如何才能确（què）保这（zhè）些栓（shuān）全，不被泄露出去？现在这些问题已经（jīng）是摆（bǎi）在（zài）面前急（jí）需要解决。

希（xī）望未（wèi）来发（fā）展中，人工（gōng）智能企业度个人隐私的保护安全方面进一步提（tí）升，向着（zhe）安全稳定的脚步向前（qián）发展（zhǎn）。