随(suí)着北京国际大(dà)数据(jù)交易所(以(yǐ)下简称“北数所”)的发起成立,近年来不温不火的大数(shù)据交易所重回(huí)舆论场中(zhōng)心。根据官方消息,北数所将以培(péi)育数据交易市场、释(shì)放数据(jù)要素价值为(wéi)核心,打造立足(zú)京津冀(jì),辐射带动全国,面向全(quán)球提供服务的金融科技基础设(shè)施(shī)。
2015年起,受(shòu)互联网金(jīn)融和数字经济(jì)爆(bào)发驱(qū)动,多省市(shì)出(chū)现过几轮数据交易平台兴建热潮。但相(xiàng)比市场化(huà)大数据(jù)公司的野蛮生长,由政府背书甚至(zhì)主(zhǔ)导的大数据(jù)交易所模(mó)式却颇为消沉。截至今年4月,国内(nèi)已公(gōng)布的(de)(含筹建)的(de)大数(shù)据交易所(中心)已(yǐ)超过30个,但业务活跃的寥寥无几。
这其(qí)中,既有顶层设计、法(fǎ)律法规的(de)缺位,亦有关键(jiàn)技术未成熟(shú)和(hé)体制机制的束缚(fù)。
据(jù)悉,目前市(shì)场最(zuì)成熟(shú)的(de)大(dà)数据应用就在金融信贷记录,而大数(shù)据(jù)交易所里,70%以上是带有金融(róng)属性的数(shù)据。
在数(shù)据要素化改革的顶层设计(jì)驱动下(xià),大数据交易所(suǒ)再次(cì)升温(wēn)。北数所的出现代(dài)表(biǎo)了一种新的路径探索,其技术突破一定(dìng)程(chéng)度上解决了此前(qián)困扰数据流(liú)通的最大(dà)难题——数据所有权争议以及数据的滥(làn)用。但这一商业模式(shì)同(tóng)样面临重(chóng)重挑战,能否(fǒu)走通有待时间的检验。
规范(fàn)金融应用技术
从(cóng)2014年成立(lì)贵阳大数(shù)据交易所开始,各类大数据交易所(中心(xīn))在国内遍地开花(huā),但在2017年之后(hòu)开始降温。2018年到(dào)2019年,市场(chǎng)一度冻结(jié)。
“有(yǒu)立法(fǎ)健全和司(sī)法打(dǎ)击力(lì)度提升(shēng)的影响,大数据问题动(dòng)辄上刑事(shì),合规成本高企,各地倾向按兵不动。”一(yī)位上海国资大(dà)数据(jù)公司内(nèi)部人士向《中(zhōng)国经(jīng)营报》记者(zhě)表示,不过在他看来,“更(gèng)重要的是业务很(hěn)难推(tuī)进(jìn),根本上模式就不(bú)成立(lì)”。
根(gēn)据中国信通院发布的《中国数字经济发展白皮书(2020年)》,我国大数据的交易模(mó)式可大致划分为四种:政府牵头或背书的交易(yì)所(suǒ)(中心);行业机构为主的行业数据交(jiāo)易(yì)模式(shì);大型互联网公(gōng)司、大型IT厂商为(wéi)主导的数据(jù)交易平台;垂直数(shù)据服(fú)务商主导的市场化(huà)数据交易(yì)模式(shì)。这其中,后两者主要以盈(yíng)利为主要诉求,而大数据交易(yì)所(中心)因其权(quán)威性和合规性最强,对我国(guó)数(shù)据合规定价与流通的(de)意义最大(dà)。
但大数(shù)据交(jiāo)易所模式始终不温不火。2015年4月,号称(chēng)全球第一(yī)家的贵阳大数据交(jiāo)易所挂牌成立,一度引(yǐn)发关注。根据《贵州日报》公开信息(xī),截(jié)至2018年3月,贵(guì)阳大数据(jù)交易所(suǒ)会员数量突破2000家(jiā),接入225家优质数据源,交易(yì)额累计突(tū)破1.2亿元。但此后(hòu),该(gāi)交易所未再公布过相关交易数据。
一位大数据(jù)行业(yè)第三方技术公司高(gāo)管向记(jì)者透(tòu)露,不少大数据交易所的1.0模(mó)式就是把从(cóng)地(dì)方政府、地方(fāng)国(guó)企拿到的数据(jù)放到平台上,有机构需要交(jiāo)易,就开个API接口把数据连(lián)上。但(dàn)后(hòu)来发现,这种方式下的(de)数(shù)据(jù)用途和用(yòng)量根本不(bú)可控,接入数据交易(yì)的技术方、需求方、中介方等都可能违(wéi)规私下截留数据,甚至将(jiāng)数据再“卖”给(gěi)其他相关方(fāng)。
前述国(guó)资大数据(jù)公司内(nèi)部人士早(zǎo)年曾参访华东某市大数据交易中心,现场(chǎng)有人就私下向其表示,如果有数据(jù)需求直(zhí)接接定向(xiàng)采(cǎi)购就可以,为什么要经过交(jiāo)易(yì)中心,他们(men)能提供什么价值? 从第三方过一道,数据就会有被截留的可能。
2020年11月,由中国人民银(yín)行发布的《多(duō)方安全计算金(jīn)融(róng)应用技术规范》规定了多方(fāng)安全计(jì)算技术金融应用的各种要(yào)求。由全国金融(róng)标准化技术委员会(huì)归口管理(lǐ)的《规范》,有助于实(shí)现在(zài)不泄露(lù)原始(shǐ)数据、保障信息安全前提下推(tuī)动多个主(zhǔ)体间的数据共享与(yǔ)融(róng)合(hé)应(yīng)用(yòng)。
事实上,随着技(jì)术(shù)发展,一些大(dà)数据交(jiāo)易所已经意识到1.0模式存在的问题,于(yú)是进(jìn)入(rù)2.0阶段——建云,但还是未(wèi)能解决数据(jù)泄露(lù)和数(shù)据滥用的问(wèn)题。“在云上算一算再(zài)把(bǎ)结果给需求方,很多需求方仍会担心:数据(jù)、算(suàn)法甚至参数放到云上,泄露了怎么办?”前述技术公司高管表示。
有别于银联、网(wǎng)联这样的“强(qiáng)牌(pái)照(zhào)机构+金融基(jī)础(chǔ)设施”,大数据交易所可(kě)谓既无强牌照,也无强(qiáng)服务,这导致最终(zhōng)很多交(jiāo)易根(gēn)本(běn)不发生在大数据交易所(suǒ)场(chǎng)内(nèi),交易(yì)所沦为了需求撮合的中介。
事实上,数据确权悬(xuán)而未决(jué)导致数据难定价,这也(yě)让大数据交易所的(de)商(shāng)业模式始终不清晰。一位华东(dōng)地区大数据交(jiāo)易所高管告诉(sù)记者:早期大数据交易所曾采取(qǔ)按比例“分佣”模式,但推高了数据交易成本(běn)又不能提供更有(yǒu)价值的服务(wù)。
“我们现在更多(duō)采取(qǔ)服务费(fèi)的模式,比如有客户需要对接一些(xiē)相关方数据,我们将双方模型部署后跑一个脱敏结果出(chū)来给到(dào)需(xū)求方。或(huò)者是(shì)需求方对与某(mǒu)一方直连(lián)数据有顾忌,一般会通过交(jiāo)易所,我们给出一(yī)个多方对接的解决方案。”他表示。
上述模式又很(hěn)像市场(chǎng)化的(de)数(shù)据服(fú)务商。他也承(chéng)认:在这些方面(miàn)交易所和市场化数(shù)据机构(gòu)相比不(bú)占优(yōu)势(shì),“我们一(yī)方(fāng)面做政府数据的开放共(gòng)享,一方面做(zuò)商(shāng)业数据的流通,但优势肯定(dìng)还是前者,这两者对能力的需求不(bú)一样”。
制(zhì)度短板
“明文数据(相对于密文数据的定义)的交易流通在理论上是一个伪命题。”华控清交(jiāo)董(dǒng)事长兼CEO张(zhāng)旭(xù)东向记者表示。因为(wéi)明文数据一旦被“看见”就会(huì)暴露信息,就可以(yǐ)被无限复制和(hé)传播(bō),就无法(fǎ)控制(zhì)用途和用量,就可(kě)能被滥用,就无法厘(lí)清“责、权、利”。在他看来,这是(shì)很多大数据交(jiāo)易所(suǒ)无法大规模推进(jìn)数据交易的根本原因。
数据确权问(wèn)题迄今无解。数据确权,指的是对数据所有权、使用权(quán)、经营权、知(zhī)情权、遗忘权、修(xiū)改(gǎi)权、删除权等一系列权利的确认。确权(quán)是任何资源市场化(huà)利(lì)用的(de)前提,但在核心的(de)数(shù)据所(suǒ)有权上,应该归属(shǔ)企业(yè)还是个人长期存在争议。在(zài)去(qù)年出台的《民(mín)法(fǎ)典》和(hé)《数据安全法(fǎ)(草案)》中,对此也(yě)没有进一步明确(què)。
早(zǎo)年间,贵阳大数据交(jiāo)易所也曾(céng)发布《数据确权暂行管理办法》及《数据交易结算制(zhì)度》,尝试登(dēng)记数据(jù)所有权,然后对(duì)数据的(de)使用权等(děng)进行公开竞价,以实现数据的登(dēng)记确权(quán)及(jí)变现。
但前述(shù)技术公司高管指出:这种“分离”和数据竞(jìng)价都是明(míng)文(wén)数据,而明文数据下面,所有权和(hé)使(shǐ)用权是没法(fǎ)真正分离的。隐(yǐn)私计算需要的算(suàn)力通(tōng)常是明文数据(jù)计算的十倍,很长一段(duàn)时间这项技术都没有投入实践之中。此外,这(zhè)种竞价所得的数据(jù)只是一(yī)次性的交易,后续数(shù)据的用途也(yě)并(bìng)不可控。
根据北数所(suǒ)成立时官方披露信息,其正是(shì)通过多方计算技术实(shí)现“数据(jù)可用不可见,用(yòng)途(tú)可控可计量(liàng)”,实(shí)质上完成(chéng)了数据(jù)使用权和所(suǒ)有权的分离。这也(yě)是市场定义其为“新型”大数据交易所的重(chóng)要原因。
这(zhè)项技术(shù)来源于国内多方计(jì)算(suàn)领域头(tóu)部(bù)机(jī)构华控清交,是北数所的四个(gè)发起股东之一。
“面对数据(jù)所有(yǒu)权难题,既可以等到法律规章明(míng)确后(hòu)再依法合规地操作,也可以先摸着石(shí)头过河,从数据(jù)的使用(yòng)权和受(shòu)益权入(rù)手进行(háng)探索(suǒ)。”张旭(xù)东向记者表示。在他看来,如果(guǒ)利用技术手段把数据“可见”的具体信(xìn)息和用(yòng)不着(zhe)“看见”就可以用于(yú)计算的使(shǐ)用价值分离,并能够对数据(jù)使用价值的具体用途(tú)和使用次数途进行控(kòng)制(zhì),实(shí)质上就可(kě)以把(bǎ)数据的使(shǐ)用权从所有权中分立(lì)出来,为厘清数据使用的“责、权、利”提供技术手段(duàn)。
张旭东认为:交(jiāo)易所流通的应该是数据的特定使用(yòng)权,而(ér)不是(shì)明文(wén)数据本(běn)身。“交易所应该是餐厅,而不是菜市场(chǎng)。它(tā)出售的不是数据原(yuán)材料,而是特定(dìng)的(de)计算结果(guǒ)。数据可用不可见和规定数据具体用途用量可以使数据(jù)的特定使用权成为有限(xiàn)的供应和有限制的需求,继而可以(yǐ)通过(guò)市(shì)场供需进行定价并大规模地交(jiāo)易流通。”
据透露,这(zhè)套(tào)底层(céng)交易系统已经跑通,华控(kòng)清交也正(zhèng)在建议和推动(dòng)数据使用权(quán)的地方立法。
技术突破为中国大数据交易所解决确权和定价问题提供了解决思(sī)路,但这(zhè)一市场的发展仍严重缺乏机制保障。除了(le)立法层面缺失(shī),地方在规划和执行(háng)层(céng)面(miàn)仍(réng)处(chù)于各(gè)自为政、一盘(pán)散(sàn)沙的局面(miàn)。
前述大数据交易所高管就表示:目(mù)前交易所基本是各省、各部门各自为政,跨区(qū)域跨系(xì)统(tǒng)很难打通关,很多不(bú)同单位之间(jiān)数(shù)据(jù)格式、字(zì)段(duàn)内容不统一,接(jiē)口不兼容,制(zhì)度制约不能(néng)让数据价值(zhí)有效流动。此(cǐ)外(wài)很多地方政(zhèng)府对于数(shù)据流通(tōng)的看(kàn)法还(hái)非常(cháng)初级,“他们认为数据是自己(jǐ)的、本省的(de),但数据其(qí)实是没有地域限制的,这些都还需要三到五年的改造过程”。
而创新技术在解决多(duō)方(fāng)问题(tí)上,也(yě)很(hěn)难采取标准化方式。例如北数所目前(qián)采取的是数据分级(jí)管理——针对无(wú)条(tiáo)件开放的公共数据,通过北京政务数据(jù)资源网向社会免(miǎn)费开放;针对金融领域数据,采用授权(quán)调用、共(gòng)同建模等方式,开展协(xié)同应用服务(wù);针对高价值的多方数据,通过新型数据交易平台,采用多方安全计(jì)算、联(lián)邦学习等技术,支撑数据(jù)使用权交易。
一位业内人(rén)士就向记者指出:金(jīn)融(róng)数据为什么没办法通过(guò)新型数(shù)据交(jiāo)易(yì)平台交易(yì),也值得思索。