“数据二十条”发布背后:国企下场探路,技术路径日渐清晰
科技云报道原创。
近日,中共中央、国务院对外发布了《关于构建数据基础制度更好发挥数据要素作用的意见》(又称“数据二十条”),为数据要素的流通和使用起到了举旗定向的作用,让从业者都感到振奋。
必须承认的是,数据要素市场培育颇为复杂,无论是国家层面还是市场各方主体,都在摸着石头过河。
“数据二十条”规定了数据确权、数据流通交易、数据收益分配、数据安全治理等关键环节,是基础制度保障。
但从制度出台到实际落地,中间还隔着很多层,比如数据标准、交易制度的制定,比如标准制定之后,在哪些环节使用什么样的标准化系统能力,都需要市场参与者去实践,将这套制度从上到下去打通,不会一蹴而就。
在明确的制度信号背后,数据的底层技术逻辑悄然生变。
传统的数据交易所,往往是通过API接口、基础性加密等手段“沉淀”数据,今天的数交所或数商从第一天起就考虑的是数据“流通”机制,直接用区块链、隐私计算、AI等技术建数据流转管道,确保数据流转“可用不可见”,交易“可控可计量”。
过去,互联网创新更多发生在“小公司”。但在不到两年时间里,电力、能源、物流、金融等“大产业”开放数据、挖掘数据价值,全国超15家数交所挂牌。
这批入局者普遍有着明显的特征:国资控股、多方参与。
多重“堵点”
与传统生产要素相比,数据作为一种新的生产要素具有自己的独特性。
由于数据的复制性很强,导致数据产权难以界定,数据价值不好判断,交易之后的权益归属也难以划分,再加上数据安全、隐私泄漏等一系列问题,都使得数据要素的流通和使用存在诸多疑虑。
授权难、定价难、互信难、流通难,是数据要素市场发展面临的重要难题。具体到数据要素市场相关主体,面临的“堵点”更为现实和复杂:
数据确权是数据要素市场发展的首只“拦路虎”。
相比实物物品,数据要素具有混合性、复杂性、可复制性、不确定性等特性,使得数据的产权制度建立存在难点。
缺乏清晰合理的数据要素产权制度,让市场主体在数据交易时顾虑多、成本高,大量潜在数据供给方不敢或不愿进场交易。
其次,为数据交易定价是一个巨大的难题。
数据具有高固定成本、低边际成本、产权不清、来源多样和结构多变等特征,数据买卖双方对数据价值评估存在“双向不确定性”特点,结合数据质量、完整性、稀缺性和潜在价值,数据难以定价,交易也就无法推进。
从数据交易各环节看,还存在互信机制建立难的问题。
例如,在交易前后如何保护数据资产方的数据所属权?由于数据共享出去之后可以不断复制,可能会发生数据权属纠纷,这就导致数据供给方不愿意把数据共享出来,数据要素难以流通。
同时,保障数据安全,也是数据要素流通绕不开的难点,其中包括保护用户隐私、数据存储和流通安全、合规交易等。没有完善的数据安全法律法规体系,以及以此为基础建立的数据要素安全整体解决方案,市场主体不敢轻易参与数据交易。
在蚂蚁集团智能数据产品部总经理李书博看来,如何让数据在安全的基础上实现规模性流通,是一个关键性问题。“数据在流动的过程中才能发挥更大的价值,但流动带来了安全、合规、使用场景的挑战,需要综合性的技术来保障数据要素安全流转开放。”
蚂蚁集团智能数据产品部总经理 李书博
国企“下场”
国家电网是关系国民经济命脉和国家能源安全的特大型国有重点骨干企业。近年来,电力数据的价值和作用日益彰显,诸多安全风险与新的挑战也随之而来。
比如:如何厘清核心数据存储情况,清晰掌握数据被哪些部门、系统或人员使用;如何保证数据敏感信息安全的前提下扩大数据资源共享;如何对核心资产和敏感数据的访问行为进行全面记录、分析;如何从源头上根治黑灰产与数据泄露问题……
国网大数据中心采用了蚂蚁数科的数据保护伞产品:一方面,对国网十大业务域的数据进行了分类分级,建立了500多个规则对敏感数据进行识别和脱敏;另一方面,基于分级分类数据权限,对用户访问记录进行风险识别和审计,确保每条数据访问的安全合规。
这是一个解决“数据安全”的典型案例。在数据安全基础之上,如何解决数据流通过程中数据共享与隐私保护之间的天然矛盾?
四川港投基于隐私计算+区块链技术搭建了全新的“四川港投联盟链”,基于区块链原生的MPC、FL等多种隐私计算技术,让多级多类供应链内主体数据安全共享,最终实现了底层资产的信息可信穿透。
四川港投是四川省管一级国有资本投资公司,集装箱吞吐能力占全省90%以上,供应链协作多元且极其复杂。
为什么选择了“区块链+隐私计算”的一体化能力?这与两项技术的特点密不可分。
近年来,国内数据要素市场化需求带来了隐私计算等相关技术的潜力爆发。
IDC《隐私计算全景研究》显示,2021年中国隐私计算市场规模突破8.6亿元,包括阿里云、百度安全、蚂蚁、腾讯云等互联网厂商都已布局隐私计算。
尽管隐私计算作为促进数据要素流通的代表性技术,已迎来了一系列的创新迭代,但依然面临挑战与风险。
在产业界有一个著名的“三角难题”,即任何单一隐私计算技术无法同时解决“安全、隐私”、“质量、易用性”、“流通性”这三个问题。
换句话说,数据在流转过程中不止是“可用不可见”,还要解决多方协作之间的数据权属和真实性等问题。
正因如此,业内开始探索通过技术融合等方式来突破瓶颈。
IDC《隐私计算全景研究2022》报告指出,随着隐私计算在数据要素交易市场中扮演更重要的角色,接入跨领域、新场景、更多数量的数据参与方,就注定需要区块链作为信任底座协调参与方间的信任。
区块链与隐私计算的有机结合,能够使原始数据在不出域的情况下,实现多节点之间的可信协同计算和数据隐私保护,发挥出“1+1>2”的价值——协作流程由智能合约驱动,数据流转由隐私计算引擎来解决,在数据加密或者不透明状态下完成计算和分析;通过区块链技术确权、登记和交易共识。
如今,区块链+隐私计算一体化的技术方案,也大量应用在新型数交所中。
比如近日成立的杭州国际数字交易中心(简称“杭数交”),重组的贵阳大数据交易所等,一大批国资控股的企业陆续踏入了数据要素市场。
不难发现,数据要素市场存在不同主体,但在数据采集、分类、脱敏、流通、利用等各环节中都会遇到安全合规、数据确权、隐私保护等难题,这也为技术先行提供了现实基础。
在蚂蚁集团智能数据产品部总经理李书博看来,综合性地运用技术能力其实很关键,“保障数据要素安全的流转,要保证数据在不同的使用主体中是可追溯的,授权是穿透性的,授权是可跟踪的;同时也要保证内部数据的分类分级是清晰的,确保数据在流转过程中可管可控,实现数据价值的流转,而不是数据原文流转,这就需要一种综合型、技术融合型的能力。”
据了解,目前蚂蚁是业内少有的同时具备区块链、隐私计算、数据安全自研技术能力的企业,这与蚂蚁多年来在这些领域一直保持技术领跑有关。
** 蚂蚁“被集成”**
光凭技术并不足以解决数据要素流通问题,仍需与用户痛点和行业场景相结合才能真正落地。
比如,数据分级分类作为数据要素流通的前提,在不同行业用户中的痛点并不相同。
据李书博介绍,在金融、电信等数字化程度较高的行业,很早就实现了数字化,结合法律法规和行业标准已形成了一套行业的数据分级分类方式。
在产业互联网化的过程中,尤其是在数字化程度不高的行业里,首先是要帮助客户建设数据治理体系,再去考虑分级分类。“这个过程中,我们也是和客户一起在成长,通过理解行业,加上我们的通识,逐渐去融合出来面向整个行业的数据分类分级模板。”
从不同行业场景需求看,客户的诉求也不尽相同,从解决一个问题开始到更深入的场景问题解决。
比如,希望解决数据安全管控问题,就会考虑采用数据安全类的产品;希望参与到数据的流动过程中,就会考虑隐私计算类的产品;还有一些营销企业,希望在新的数据授权或数据合规要求下,将原有的数据更合规地连接起来,也会去考虑隐私计算平台。
但值得注意的是,在技术与实际场景结合的过程中,企业用户其实很难分辨不同的技术服务商,毕竟市场上有大量提供大数据、隐私计算、区块链、数据安全等技术的数据服务商。
对此李书博表示,蚂蚁区别于传统的大数据公司最核心的价值,就在于“建设数据开放流转的管道”,通过提供数据流转的综合技术能力,把数据价值发挥出来。
为了让企业客户看到蚂蚁解决实际问题的能力,蚂蚁做了很多工作。
例如,在数据安全治理方面,蚂蚁通过可视化系统让客户清楚地看到梳理了多少张资产表,多少数据涉及敏感字段,哪些数据做了符合安全水位的管控等等。
在数据安全合规方面,蚂蚁通过各类第三方权威机构进行产品安全性评测,减少客户对数据安全保障的顾虑。
在数据开放方面,蚂蚁帮助客户一起梳理出对于需求方有价值的数据,同时通过便捷、可视化的产品和真实案例,让客户对数据流转有更直观的感受。
在生态合作上,蚂蚁也积极“被集成”,与对客户场景和行业领域更加熟悉的合作伙伴一起服务客户,贴近客户去解决场景化的问题,这也是蚂蚁被客户认可不同于其他技术服务商的一点。
“技术是我们立身之本,但是面向客户不仅是讲讲概念,我觉得到最后还是要看到落地效果”,李书博表示。
** 市场“细分工”**
在当下数据价值越来越重要的背景下,中国数据要素市场即将进入高速发展时期。
据国家工业信息安全发展研究中心等机构联合发布的《中国数据要素市场发展报告》显示,2021年数据要素对我国GDP增长的贡献率和贡献度分别为14.7%和0.83个百分点,呈现持续上升状态。
市场空间方面,2021年我国数据要素市场规模达到815亿元,2022年市场规模接近千亿元,并且在“十四五”期间有望保持25%的复合增速。
毫无疑问的是,“数据二十条”将进一步推动数据要素市场的爆发。“数据要素市场的空间太大了,市场里有大量的价值还没有挖掘出来,这对于所有行业里的参与者来说都是一个巨大的机会”,李书博表示。
事实上,数据要素作为一个庞大而细分的市场,需要各种各样的生态角色参与进来。“数据二十条”指出,培育交易服务的生态体系,是加快培育数据要素市场不可缺少的重要组成部分,并明确数据要素流通与交易市场的参与者角色,包括市场建设主体、各类数商以及各行各业使用数据的企业等。
例如,数商分为两类:第一类是指数据商,对应于数据产品供应商和中介增值服务商等;第二类是指围绕着数据资源化、产品化、资产化进程以及流通交各个环节中的第三方服务商,包括数据集成、数据经纪、合规认证、安全审计、数据公证、数据保险、数据托管等11类专业化的服务商。
“这么大的市场需要有非常细的分工,每个厂商其实都在做自己最擅长的事情,在生态里面都有自己的角色发挥价值”,李书博表示,现阶段市场竞争态势仍属于早期,更多的是各方共同摸索如何将“数据二十条”等基础性制度落地执行。
“作为一家科技公司,我们相信隐私计算、区块链等数字技术可以解决一定的问题,但也知道仅靠技术并不能解决所有问题。
我们希望基于‘数据二十条’与业界伙伴和客户携手,把数字技术与行业知识充分结合,可以更快速地落地更多实践,促进数据高效流通使用”,李书博表示。
李书博说,蚂蚁将坚持“建设数据管道”的定位,围绕不同行业场景发挥数据要素流转的价值。
在产品上,将进一步推出更多的标品,去降低定制化的比例,尽可能地让产品更容易被集成,这样才能方便数据更有效、更大规模的流转。
在技术上,也将保持多项技术的领跑地位,同时融合更多技术如:图计算、可信AI等,发挥技术融合的横向连接价值。
结语
数字经济时代,数据要素流通是一个大命题,面临的难题就像一座座大山。
但随着制度、技术、安全等问题全部得到解决,实现数据真正自由流动的世界,也许会超出所有人的想象力。
【关于科技云报道】
专注于原创的企业级内容行家——科技云报道。成立于2015年,是前沿企业级IT领域Top10媒体。获工信部权威认可,可信云、全球云计算大会官方指定传播媒体之一。深入原创报道云计算、大数据、人工智能、区块链等领域。