数据安全互操作网络:数联网——数字经济新型基础设施

摘要:新时代的安全必将直接融入到数字社会的运行与价值创造中,“数据安全互操作网络”正是践行这一革新的关键行动之一,其中密码是核心,而这正是“数字安全”一词的本质涵义。数据无疑是数字经济中最核心的新型生产力,加快推进数据要素市场化、大幅释放数据资源价值正在成为数字经济发展最根本的保证与最大原动力,其中的关键点是数据开放与共享。实践证明,只有跨域、跨组织互联互通才能充分发挥数据要素红利,然而长期以来,数据安全隐私保护与数据开放共享之间的矛盾无法得到较好的解决,系统化的跨域数据共享一直难以有效落地,这已经成为数据价值发挥乃至数字经济发展的主要障碍。本文提出的数据安全互操作网络“数联网”旨在基于新一代数字安全技术、创新架构与模式设计,从数据共享互联的参与者身份、数据所有权、使用权与运营权确权,以及安全计算环境几个方面入手,根本上解决数据开放共享与安全隐私的矛盾,推动实现国家、地区、行业/产业乃至新数字时代的数据流通安全运营模式,将密码安全技术从传统的静态保护要素升级为数字经济社会的动态运营要素,以“密码业务化”最大程度地释放数据要素价值,打造数字经济运行的安全引擎,形成数字经济新型基础设施,是新一代互联网向WEB3.0进化的典型代表,“数字安全”一词的内涵正是如此。

1. 问题的提出

2020年4月,《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》正式发布;2022年初,国务院印发《十四五数字经济发展规划》,明确要求“加快数据要素市场化流通”,“构建以数据为关键要素的数字经济”,数据要素的市场价值日益受到重视。如何建设与完善数据要素市场化机制,充分发挥数据要素价值,成为各级政府推动数字经济发展工作的重中之重。

实践证明,数据要素的威力,大多数情况下源于对多源数据的融合分析,单一组织靠自身积累往往难以聚集足够价值的数据,因此,只有通过数据跨域流通与共享开放才能真正发挥大数据的应用价值。面向跨域数据流通,我国部分政府自2014年开始启动相关试点活动,但受限于数据要素法律属性和产权规则在理论、立法层面尚在探索中,隐私、安全与共享之间的矛盾越来越明显,一直收效甚微:一方面跨域数据共创需求越来越迫切,另一方面,数据的无序流通,又可能导致隐私保护与数据安全的重大风险,必须加以规范与限制。无论是国际还是国内,日趋严格的“数据安全法”“信息保护法案”不断出台,在客观上增加了数据流通的成本,降低了数据综合利用的效率。如何兼顾发展与安全,平衡效率与风险,准确衡量价值,有效建设运营,是当前全世界在大数据治理中面临的共同课题,也导致规范高效的数据流通市场始终未能形成。

2. 策略与方法

如何才能兼顾安全隐私与开放共享呢?从传统的数据所有权拷贝进化到数据使用权流通,是解决这一矛盾的有效途径,其主体思想是保证原始数据不暴露,在隐私保护的前提下实现多方数据资源跨域联合计算,再将计算的结果分享给被授权者,即“数据安全互操作”策略,其落地依赖于以下两个方面:

(1)数据可用不可见

(2)可信身份保证与数据资产确权

2.1 数据可用不可见

以密码为核心的现代数字安全技术保证了“数据可用不可见”的实现,一般有如下几种方法:

  1. 安全计算沙盒:由可信第三方建立“数据安全计算沙盒”,参与联合计算的多方数据资源以加密的方式传送到沙盒中,再以明文进行计算,并销毁原始数据,将结果分享到授权方;
  2. 隐私计算:隐私计算使多方数据在不离开本域的前提下参与联合计算,虽然由多种技术栈组成(如不经意传输、零知识证明、差分隐私等多方安全计算方法,以及联邦机器学习),但可以统一理解为“数据在加密状态下参与计算,解密后的结果与明文计算完全一致”,以加法为例,可表示为f(x+y) = f(x)+f(y)。隐私计算技术是目前实现“数据可用不可见”,落地数据使用权流通策略最重要的方法。纯技术上讲,隐私计算也可以实现多方数据不依赖第三方的联合计算;
  3. 中间态数据元件:中间态数据元件指对原始数据脱敏后,由若干相关字段形成的数据集或由数据的关联字段通过建模形成的数据产品。将原始数据脱敏后生成中间态数据元件,然后对数据元件开放,实现跨域数据流通互联;

2.2 可信身份保证与数据资产确权

可信身份保证与数据资产确权指在数据跨域流通共享的注册、登记、审计以及执行过程中,对参与联合计算的数据供应/消费者身份,以及对数据资产、计算结果和过程进行认证确权。现阶段,绝大多数“数据安全互操作”的研究者与试行者都只是重点关注了“数据可用不可见”,却没有给予高安全级别的身份保证与资产确权足够的重视,甚至完全没有考虑,大多还是采用用户名/密码的账户管理思路。其中的原因是以数据使用权流通为指导思想的跨域联合计算领域在国际国内都是刚刚兴起,规模化的、切实运行与运营的案例还不多,从而还没有在实践中感受到身份保证与资产确权的重要性。

然而,显而易见,对于一个规模化运营的跨域数据流通共享环境来讲,参与者需要将隐私数据资源的使用权/计算权开放出来,如果不能以高安全级别确认究竟是谁参与了计算,各方数据资源是否真实可信,是否就是注册登记时被评估认可的资产......,等等一系列问题,对安全互操作的可实施性都是至为关键、不可或缺的,必须给予系统化的应对;另一方面,从更深远的意义来讲,“数据安全互操作”在数据分布的去中心化存储模式下实现了数据拥有者价值发挥,从而也成为互联网由WEB2.0逐步进化到WEB3.0的典型代表,而新一代WEB3.0网络世界的核心特征正是无处不在的“数字身份”与“资产确权”(WEB1.0是只读,WEB2.0是交互),这也正是新数字时代“密码业务化”理念驱动的安全技术已经必须从合规与保护要素进化为运营与效率要素的充分证明。

就此,本文对“数字安全”的概念作以定义。现阶段业界都广泛使用数字安全的概念来代表自己在数字化时代的新方向,然而,却少有对“数字安全”的提法作以明确定义的,依据本文上述的内容,这里认为:“数字安全”正是指在各项数字化技术创新与场景驱动下,从低频的后台支撑融入高频的前台业务运行与价值创造,从成本转化为效益,从传统的静态保护要素全面升级为动态运营要素的新一代安全技术体系与相关模式,它正是代表了WEB3.0契约与价值互联网时代的新型“安全”

可以看出,以上各种方法都需要以密码技术为主体,然后再综合集成区块链等先进技术手段来实现。本文认为,以现代密码驱动的新一代数字安全技术为核心,从安全互操作的计算环境、参与者身份、数据资产确权几个层面入手,建设“数据安全互操作网络”,打造新一代的数字经济安全运行引擎,是解决数据跨域流通互联,落地数据要素市场化战略要求的最佳途径。

3、数据安全互操作网络架构与组成

3.1 总体架构

“数据安全互操作网络”的高阶总体架构示意如下图所示:

数据安全互操作网络:数联网——数字经济新型基础设施_第1张图片

图1 数据安全互操作网络总体架构示意

从图1中可以看出:

       . “数据安全互操作网络”由主体骨干网络与接入节点两部分组成,接入节点承载参与流通共享的数据资源供应者与消费者,骨干网络承载数据资产目录(元数据)、认证鉴权、安全计算执行与运营支撑等核心能力;

        . 骨干网络可以是国家、省、市、县或总分的多级服务中心互联结构(如下图2),也可以是单一的服务中心;

        . “数据安全互操作网络”中的数据资源遵循“存算分离”的先进架构原则,即“存”在本地端,“算”在服务端,而这也正是走向新一代去中心化互联网、强调个性化价值创造与分享的关键。

数据安全互操作网络:数联网——数字经济新型基础设施_第2张图片

图2 骨干网络多级服务中心示意

3.2 主要组成与运行流程

如上图1所示,“数据安全互操作网络”的主要组成部分如下:

. 安全计算中心:

安全计算中心是数据安全互操作实际执行的核心部件,它负责完成多方数据在隐私与安全保护前提下的联合计算,包括但不限于查询、求交、指标、标签计算以及统计建模等,类似于“计算工场”。安全计算中心的具体实现可以由安全沙盒工场,隐私计算工场及数据元件工场组成,它们的实现方法、安全级别各自有所不同,可以由使用者自行选择:

安全沙盒工场是多方数据以明文进行联合计算的安全保护空间,数据资源需要以密文传送到沙盒中,计算完成后予以销毁。在这种模式下,联合计算完全使用骨干网络中心的计算资源,原始数据虽然在传送过程中以密文保护,但毕竟数据要出本域,因此是一种较低安全级别的联合计算方案;

隐私计算工场是以隐私计算技术方法进行联合计算的安全空间。在这种模式下,联合计算综合使用骨干网络中心、数据共享参与方的本地计算资源,原始数据可以做到完全不出本地域,因此是一种较高安全级别的联合计算方案;

数据元件工场需要将原始数据脱敏后,先由若干字段关联建模形成中间态数据元件,然后将中间态数据元件开放共享出去。在这种模式下,中间态数据元件根据需要可以在本地域与/或骨干网络中心处加工,原始数据也可以做到完全不出本地域,因此也是一种较高安全级别的联合计算方案。

安全沙盒工场,隐私计算工场及数据元件工场三种方案之间可以根据需要结合使用。

. 基础能力中心:

基础能力中心为多方数据安全互操作提供通用的公共基础能力,主要包括骨干网络预制的标准算子库、标准模型库,以及用户可自定义的自助模型市场。

. 认证服务中心:

认证服务中心主体实现身份与资产在多方联合计算过程中需要的各种鉴权与认证工作,包话证书发放与管理的证书服务中心(即PKI系统),实现各种密码资源、签名验签、证书认证、加解密、电子印章、时间戳、数字信封等丰富密码业务管理与服务的密码服务中心,以及对所有的数据供应者、消费者与运营者的身份与资产、权限等进行统一管理、授权与多端多模态认证的统一身份/认证中心。

. 数据资产元数据管理

数据资产元数据管理以目录、地图、动态滚动、个性化推荐等多种形式存储、展示数据供应商通过鉴权评估后的数据资产元数据(包括但不限于表名、字段名、条目数、文件描述等),并提供相应的检索与选择工具与流程;

. 运营支撑管理:

运营支撑管理为多方数据联合计算的流程提供用户、权益、订单、审批、计量/计费等等运营管理能力;

. 安全互操作端计算单元:

以上组件都位于骨干网络处,而安全端计算单元则位于数据供应者/消费者本地域,具体完成数据加密、脱敏、数据资产目录/元数据抽取/上传、隐私计算本地端计算、中间态数据元件的按需生产等端计算的任务。

数据安全互操作网络的主体运行流程描述如下:

        . 数据资源的供应者可以向“骨干网络”注册、登记自己意图分享使用权/计算权的数据资产目录,通过审核评估后,获得身份与资产证书;

        . 数据资源的消费者注册获得身份证书,然后可以通过“骨干网络”的“数据资产元数据”管理设施浏览、搜索意图合作的数据资源供应者经过注册与确权的数据资产目录/地图,选择并申请数据合作;

        . 数据联合计算的申请者获得授权(签名确权)后,可以选择相应的算子与模型,驱动执行安全计算过程,得到计算结果;

        . 参与计算的各方也可以上载预定义或者实时自定义的算子与模型用于联合计算;

        . 计算过程中的多方参与者的身份需要得到鉴权确认(证书认证);参与计算的数据资源本身也需要得鉴权确认(证书认证与签名确权),鉴权确权支持细粒度服务水平,可以有效支撑到表、字段及文件等多种形式与级别;参与计算过程的所有数据及中间结果(包括脱敏态数据)都需要以密文传送;

        . 将计算结果分享给授权的可获取方,并附加必要的结果分享确权证明(计算成果资产证书与签名);

        . 计算过程中,需要对参与分享的数据供应者数据资源的计算使用量进行计量,并对每一次联合计算的各方数据资源计算使用量进行鉴权确认(签名),并根据需要按设定的规则计费运营。

4. 数据安全互操作网络的建设策略与典型应用

“数据安全互操作网络”是基于密码技术,实现数据互联互通现代数字化转型升级的关键举措,是真正落地数据要素市场化国家战略,充分发挥大数据红利的重要基础设施,属于新数字时代的重大“新基建”工程,具有极为广泛的应用前景、巨大的社会意义与经济效益潜力。

为了同时保证设施的权威性与市场化性质,可以以“政府主导、市场协同”的建设策略,采用政府与国资牵头,与数字安全专业企业协同的政企联合“三位一体”模式。

其典型应用可以涉及如下几个层面:

. 国家数据流通网:国家数据流通网是国家级数据流通监测管理与宏观调控的重要基础设施,从国家全局的角度为重要机关、领域与组织提供数据安全互操作的能力,也是推动与助力国家层面数字经济深化、快速、高质量发展的核心部件,可由国家级的部委或央企联合数字安全专业企业协同建设;

. 地方数据流通互联网络:地方数据流通互联网络是面向省、市一级的政府、企业、组织及至个人进行数据共享互联的重要基础设施,也是地方数字经济建设的关键举措,可由地方政府/国资牵头联合数字安全专业企业建设;

. 行业/产业数据共享联盟:行业/产业数据共享联盟为如金融、政法、公安、财税、交通等垂直行业或某一产业链集群内的组织提供数据共享互联的基础设施,可由该行业/产业链的头部与中心组织(如人行、银保监会、财政部、公安部或核心企业等)牵头联合数字安全专业企业建设;

. 新一代WEB3.0互联网的数据基础设施:上述3个方向都倾向于G端与B端的应用,而数据安全互操作的完全契合WEB3.0所强调的去中心化价值的创造、分配与流通理念与模式,将成为新一代WEB3.0价值互联网中去中心化数据资产管理的基础设施,从而普遍惠及到小B端与C端,成为现代数字社会运营的重要支撑。

5. 结论

“密码驱动计算,安全营创价值”,数据安全互操作网络以新一代密码技术为核心,结合先进数字化技术手段,在保证数据隐私与安全的前提下,以跨域多方数据联合计算的方式实现国家/地方/行业/产业范围内数据要素的互联互通,解决新数字时代的核心生产要素:数据要素红利充分、有效发掘与释放的关键难题,推动了数据要素市场化国家战略的落地,为数字经济进一步深化、快速、高质量发展提供了重要的、坚实的、必须的基础设施,从根本上解决数据开放共享与安全隐私的矛盾,使密码安全技术从传统的静态保护要素进化为数字经济社会的动态运营要素,赋予“数字安全”新的内涵,打造数字经济运行的安全引擎,从而形成数字经济新型“数联网”基础设施。

你可能感兴趣的:(数字安全,数据要素流通,安全架构)