数据智能产业创新服务媒体
——聚焦数智 · 改变商业
前不久,微信读取用户相册的新闻登上了微博热搜榜,一时间引起轩然大波,公众议论纷纷,并斥责微信侵犯了用户个人隐私,对此,微信方面称该系统能力是为了使用户发送图片更快速流畅,最新版本将取消该系统能力的使用。不论我们是认同还是反对这种说法,不可否认的是,互联网时代下产生的海量数据,使人们对数据的安全忧虑持续加剧。同时,很多人开始感受到科技巨头可能正在利用他们收集海量用户数据的优势,侵犯人们的隐私,甚至是谋取不当利益。
面对日益加剧的数据安全问题,如何在保证数据安全的前提下有效利用数据价值,成为在数字经济时代下亟待解决的难题。2021年6月10日,《数据安全法》出台,为数字经济发展构建了法律层面的保障,意味着数据安全不容忽视,同时也为企业和用户树立了数据应用的规范。
除了法律层面外,在技术层面,是否既可以保护个人数据不被滥用,同时又能够满足企业的数据分析与业务发展需求,从而为用户提供安全高效的服务呢?
近日,洞见科技创始人、董事长姚明出席了由上海市经济信息化委员会、上海市科学技术委员会指导,数据猿与上海大数据联盟共同举办的“魔方大数据系列论坛之企业数智化转型升级”活动专场,在本次活动中,姚明作了“从数据流通,到数智流通”的主题演讲,在技术层面给出了答案:“在数据安全日益重要的大背景下,可以通过隐私计算技术对数据进行原始化开放,形成原始化数据之间的价值协同,从而打破数据孤岛,充分释放数据的价值。”
姚明认为,数据安全和隐私保护已成为左右未来数字经济健康持续发展的头号难题。对此,洞见科技希望通过隐私计算技术,将数据从技术逻辑上拆解为可见的具体信息部分以及不可见的计算价值部分。
当前,隐私计算技术的场景化应用虽然仍处于发展初期,但它的重要性却难以忽略。2020年,全球知名咨询公司Gartner,第一次将隐私增强计算技术(PEC)纳入2021年九大重要战略科技趋势之一;2021年10月,Gartner再次将该技术纳入2022年重要战略技术趋势之一。
改变传统的数据流通方式
数据作为数字经济时代核心生产要素,在社会生产、生活中的巨大价值已经不言而喻。数据要素价值的充分发挥在于有效流通共享。很难想象,如果没有数据之间的流通共享,微信、支付宝等应用如何打造亿万级的用户和流量互联网生态;如果没有移动位置、在线支付、打车需求等数据的共享,滴滴、首汽等网约车企业如何在短时间内迅速崛起,公众又如何随时随地满足快速出行的需求。
然而,数据在市场的自由流通却隐藏着巨大的安全隐患。一般而言,数据的流通主要有两种方式:一种是基于市场化运行的数据流通方式——即企业间的数据交易共享;一种是带有公共服务属性的数据流通方式——即政府数据面向社会开放。中国数字经济和互联网行业近十余年间的高速发展,起始于企业间数据的流通和共享,得益于数据要素价值的巨大释放。
然而,在传统的数据流通中,使用原始数据出私域的方式,将导致隐私信息可查看,数据可复制、可缓存、可转售,计算规则/模型暴露。
姚明表示:“互联网公司基于多方用户数据进行数据分析时,如果通过数据拷贝的方式将其存储在多方服务器上,则意味着所有拥有这份数据拷贝的机构都有权限查看及挖掘这些数据,并且可以对这些数据作进一步的处置。”
姚明进一步说道,银行、保险公司等金融机构,为了判断申请信用卡的用户或者企业的信用风险,会和外部第三方数据公司开展合作,在合作中通过API接口或其他的形式完成数据拷贝,在这种传统数据信息流通方式下,数据的提供方和使用方之间都拥有同一份数据拷贝。然而,在数据流通的环节中存在多个节点,若在其中一个节点发生了数据泄露,或者在未经授权的情况下对这些数据进行使用和销售,都会造成数据安全事故。
洞见科技定位于以安全多方计算、联邦学习、区块链等为核心技术的隐私计算技术服务商,应用的隐私计算技术既可以让数据被安全使用,又能让数据在使用过程中不被复制、不被破解、不被缓存、不被转售。通过这种新型数据智能流通方式,可以让原来不愿意或者不敢于开放的数据,在隐私计算技术下得以开放;可以让原来脱敏开放的数据,借助于隐私计算技术实现原始化数据的开放。从而打通原始化数据之间的价值协同,更加充分释放数据的价值。
隐私计算带来了什么?
实际上,隐私计算并不是某一项具体的技术,而是一大类既可以保护用户隐私、又能够实现数据计算效果的新兴计算技术的统称。需要说明的是,隐私计算技术的使用,本身并不能自动分析出数据应用是否合法、合乎道德或值得信赖,但可以肯定的是,实施隐私计算技术可以确保使用数据风险可控,针对特定隐私的保护有力有效。
那么,隐私计算技术具体可以带来哪些方面的保护和改善?
对此,姚明指出,隐私计算技术能够赋能数据智能流通、数据价值效果增益、合规安全技术升级、数据智能模式重构等。
一、赋能数据智能流通。隐私计算能够消除所有数据协作方之间的顾虑,加强数据隐私安全。很多企业存有海量数据,可以基于这些数据进行数据分析建模产生数据智能。然而局部数据的分析对整个大数据环境来说有一定的局限性,因此企业之间需要数据协同,打通数据孤岛,克服局部数据分析的难点,使数据充分融合,从而产生协同价值。值得注意的是,数据的全面流通,可能会导致原始信息被复制、缓存和转售,隐私计算技术的应用将极大地减少数据流通中的问题,从数据的信息流通变为智能流通。
二、数据价值效果增益。洞见科技在各个行业均有丰富的服务经验,其中,金融领域是其主要服务的行业之一。金融机构基于样本数据建立风控模型,往往会和外部第三方机构合作,在各个外部机构建立多个子模型。在这个过程中,两者之间的数据并不会充分地融合,因此数据之间的关联价值也不会被充分利用,数据在流通计算的过程中会有损耗,模型的精度也会有一定程度的降低。而基于隐私计算技术的联合建模,可以为多方的数据建立安全链接,数据之间的关联价值会被充分地利用。由于隐私计算技术既可以解决数据安全的问题,又可以提升数据融合的价值,因而被众多的咨询机构广泛研究。
三、合规安全技术升级。Gartner预测,2023年底世界上将有75%的人所拥有的个人数据会受到数据隐私法规的保护,而当前这个比例只占25%;至2023年底,全球80%以上的公司将遵循至少一项以隐私为重点的数据保护法规;到2025年,全球将有60%的大型企业机构在数据分析、BI、云计算中使用一种或多种隐私计算技术。这表明,隐私计算技术已成为未来数据智能生态的底层基础设施,也是每一个参与数字经济运营的企业必须要考虑和使用的技术,因此隐私计算技术也会在合规安全方面不断升级。
四、数据智能模式重构。洞见科技在政务、金融等领域已获得了丰富的实战经验,并且在风控、营销、精算和资管领域,迭代出了自己的标准化平台和产品服务。
1、风控领域:洞见科技能够在金融机构与外部机构之间构建安全可控的数据协作通道,在原始数据不出库的前提下,使用金融机构内部客户数据和外部合作数据联合构建风控模型,并基于模型进行实时预测,包括反欺诈、反洗钱、信用评估和风险预警等。
2、营销领域:洞见科技利用隐私求交技术去判断用户画像和消费意愿。具体而言,利用隐私求交集运算,只有交集部分用户的计算结果会被需求方获得,进而在保护用户隐私信息的前提下去判断用户的购买意愿和风险承受能力,达成改善用户体验和拓展市场的目的。
3、精算领域:洞见科技能够帮助保险公司链接更多的外部数据,在不获取对方数据的前提下,面向保险产品的设计和定价进行联合计算分析,获得更加准确实时的精算模型,有助于开发出更加丰富的保险产品和服务更广泛的人群。
4、资管领域:洞见科技在资产方、投资方、监管方、评级机构和征信机构以及券商之间构建可信的安全计算通道,在具体数据不可见的情况下,依然能检测出底层资产的信用风险,帮助企业对底层资产判断及进行合理化配置。
基于FL+MPC融合引擎的隐私安全计算平台
2020年5月,洞见科技推出了面向场景的隐私计算平台——洞见数智联邦平台(InsightOne),该平台以安全多方计算和可信联邦学习为主计算引擎,以可信执行环境、差分隐私、零知识证明等为辅助计算引擎,面向具体场景提供可定义的计算能力,实现“数据可用不可见”。同时,通过隐私计算的智能合约化和算法容器化等技术,构建分布式信任机制和互联互通能力,实现“计算可信可链接”。
姚明介绍说,以隐私计算技术在金融风控建模场景为例,可以分为四个阶段,第一阶段是数据对齐阶段,银行和第三方数据公司通过PSI技术完成建模样本的确定;第二阶段是基于共有的样本数据开展联邦学习建模;第三阶段是模型部署环节,可以通过传统的API方式直接获取数据代入模型计算的结果,或者使用MPC的方式来完成模型结果的计算;第四阶段是开展业务实时查询环节,利用PIR技术来保护银行方的用户信息,保证用户需求意向不泄漏。
洞见数智联邦平台(InsightOne)分为4个层次。分别是场景服务层、计算引擎层、数据处理层和系统优化层。
1、场景服务层:洞见平台根据服务的金融风控、广告营销、保险精算等目标场景,进行了从底层算法到应用系统的优化和开发,做到场景应用方开箱即用。
2、计算引擎层:基于安全多方计算和联邦学习技术的融合计算引擎,在秘密分享、同态加密、不经意传输等底层密码学技术基础上,实现了隐私安全的融合计算能力,以此来支持场景服务层需要的各种计算需求。
3、数据处理层:对接入到计算引擎的数据资源进行多维度的分析和处理,在不泄露原始数据的前提下完成数据探查、特征工程等工作,使应用方更好地发现和应用数据价值。
4、系统优化层:从系统内核到硬件交互多层次的整体平台计算效率提升,实现通信网络、任务调度、计算性能等多方面的优化提高。
互联互通是实现全局数据智能的技术最优解
在数据安全日益重要的大背景下,保护数据安全的技术发展正如火如荼,关于加强数据安全的技术平台也陆续出现。面对繁多的技术平台,无论是数据的提供方还是数据的使用方,都面临着多个平台无法互通的尴尬境况。
当前,各个隐私计算平台在技术架构和算法协议上存在较大的差异,也不具备完全的开源性质。因此,如何促进全局性数据智能,又保持计算的异构自治,成为隐私计算平台面临的新课题。
洞见科技作为隐私计算平台互联互通的创新者和推动者,率先利用了“算法容器”技术促进隐私计算平台之间的互联互通。
据姚明介绍,洞见科技主要运用了三种互联互通方式:白盒互通、灰盒互通、黑盒互通。
1、白盒互通:即与开源项目之间的互通,通过开源算法源代码的形式,易建立双方的信任。
2、灰盒互通:基于开源算法的逻辑,同样相对容易建立信任。
3、黑盒互通:基于闭源算法独立,能保持算法的独立性和完整性。
姚明认为,隐私计算平台互联互通的实现方式包括三个层级:第一层级的互联互通在于管理系统的互通;第二层级是算法协议的互联互通;第三层级是计算原语的互联互通,可以自定义引进计算算法,不受对方算法的影响,是比较理想化的互通模式。
2021年6月,洞见科技与蚂蚁集团、锘崴科技实现业界首次多方异构隐私计算平台之间完全对等的算法协议互通,并在之后也持续与众多友商建立了互联互通合作。
未来,洞见科技希望与众多数据的提供方和使用方,以及隐私计算技术服务商共同建设一个互联互通的生态网络。在互联互通的“算法容器”技术支持下,真正让数据智能构建成数据全面安全流通的网络生态,从局部的最优解演变为全局的最优解,从而更好地赋能数字经济的发展。
编辑:Winter / 数据猿
❷ 创新服务企业榜
❸ 创新服务产品榜
❹ 最具投资价值榜
❺ 创新技术突破榜
☆条漫:《看过大佬们发的朋友圈之后,我相信:明天会更好!》
联系数据猿
北京区负责人:Summer
电话:18500447861(微信)
全国区总负责人:Yaphet
电话:18600591561(微信)