数据安全重构产业链,我看到的机会与挑战

关于数据隐私

一年一度的3·15晚会,一定是众多互联网行业人员必看的“春节晚会”,今年因为疫情,往后推迟了。今天我想针对近几年一个一直关注且影响众多行业模式的问题:数据行业何去何从?

因为隐私,数据已经成为影响2019年所有互联网金融业务的棘手的难题。既要保护公民数据隐私,又要发挥大数据在互联网业务里面的价值,这似乎是一个悖论!

我们先来看几个比较典型的因为数据的不合规使用:
1)2018年7月8日,据新华网“新华视点”报道,山东日前成功破获一起特大侵犯公民个人信息案,共抓获犯罪嫌疑人57名,打掉涉案公司11家,查获公民信息数据4000GB、数百亿条。其中,国内知名大数据公司、新三板挂牌企业“数据堂”被查。
2)2018年六月份,暗网一位ID“f666666”的用户开始兜售圆通10亿条快递数据,该用户表示售卖的数据为2014年下旬的数据,数据信息包括寄(收)件人姓名,电话,地址等信息,10亿条数据已经经过去重处理,数据重复率低于20%,数据被该用户以1比特币打包出售。
3)2018年万豪国际集团11月30日发布公告称,旗下喜达屋酒店客房预订数据库遭黑客入侵,最多约5亿名客人的信息可能被泄露。万豪酒店在随后的调查中发现,有第三方对喜达屋的网络进行未经授权的访问。目前,未经授权的第三方已复制并加密了某些信息,且采取措施试图将该信息移出。

大家可以知乎一下“数据隐私案件”,粗略的看,大概就是两个原因导致:
第一种:为了获取暴利而贩卖数据(必须大力打击这样的可耻行为!)
第二种:因为数据的存储或使用过程存在被攻击的漏斗,间接被不法分子获取,用于其他非法行为(如何让数据的存储或者使用从技术上来保证安全?)

大数据行业现状

大数据是最近几年最热的互联网细分领域之一,因为它能从解决人工智能领域技术的基础数据需求,因为有大数据,我们的所有行业都发生了一些质的飞跃,比如营销推荐更加精准、征信风控更加完善等等。在这个领域从业十余年,从技术到业务,我们暂时把大数据行业分为三个阶段:
1)萌芽期:重点解决了大数据的底层技术,包括分布式存储、计算等;
2)增长期:基于大数据的业务开始井喷,各行各业都依附于大数据技术来提高业务增长率;
3)洗盘期:因为合规要求,粗放式的数据经验模式已经宣告结束;市场玩家因为数据合规要求,面临着业务升级或者淘汰。

数据安全重构产业链,我看到的机会与挑战_第1张图片

2020年如果是数据安全合规元年,和很多同行聊下来,大家对行业的转变认知是一致的:数据行业已经悄悄地发生了业务模式的变化,从而影响到依赖于数据行业的其他领域,包括银行、保险、消费金融等;合规合法的数据服务商会吃掉头部机构的业务;数据安全解决方案服务商会是保证数据服务商的一个支撑,成为大数据产业链中的重要一员。

大数据产业链2.0时代

大数据产业链上中下游大致可以按大数据技术、大数据服务、大数据应用三个大维度来分类,假设我们将过去十年的增长期定义为1.0,那么安全监管下催生的可以用2.0来描述,有几个特点:
1)增长期大数据服务商的暴利野蛮增长,大数据应用领域百花齐放;但是数据安全核心在数据的存储和加密技术;
2)洗盘期,很多大数据技术和服务商因为合规收到了数据应用的瓶颈,导致下游应用领域业务大规模缩减;数据安全解决方案服务商在产业链的重要性渐渐显露出来。

数据安全重构产业链,我看到的机会与挑战_第2张图片

为什么数据安全会改变整个生态的格局?我想说一个2019年的家喻户晓的业务——信贷:互联网金融发展过程中的“变相”金融科技三年内,催生了消费金融,这个业务模式其实脱光衣服看,可以赤裸裸地看到数据是业务的核心技术。
机构放贷传统的方式是找人或房车进行抵押或者担保,然后通过各种线下背调,给借款人授信一定的额度,从而完成放贷。然后因为大数据,一切都变的更简单了。借款人通过手机APP,填写基本信息资料,机构会通过第三方的征信公司或者大数据风控服务商,查询借款人在央行征信、运营商在网行为属性、社保公积金缴纳情况、电商消费数据、手机的使用行为数据等全方位地刻画借款人的信用评分值,从而完成授信评估。这个过程中,大数据技术和大数据服务商成为整个授信过程的齿轮。去年一大批数据服务商因为数据的来源不合法、或者使用不合规,都面临了整改,导致整个金融风控行业“缺数据”,直接造成金融科技业务急剧萎缩。后面的事情,大家就都知道了。

今天回过头来看整个风控和营销市场,因为缺少对数据的合法合规使用,业务量腰斩甚至归零的细分领域和企业机构,一地鸡毛、遍体鳞伤。如何既要保护数据合法合规,又要谈大数据人工智能,似乎真的很难找到一个有效的、共识的安全数据使用解决方案。我相信整个行业都在朝着这个方向努力与试探。

今年比较有代表意义的是微众银行推出了联邦学习开源平台,微众的数据和模型能力,通过FATE平台,在一定程度上算是实现了“打破数据孤岛、又能保护用户隐私”的目的。科创板上市的Ucloud的安全屋,也是一种解决方案,但是弊端是使用双方必须依赖安全屋的公信力。还有其他一些保护数据使用过程中的解决方案比如TEE等。总体来看,包括GOOGLE、腾讯、阿里巴巴、百度等行业巨头,都倾向于联邦学习的数据安全解决方案。市面上也有一些其他的玩家已经投入产品化,比如刚刚说的微众银行fate、蚂蚁金服的摩斯平台、百度的点石平台,还有华控清交、富数科技、同盾等,都在联邦学习领域有自己的特色。

行业机会点

我觉得数据安全解决方案这个细分领域存在很大的市场机会点,有一下几个重要依据:
1)数据安全、公民隐私是我们国家最近一两年的重点,非法的数据业务一定会被一网打尽
2)下游业务的复苏必须依赖于大数据,目前缺的是一个合法合规的方式
3)上游的数据厂商必须有效地对数据进行增值、服务于社会,目前缺的也是一个合法合规的方式
整个产业链上下游的刚需所在,谁能制定好这个安全的游戏规则,并且能给出满足驱动业务的解决方案,谁就能将上下游整个生态链上的客户收入囊中。
十来年的大数据码农、产品设计、业务模式、解决方案,去年有一段时间,真的感觉所在的行业没有方向,看不清未来。静下心来,仔细看看因为数据行业遇到的问题,整个社会似乎都挣扎了一下,但是很快,聪明的人,都会选择使用环境和游戏规则,聪明的企业,都会布局有前瞻性的业务领域,看清楚自己所处的行业位置,说不定努力一下,也能给社会生产力带来真正的价值呢?

写在最后

这篇笔记,零零散散,也是和一些朋友聊的过程中得到的一些感悟。那天我在软件园晒太阳,碰到了富数的老朋友,聊的很嗨,有一句话我觉得感受很深,“我们公司all in 在安全上,是看清楚了这个市场的空白,总要有公司去竞争,去做点有社会意义的事情,你看我们写的那句话挺有意思——以AI为舟,摆渡价值,我们现在就是在造船哈哈”。作为一个目前对联邦学习非常热爱的粉丝,有点心动。这里也介绍一下这个知乎的来由,我之前注册了一个域名 www.hellompc.com,程序员出身,我特别喜欢开发开源自由共享,所以,在知乎上也搞了一个hellompc的空间,记录和数据安全领域相关的感悟和一些干货,希望对这一块领域有兴趣的同学一起,来维护这样的一个共同学习的环境。

你可能感兴趣的:(数据安全)