数据分类分级在数据安全治理过程中至关重要,数据的分级是数据重要性的直观化展示,是组织内部管理体系编写的基础、是技术支撑体系落地实施的基础、是运维过程中合理分配精力及力度的基础(80%精力关注重要数据,20%精力关注普通数据)。
数据分类分级起到成承上(管理)启下(技术)的作用。承上:从运维制度、保障措施、岗位职责等多个方面的管理体系都需依托数据分类分级进行针对性编制(管理体系与分类分级的结合,可强化体系落地执行性)。启下:根据不同数据级别,实现不同安全防护,如高级数据需要实现细粒度规则管控和数据加密,低级别数据实现单向审计即可。
总而言之,数据分类分级是管理体系合理规划、数据安全合理管控、人员精力及力度合理利用的基础,是迈向数据安全年精细化管理的重要一步。
目前业界数据分类分级多数属于数据资产管理系统的一个重要模块,大体实现思路是自动发现敏感数据,再结合人工方式进行分级(因为数据分类分级主观占比较重)操作,虽可帮助相关人员快速发现敏感数据,但针对主观数据还是力不从心,分级方式不灵活,不能适应各种组织的数据安全分级需要。整体而言,业界系统其实并不能满足所倡导的数据分类分级要求(主要是因为业界数据分类分级没有标准),多数解决方式是利用具有行业、业务、安全多方面经验的人员进行梳理,特点是准确性高、效果好但效率低、周期长、无规范依据。
为尽可能解决两者不匹配的问题,更好支撑组织对数据安全分类分级需要,在结合自身数据安全经验及对数据分类分级了解的基础上,初步形成了数据分类分级系统应具有的特性和功能架构,以期助力数据安全治理工作的发展。
数据分类分级系统应具的特性,如下图:
主观判定与客观判断主要是针对数据的敏感性(机密性)。组织内部数据分级判断常分为客观数据及主观数据,客观数据可直接辨别敏感性(如电话、身份证等),而有些数据则需要进行主观判定。
敏感数据发现是数据分类分级的基础,也是客观判断的前期条件,如对电话、身份证号码、社保卡号、银行账号等多种数据进行判断,及时发现组织内部敏感数据。
数据分类分级要考虑数据多种特性,其中包括数据安全可控性的问题,如果组织内部具有高强度的安全可控环境,那数据分级价值则会有限,如果环境中安全防护能力有限,则需考虑如何利用现有设备(或部分新购设备)有针对性的加深数据防护粒度,从而减轻资金、人员、运维精力等综合投入成本,在此环境下数据分类分级则显得尤为重要。
动态扩展能力是适应不同场景的需要,是系统能否适用组织内部不同数据形态、不同分类分级需求的基础(如果不具备动态扩展的能力且但满足需求,则可初步认定该系统是项目级,非产品级)。动态扩展能力包括敏感数据发现规则的动态拓展、元数据管理的动态扩展、标准自定义的动态扩展等。
数据分类分级的意义不在于对数据进行分类分级,而是在于对分类分级后的数据如何进行精细化安全管控,所以数据分类分级应具有上下游系统结合的能力(即需要丰富的接口)。可提供上游态势可视化展示(数据分布可视化、数据流程可视化等)、资产应用等,下游的数据安全管控(审计、防火墙、脱敏、加密、数据防泄漏)等。
依托数据分类分级系统应有的几个特性,数据分类分级系统功能应包括但不限于:规则管理、元数据管理、安全映射管理、指标管理、数据分类分级管理、接口管理、血缘分析等,简易架构图如下:
应用层:应用层是数据分类分级价值输出层,包括资产管理、态势感知、安全管理(审计、防火墙等)。该层业务系统是利用不同数的分类分级进行细粒度操作,如态势感知系统进行高级别数据请求、使用、分布的态势展现,安全管控系统形成定向防护策略等。
应用支撑层:该层是数据分类分级应具有的功能。包括规则管理、元数据管理、指标管理、安全映射管理、数据分类分级管理、接口管理、血缘分析等。
规则管理:通过建立的规则引擎,实现敏感数据发现(客观数据),方案(标准)的组合执行规则、指标判定规则等。
元数据管理:是系统的基础支撑功能,如满足指标管理中各种指标的动态管理。
指标管理:是数据分类分级的判定指标,是方案管理中基础元素。
安全映射管理:是现有安全环境的映射,利用如SNMP协议自动爬取网络环境,通过规则形成安全可控情况。
数据分类管理:客观数据利用规则引擎进行分类。结合机器学习方式进行主观类别分类,形成初步的分类方案,最终需要人员介入。
数据分级管理:客观数据利用规则引擎进行分级。结合机器学习方式进行主观数据分级,形成初步的分级方案,最终需要人员介入。
接口管理:打通上下游应用的唯一途径,包括获取数据分类、分级信息,判断数据的分类分级结果等。
数据层:数据分类分级的基础数据内容。
以上便是数据分类分级系统建设大致思路,由于业界没有相关标准且行业最佳实践屈指可数,难免会出现仁者见仁智者见智的情况,如您有更好建设思路,望互相交流。