文/邱彬
摘要
智能网联汽车大数据已经成为推动自动驾驶技术迭代更新,促进产业生态创新发展的基础性战略资源,随之而来的用户隐私和数据安全问题受到了社会各界的广泛关注。分析了智能网联汽车数据区别于一般大数据的典型特征,针对不同类别的数据进行了权属问题研究,认为除基础属性信息外,其他数据都应在匿名处理后进行分析应用。研究提出了目前数据产业化应用的4种典型场景。在国内外关于汽车数据安全保护相关法律法规的框架下,从国家、行业、企业3个层面分析提出了规范数据采集处理、强化数据挖掘应用的策略建议。
智能网联汽车作为新一轮科技革命和产业融合创新的重要载体,已成为全球汽车产业发展的重要战略方向,正在全面重构交通出行模式和社会运行方式。由于搭载先进传感器,融合网络通讯技术,具备智能决策和控制等特点,智能网联汽车在运行过程中将会产生大量的基础数据,其与人工智能、大数据等新一代信息技术的深度融合,不仅可以让汽车向高等级自动驾驶演进,帮助政府部门 做好安全监管和事故预警,还能在新车改进研发、个性化服务等多方面发挥重要作用。
然而,在有效挖掘和利用智能网联汽车数据的潜在价值,推动产业生态蓬勃发展的同时,不可避免地带来了车辆运行安全、用户隐私泄露等一系列数据安全问题。2016年,来自挪威安全公司Promon 的专家在入侵用户手机后,窃取了某车主app 的用户名和密码等数据,然后登录该品牌车联网服务平台,进而可以随时对车辆定位、追踪,并可解锁、启动车辆。
我国高度重视数据安全监督管理,2020年,国家发改委等 11 部门联合发布的《智能汽车创新发展战略》中提出:建立覆盖智能汽车数据全生命周期的安全管理机制,明确相关主体的数据安全保护责任和具体要求。实行重要数据分类分级管理,确保用户信息、车辆信息、测绘地理信息等数据安全可控。
如何在保障公共安全和个人隐私的基础上,充分促进数据潜在价值的挖掘利用,是发展智能网联汽车新技术、新业态必须要面对和解决的问题。因此,有必要深入研究智能网联汽车数据权属特点及安全机制等关键问题,在国家关于隐私保护和数据安全管理要求的框架下,提出行业和企业规范数据采集处理、强化数据挖掘应用的策略建议,以提升车联网大数据综合应用和数据安全水平。
1 智能网联汽车数据的典型特征
与传统汽车仅能提供简单的信息服务及执行驾驶员的驾驶操作不同,智能网联汽车能够提供强大丰富的娱乐交互功能,且当处于自动驾驶或辅助驾驶模式时,需要采集大量的外部环境数据,接收高 精地图、路测单元关于道路信息的数据,并通过感知、决策、控制等复杂算法进行分析运算,从而达到智能控制车辆的目的。因此,智能网联汽车数据除具有一般大数据的4V特点(海量、多样、高速、价值)外,还具有以下3个方面的显著特点。
1.1 智能网联汽车数据高度还原真实世界
智能网联汽车具有融合了摄像头、激光雷达、毫米波雷达等一种或多种方案组成的感知系统,强大的数据采集能力,长时间在公共道路上行驶,使其可以获得海量、高精度的关于车辆周边行人、车 辆和建筑物等目标物的详细信息。
1.2 智能网联汽车数据关乎公众社会安全
一方面,自动驾驶系统依靠采集和接收的外部环境数据进行分析运算,产生驱动车辆运行状态改变的控制数据,鉴于目前自动驾驶软硬件系统的复 杂性和精密性,这其中任何一部分数据被篡改、破 坏或丢失都可能对驾驶决策产生影响,进而造成交通事故。另一方面,车辆在道路上行驶,实时连续采集环境数据时,如果没有对这些数据进行规范采集和有效监管,当汇聚处理大量智能网联汽车连续 行驶的数据时,将会带来难以预估的信息安全问题。特别是会涉及军事管理区等敏感地理信息, 非法采集或泄露后将对社会安全乃至国家安全带来巨大风险。
1.3 智能网联汽车数据包含个人敏感信息
智能网联汽车作为下一代移动智能终端,在实现用户便捷登录的过程中,需要采集账户密码、脸部特征、指纹声纹等信息,在用户与车机交互的过程中,会涉及操作习惯、应用记录、语音和图像等信息,在车辆行驶过程中,记录行程轨迹、地理位置、驾乘习惯等信息。这些数据一旦泄露、非法提供或滥用将严重危害驾乘人员的身心健康和财产安全。
2 智能网联汽车数据的权属分析
随着大数据产业的快速发展和应用落地,其巨大价值和潜能逐渐被全社会所普遍认知,数据作为基础性战略资源的地位日益凸显。然而关于数据权属问题一直没有形成统一的看法,这在一定程度上阻碍了数据的交互共享和挖掘应用。一方面,为避免数据被非法应用及交易带来个人隐私的极大伤害,并产生难以预计的信息安全问题,应认为这部分数据的权属为数据产生主体。另一方面,为促进数据融合应用推动产业转型升级,同时考虑企业对于数据的采集存储等投入了大量成本,且只有经过分析挖掘之后的数据才有价值等因素,应认为这部分数据的权属为企业。智能网联汽车数据也是如此。
为了便于进行权属分析,将智能网联汽车在运行过程中产生的大量数据分为 5 类,见表1。对于基础属性数据,一般可以通过汽车公告信息和企业公开发布的信息来获取,可认为属于公开数据。对于环境感知数据,装载了摄像头、雷达等先进感知设备的车辆在自动驾驶过程中,需要实时采集分析车外行人、车辆、建筑物等目标物,以及道路状况等数据,这部分数据应当按照我国测绘相关法律要 求执行。对于运行控制数据,虽然从直观上不能识别出自然人,但其是驾驶员在使用车辆过程中产生的信息,且表征了自然人的驾驶习惯和性格爱好等信息,根据《中华人民共和国个人信息保护法》第4条“个人信息是以电子或者其他方式记录的与已识别或者可识别的自然人有关的各种信息,不包括匿名化处理后的信息”,可认为也属于个人信息。特别地,当车辆的自动化等级达到L3 以上级别时,虽然驾驶员不参与车辆运行决策,但运行控制数据 能够表征车辆的运行状态信息,而车辆属于驾驶员 的常用设备,所以为了防止潜在的个人信息安全风险,仍然应当将这部分数据看做个人信息。对于应用服务数据,同样包含着“可识别的自然人有关的各种信息”,通过收集、汇聚和分析可以进行特征建模或行为预测,在开展数据应用时不应与特定自然人关联。对于用户的个人数据,一旦泄露或者被非法使用,可能导致个人受到歧视,或者人身、财产安全受到严重危害,属于敏感个人信息。
表1 智能网联汽车数据分类及描述
因此,除基础属性信息外,其余数据全部属于个人信息或敏感个人信息,企业应在个人知情并同意的基础上进行采集和应用,且数据主体对这些数据有使用、交易、删除等权利。需要明确的是,当这些数据经过差分隐私算法、匿名算法等处理,使个人信息主体无法被识别且不能被复原之后,根据《中华人民共和国个人信息保护法》 第 4 条,这部分数据便不再属于个人信息,企业可以在能够充分保证数据安全的基础上,对数据进行挖掘应用及交易共享,促进智能网联汽车技术的进步及产业生态的发展,更好地服务和提升交通便捷及出行安全。
3 智能网联汽车数据的隐私保护要求
作为产业转型升级的基础性战略资源,智能网联汽车数据既能推动自动驾驶技术的迭代更新,又能促进产业生态和商业模式的创新发展,但蕴含其中的个人隐私和关键地理信息泄露等数据安全问题同样让人担忧。随着智能网联汽车量产化进程的不断加快,其具备的数据采集分析能力大幅增强,企业对于数据挖掘应用的重视和投入程度也显著提高,引起了国家政府部门和民众对于数据规范管理的重视。为此,各主要汽车生产国家正在研究探索数据管理要求,并且相继出台了一些标准法规,用以约束整车企业及第三方服务商合理进行数据的采集应用,在数据安全可控的前提下促进产业的健康发展。
3.1 美国
2017 年 9 月, 美国众议院通过了 HR3388 号《自动驾驶法案》,该法案要求开发者制定需要 的数据隐私保护计划,遵循选择同意、最小必要、公开透明、主体参与等信息处理原则,同时说明如 果个人信息经过匿名化处理或无法与个人关联,则 无需采取前述保护措施。2020 年 4 月,《确保美国在自动驾驶汽车技术中的领导地位:自动驾驶汽车 4.0》发布, 其确定的十大技术原则之一便是: 确保隐私和数据安全,强调美国政府将在自动驾驶 汽车技术开发和集成的过程中整体考虑保护数据安 全和公众隐私。
3.2 欧盟
欧盟《通用数据保护条例》(GDPR) 可以说是目前最严苛的数据保护法,详细制定了欧盟企业和非政府组织等机构收集、储存、处理和转移个人数据的相关规则。2021 年3 月,欧盟在GDPR 框架下发布了《车联网个人数据保护指南》,该指南从数据保护、本地化处理、匿名化和假名化、数据主体权利的保障等方面提出了处理原则,如指纹等生物识别数据应当存储在车内,并以基于驾驶行为的保险、自动紧急呼叫等5 个场景为示例,给出了个人数据采集存储、数据主体权利等数据处理参考建议。
3.3 日本
日本早在 2005 年就实施了《个人信息保护法案》,为防范大数据时代个人信息保护中的各类风险,于 2015 年开始进行了大幅修正,并在 2017 年开始实施修订版。新版法案中将个人信息定义为能够识别特定个人或者含有个人识别符号的信息,从总则、有关机构职责、个人信息保护的规则、个人信息处理业者的义务、个人信息保护委员会、附则、罚则等7 个方面进行了规定。
3.4 中国
作为致力于推动互联网和智能网联汽车产业快速发展的国家,我国也在逐步加快相关领域的立法和规范管理,《数据安全法》、《个人信息保护法》已正式发布执行,对企业进行数据处理活动和个人 信息权益保护等作出了详细要求。聚焦汽车领域,工业和信息化部于2021年4月发布的《智能网联汽车生产企业及产品准入管理指南(征求意见稿)》,提出了数据安全的管理要求,指出企业应建立数据安全保障机制和管理制度,在合法合规的前提下进 行采集、存储和应用,同时应对部分关键行车数据进行采集分析,以便进行场景还原和事故判责。7 月份发布的《关于加强智能网联汽车生产企业及产品准入管理的意见》,更加明确了强化数据安全管理能力的具体要求,比如,企业应当建立健全汽车数据安全管理制度,实施数据分类分级管理,建设数据安全保护技术措施等。此外,地方政府也积极结合区域特点研究出台智能网联汽车管理条例等文件,均将数据安全问题摆在突出位置。如《深圳经济特区智能网联汽车管理条例(征求意见稿)》明确提出:车辆应具有行车数据记录、车辆位置等设备,并将相关数据接入市政府监管平台,同时应保障网络安全、数据安全等,禁止非法收集利用个人信息及涉及国家安全的数据。
4 智能网联汽车数据的典型应用研究
智能网联汽车数据在推动产业发展进步方面的巨大作用,使相关企业对于数据采集应用的投入也越来越大,工业和信息化部印发的《车联网(智能网联汽车)产业发展行动计划》提出:通过车联网实现对车辆运行数据的采集、分析与运用,形成运 行安全保障、个性化保险、透明化维修等多样化的应用服务。国内外各大整车企业正在致力于建设车联网平台,用以采集、存储和分析智能网联汽车数据,社会各方也在积极探索释放数据的潜在价值,截至目前, 产业化应用场景主要围绕以下几个方面。
4.1 开展车辆运行监测和性能评价
当连续实时记录智能网联汽车的大量数据后,便可以有效监测和统计车辆真实的运行工况、运行状态等信息,同时对自动驾驶系统等关键部件的性 能等进行分析评价。在已经开放了公开道路测试的 城市,如北京、广东等地都要求车辆具备数据采集和存储的能力,同时将相关数据上传至统一的平台,从而对自动驾驶模式下车辆运行的安全性进行 监管和评估。这些数据可以用作事故调查与分析, 关于数据记录的国家强制性标准《智能网联汽车 自动驾驶数据记录系统》和《汽车事件数据记录系统》正在起草过程中。
4.2 开展基于用户画像的个性化服务
通过汇聚、分析与决策控制及感知、运行等相关的数据,可以对驾驶员的驾车行为、车辆的健康状态、使用寿命等方面进行分析或预测。比如,通过分析用户操控数据 (驾驶技巧相关)、环境感知数据 (行驶工况相关)、车辆运行数据 (车辆综合性能相关) 等数据,可以提供基于使用量确定保费的保险,同时面向用户提供维保提醒、远程诊断等多种服务。需要注意的是,在采集处理用户相关数据时必须事先征得用户的同意,并提供暂停收集及删除数据等功能,在向企业数据中心进行数据传输时应为脱敏数据,以保证用户基本权益。
4.3 开展自动驾驶算法训练
智能网联汽车自动驾驶功能的实现依赖于高性能的计算芯片和决策控制算法,由于驾驶场景不可能完全通过抽象穷举,因此,稳定、安全、智能的决策控制算法依靠大量真实的场景数据、驾驶数据作为输入,一方面是进行调整优化策略、训练算法,另一方面则是对其进行仿真验证和性能评估。
4.4 开展城市道路优化及智能交通建设
智慧城市是未来城市建设的重要方向,智能网联汽车作为智慧城市的参与者,也将为其规划设计提供大量的有价值的数据。比如,通过分析车辆在一个城市的流动,结合车速等数据,可以分析评估道路的拥堵情况,从而有针对性地对交通路网进行改造升级。智能网联汽车数据还可以同城市交通、公安等数据进行融合应用,衍生出智能交通信号灯、高危驾驶场景分析等多种功能。
5 智能网联汽车数据管理建议策略
随着各国对于数据安全管理工作的重视,以及智能网联汽车大数据融合应用在推动产业升级方面的作用逐渐显现,整车企业都在积极推进相关研究工作,并且在车内预制了TBOX 数据记录设备以收集整车数据,但是由于数据资源分散,数据类型不统一,以及隐私保护等众多客观原因,目前数据分析应用产生的实际价值较少,更多停留在了统计分析的层面。为此,提出以下建议:
5.1 国家层面
在我国《网络安全法》《数据安全法》 等法律法规的框架下,紧密结合智能网联汽车产业数据采 集与分析应用实际,研究建立适用于产业数据发展 的数据安全管理办法,规范行业数据采集及处理活 动,指导相关企业加强个人信息和重要数据保护, 进一步明确重要数据范围,给出企业采集、处理、交互数据的基本原则,尤其是匿名化和脱敏处理的 要求, 提高数据安全保护水平, 促进行业健康发展。
5.2 行业层面
研究建立统一的数据分类、分级及采集标准规范,共同进行数据匿名化及加密技术研究攻关,对采集数据类型、格式要求、传输协议、加密机制等进行规范,同时建立数据交互与综合应用公共平台,将不同企业采集的数据汇聚成行业海量数据资源池,解决仅靠单一车企采集足够体量数据需要付出巨大的财力和时间成本等问题,以支撑智能网联汽车企业及第三方应用服务商进行合规、高效的数据共享,并进行大规模商业化应用。
图1 智能网联汽车数据交互与综合应用公共服务平台架构
5.3 企业层面
由法务部门负责根据国家有关规定,对企业采集处理数据的合规性进行审核把关。同时成立专门的大数据部门,建立规范的数据采集、传输、处理、分析流程及要求,按照要求对数据进行分级分类管理,加强数据安全审计管理,建立企业数据综合平台,统一存储和管理企业内各品牌车辆采集的数据,并且基于脱敏数据进行分析挖掘,向技术研发、售后维保等部门开放数据应用接口,根据业务需要,协作开展研发改进、性能分析、金融保险等融合应用。
6 结论
综上所述,智能网联汽车大数据拥有广阔的应用场景,比如在车辆运行监测、研发改进、测试评价、个性化服务等方面,但同时也面临着隐私保护、数据安全等国家及消费者高度重视的问题,企业和行业应当协同发力,统一数据交互标准规范,共建数据综合应用平台,合作探索数据多场景综合应用,最终实现数据驱动技术进步、数据促进产业发展的格局。
END