形成机制
不同于传统生产要素较为直观、成熟的市场化机制,数据要素由于存在非竞争性等技术经济特性,以及法律规定的不明确,叠加数据要素交易场景的复杂性导致探索数据要素市场化一般机制成为难题。在完成了数据要素化和市场化的跨越后,就对市场流通化的数据产品有了清晰的界定和描述且存在这样的有效供给,那么数据要素市场建设的基本任务就成了搭建供需匹配的渠道,建立确保数据交易安全的制度机制,从而降低数据要素市场环境的不确定性。如前所述,数据要素市场建设的关键并不是交易场所本身,而是与数据要素特点相适应的数据要素市场的基础性制度机制。依据牛津大学拉尔夫·施罗德教授的大数据业务模式分析模型来分析数据要素市场框架,笔者认为,数据使用者、数据供给者和数据设施提供者可以勾勒出数据经济的基本画面:数据使用者可以是社会中任何主体,能使数据要素最终转化为社会生产力表现,而数据供给者既从数据使用者处收集数据,又为其提供数据产品,而这两类主体都离不开以技术见长的设施提供者的服务。三类角色大致勾勒出数据经济的分工体系。据此,数据要素市场形成机制在此意义上可以概括为数据基础设施服务,发展数据产品供给,促进数据的使用。本文就促进数据产品供给和使用的数据要素市场形成机制提出以下几点看法。
(一)数据产品化的促进与激励机制
在万物互联的泛在网络时代,大量数据因系统的运行和各社会活动而形成,但是这些数据本身并没有多少价值。数据要素市场化就是激励社会各主体将不可用、不好用的数据变成可用和可重用的数据。数据一旦具备社会可重用性,就使数据成为可交易的“产品”,产生交换价值。因而数据要素市场形成最基础的制度需求是从源头上激励数据产品化或数据产品的生产。为此,法律需要承认数据初始生产及其整个产品化过程的参与对数据的控制和使用权利,构建数据可以不断被社会利用的秩序。这是基于“额头流汗”原则,保护数据价值创造者得出的结论。而问题在于,数据往往反映或映射着客观存在,当人类利用数据认知客观规律时,也涉及揭示出数据描述对象或关联主体的行为规律甚至“秘密”(如隐私、商业动向)。如果这些利益相关者的利益得不到保护,那么他们就不会信任他人对数据的使用;如果利益相关者有权拒绝他人获取关于他们的数据,因而拒绝被分析和认知,就会形成社会认知障碍,影响正常的社会活动的开展。在数据要素化利用过程中,最为基础的制度是如何处理数据使用(认知分析)者和“被使用”(被分析)者之间的关系。正如数据英国开放数据研究院的杰尼·坦尼森指出,数据是一种新型无形基础设施(Intangible Infrastucture),支撑着社会和经济的各个领域。与其他基础设施一样,数据基础设施也需要相应的市场机制以满足社会和经济需求。这包括设计法律和制度以规范谁可以控制数据基础设施及其应施加的限制。因此,制度规范要承认和保护数据各利益相关者的权益,以建立数据流通利用或分享利用的秩序。在这样利用秩序中,不能采取传统的排他支配权(所有权)范式,给予某个类型的主体排他决定数据使用的权利,而是平衡保护各利益相关者前提的数据治理范式。
在数据治理范式下,制度规范需要在数据开放与控制、数据使用与限制、数据来源者利益与数据使用者利益之间取得平衡,构建激励数据产品化和产品化数据不断流通利用(重用)的制度。首先,需要确立数据的开放利用制度,将数据定位为社会可用资源,只是要建立获取数据的规则,允许社会主体以合法方式取得和使用数据;其次,确认和保护数据利益相关者的利益,规范和限制数据使用者的使用行为,使数据上承载的利益在整个使用过程均能得到维护;最后,以确保和保护数据使用者权益为核心以不断促进数据资源化或产品化流通利用,促进社会生产力不断提升。个人数据保护制度实际上就是按照这样的逻辑展开的。由于数据用于分析个人可能揭示个人隐私或作出不正确的分析结论,因此需要法律保护个人权益(包括尊严、隐私等主体利益)不因数据处理而受侵害,但是,个人信息权益保护制度并没有将个人数据转化为由个人决定的“私有财产”,而建立正当使用个人信息的规则,保持个人数据的社会可用性。同样地,当数据来源于组织或关系组织利益的同时,仍然需要关注组织在该数据使用上是否存在不正当的利益,只有存在正当的需要保护的利益时,才限制数据使用者的权益。
(二)数据产品描述、识别与发现机制
即使数据完成产品化或具备可重用性,其仍然属于价值不固定的非标准产品,如何发现或找到自己需要的数据产品是数据流通交易所面临的独特难题。因而如何让数据生产者匹配数据需求,让有需求的主体找到可用的数据是数据要素市场建设的另一项任务。从数据产品提供者的角度来讲,首先需要描述自己的数据,以向他人展示自己有什么。这不仅是个别地向他人介绍、描述,而且是以标准化内容、格式、规则来描述数据产品。标准化的数据要素产品描述是数据进入市场,供市场选择,自由竞争的基本条件。当一个组织要引入外部数据要素时,就会面临判断该数据产品是否能满足自己分析需要的问题,就可能面临数据格式不同、命名规则不一致、系统不兼容等问题。数据要素进入市场也要进行产品打包,添加名称、描述、使用条款甚至价格,形成可以发布、搜索、使用、定制、管理和衡量数据要素使用的单元。因此,数据要素市场建设首先要解决数据交易基本单元的界定问题。
制定标准化的数据产品描述规范,其中一个关键问题就是对产品主题与属性的描述。由于数据的属性多样、动态且繁杂,因此需要一个合理的框架对其进行组织。对于这一问题,阮冈纳赞的“分面分类理论”提供了一个有效的思路。阮冈纳赞认为,可以将所有的基本概念归纳为五个基本类型:本体(Personality)、材料(Material)、动力(Energy)、空间(Space)、时间(Time)。其中,本体表示事物对象或事物种类;材料表示与主题对象有关的材料;动力表示对事物对象的操作和处理;空间与时间则表示资源对象发生的空间位置和时间概念。对于数据产品而言,本体可对应数据产品主题;材料可对应数据产品质量及结构性属性;动力可对应对数据产品的处理、目的与用途;空间可对应数据产品的适用场景;时间可对应数据产品的供给时间。通过借鉴阮冈纳赞的“分面分类理论”,可以大致对各种数据产品的基本属性进行分类、梳理和组织。当然,除此以外,对于数据产品的描述还可以涉及对价格、交易信息、评价信息等动态信息的组织机制进行设计。最终,形成一套完整的数据产品描述机制。
从需求方的角度,首先需要识别、判断他人的数据是否适合或满足自己的需求。这实际上是数据产品需求者自身的需求识别和揭示,然后在数据要素市场中发现满足自身需求的数据产品。对数据的需求取决于需求者要解决什么问题,而解决该问题需要哪些信息、知识或方法,进而需要哪些类型或来源的数据可以产出这样的信息、知识或方法。从总体上,数据产品的需求者往往为了满足自身的生产力或生产效率的提升而产生对相关数据产品的需求。但是,这种需求必须要从解决具体问题的角度出发,针对本组织业务、市场、领域及场景,创造性地发现支撑机器学习、人工智能的数据需求,以产出解决特定问题,支撑业务决策的知识。例如,个性化、差异化需求成为数字经济的基本需求,而只有那些能够精准地发现最适合自己产品或服务的客户的数据维度才是自己的需求。数字化转型的需要就成为数据产品需求者发现自身数据需求的最佳途径。
在识别自己需求之后,接下来就是发现满足自己需求的产品在哪里。产品发现机制的构建不仅包括对类目导航、搜索策略和推荐算法的改进,还要依靠产品信息组织的完善。因此,原本适用于企业资产管理的数据要素目录逐渐地被借鉴到数据要素市场当中,由专业的交易撮合组织形成可信的数据源,制作成数据要素目录,供社会查询、评估、交易。这类组织对于解决数据产品发现问题至关重要,因为只有这些组织平台在后台充分实现数据产品的发掘、产品信息的组织,才可以在前台支撑目录导购、搜索、匹配推荐等流程化的产品发现机制。这一组织过程往往是通过构建数据产品目录予以实现的。数据产品目录通过数据集的发现、描述和组织来维护数据资产的清单。通过赋能数据分析师、数据科学家、数据管理员和其他数据使用者,以便找到并为特定业务分析目的而理解相关的数据集。因此,数据产品目录会告知需求者关于某个主题的可用数据集和元数据,并帮助需求者快速查找该数据产品。数据产品的发现机制本质上是对数据要素市场信息供需不对称问题的应对途径,而数据产品目录的功能类似于公共服务基础设施的图书馆书目检索系统,需要数据市场主体进行登录或注册,形成可查阅的系统,从而实现数据产品供需双方的市场化互动。
(三)数据产品的价值实现机制
由于数据产品属于非标准化产品,社会对数据需求的多样性远超数据供给者的想象,所谓的数据产品化也只是在技术上满足需求者的要求,而不是制造出满足特定需求的数据。甚至数据的使用价值是由需求方发现的,而不是数据供应方定义或给予的。数据交易是需求驱动的市场,而不是供给决定市场。数据产品交易区别于传统物品交易,可以不断转手的资产交易,数据流通交易的本质是让他人使用数据。数据要素的特征决定了数据要素不太适合通过界定数据,赋予持有者以所有权,以转让数据产权的形式来交易数据的市场范式。市场交易范式依赖于繁重的标准化流程、易于比较、买家和供应商之间的公平互动以及明确的价值转移。因此,数据要素实现市场化就必须将数据资源转换为随时可用的数据产品,允许任何使用者能够比当前的方法更快、更广泛地扩展创造的价值。数据供需匹配需要媒介,这便是数据流通或交易分享平台,但这样的平台一定不是仅仅构建资产交易的撮合、交割和清算机制,关键是平台能够为数据提供者和数据接受者创造价值并实现价值交付或分配。数据要素市场最终的价值体现在帮助最终用户找到和获取可用好用的数据产品,这样数据科学家就无需在中间的治理流程上花费时间并专注于从中获取洞察力。数据交易平台像任何其他在线市场,可以为供需双方提供数据产品展示、浏览比较、竞价撮合和履行辅助等的市场环境,使数据提供者营销、管理和销售其数据,使数据购买者在一个集中的市场浏览、比较和购买多个来源的数据。平台提供治理结构和一套标准及协议,通过自治管理方式创造和维系了任何市场不可或缺的因素——信任。在数据市场中,信任要重要得多,解决起来也更具挑战性。因此,培育和发展数据交易平台,应当成为数据要素市场建设的重要内容。数据交易平台在这个意义上就不应当与其他商品或服务一样系单一技术支持,而是应当起到进一步通过平台化转型开拓市场、供匹配需要和实现价值的社会功能。
前文将数据产品概括为三类,数据交易平台应当围绕这些产品价值实现搭建安全、可信的“数据流通道”,以实现可重用数据服务域。对于知识生产要素类数据产品需要数据实际控制移转,而其他两类都可以“服务”形式实现其价值。在移转数据的情形下,需要各种安全的交付安排。随着分布式存储和计算技术的发展,在一定范围内可以实现不移转数据就可对特定数据进行计算使用。这在一定程度上消解了前述因数据产品移转而带来的原发性交易风险。产品化的数据集的拥有者可以为数据需求者提供接口或环境,允许使用者布设算法,直接获得计算和分析结果,实现“原始数据不出域、数据可用不可见”。随着计算技术的进步和数据源头产品化思维治理数据的开展,在良好数据架构环境中生产的数据,可以不经过汇集或集中即可实现计算分析利用。因此,数据要素市场必须适应数据要素永远存在、无处不在和分布式的现实,为数据产品的使用搭建通道,为数据要素的计算提供条件或环境。针对特定数据集或数据库的一次性许可使用也不是数据要素流通交易常态,更普遍且重要的是持续提供数据产品服务域,以允许访问或使用数据产品的交易模式(有时被称为数据产品订阅模式或数据服务模式),从而实现数据产品的持续更新或阶段性更新。
除了构建数据价值发现和实现的机制外,数据交易平台还应当为数据交易提供风险合规机制,这是解决数据产品合法性与可交易性的关键路径。当前中国数据业务仍存在供求适配度偏低、安全风险凸显等问题,严重制约着数据资源配置水平。这是因为数据要素本身是一种风险性的资源,不仅有数字化数据本身的安全控制问题,而且数据存在多重利益相关者、社会公共利益和国家安全利益,是否能够提供数据产品流通的安全和合规服务,成为数据要素市场建设的重要内容。关于个人的数据,其不仅承载个人利益,而且同时承载着使用者、社会、组织、国家等多方主体的利益。关于机器的数据亦可能涉及设计者、制造者、应用者的财产利益,甚至还涉及应用者或设备主人的人格(隐私)利益。数据上存在的多重利益也就意味着数据产品上的多重风险,而数据产品流通可能会扩大风险,因而数据要素流通需要有相应的风险控制机制,使数据产品风险不因为流通使用而无限扩大。因而数据要素市场需要的基础性机制就是为数据产品提供者和数据产品使用者构建一个安全、合规的数据产品流通利用的生态系统,使数据产品持有者可以安全地实现数据要素的社会价值,而使数据要素使用者能够获取所需要的数据产品。比如,数据产品交易应遵守关于数据安全管理的法律法规,尊重社会公德,不得损害国家利益、社会公共利益和他人合法权益。数据产品交易涉及个人信息的,应采取个人信息安全保护技术和管理措施,避免个人信息的非法收集、非法获取、非法出售、滥用、泄露等安全风险,所涉及的个人信息内容和处理行为不得与相关法律法规产生冲突,坚持去标识化流通原则。简言之,数据产品风险合规机制最为重要的是要使数据产品流通过程可控,责任可追溯,合规性可监督,将数据产品流通产生的风险分配给产生源头和能够预防风险的责任主体。
综上,作为一个一般性的抽象概念问题,市场更趋向于一种经过设计的制度结构。从这一角度来说,强调以市场为基础的方法来构建丰富的价值发现、转化与社会参与是数据要素培育的关键。从新自由主义理论的角度来看,市场构建的最良性和最有效的形式就是自主、融合和关于效率和价值的市场化反馈。数据产品价值实现的特殊性决定了实现数据要素市场化配置基础制度不同于传统市场。因此,制度设计者需要供给一套适用于数据产品的市场基础制度规则,以激励数据产品化和流通交易,从而实现市场经济层面的数据治理,最大化地促进数据要素价值的市场性生产与实现。