数据派THU

数据有价——数据资产定价研究初探

数据（Data）是一项资产的观念形成虽然时间不长，但已经成为人们的共识。成为资产的两个基本前提条件是能够确权和定价。确权是确定谁拥有什么权利或权益，定价使得资产具备可转让性。相比其他资产类别，数据资产（Data Assets）的确权和定价的研究刚刚起步，但数字经济的发展迫切需要对这一课题进行研究。

从数据流动的宏观结构观察，数字化首先形成初级的、未经处理的原始数据(Raw Data），这些原始数据是由不同的数字化设备（传感器）产生的“传感数据”（Sensor Data），经过简单的组合或融合而形成的。这些原始数据再经过处理，形成各种各样的数据产品（Data Products），进入数据交易市场。数据资本化进程的演进，逐渐形成包括数据资产、数据资本和数据金融的数据金融市场（如下图）。由此可以看出，数据必然的成为可进行交易的商品、必不可少的生产要素与资产。数据资产列入资产负债表，也只是时间问题。

不是所有的原始数据都能够加工成数据产品，能够加工成数据产品的原始数据需要满足一些特性。严格定义和测度究竟哪些原始数据能加工成数据产品还很难形成统一的标准。但目前，认为具备“大数据”特性的数据是能够加工数据产品，并进一步能够成为数据资产的观点基本能够形成共识。为避免歧义，本文所研究的数据，是指满足“大数据”特性的这一类数据。

在当前的数据市场中，买家和卖家之间几乎没有透明度、信息严重不对称。这种缺乏透明度和信息不对称，让参与交易的各方被误导并最终形成“柠檬市场”。如果存在数据定价的标准模型，这个模型考虑了影响数据价值的许多方面，例如数据的年龄、样本的可靠性以及其他因素。买家就可以进行适当的比较，以获得合理的价格。如果数据市场采用了基于这些标准化的定价模型，市场的效率将会得到大幅改进，并促进数据科学的研究和发展。

早期的研究主要是数据资产评估。Moody和Walsh（1999）提出信息资产作为一个有形资产进行评估，以为信息的价值由搜集信息成本、管理信息成本和信息质量共同决定。Long Staff和Schwartz（2001）运用B-S期权定价理论提出LSM方法，解决价格对历史数据依赖性的期权定价等问题。Pitney Bowes、John Gallaugher （2009）从数据资产管理的角度，研究从数据流动过程对数据资产进行管理。提出了数据资产管理包括目标数据、数据来源、数据体积、数据质量、数据托管等方面。

这些研究，大多没有涉及数据本身。本文主要讨论数据本身的定价问题。

一、分析框架

从经济学的视角看，这类数据无法由经济人通过人工方式直接处理，必须且只能够借助某种软件来处理。因此，对经济人而言，数据产生的效用应该是数据和软件共同作用的结果。

处理数据的软件也处于不断演进中。从最简单的到复杂的人工智能，软件的发展极大的提高了数据处理的能力，同时，也对数据产生巨大的需求。为了训练一个人脸识别AI，需要大量的采集人脸数据进行训练；自动驾驶AI系统，无论在训练时，还是在工作中，都需要大量的数据。

以微观的视角，将处理数据的软件与数据分开来考察的好处是，可以基于经济学的理论体系，构建一个关于数据和软件的经济学分析框架。这个分析框架的核心要点主要是两个：一个是将满足一定规范条件的输入数据无差别化处理，考察不同的软件在处理相同输入的情况下，其输出的效用差异；一个是将软件看作经济人的智能代理（Intellgent Agent），运用代理理论来对数据市场的交易行为进行分析。

需要补充的是，对于程序员和工程师而言，将软件和数据进行分离是一件不可思议的事情。但将软件和数据分开，是为了更好的在经济学意义上，分别研究软件、数据的经济学性质。特别的，这样的分离更便于建立数据交易和定价所需要的微观基础。

首先分析软件，为此建立了一个初步的软件经济学分析框架。在这个分析框架中，得出的结论是：软件本质上，代表的是某个时期，人们关于处理某类数据的全部知识和方法的总和。软件作为经济人的智能代理，按照委托，处理特定的数据，向经济人提供效用。

这个分析框架将数据作为软件所定义的输入空间和输出空间的子集【定义1】。数据从一个层级“流动”到上一个层级，驱动数据流动的动力是数据的价值（分析框架示意图如下）。

本文后续的讨论，为了将研究对象聚焦在数据上，假设经济人都使用相同的软件，但输入数据是有差别的。【假设1】

对经济人而言，拥有软件

，软件成本为

。输出数据的预期效用

大于输入数据的效用

和软件使用成本，经济人才会考虑购买输入数据，即

【条件1】。

对于任意两个输入数据子集，

和

，通过同一软件

处理后的对应输出为

和

。如果期望效用

大于

，那么很合理的结论是经济人愿意为数据

付出比数据

更高的价格。

对任意输入数据子集

，事实上面临两类情况：a）这个输入数据子集经过软件的处理，在输出空间上没有输出；b）这个输入数据子集经过软件的处理，能够在输出空间上得到输出数据。显然，在a）情况下，没有人愿意为这个数据付钱；在b）情况下，只要满足【条件1】，数据就会有价值。

既然这些输入数据子集都满足“输入数据规范”，为什么还存在得不到输出的a）情形呢？

用一个形象的类比来说明：将软件看作是一个秤，要秤的东西是输入空间的数据，秤的重量刻度表是输出空间。我们将某些数据放在称上时，能够秤出重量的，可以从刻度表上读取数值；不能称出重量的，就无法从刻度表读取数值。（下图示意）

为数据构建什么样的度量，直接影响和决定了输出数据。由此可以得出结论，导致数据效用差异的原因是数据内蕴的，这些差异必须通过建立某种度量来区分。而这些度量本身，也自然的成为数据定价的基础。

那么这些度量是如何构建的呢？

二、数据的度量

数据的度量（Metric）是研究数据交易、定价以及其他经济性质的起点。

为了建立数据的度量，我们首先需要了解数据的数学结构。为此，引入如下三条公理：对于输入空间的数据

，

【公理1】

是一个集合，具有一些属性

（Attribute）。

【公理2】这个集合是可拓扑的

（Topologized）。

【公理3】集合的数据是由多种感应数据组合和融合的，具有异质性（Heterogeneous）。

由以上公理，我们就可以建立数据的数学结构和度量，并进行计算和分析。

数据的属性是复杂多样的，人们可以根据需求选择一些属性来对数据进行计算和分析。因此，不同的软件被用来处理具有不同属性的数据。为了建立标准的模型，需要对这些属性进行规范化要求，由此就形成了“数据规范”。将数据标准化、规范化是进行商品化（Commditzation）的前提。

NIST提出了一个数据属性的层级关系模型（见下图），可以更好的理解数据内蕴的层次结构。

数据属性在每个层级都有其对应的、可以定性或定量的参数化（坐标）表示（每个属性可以看作为一个坐标）。上述三条【公理】使得可以对具有上述复杂层级结构的数据，建立“等价的”数学结构，有了恰当的数学结构，就能够很好的运用成熟的数学方法来进行分析和计算。目前主要有两类数学结构：一种是流形；一种是拓扑。无论那种数学结构，起点都是要找到一种合适的度量。

数学上，度量是指对于非空集合

中任意的两个元素

，一个能够满足下面三个性质的距离函数

：

1）

，而且等号成立当且仅当

；

2）对于任意两点

，

；

3）对于任意三点

，

。

欧几里德距离函数

是最常见的度量，以此得到2维欧氏空间

。推广到

维，得到维欧氏空间

。除了欧几里德距离函数，根据应用场景不同，还有很多距离函数：例如汉明距离、曼哈顿距离、车比雪夫距离等。不同距离函数是将数据的属性进行参数化（坐标）表示，进行计算，从而实现诸如分类、聚类等目的。

将度量的概念推广到流形的时候，就形成了黎曼度量

的概念。简单的说，为了计算流形中任意两点的距离，需要黎曼度量来决定无穷小距离

，它的形式可以写为：

。这些无穷小距离逐段相加，就可以计算出路径的长度，而这个长度就可以定义为两点之间的最短距离。

黎曼度量是一大类度量的统称。例如，地球上，从任意一点A到B的最短距离是它们之间测地线的长度；Wasserstein距离是概率密度函数空间中的黎曼度量。对于任意给定的空间，有很多可能的黎曼度量。如何选择在某方面“最好”的黎曼度量一直是数学上的重大主题，这也是当前挖掘数据价值的主要来源之一。

上述度量构造方法在具有很大异质性的数据集合中，暴露出很多缺陷。人们逐渐认识到“距离函数”的局限性，很多数据集本身就不存在“距离”这种结构，或者无法构造出类似“距离”的结构。采用拓扑学的方法和工具来处理这些数据就成为必要的手段，由此发展出了计算拓扑学（computing topology）。拓扑的方法是分析数据集的拓扑性质，进一步的通过计算拓扑不变量，例如洞、环等（也是一种度量）来对数据集进行比较、分类和预测（示例如下图）。

通常可以在特定的任务下，通过选择数据的属性来人工的构建度量。然而这种方法需要很大的、有时候甚至很高端的人力资源投入。同时，由于存在人为因素，也可能对数据的改变非常不鲁棒。采用机器学习的方式，根据不同的任务来自主学习出针对某个特定任务的度量。这种方法极大的扩展了数据的度量方法，目前已经构建了几十种度量，而且还在不断增长中。

对于一个数据集合，往往采用多种度量，不同度量经过软件的处理会得到各自的数值。度量

和对应的值

描述了数据的特征，称之为特征空间

。数据的这些特征，软件最终将其表示为经济人能够理解和使用的信息，就产生了效用。

度量与数据价值之间的关系

输入空间的不同数据，在输出空间得到不同的输出，其效用的差异是输入数据的特征诱导的。而这些特征是度量的函数。由此，可以看到度量与数据价值之间的联系。

输入空间的不同数据子集的价值差异的定量化，就是数据资产定价研究的核心问题。目前，业界研究了一些度量方法以及由此建立的定价模型。例如，出于对个人隐私的保护，很多学者研究了隐私数据度量的方法及基于隐私度量的数据定价模型；基于微观市场一般均衡机制的价差度量，建立了私人数据定价模型；一些大数据交易所和平台制订了包括数据质量评价指标、数据效用指标等在内的度量指标体系，并以此建立了包括协议定价、竞价等多种数据定价机制。

数据价值的发现和计量是通过度量来实现的，而度量的构建有着严格的数学基础。因此，建立标准的定价模型是可行的。

三、数据资产定价

当前数据资产交易通常由卖方推动，买方对于将要购买的数据的信息知之甚少。信息的这种不对称导致定价缺乏透明度，持续损害卖方利益，这就会形成典型的“柠檬市场”。由此，建立具有标准化定价模型的数据市场是非常必要的。

考察一种简单的情形：一个满足“输入数据规范”的所有数据构成的集合

，给定一组度量

，构成输入空间

。对于其中的两个子集

和

，我们需要建立一个模型，能够根据其各自的度量值进行定价。

最基本的是权重法：对于任意度量

,可以根据每个度量对数据价值的贡献权重分配每一个度量相应的权重

。然后根据其度量值分别计算后，进行定价。

例如，我们选择三种度量和固定权重计算两个数据的价值。（下图）

这种方法比较简便和便于计算。度量是定量的，也可以是定性的。这种方法存在的问题和争议的地方包括度量的构建和权重分配的优化。解决的办法主要是依靠市场的交易数据的积累和反馈，寻求一种再调整和优化的机制。这种定价方式适合场外市场交易。

从数据的层级结构（NIST）考察，可以发现不同层级的数据对于整个数据集的价值贡献是不同的。大数据科学揭示出来的一个显著的特性就是，高层级数据包含更丰富的信息，因此对于数据价值的贡献也更多。由此，可以建立一个基于数据层级结构的价值树（Value Tree）模型：高层级的数据具有更高的权重，价值在不同层级的分布是不均匀的（示意图如下）。这种定价方法，需要确定价值在不同层级的分布情况。这方面的定性研究已经取得一些进展，但定量的研究还处于起步阶段。

如果存在一个有效的数据市场，那么可以通过交易来定价。有效的数据市场是指对于市场上交易的数据资产，有一个信任中介，有效的解决了信息不对称的问题。由于数据的特殊性，这样的数据市场需要构建基于区块链的数据交易基础设施。这些基础设施可以满足买卖双方对拟交易的数据资产的信息透明度以及信任问题。由于区块链的一些显著的特点和优势，它能够为交易各方提供数据来源、数据质量以及其他数据属性可信的、可靠的和不可删改的信息。因此，“链上的数据交易”会成为数据交易的主要方式。

基于链上的数据交易的主要方式有两种：1）点对点；2）Token化。

点对点的交易是买卖双方依据链上的规则来直接进行交易。定价的依据可以参照上述的模型。

Token化的交易是将标的数据Tokenization后的一种间接交易方式。交易各方不再直接交易数据，而是交易代表数据的Token。数据的定价反映在Token的价格上。这种方式的好处是，不仅将数据的真正买卖双方引入公开市场，也引入了投机交易者，从而通过市场机制更好的定价。Token的设计可以是权益、也可以是期权。由此，可以派生出很多不同数据权利产品的价值发现工具，有利于更好、更公允的定价。

Token化交易的另一个显著的优势是，可以解决不完全信息条件下的数据资产定价。主要原因是，由于认知差距，人们还无法对数据层级价值分布以及不同参数对价值贡献的掌握的非常准确。通过Token化，可以将未知的部分（风险）通过公开市场交易进行转移，从而有效的获得合理的、公允的定价。

由于云计算、物联网以及数据时效性的原因，数据市场的交易将越来越呈现实时性、高频率以及高频次。数据市场的交易的时间按毫秒计算、每次交易从发起到完成在秒级计算。同时，交易发起的频次非常高，每秒钟可能就会有高达几千次的交易发起。更为显著的是，交易参与方不再是人类，而更多的是智能代理。买卖双方都是机器，可以遇见数据市场的大多数交易都是M2M（Machine To Machine）的。

就如同当今的证券市场，超过80%的交易都是由算法驱动的程序或Robo完成的。一份研究报告指出，比特币市场上超过90%的交易都是Robo完成的。这些Robo交易者的策略以及交易行为，将显著的影响市场的价格和波动。特别是拥有更多自主AI算法的Robo交易者参与到市场中来的时候，我们还面临很多未知的问题。

这将是一种全新的交易环境。区别于我们已知的定价模型，这样的交易环境，其定价机制以及理论都尚待进一步的研究。

参考文献

A pricing Model for data marker, J.Heckman等 2015年
Gkatzelis V, Aperjis C, Huberman B A. Pricing private data[J]. Electronic Markets, 2012, 25(2): 1-15.
“大数据之父”维克托·迈尔·舍恩伯格。
Data As economic Goods,Yuri Demchenko等
https://baike.baidu.com/item/柠檬市场/2174659?fr=aladdin
Measuring the Value of information:an assets valuation approach. Daniel Moody & Peter Walsh,199
《开源软件经济学浅议》，张家林
NIST Big Data Interoperability Framework: Volume 2, Big Data Taxonomies
《TOPOLOGY AND DATA》，GUNNAR CARLSSON ，2009
https://blog.csdn.net/pipisorry/article/details/45651315
http://www.ams.org/journals/bull/2009-46-02/S0273-0979-09-01249-X/S0273-0979-09-01249-X.pdf
https://arxiv.org/pdf/1806.05167.pdf
http://www.cs.cmu.edu/~liuy/distlearn.htm
《结构化数据的隐私与数据效用度量模型》，谢明明等
Wagner I, Eckhoff D. Technical privacy metrics: a systematic survey [J].
ACM Computing Surveys, 2018, 51(3): articleNo 57
《基于隐私度量的数据定价模型》，彭慧波，周亚建。
《A theory of pricing private data》，Chao Li等
这里的数据效用不是经济学的效用函数，而是指经过处理之后的数据与没有处理的同组数据的相同程度或者真实程度，数据真实性越高，数据效用越好。
《浅析国内大数据交易定价》，赵子瑞
《数据定价机制现状及发展趋势》，彭慧波，周亚建。

作者简介

张家林

1995年-1997年创办期货经纪公司，北京商品交易所会员，从事商品期货经纪业务。

1995年-2003年涉足证券投资与股权投资。

2006年-2009年在国外从事结构化金融衍生品交易，包括CDO,CDS等。

2009年6月创建私募证券投资管理公司，负责决定公司的投资计划、投资策略、投资原则、投资目标、资产分配及投资组合的总体规划。

2014年初创建金融科技公司，从事人工智能投顾、监管科技的业务。

1）发表过有金融人工智能、数字货币、网络空间贸易与投资、区块链等二十余篇文章，政策建议。著有《证券投资人工智能》等专著。

2）参与多项央行、证监会的多项优秀课题研究。2017、2018年证券业协会的优秀课题。

3）2015年开始涉足区块链的应用和技术研究。是Hyperledger中国区首家会员，开发多项区块链的应用研究和跨链技术。

编辑：文婧

校对：龚力

缓存三兄弟和布隆过滤器想躺平的咸鱼干 redis 缓存哈希算法算法 java intellij-idea
缓存三兄弟缓存穿透：大量的请求查询数据库中不存在的数据，缓存直接从机数据库，导致数据库压力过大甚至宕机解决方案：布隆过滤器：在缓存层前加入布隆过滤器，预存合法数据的Key，请求到达时先通过布隆过滤器查看是否存在，查看是否拦截。缓存空对象：对数据库中不存在的数据，缓存一个短期的空值。需要结合异步线程定期清理无效空值，避免长期占用内存。缓存空对象缓存空对象：是一种解决缓存穿透问题的策略，当查询某个不存
乐观锁的介绍想躺平的咸鱼干 redis java 数据库大数据 intellij-idea
乐观锁乐观锁是一种并发控制机制，如果多种事务并发冲突的概率比较低，所以在数据操作的时候布里吉加锁，在提交时检查数据是否被其他事务修改过，通过版本号（version）或时间戳（Timestamp）实现，确保数据一致性。乐观锁通过版本控制+冲突检测实现高效并发管理，适用于低冲突，高并发的互联网，优势在于无锁设计与高吞吐。时间戳：用于记录某个事件具体时间的数值或字符串，它的核心作用是唯一标识某一时刻。时
C#语法基础总结（超级全面）（二） inwith C#语法基础 c#开发语言
文章目录c#语法基本元素关键字操作符（operator）类型转换标识符（Identifier）语句try语句迭代语句（循环语句）索引器文本（字面值）五大数据类型引用类型：值类型：变量、对象与内存装箱和拆箱类类的实例化类的三大成员（属性、方法、事件）属性（property）方法（函数）方法参数值参数引用参数输出参数数组参数具名参数可选参数扩展方法（this参数）方法的重载构造器（constructo
Docker架构深度解析：从核心概念到企业级实践
Docker架构深度解析：从核心概念到企业级实践一、Docker架构全景图1.1整体架构示意图二、核心组件深度解析2.1DockerDaemon工作机制三、镜像与容器原理3.1镜像分层结构3.2容器生命周期四、网络架构详解4.1网络模式对比4.2Bridge网络实现原理五、存储架构与实践5.1存储驱动对比5.2数据卷使用模式六、企业级实践方案6.1高可用架构设计七、安全最佳实践7.1安全防护体系八
C#中的LINQ解析三千道应用题 C#学无止境 c#
本文仅作为参考大佬们文章的总结。LINQ（LanguageIntegratedQuery，语言集成查询）是C#中一项革命性的技术，它将查询功能直接集成到C#语言中，使开发者能够以声明式的方式查询各种数据源。LINQ提供了一种统一的语法来查询和操作不同类型的数据，包括内存中的集合、数据库、XML文档等，极大地简化了数据处理流程。一、LINQ概述与核心概念1.LINQ的定义与价值LINQ是.NETFr
2023-09-15 五角大楼探索生成式人工智能解决方案泰格
佳文砺道智库2023-09-1409:58发表于北京据“防务头条”网9月12日报道，美国研究机构“特殊竞争力研究项目”（SCSP）的一份报称告，如果美国想在制定生成式人工智能的开发和使用规范方面引领全球，就必须增加联邦研发支出，建立新的政府机构，或者改变现有的政府机构。生成式人工智能可以加速新药和网络安全解决方案的发现，从根本上实现更好的计算机网络，并提高公众的理解。但在对手手中，它可能会导致更多
Proto文件从入门到精通——现代分布式系统通信的基石（含实战案例）筏.k gRPC c++rpc 服务器
gRPC核心技术详解：Proto文件从入门到精通——现代分布式系统通信的基石（含实战案例）更新时间：2025年7月18日️标签：gRPC|ProtocolBuffers|Proto文件|微服务|分布式系统|RPC通信|接口定义文章目录前言一、基础概念：Proto文件究竟是什么？1.什么是Proto文件？2.传统通信vsProto通信二、语法详解：Proto文件的构成要素1.基本语法结构2.数据类型
2019-11-11晨间日记野老说史
今天光棍节起床：6：05就寝：9：30天气：晴6～17℃心情：好纪念日：叫我起床的不是闹钟是梦想年度目标及关键点：本月重要成果：今日三只青蛙/番茄钟成功日志-记录三五件有收获的事务学风整顿散步财务检视人际的投入开卷有益-学习/读书/听书三焦，以横膈膜和肚脐为界中医把人体五脏六腑分成三个部分：上焦中焦和下焦。上焦主清应该升，下焦主浊应该降中焦运转健康与饮食今日步数：18693今日锻炼：10000今日
初识linux（一）：全面了解linux目录结构&基础操作指令详解 whelloworldw linux系统编程 linux 运维服务器
今天小风将带着大家进行有关liunx部分章节的学习，由于是第一节初识linux部分的内容，所以内容理解起来并不会太过困难。在本篇博客中，小风将向大家具体讲解一下内容：初识Linux操作系统初识Xshell登录命令,简单了解一下操作系统基本概念使用常用Linux命令，了解linux系统目录结构和访问方式一、初识linux操作系统1.linux发展史1991年10月5日，赫尔辛基大学的一名研究生Lin
GEV/POT/Markov/点过程/贝叶斯极值全解析；基于R语言的极值统计学
极值统计学就是专门研究自然界和人类社会中很少发生，然而发生之后有着巨大影响的极端现象的统计建模及分析方法；在水文、气象、环境、生态、保险和金融等领域都有着广泛的应用。专题一、独立假设下的极值统计建模主要内容包括：1.广义极值模型.2.极小值的处理.3.广义Pareto模型.4.第r大次序统计量建模.5.R语言中极值统计学包.6.实例操作1-2.(提供案例数据及代码)专题二、平稳时间序列的极值统计建
java cas aba问题_Java CAS操作的ABA问题自考大三学狗 java cas aba问题
CAS介绍比较并交换(compareandswap,CAS)，是原子操作的一种，可用于在多线程编程中实现不被打断的数据交换操作，从而避免多线程同时改写某一数据时由于执行顺序不确定性以及中断的不可预知性产生的数据不一致问题。CAS操作基于CPU提供的原子操作指令实现，各个编译器根据这个特点实现了各自的原子操作函数。来源维基百科：C语言：由GNU提供了对应的__sync系列函数完成原子操作。Windo
c语言如何宏定义枚举型结构体,C语言学习笔记--枚举&结构体搁浅的鲎 c语言如何宏定义枚举型结构体
枚举枚举是一种用户定义的数据类型，它用关键字enum以如下语法格式来声明：enum枚举类型名字{名字0，名字1，。。。，名字n}；枚举类型名字通常并不真的使用，要用的是大括号里面的名字，因为它们就是常量符号，它们的类型是int，值则依次从0到n。如：enumcolor{red,yellow,green};就创建了3个常量，red的值是0，yellow的值是1，green的值是2。当需要一些可以排列
Spring框架整合Redis哨兵模式的实战教程轩辕姐姐
本文还有配套的精品资源，点击获取简介：Spring框架作为Java企业级开发的重要组件，与Redis高性能键值数据库结合，特别是在其哨兵系统支持下，能实现Redis服务的高可用性。本文详细阐述了如何在Spring项目中整合Redis哨兵模式，包括依赖添加、配置哨兵系统、创建连接工厂、配置RedisTemplate以及异常处理等关键步骤。通过整合，可以确保应用数据存储和缓存的稳定性和连续性，适用于需
USB （四）基于 STM32 USB的开发
文章目录官网demo基于官网demo考虑的事情usb代码的架构及接口USB数据流程USB中断枚举复位挂起唤醒usbdevice收数据以MSC为例usbdevice发数据以MSC为例应用处理流程其他描述符官网demo软件代码在官网是存在的:STSW-STM32046开发板对应的是:en.stm32_f105-07_f2_f4_usb-host-device_lib\Project\USB_Devic
CVE-2005-4900：TLS SHA-1 安全漏洞修复详解 Nova_CaoFc 运维日常技术博文分享安全 linux 服务器运维
前言在信息安全日益重要的当下，任何微小的加密弱点都可能被攻击者利用，从而导致数据泄露、流量劫持或更严重的业务中断。本文将结合实际环境中常见的Nginx配置示例，深入剖析CVE-2005-4900（TLS中使用SHA-1哈希算法）的危害，并提供完整、可操作的修复流程。一、什么是CVE-2005-4900漏洞CVE-2005-4900定位于TLS协议中使用SHA-1作为消息认证和签名哈希算法的安全漏洞
深入探索C++ STL：从基础到进阶
目录引言一、什么是STL二、STL的版本三、STL的六大组件容器（Container）算法（Algorithm）迭代器（Iterator）仿函数（Functor）空间配置器（Allocator）配接器（Adapter）四、STL的重要性五、如何学习STL六、STL的缺陷总结引言在C++的世界里，标准模板库（STL）是一项极为强大的工具。它不仅为开发者提供了可复用的组件库，更是一个融合了数据结构与算
STM32 驱动步进电机代码 pollotui stm32 嵌入式硬件单片机
本文采用了28BYJ48步进电机，其中末尾的48表示4相8拍的驱动方式。ULN2003驱动模块接受来自控制器的脉冲信号，并将其转换为步进电机的相位信号，从而驱动电机按预定的步进角度转动，由于本文采用四相八拍的步进电机，四相表示电机的绕组组数为四组。拍则表示通电状态的改变次数，因此可得在四相八拍工作模式下驱动器各引脚通电状态如下表：表1四相八拍引脚电平状态变化表引脚12345678IN1000IN2
尚硅谷C语言笔记-结构体与共用体想名困难户尚硅谷C语言笔记 c语言笔记
1、结构体(struct)类型的基本使用1.1为什么需要结构体？C语言内置的数据类型，除了几种原始的基本数据类型，只有数组属于复合类型，可以同时包含多个值，但是只能包含相同类型的数据，实际使用场景受限。1.2结构体的理解C语言提供了struct关键字，允许自定义复合数据类型，将不同类型的值组合在一起，这种类型称为结构体（structure）类型。C语言没有其他语言的对象(object)和类(cla
微信小程序案例 - 本地生活（列表页面）
一、前言随着微信小程序的普及，越来越多的生活服务类应用开始基于微信小程序进行开发。其中，“本地生活”类小程序（如美食、团购、周边游等）因其贴近用户日常需求而广受欢迎。本篇文章将以一个“本地生活列表页面”的实际案例为例，手把手带你实现一个完整的微信小程序本地生活类首页列表页面，包括：✅页面结构设计✅数据绑定与渲染✅列表项布局与样式优化✅下拉刷新与上拉加载更多✅搜索功能初步实现✅真实数据模拟与静态化处
关于Spring RestTemplate
一、概述RestTemplate是SpringFramework提供的一个同步HTTP客户端工具，用于简化与RESTfulAPI的交互。它封装了底层HTTP通信细节，提供了统一的API来发送各种HTTP请求（GET、POST、PUT、DELETE等），并自动处理响应数据的序列化和反序列化。二、依赖配置如果使用Maven项目，需要在pom.xml中添加以下依赖：xml org.springfram
【橘子分布式】Thrift RPC(编程篇) 当年明日分布式分布式 rpc 网络协议
一、简介之前我们研究了一下thrift的一些知识，我们知道他是一个rpc框架，他作为rpc自然是提供了客户端到服务端的访问以及两端数据传输的消息序列化，消息的协议解析和传输，所以我们今天就来了解一下他是如何实现这些功能，并且如何在实际代码中使用。我们需要搭建环境。1.安装Thrift作用：把IDL语言描述的接口内容，生成对应编程语言的代码，简化开发。我们已经介绍了在mac如何使用brew安装了。2
Day04_C语言网络编程20250716_sql语言大全 liujing10232929 C语言网络编程 c语言网络 sql
linux中sql语法大全：MYSQL数据库什么是数据库：关系型数据管理系统数据库的结构层次：数据库文件(后缀名.db)->表单->字段->存储的数据数据库里面针对数据的所有操作，都需要使用指令去实现MYSQL数据库特点：特别适合web的环境，和PHP结合非常好低版本的MYSQL依旧是开源软件，适合用来做二次开发先安装一下mysql安装前，检测是否安装了mysql:rpm–qa|grepmysql
LINDDUN威胁建模原理和架构及案例 hao_wujing 人工智能
大家读完觉得有帮助记得关注和点赞！！！LINDDUN威胁建模框架是专注于隐私风险分析的系统化方法论，其名称源自七类隐私威胁的首字母缩写（Linking,Identifying,Non-repudiation,Detectability,Disclosure,Unawareness,Non-compliance）。以下从原理、架构及典型案例三方面展开深度解析：一、核心原理：隐私威胁分类与数据流分析1
基于生成对抗网络增强主动学习的超高温陶瓷硬度优化神经网络15044 深度学习算法仿真模型生成对抗网络学习人工智能
复现论文：基于生成对抗网络增强主动学习的超高温陶瓷硬度优化我将使用Python复现这篇关于使用生成对抗网络(GAN)增强主动学习来优化超高温陶瓷(UHTC)硬度的研究论文。以下是完整的实现代码和解释。1.环境准备和数据加载首先，我们需要准备必要的Python库并加载数据。importnumpyasnpimportpandasaspdimportmatplotlib.pyplotaspltimpor
分布式弹性故障处理框架——Polly(1)
1前言之服务雪崩在我们实施微服务之后，服务间的调用变得异常频繁，多个服务之前可能存在互相依赖的关系，当某个服务出现故障或者是因为服务间的网络出现故障，导致服务调用的失败，进而影响到某个业务服务处理失败，服务依赖的故障可能导致级联崩溃，如一个微服务不可用拖垮整个系统。【服务雪崩】服务雪崩通常遵循“从局部故障到全局崩溃”的递进路径，可拆解为以下步骤：初始故障某个基础服务（如数据库、缓存、第三方API）
投资总结之——2月投资总结，缩量震荡，利润回吐蛙声叫叫一家亲
“时间过得飞快，2023年过去了六分之一。2月份的行情没有了1月份让人回味的期待，指数走出的是缩量震荡下跌的行情，索然无味，对持仓缩水影响不少，青蛙君的资产收益从2月初创了新高后不断走下坡路。一样的剧本，3月的第一个交易日又是一波大涨，收益回来不少。整体收益资产整体配置比例为股票：可转债：基金：衍生品=5：7：4：2。资产收益展示启用净值法，并在月度净值基础上增加周净值，以便更客观地体现资产盈亏表
基于R、Python的Copula变量相关性分析及AI大模型应用梦想的初衷~ 环境气象人工智能 r语言 python
在工程、水文和金融等各学科的研究中，总是会遇到很多变量，研究这些相互纠缠的变量间的相关关系是各学科的研究的重点。虽然皮尔逊相关、秩相关等相关系数提供了变量间相关关系的粗略结果，但这些系数都存在着无法克服的困难。例如，皮尔逊相关系数只能反映变量间的线性相关，而秩相关则更多的适用于等级变量。大多数情况下变量间的相关性非常复杂，而且随着变量取值的变化而变化，而这些相关系数都是全局性的，因此无法提供变量间
DSC(Display Stream Compression) 显示流压缩技术解析
DSC(DisplayStreamCompression)是一种由VESA(视频电子标准协会)开发的视觉无损显示压缩技术，主要用于解决高分辨率、高刷新率显示设备的数据传输带宽问题。DSC技术核心特点视觉无损压缩：虽然是有损压缩，但人眼几乎无法察觉质量损失低延迟：压缩/解压延迟极低(通常<1行扫描时间)固定比率压缩：支持3:1、2:1和1.5:1等固定压缩比实时处理：能够实时压缩和解压视频流DSC工
HDMI、DisplayPort、USB-C 不同版本对比：带宽、刷新率、协议版本详解 TESmart碲视 KVM切换器领域相关技术电脑计算机外设智能硬件物联网
一、接口概览：HDMI、DP接口、USB-C到底是干嘛的？接口名称主要功能常见设备支持传输内容HDMI（High-DefinitionMultimediaInterface高清多媒体接口）专为高清音视频传输设计电视、显示器、显卡、游戏主机视频+音频DP（DisplayPort显示端口）高性能视频输出接口显卡、显示器、扩展坞视频+音频USB-C（带DPAlt模式支持DP替代模式）多功能数据传输接口笔
CCF编程能力等级认证GESP—C++1级—20250628
CCF编程能力等级认证GESP—C++1级—20250628单选题（每题2分，共30分）判断题（每题2分，共20分）编程题(每题25分，共50分)假期阅读值日单选题（每题2分，共30分）1、2025年4月19日在北京举行了一场颇为瞩目的人形机器人半程马拉松赛。比赛期间，跑动着的机器人会利用身上安装的多个传感器所反馈的数据来调整姿态、保持平衡等，那么这类传感器类似于计算机的()。A.处理器B.存储器
安装数据库首次应用 Array_06 java oracle sql
可是为什么再一次失败之后就变成直接跳过那个要求 enter full pathname of java.exe的界面这个java.exe是你的Oracle 11g安装目录中例如：【F:\app\chen\product\11.2.0\dbhome_1\jdk\jre\bin】下的java.exe 。不是你的电脑安装的java jdk下的java.exe！注意第一次，使用SQL D
Weblogic Server Console密码修改和遗忘解决方法 bijian1013 Welogic
在工作中一同事将Weblogic的console的密码忘记了，通过网上查询资料解决，实践整理了一下。一.修改Console密码打开weblogic控制台，安全领域 --> myrealm -->&n
IllegalStateException: Cannot forward a response that is already committed Cwind java Servlets
对于初学者来说，一个常见的误解是：当调用 forward() 或者 sendRedirect() 时控制流将会自动跳出原函数。标题所示错误通常是基于此误解而引起的。示例代码： protected void doPost() { if (someCondition) { sendRedirect(); } forward(); // Thi
基于流的装饰设计模式木zi_鸣设计模式
当想要对已有类的对象进行功能增强时，可以定义一个类，将已有对象传入，基于已有的功能，并提供加强功能。自定义的类成为装饰类模仿BufferedReader，对Reader进行包装，体现装饰设计模式装饰类通常会通过构造方法接受被装饰的对象，并基于被装饰的对象功能，提供更强的功能。装饰模式比继承灵活，避免继承臃肿，降低了类与类之间的关系装饰类因为增强已有对象，具备的功能该
Linux中的uniq命令被触发 linux
Linux命令uniq的作用是过滤重复部分显示文件内容，这个命令读取输入文件，并比较相邻的行。在正常情况下，第二个及以后更多个重复行将被删去，行比较是根据所用字符集的排序序列进行的。该命令加工后的结果写到输出文件中。输入文件和输出文件必须不同。如果输入文件用“- ”表示，则从标准输入读取。 AD： uniq [选项] 文件说明：这个命令读取输入文件，并比较相邻的行。在正常情况下，第二个
正则表达式Pattern 肆无忌惮_ Pattern
正则表达式是符合一定规则的表达式，用来专门操作字符串，对字符创进行匹配，切割，替换，获取。例如，我们需要对QQ号码格式进行检验规则是长度6~12位不能0开头只能是数字，我们可以一位一位进行比较，利用parseLong进行判断，或者是用正则表达式来匹配[1-9][0-9]{4,14} 或者 [1-9]\d{4,14} &nbs
Oracle高级查询之OVER (PARTITION BY ..) 知了ing oracle sql
一、rank()/dense_rank() over(partition by ...order by ...) 现在客户有这样一个需求，查询每个部门工资最高的雇员的信息，相信有一定oracle应用知识的同学都能写出下面的SQL语句： select e.ename, e.job, e.sal, e.deptno from scott.emp e, (se
Python调试矮蛋蛋 python pdb
原文地址： http://blog.csdn.net/xuyuefei1988/article/details/19399137 1、下面网上收罗的资料初学者应该够用了，但对比IBM的Python 代码调试技巧： IBM：包括 pdb 模块、利用 PyDev 和 Eclipse 集成进行调试、PyCharm 以及 Debug 日志进行调试： http://www.ibm.com/d
webservice传递自定义对象时函数为空，以及boolean不对应的问题 alleni123 webservice
今天在客户端调用方法 NodeStatus status=iservice.getNodeStatus(). 结果NodeStatus的属性都是null。进行debug之后，发现服务器端返回的确实是有值的对象。后来发现原来是因为在客户端，NodeStatus的setter全部被我删除了。本来是因为逻辑上不需要在客户端使用setter，结果改了之后竟然不能获取带属性值的
java如何干掉指针，又如何巧妙的通过引用来操作指针————>说的就是java指针百合不是茶
C语言的强大在于可以直接操作指针的地址，通过改变指针的地址指向来达到更改地址的目的,又是由于c语言的指针过于强大，初学者很难掌握， java的出现解决了c，c++中指针的问题 java将指针封装在底层，开发人员是不能够去操作指针的地址，但是可以通过引用来间接的操作：定义一个指针p来指向a的地址（&是地址符号）：
Eclipse打不开，提示“An error has occurred.See the log file ***/.log” bijian1013 eclipse
打开eclipse工作目录的\.metadata\.log文件，发现如下错误： !ENTRY org.eclipse.osgi 4 0 2012-09-10 09:28:57.139 !MESSAGE Application error !STACK 1 java.lang.NoClassDefFoundError: org/eclipse/core/resources/IContai
spring aop实例annotation方法实现 bijian1013 java spring AOP annotation
在spring aop实例中我们通过配置xml文件来实现AOP，这里学习使用annotation来实现，使用annotation其实就是指明具体的aspect,pointcut和advice。1.申明一个切面(用一个类来实现)在这个切面里,包括了advice和pointcut AdviceMethods.jav
[Velocity一]Velocity语法基础入门 bit1129 velocity
用户和开发人员参考文档 http://velocity.apache.org/engine/releases/velocity-1.7/developer-guide.html 注释 1.行级注释## 2.多行注释#* *# 变量定义使用$开头的字符串是变量定义，例如$var1, $var2, 赋值使用#set为变量赋值，例
【Kafka十一】关于Kafka的副本管理 bit1129 kafka
1. 关于request.required.acks request.required.acks控制者Producer写请求的什么时候可以确认写成功，默认是0， 0表示即不进行确认即返回。 1表示Leader写成功即返回，此时还没有进行写数据同步到其它Follower Partition中 -1表示根据指定的最少Partition确认后才返回，这个在 Th
lua统计nginx内部变量数据 ronin47 lua nginx　统计
server { listen 80; server_name photo.domain.com; location /{set $str $uri; content_by_lua ' local url = ngx.var.uri local res = ngx.location.capture(
java-11.二叉树中节点的最大距离 bylijinnan java
import java.util.ArrayList; import java.util.List; public class MaxLenInBinTree { /* a. 1 / \ 2 3 / \ / \ 4 5 6 7 max=4 pass "root"
Netty源码学习-ReadTimeoutHandler bylijinnan java netty
ReadTimeoutHandler的实现思路：开启一个定时任务，如果在指定时间内没有接收到消息，则抛出ReadTimeoutException 这个异常的捕获，在开发中，交给跟在ReadTimeoutHandler后面的ChannelHandler，例如 private final ChannelHandler timeoutHandler = new ReadTim
jquery验证上传文件样式及大小(好用) cngolon 文件上传 jquery验证
<!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=utf-8" /> <script src="jquery1.8/jquery-1.8.0.
浏览器兼容【转】 cuishikuan css 浏览器 IE
浏览器兼容问题一：不同浏览器的标签默认的外补丁和内补丁不同问题症状：随便写几个标签，不加样式控制的情况下，各自的margin 和padding差异较大。碰到频率:100% 解决方案：CSS里 *{margin:0;padding:0;} 备注：这个是最常见的也是最易解决的一个浏览器兼容性问题，几乎所有的CSS文件开头都会用通配符*来设
Shell特殊变量：Shell $0, $#, $*, $@, $?, $$和命令行参数 daizj shell $#$?特殊变量
前面已经讲到，变量名只能包含数字、字母和下划线，因为某些包含其他字符的变量有特殊含义，这样的变量被称为特殊变量。例如，$ 表示当前Shell进程的ID，即pid，看下面的代码： $echo $$ 运行结果 29949 特殊变量列表变量含义 $0 当前脚本的文件名 $n 传递给脚本或函数的参数。n 是一个数字，表示第几个参数。例如，第一个
程序设计KISS 原则-------KEEP IT SIMPLE, STUPID! dcj3sjt126com unix
翻到一本书，讲到编程一般原则是kiss：Keep It Simple, Stupid.对这个原则深有体会，其实不仅编程如此，而且系统架构也是如此。 KEEP IT SIMPLE, STUPID! 编写只做一件事情，并且要做好的程序；编写可以在一起工作的程序，编写处理文本流的程序，因为这是通用的接口。这就是UNIX哲学.所有的哲学真正的浓缩为一个铁一样的定律，高明的工程师的神圣的“KISS 原
android Activity间List传值 dcj3sjt126com Activity
第一个Activity： import java.util.ArrayList;import java.util.HashMap;import java.util.List;import java.util.Map;import android.app.Activity;import android.content.Intent;import android.os.Bundle;import a
tomcat 设置java虚拟机内存 eksliang tomcat 内存设置
转载请出自出处：http://eksliang.iteye.com/blog/2117772 http://eksliang.iteye.com/ 常见的内存溢出有以下两种: java.lang.OutOfMemoryError: PermGen space java.lang.OutOfMemoryError: Java heap space ------------
Android 数据库事务处理 gqdy365 android
使用SQLiteDatabase的beginTransaction()方法可以开启一个事务，程序执行到endTransaction() 方法时会检查事务的标志是否为成功，如果程序执行到endTransaction()之前调用了setTransactionSuccessful() 方法设置事务的标志为成功则提交事务，如果没有调用setTransactionSuccessful() 方法则回滚事务。事
Java 打开浏览器 hw1287789687 打开网址 open浏览器 open browser 打开url 打开浏览器
使用java 语言如何打开浏览器呢? 我们先研究下在cmd窗口中,如何打开网址使用IE 打开 D:\software\bin>cmd /c start iexplore http://hw1287789687.iteye.com/blog/2153709 使用火狐打开 D:\software\bin>cmd /c start firefox http://hw1287789
ReplaceGoogleCDN：将 Google CDN 替换为国内的 Chrome 插件 justjavac chrome Google google api chrome插件
Chrome Web Store 安装地址： https://chrome.google.com/webstore/detail/replace-google-cdn/kpampjmfiopfpkkepbllemkibefkiice 由于众所周知的原因，只需替换一个域名就可以继续使用Google提供的前端公共库了。同样，通过script标记引用这些资源，让网站访问速度瞬间提速吧
进程VS.线程 m635674608 线程
资料来源： http://www.liaoxuefeng.com/wiki/001374738125095c955c1e6d8bb493182103fac9270762a000/001397567993007df355a3394da48f0bf14960f0c78753f000 1、Apache最早就是采用多进程模式 2、IIS服务器默认采用多线程模式 3、多进程优缺点优点：多进程模式最大
Linux下安装MemCached 字符串 memcached
前提准备：1. MemCached目前最新版本为：1.4.22，可以从官网下载到。2. MemCached依赖libevent，因此在安装MemCached之前需要先安装libevent。2.1 运行下面命令，查看系统是否已安装libevent。[root@SecurityCheck ~]# rpm -qa|grep libevent libevent-headers-1.4.13-4.el6.n
java设计模式之--jdk动态代理（实现aop编程） Supanccy2013 java DAO 设计模式 AOP
与静态代理类对照的是动态代理类，动态代理类的字节码在程序运行时由Java反射机制动态生成，无需程序员手工编写它的源代码。动态代理类不仅简化了编程工作，而且提高了软件系统的可扩展性，因为Java 反射机制可以生成任意类型的动态代理类。java.lang.reflect 包中的Proxy类和InvocationHandler 接口提供了生成动态代理类的能力。 &
Spring 4.2新特性-对java8默认方法(default method)定义Bean的支持 wiselyman spring 4
2.1 默认方法(default method) java8引入了一个default medthod; 用来扩展已有的接口,在对已有接口的使用不产生任何影响的情况下,添加扩展使用default关键字 Spring 4.2支持加载在默认方法里声明的bean 2.2 将要被声明成bean的类 public class DemoService {

数据有价——数据资产定价研究初探

你可能感兴趣的:(数据有价——数据资产定价研究初探)