Demon的黑与白

条件随机场学习笔记

前言

这是在《统计学习方法》中学习到的最后一个方法了，不像其他统计方法，学完精气神超足，都能让我继续振奋好几日。然学完该方法，我陷入了沉思与迷茫。首先，对条件随机场的【提出】和【应用场景】一片混沌，其次，说说它的思想吧，无非加入了【空间属性】，相比最大熵模型，多加入了【边特征函数】，而随机变量【X，Y】的联合概率分布的表达式并没有发生本质变化，所以说，它还是一个我认为的【概率模型】。既然是【概率模型】，那么它依旧可以用【对数似然函数】进行迭代求解，事实也是这样做的。但我所不解的是为何概率表达式清一色的表示为exp和规范化因子呢？难道仅仅因为exp在求导和概率计算中有很好的性质么？

在知乎上【如何用简单易懂的例子解释条件随机场（CRF）模型？它和HMM有什么区别？】提到了一篇经典论文，对上述有疑问的童鞋们，可以参考一下，本人暂且不研读。
from Sutton, Charles, and Andrew McCallum. “An introduction to conditional random fields.” Machine Learning 4.4 (2011): 267-373.

条件随机场进阶一

这里先简单叙述下条件随机场的几个基本概念，方便后续理解。首先，【条件随机场】其实分为两个关键词【条件】和【随机场】，他俩需要明确区分，咱们分别叙述下。【条件】对应于【条件概率】，说起条件概率，我们就需要扯一扯【联合概率】，所以待会先来谈谈【联合概率】问题。其次，【随机场】对我来说是一个全新的概念，参考相关资料发现，它是单独定义的。所以，条件+随机场 = 条件随机场。

条件随机场的由来
如果参看《统计学习方法》第11章节的话，你会发现一个很有趣的现象。书中首先提到的是图，图有个很有趣的特性，你会发现每个节点都是平铺在一个平面上的，所以每个节点都有可能与另外一个结点阐述【联系】，也就是所谓的【E or 边】。有了图的定义，便开始定义【联合概率】分布下，各随机变量的图结构，并对每个节点进行约束，所谓的三种性质【成对马尔科夫性】、【局部马尔科夫性】和【全局马尔科夫性】，节点的约束一步步增强。定义完这些后，便在此基础上有了马尔科夫随机场的概念，我就呵呵了，你给我一堆定义，我怎么知道谁和谁是【组合】，谁是谁的【递进】关系啊。

好吧，还是按照自己的思路来重新梳理下吧。之前学习过隐马尔可夫模型的话，我们知道它是一个时间序列模型。起初对这个【时间】不以为然，隐马尔可夫模型中的节点，不就是一个个状态么，何必叫时间序列模型，还不如更名为状态序列模型。学到条件随机场，发现了HMM和CRF的一个显著区别，即节点与节点之间的边，HMM是有向的，而CRF是无向的。而时间序列，能很好的表达当前状态与之前状态有关而和后续状态无关这一特性，即在图中的有向性，因此时间序列模型相比状态模型更合适。而CRF则可以成为一个HMM的扩展，称为状态序列模型更合适，从【有向边】升级到【无向边】。

隐 马 尔 可 夫 模 型

条 件 随 机 场

这张图很好的描述了HMM和CRF之间的差异，暂且不去关注底下的公式和随机变量X，单独看

Y1∼Yn 的联合概率在图中的表现形式。是不是很有爱，有数学之美。

对于条件随机场是不有个简单的认识了，再来看看wiki上关于Random Field的定义。

A random field is a generalization of a stochastic process such that the underlying parameter need no longer be a simple real or integer valued “time”, but can instead take values that are multidimensional vectors, or points on some manifold.

注意我标黑的字词，我这里就大胆猜测下概率论研究的一个阶段成果，无实际根据，纯属个人臆想。在Demon同学的世界里，概率论现分为两个阶段，有向概率论和无向概率论。起初，为了研究现实生活中大量的【数据现象】，诸如统计欧洲黑死病每年死亡人数，通过数据判断黑死病是否逐年严重or维持在某个稳定状态。在那个时代，统计学者们收集到的大量数据，都存在一个明显的特征即随机变量的先后顺序，所以从维度上来看，对这些数据的研究，完全可以映射到二维的横轴和纵轴，横轴表示随机变量，而纵轴表示当前随机变量的出现概率。所以对概率密度函数的积分，你也会发现，它一定是从负无穷累加到当前时间点t，而不会继续积下去了。它对随机变量时间的统计是有向的。

这是一张经典的隐马尔可夫模型图，我们关注隐含状态的序列，你会发现在同一时刻，只有一个状态指向下一个状态，不会出现多个状态同时指向一个状态的情况发生，这是因为隐马尔可夫模型做了一个基本假设，即在同一时刻，不存在两个或者多个状态同时发生的情况，起初这的确合理，比如掷骰子的过程，一定是一次次投掷得出的结果，但对一维的时间如此，但对二维空间就一定是这样子么？

参看《统计学习方法》词性标注的例子

输入：At Microsoft Research, we have an insatiable curiosity and the desire to create new technology that will help define the computing experience.
输出：At/O Microsoft/B Research/E, we/O have/O an/O insatiable/B curiosity/E and/O the/O desire/BE to/O create/O new/B technology/E that/O will/O help/O define/O the/O computing/B experience/E.

这一内容在博文【隐马尔可夫学习笔记（一）】引出过，这里就不在详细叙述了。HMM所做的就是统计当前状态与前一状态在整个序列中出现的频次，从而估算出转移概率矩阵。它有个很明显的特征在于，假设语句是按时间顺序一个一个生成的，所以可以不用考虑当前单词与下一单词的关系，而只需统计与上一单词的联系。但在真正的训练过程当中，所有句子的训练集，并非单纯的一维时间啊，我们完全可以映射到二维空间中去，统计当前单词和上一单词以及前一单词的关系，这是完全可以做到的，因为程序在训练语料时，它把握了全局信息，而且从语义上来看，更加符合句子的构成。

所以说，条件随机场是隐马尔可夫模型的加强版，无非从原先的【时间维度】上升到了【空间维度】，而后者更加合理，每个状态所依赖的信息更多。

在这里引用博文【随机场（Random field）】中关于马尔科夫随机场的形象例子，它说

随机场包含两个要素：位置（site），相空间（phase space）。当给每一个位置中按照某种分布随机赋予相空间的一个值之后，其全体就叫做随机场。我们不妨拿种地来打个比方。“位置”好比是一亩亩农田； “相空间”好比是种的各种庄稼。我们可以给不同的地种上不同的庄稼，这就好比给随机场的每个“位置”，赋予相空间里不同的值。所以，俗气点说，随机场就是在哪块地里种什么庄稼的事情。

好了，明白了上面两点，就可以讲马尔可夫随机场了。还是拿种地打比方，如果任何一块地里种的庄稼的种类仅仅与它邻近的地里种的庄稼的种类有关，与其它地方的庄稼的种类无关，那么这些地里种的庄稼的集合，就是一个马尔可夫随机场。

马尔可夫随机场，描述了具有某种特性的集合。拿种地打比方，如果任何一块地里种的庄稼的种类仅仅与它邻近的地里种的庄稼的种类有关，与其它地方的庄稼的种类无关，那么这些地里种的庄稼的集合，就是一个马尔可夫随机场。

简单总结下概念，什么是马尔科夫随机场，首先随机变量由图中各节点表示，每个节点至少有一条边与其另一个节点相连（不会出现孤立节点，孤立节点毫无意义）。那么整个图由 Y1,Y2,...,Yn 节点，图所代表的物理含义为 P(Y1,Y2,...,Yn) 的联合概率，一定是联合概率，否则表示成图也没有任何意义。马尔科夫性在于当前节点只与相邻节点有关，它的概率受邻居影响。何谓随机场？从随机变量【一维时间序列】上升到了随机变量【二维空间图结构】，【有向】到【无向】的飞跃在于维度的上升，个人觉得拿它做区分欠妥，容易产生误解。

其实说了一大堆，我们只是在阐述隐马尔可夫模型和马尔科夫随机场的区别，根本还未涉及条件随机场的概念。刚才说了随机场一定表现为【联合概率】，因此随机变量一定是作为一个整体出现的，我们可以用图去刻画，这点很明确了，给你某个马尔科夫随机场吧，用图来表示各节点与边的关系，记作 G(V,E) 。那么 P(Y1,...,Yn) 表示该图的值咯，所以简单点

P (G (V, E)) = P (Y 1, Y 2, . . ., Y n)

好了，条件随机场是什么？很显然，对于每个随机变量 Yn 是否还需要做些限定呢？否则怎么能叫条件随机场呢？所以对于每个单独的随机变量 Yn 都有一个条件 Xn 做限定，条件概率为 P(Yn|Xn) ，限定约束在节点上即可。图结构参考如下：

线 性 链 条 件 随 机 场

X 和 Y 有 相 同 的 图 结 构 的 线 性 链 条 件 随 机 场

这才是我们真正的条件随机场，已知一堆样本数据，无非求 P(Y|X) 在输入序列为 X 的情况下，最有可能输出序列 Y 。

条件随机场进阶二

怎么说呢，看了“An introduction to conditional random fields.” Machine Learning 4.4 (2011): 267-373.的第二章内容，发现一张图就能完全概括条件随机场的由来。见下图：

从图中你能找到CRF所处的位置，它可以从朴素贝叶斯方法【用于分类】经过【sequence】得到HMM模型，再由HMM模型【conditional】就得到了CRF。或者由朴素贝叶斯方法【conditional】成逻辑斯蒂回归模型，再【sequence】成CRF，两条路径均可。

在该论文中，它提出了两个模型分别叫做【generative model】和【discriminative model】，中文分别是【生成模型】和【判别模型】。朴素贝叶斯和隐马尔可夫模型被归为生成模型，而逻辑斯蒂回归模型和条件随机场被归为判别模型。它们有何区别？这里我拿朴素贝叶斯模型和逻辑斯蒂回归模型举例，来说说自己的看法。

首先来看看朴素贝叶斯的模型：

P (Y | X) = P ( Y ) P ( X | Y ) P ( X )

其中X可以是特征向量，

X=(x1,x2,...,xn) ，朴素贝叶斯的一个假设在与每个特征独立同分布，所以

P(X|Y)=P(x1|Y)P(x2|Y)⋯P(xn|Y) 。整理得：

P (Y, X) = P (Y) \prod i = 1 n P (x i | Y)

而逻辑斯蒂回归模型长什么样？同样的，对于分类问题，有输入空间 X=(x1,x2,...,xn) ，那么整个模型为：

P (Y | X) = 1 Z e x p (θ y + \sum i = 1 n θ y i f i (X, Y))

其中，Z为规范化因子。如果特征函数

fi(X,Y)=xi 情况下，就是一般形式的逻辑斯蒂回归模型了。

对于这两个模型有何区别么？不急，先来看看这张图。

怎么说呢，我找了很久的区别，但始终没有发现朴素贝叶斯和逻辑斯蒂回归模型的本质，令我更加头疼的是，即时发现了一些区别，但始终无法理解这些区别如何作用于数据集，如何影响预测结果。

先来说说朴素贝叶斯吧，在朴素贝叶斯中，它的模型是以联合概率 P(Y,X) 体现的，从图中也能看出，只要我们求出了每个特征随机变量x的分布，如在《统计学习方法》第四章的例4.1所示，有两个特征，分别表示为 x1,x2 且 x1∈1,2,3，x2∈S,M,L ，那么朴素贝叶斯的做法是，给你一堆数据集，分别求出 P(x1|Y=1)和P(x1|y=−1) 的分布，注意，这里是随机变量 x1 ，同理，也能求得随机变量 x2 的分布，又由于朴素贝叶斯各特征之间独立同分布的假设，所以联合概率 P(Y,X) 就是两个随机分布的乘机再乘以标签 Y 的分布。

什么意思呢，如果从逻辑斯蒂回归模型的角度去表示朴素贝叶斯，那么该怎么表示呢？

P (Y, X) = P (Y = y c) \cdot \prod i = 1 n P (X = x i | Y = y c) = e x p [log P (y c)] e x p [\sum i = 1 n log P (x i | y c)] = e x p {θ y + \sum i = 1 n θ y i [X = x i 且 Y = y c]}

其中

θy=logP(yc),θyi=logP(xi|yc) ，

[X=xi|Y=yc] 表示指示函数，当且仅当方括号中的条件满足时，取值为1否则为0，也就是最大熵模型中的特征函数

fi(xi,yc) 。如果式子写到这里，想比较两者的区别，是得不到任何有趣的东西，这点我想了很久，在于忽略了一个重要的因素，仔细观察条件概率

P(xi|yc) ，X是一个特征向量，而在每个特征向量中，还有随机变量

xi ，所以，式子到这还没有结束，应为

P (Y, X) = e x p {θ y + \sum i = 1 n \sum k = 1 K θ y i k [X = x i k 且 Y = y c]}

很可惜，这里只选中第

i 个随机变量的第

k 个值，所以式子又进一步简化为：

P (Y, X) = e x p {θ y + \sum i = 1 n θ y i k [X = x i k 且 Y = y c]}

这就是从逻辑斯蒂回归模型看贝叶斯模型，我们能得到一个什么样的结论？对于输入空间

X ，每个特征的分布我们都会求出来，如特征

x1 的条件分布

p(x1|yc) 。所以朴素贝叶斯根据给定的训练集求的是

P(X|Y=yc) 的整体分布。从图来看的话，每个随机变量

xi 的节点值为1，而边权值代表了每个节点

xi 的分布。

总结完朴素贝叶斯，回过头来看看逻辑斯蒂回归模型的定义，我们参考《统计学习方法》第六章的内容。

P (Y | X) = 1 Z ( X ) e x p {θ y + \sum i = 1 n θ y i x i}

首先，逻辑斯蒂回归模型最终模型表达为条件概率，而非联合概率，这是一个区别，其次仔细对比exp中的内容，你会发现参数

θyi 后的【特征函数】有区别，没错，这是我能看到的最大区别。如果说之前

xi 为随机变量，那么这里就不再考虑输入空间

xi 的状态数了，而是直接作为值输入到模型中进行训练，从图中可以发现，节点

xi 的值并不是1，而是具体的某个任何可能的实数。逻辑斯蒂回归模型，并不计算

P(xi|yc) 的分布，而是把每个特征的实际值代入模型，进行整体训练。虽然是这么说，但我不知道怎么整体训练，难道是把所有的特征组合的联合概率

P(X|yc) 都看成一个黑盒？这点着实不太明白。但逻辑斯蒂回归模型相比朴素贝叶斯方法，它的模型更加灵活，因为特征函数可以选取指示函数，也可以是

q(xi) 的实数映射，可以说是朴素贝叶斯的推广吧。

以上虽然能看出两者的一些区别，但却不知道这些区别对模型训练有何影响，只作为单纯的个人思考笔记，知识有限，暂且不解答了。接下来咱们继续条件随机场的内容。

可以明确的是，条件随机场是从最大熵模型那里衍化过来的，所以它们的条件概率表达式清一色的为exp函数与规范化因子。

P (Y | X) = 1 Z ( X ) e x p (\sum i, k λ k t k (y i - 1, y i, x, i) + \sum i, l μ l s l (y i, x, i))

在最大熵模型中或者说是逻辑斯蒂回归模型中，exp里只包含 f(y,x) 的联合特征函数，而在CRF中，多了一项所谓的标签之间的关系，也就是 tk(yi−1,yi,x,i) ，所以自然求的也是序列的联合概率。那么问题有回到了HMM所提出的三个问题，该式的联合概率该怎么求，式中的参数该怎么训练得到。

条件随机场进阶三

概率计算问题

节点在图中的概率计算
条件随机场的概率计算和HMM的概率计算没有本质区别，可以说是完全一样的，这里就不再赘述了，详细的可以参考博文【隐马尔可夫学习笔记（一）】中的前向算法以及【隐马尔可夫模型之Baum-Welch算法详解】中的前向后向算法。

这里就阐述下大致思路，此处都是为了计算每个节点的概率，如书中提到的 P(Y=yi|x) 的概率，对于这类概率计算，从图的模型该怎么得到呢？这类问题我们用个前向算法或者后向算法其中的任何一个就可以解决了。前向or后向算法，都是扫描一遍整体的边权值，计算图的 P(X) ，指示它们扫描的方向不同，一个从前往后，一个从后往前。所以书中的公式：

P (x) = Z (x) = \sum y P (y, x) = α T n (x) \cdot 1 = 1 T \cdot β 1 (x)

这里的计算和HMM模型没什么两样。有了

P(x) ，那么

P(Y=yi|x) 的概率也就显而意见了，无非是联合概率

P(yi,x)/P(x) ，而某个i状态的联合概率，很容易求解，分别从前向和后向扫描至i状态，对应的i状态的每个随机变量的联合概率就求出来了，如书上所示：

P (Y i = y i | x) = α T i ( y i | x ) β i ( y i | x ) Z ( x )

而条件概率，稍许有些麻烦，但看一张图就明白了，如下图所示：

公式如下：

P (Y i - 1 = y i - 1, Y i = y i | x) = α T i - 1 ( y i - 1 | x ) M i ( y i - 1 , y i | x ) β i ( y i | x ) Z ( x )

中间无非有一条边需要考虑下，用

Mi(yi−1,yi|x) 表示。

期望的计算
书中介绍了两种期望值的计算，分别是联合分布 P(X,Y) 和条件分本 P(Y|X) 的数学期望，对谁期望，这里是对特征函数求期望，具体的用处暂时还不明了。（为何对特征函数求期望？）

从公式理解的话，对特征函数求期望，就是对图中的每条边求期望，边的值变成了随机变量，而一条边的出现跟连接两个边的节点有关系，如对特征 fk(yi−1,yi,x,i) 第i时刻的某条边，那么能出现这种情况的条件概率为 P(yi−1,yi|x) ，所以对 P(Y|X) 的期望如下，即所有边的期望和。

E P (Y | X) [f k] = \sum y P (y | x) f k (y, x) = \sum i = 1 n + 1 \sum y i - 1 y i f k (y i - 1, y i, x, i) α T i - 1 ( y i - 1 | x ) M i ( y i - 1 , y i | x ) β i ( y i | x ) Z ( x )

内累加和表示对第i-1个状态和第i个状态的所有 yi−1,yi 的边值求期望，外累加和是对整个序列求期望，总和即为整个 P(Y|X) 关于特征函数 fk 的期望。

第二个期望利用了经验分布 P^(X) ，可以求得特征函数关于 P(Y,X) 的数学期望：

E p (X, Y) [f k] = \sum x, y P (X, Y) \sum i = 1 n + 1 f k (y i - 1, y i, x, i) = \sum x P^(x) \sum i = 1 n + 1 \sum y i - 1 y i f k (y i - 1, y i, x, i) α T i - 1 ( y i - 1 | x ) M i ( y i - 1 , y i | x ) β i ( y i | x ) Z ( x )

这里不明白为什么求联合分布的时候，用的是经验分布 P^(x) 而不是直接用 Z(x) 代替，难道是说 P(X,Y) 的分布是不知道的？ P(x) 的分布是不知道的？

参数学习算法

参数模型算法与最大熵模型算法的理论推导没有什么区别，就是对训练的对数似然函数

L (w) = L p^(P w) = log \prod x, y P w (y | x) P^(x, y)

求极大的过程，具体的算法思想可以参看博客【最大熵模型与GIS ，IIS算法】。

预测算法

维特比算法采用了经典的动态规划思想，该算法和HMM又是完全一致的，所以也不需要重新再推导一遍，可直接参看博文【隐马尔可夫学习笔记（一）】的维特比算法。但这里重新回顾一遍的同时，有了一些新的感悟，为什么需要使用维特比算法，而不是像最大熵模型那样，直接代入输入向量x即可。简单来说，是因为在整个图中，每个节点都是相互依赖，所以单纯的代入 P(Y|X) 是行不通的，你没法知道，到底哪个标签与哪个标签是可以联系在一块，所以必须把这个问题给【平铺】开来，即计算每一种可能的组合，但一旦平铺你会发现，如果穷举，那么运行时间是 O(kT) ，k为标签数，T为对应的序列状态数。算法的开销相当大，而采用动态规划的一个好处在于，我们利用空间换时间，在某些中间节点直接记录最优值，以便前向扫描的过程中，直接使用，那么自然地运行时间就下去了。

Code Time

分析并实现CRF源码，是一项大工程，所以这篇博文暂且不去实现了，后续会专门开几篇文章来介绍相关的迭代算法，条件随机场涉及的迭代算法有【IIS算法】、【拟牛顿法】、【BFGS算法】，下回分析。

参考文献

李航. 统计学习方法[M]. 北京：清华大学出版社，2012
如何用简单易懂的例子解释条件随机场（CRF）模型？它和HMM有什么区别？
Sutton, Charles, and Andrew McCallum. “An introduction to conditional random fields.” Machine Learning 4.4 (2011): 267-373.
隐马尔可夫学习笔记（一）
随机场（Random field）
隐马尔可夫学习笔记（一）
隐马尔可夫模型之Baum-Welch算法详解
最大熵模型与GIS ，IIS算法

Anaconda 和 Miniconda：功能详解与选择建议古月฿ python入门 python conda
Anaconda和Miniconda详细介绍一、Anaconda的详细介绍1.什么是Anaconda？Anaconda是一个开源的包管理和环境管理工具，在数据科学、机器学习以及科学计算领域发挥着关键作用。它以Python和R语言为基础，为用户精心准备了大量预装库和工具，极大地缩短了搭建数据科学环境的时间。对于那些想要快速开展数据分析、模型训练等工作的人员来说，Anaconda就像是一个一站式的“数
机器学习必备数学与编程指南：从入门到精通 a小胡哦机器学习基础机器学习人工智能
一、机器学习核心数学基础1.线性代数（神经网络的基础）必须掌握：矩阵运算（乘法、转置、逆）向量空间与线性变换特征值分解与奇异值分解(SVD)为什么重要：神经网络本质就是矩阵运算学习技巧：用NumPy实际操作矩阵运算2.概率与统计（模型评估的关键）核心概念：条件概率与贝叶斯定理概率分布（正态、泊松、伯努利）假设检验与p值应用场景：朴素贝叶斯、A/B测试3.微积分（优化算法的基础）重点掌握：导数与偏导
AI 生成虚拟宠物：24 小时陪你聊天解闷大力出奇迹985 人工智能宠物
本文围绕AI生成虚拟宠物展开，介绍这类依托人工智能技术诞生的虚拟伙伴，能实现24小时不间断陪伴聊天，为人们解闷。文中详细阐述其技术基础，包括自然语言处理、机器学习等；分析多样功能，如个性化互动、情绪回应等；探讨在独居人群、压力大者等不同群体中的应用场景，最后总结其为人们生活带来的积极影响及未来发展潜力，展现AI虚拟宠物在陪伴领域的独特价值。一、AI生成虚拟宠物的诞生背景与技术基石在快节奏的现代社会
基于Python的AI健康助手：开发与部署全攻略 AI算力网络与通信 AI算力网络与通信原理 AI人工智能大数据架构 python 人工智能开发语言 ai
基于Python的AI健康助手：开发与部署全攻略关键词：Python、AI健康助手、机器学习、自然语言处理、Flask、部署、健康管理摘要：本文将详细介绍如何使用Python开发一个AI健康助手，从需求分析、技术选型到核心功能实现，再到最终部署上线的完整过程。我们将使用自然语言处理技术理解用户健康咨询，通过机器学习模型提供个性化建议，并展示如何用Flask框架构建Web应用接口。文章包含大量实际代
数据分析领域中AI人工智能的发展前景展望 AI大模型应用工坊 AI大模型开发实战数据分析人工智能数据挖掘 ai
数据分析领域中AI人工智能的发展前景展望关键词：数据分析、人工智能、机器学习、深度学习、数据挖掘、预测分析、自动化摘要：本文深入探讨了人工智能在数据分析领域的发展现状和未来趋势。我们将从核心技术原理出发，分析AI如何改变传统数据分析范式，详细讲解机器学习算法在数据分析中的应用，并通过实际案例展示AI驱动的数据分析解决方案。文章还将探讨行业应用场景、工具生态以及未来发展面临的挑战和机遇，为数据分析师
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
数据中台中的数据科学工作台：Jupyter集成方案 AI大数据智能洞察大数据与AI人工智能 jupyter 信息可视化 ide ai
数据中台中的数据科学工作台：Jupyter集成方案关键词：数据中台、数据科学工作台、JupyterNotebook、数据科学、机器学习、数据可视化、协作开发摘要：本文深入探讨了在数据中台架构中集成JupyterNotebook作为数据科学工作台的完整解决方案。我们将从数据中台的基本概念出发，详细分析Jupyter在数据科学工作流中的核心作用，介绍多种集成方案和技术实现细节，并通过实际案例展示如何构
2018年中南大学中英翻译某翁
参考：20180827235856533.jpg【1】机器学习理论表明，机器学习算法能从有限个训练集样本上得到较好的泛化【1】Machinelearningtheoryshowsthatmachinelearningalgorithmcangeneralizewellfromfinitetrainingsetsampleslimited有限的infinite无限的【2】这似乎违背了一些基本的逻辑准
今年校招竞争真激烈 12_05
程序员满大街，都要找不到工作了。即使人工智能满大街，我也后悔当初没学机器学习，后悔当初没学Java。C++真难找工作。难道毕了业就失业吗？好担心！
基于随机森林的白酒风味智能分类系统：从数据到洞察的完整实践笙囧同学 python
作者：笙囧同学|中科院计算机大模型方向硕士|全栈开发爱好者座右铭：偷懒是人生进步的阶梯联系方式：[email protected]各大平台账号/公众号：笙囧同学前言大家好，我是笙囧同学！今天给大家分享一个超级有趣且技术含量爆表的项目——白酒风味智能分类系统。作为一个既爱技术又爱美酒的程序员，我花了大量时间研究如何用机器学习的方法来"品酒"，让AI帮我们识别白酒的风味特征。这个项目融合了机器学习、数
Spring AI与机器学习：智能应用开发新范式 tmjpz04412 人工智能 spring 机器学习
SpringAI与机器学习的整合SpringAI是一个基于Spring生态的AI开发框架，旨在简化智能应用的开发流程。通过SpringAI，开发者可以快速集成机器学习模型，构建高效的智能应用。SpringAI支持多种机器学习库和框架，如TensorFlow、PyTorch和Scikit-learn，提供统一的API接口。SpringAI的核心优势在于其模块化设计和自动化配置。开发者无需关心复杂的依
PyTorch 使用指南
PyTorch是一个功能强大且灵活的Python开源机器学习库，以其动态计算图和直观的Pythonic接口而闻名。本指南将带您了解PyTorch的基础操作，包括张量创建、自动求导，以及如何构建、训练和优化神经网络模型。我们还将深入探讨其在图像分类（以CIFAR-10为例）和自然语言处理（以灾难推文分类为例）等特定领域的应用，并概述其在图像分割和强化学习等其他领域的应用。PyTorch使用指南1.P
Python 4.0新特性解析：性能优化与语法升级知识产权13937636601 计算机 python 性能优化开发语言
本文针对Python4.0的核心升级展开系统性分析，从性能优化与语法革新两个维度揭示其技术突破。首先解析新型解释器架构对运算效率的提升路径，其次探讨模式匹配、异步编程简化和类型系统强化等语法特性，最后结合机器学习与高并发场景验证新版本的实践价值。研究发现，Python4.0通过JIT编译器与内存管理重构实现3倍以上性能跃升，同时静态类型推导的完善显著提升大型项目维护效率，标志着Python从"胶水
Python,C++,go语言开发社会犯罪人群回归社会跟踪与辅助管理APP Geeker-2025 python c++golang
开发一款用于**社会犯罪人群回归社会跟踪与辅助管理**的App，结合Python、C++和Go语言的优势，可以实现高效的数据处理、实时的跟踪监控以及用户友好的前端界面。以下是一个详细的开发方案，涵盖技术选型、功能模块、开发步骤等内容。##技术选型###后端（Python+Go）-**编程语言**：-**Python**：用于数据处理、机器学习（如风险评估、行为预测）、脚本编写等。-**Go**：用
IoTDB智能分析节点AINode：时序数据分析的新引擎时序数据说 iotdb 数据分析数据挖掘时序数据库数据库大数据 ai
在大数据与物联网的驱动下，时序数据处理需求激增，如何高效存储、管理并实时分析海量时序数据成为技术挑战。作为专为时序数据设计的数据库，IoTDB通过引入智能分析节点（AINode），将机器学习能力原生集成到数据库中，实现了“数据存储-分析-决策”的一体化闭环。本文将深入解析AINode的核心功能、技术优势及实际应用场景。AINode：IoTDB的智能分析引擎AINode是IoTDB推出的第三种内生节
【免费下载】探索PlantVillage-Dataset：深度学习在植物病害检测中的革命性突破
探索PlantVillage-Dataset：深度学习在植物病害检测中的革命性突破在这个数字化时代，人工智能正逐步改变我们的生活，其中深度学习在农业领域的应用尤其引人注目。PlantVillage-Dataset是一个开放源代码的项目，它提供了一个庞大的植物病害识别数据集，旨在帮助开发人员和研究者利用机器学习技术改善农作物健康状况的监测。本文将深入探讨该项目的技术细节、应用价值及其独特之处。项目简
Python 的 GIL 时代即将终结，迈向真正的多线程时代技术狂潮AI Python开发实战 AI编程实战 AI应用实战开发语言 GIL Python
Python功能强大、灵活且对程序员友好，广泛应用于从Web开发到机器学习的各个领域。根据引用次数最多的两项指标，Python甚至超越了Java和C等语言，成为最流行的编程语言。经过多年的流行，Python似乎势不可挡。但Python作为一种编程语言的未来发展至少面临一个重大障碍。它被称为GIL，即全局解释器锁，几十年来，Python开发人员一直试图将其从Python的默认实现中删除。虽然GIL在
如何从零开始入行机器学习
在当今的科技浪潮中，机器学习无疑是最耀眼的明星之一。它不仅引领了人工智能的发展，还在各个行业中催生了大量的创新和变革。对于那些对技术充满热情、渴望在这个领域有所作为的人来说，“如何从零开始入行机器学习”成为了最热门的话题之一。这不仅仅是技术上的挑战，更是一个职业生涯的新起点。想象一下，在未来的工作中，你能够开发出自动识别图像的应用程序，或者设计一个可以预测市场趋势的智能系统，这一切都源于你现在迈出
如何评价开课吧机器学习特训营这个课程？ cda2024 机器学习人工智能
开场：点明主题，吸引眼球在当今数据驱动的时代，机器学习（MachineLearning）已经成为各个行业不可或缺的技术之一。无论是金融、医疗、制造还是零售，机器学习的应用都为这些领域带来了巨大的变革。面对这样的趋势，许多人都希望能够掌握这门技术，从而提升自己的职业竞争力。那么，当我们谈论“如何评价开课吧机器学习特训营这个课程”时，实际上是在探讨一个非常具体且重要的问题：对于那些希望进入或深入机器学
Anaconda（AI生成测试） harrio_ python
技术文章大纲：Anaconda插件开发挑战赛引言Anaconda作为数据科学与机器学习的核心工具，其插件生态系统的扩展性为开发者提供了广阔的创新空间。插件开发挑战赛旨在激励开发者探索Anaconda的潜力，解决实际场景中的技术痛点。以下为技术文章的核心框架。Anaconda插件开发的核心价值插件开发能够增强Anaconda的功能模块化，例如集成新的编程语言支持、优化包管理流程或扩展可视化工具。通过
Python与机器学习库Scikit-learn进阶 master_chenchengg python python Python python开发 IT
Python与机器学习库Scikit-learn进阶Scikit-learn进阶之旅：从新手到高手的必经之路为什么选择Scikit-learn？安装与环境设置特征工程的艺术：打造更强大的预测模型数据清洗特征构造模型调优秘籍：网格搜索与交叉验证的最佳实践网格搜索交叉验证集成学习的魅力：提升模型性能的组合拳随机森林梯度提升机堆叠实战案例解析：使用Scikit-learn解决真实世界问题数据准备模型训练
表征学习：机器认知世界的核心能力与前沿突破大千AI助手人工智能 #OTHER Python 学习人工智能机器学习神经网络表征学习 RL 特征工程
一、定义与背景：从特征工程到自动化学习表征学习（RepresentationLearning），又称特征学习（FeatureLearning），是机器学习的核心技术领域，其核心目标是通过算法自动学习数据的内在特征表示，将复杂多变的原始数据（如图像、文本、语音）转化为低维、富含语义信息的向量形式，从而提升下游任务（如分类、回归、聚类）的效率和精度。与传统依赖人工设计特征的特征工程（FeatureEn
踏上人工智能之旅（一）-----机器学习之knn算法 Sunhen_Qiletian 人工智能机器学习算法 python
目录一、机器学习是什么（1）概述（2）三种类型1.监督学习（SupervisedLearning）：2.无监督学习（UnsupervisedLearning）：3.强化学习（ReinforcementLearning）：二、KNN算法的基本原理：1.距离度量：2.K值的选择：3.投票机制和投票：三、Python实现KNN算法1.导入必要的库和数据：2.提取特征和标签：3.导入KNN分类器并训练模型
【Python】pandas.cut()函数的用法
pandas.cut()函数是一个非常有用的工具，用于将数值型数据按照指定的分箱或区间进行分割，从而将连续的数值变量转换为离散的类别变量。这在数据分析和机器学习的特征工程中尤其有用，因为它可以帮助揭示不同区间内的数据分布特征，或者简化模型的输入。基本用法pandas.cut()的基本语法如下：pandas.cut(x,bins,right=True,labels=None,retbins=Fals
以AI人工智能为核心，发展空间智能 AI智能探索者 AI Agent 智能体开发实战人工智能 ai
以AI人工智能为核心，发展空间智能关键词：人工智能、空间智能、智能系统、机器学习、计算机视觉、物联网、自动化技术摘要：本文围绕"以AI人工智能为核心发展空间智能"这一主题，系统解析空间智能的技术架构与实现路径。通过揭示AI与空间智能的核心关联，深入探讨机器学习、计算机视觉、数字孪生等关键技术如何赋能空间数据的感知、处理与决策。结合智能建筑、智慧城市等实际场景，展示从算法原理到工程落地的完整技术链条
Python金融分析：情感分析在量化价值投资中的完整实现 AI量化价值投资入门到精通 python 金融开发语言 ai
Python金融分析：情感分析在量化价值投资中的完整实现关键词：Python金融分析、情感分析、量化投资、价值投资、自然语言处理、机器学习、金融文本挖掘摘要：本文系统解析如何将情感分析技术深度整合到量化价值投资体系中，通过Python实现从金融文本数据采集、预处理、情感建模到策略回测的完整流程。详细阐述基于规则引擎、机器学习和深度学习的多维度情感分析方法，结合财务指标构建复合投资模型，并通过实战案
通用图片 OCR 到 Word API 数据接口 2301_78772565 ocr
通用图片OCR到WordAPI数据接口高可用图像识别引擎，基于机器学习，超精准识别率。1.产品功能通用的识别接口，支持多种图片格式；支持中英文字符混合识别；支持Base64以及网络地址传参；基于机器学习不断提高的识别率；输出的Word文件永久存储；数据持续更新与维护；全接口支持HTTPS（TLSv1.0/v1.1/v1.2/v1.3）；全面兼容AppleATS；全国多节点CDN部署；接口极速响应，
机器学习模型评估：交叉验证、混淆矩阵、ROC曲线及其在医学影像领域的应用猿享天开机器学习矩阵人工智能 DICOM医学影像模型评估
博主简介：CSDN博客专家、CSDN平台优质创作者，高级开发工程师，数学专业，10年以上C/C++,C#,Java等多种编程语言开发经验，拥有高级工程师证书；擅长C/C++、C#等开发语言，熟悉Java常用开发技术，能熟练应用常用数据库SQLserver,Oracle,mysql,postgresql等进行开发应用，熟悉DICOM医学影像及DICOM协议,业余时间自学JavaScript,Vue,
深入详解：决策树在医学影像分割特征选择中的应用与实现猿享天开决策树算法机器学习人工智能
深入详解：决策树在医学影像分割特征选择中的应用与实现决策树（DecisionTree）作为一种经典的机器学习算法，以其简单、直观和可解释性强的特点，在医学影像分割的特征选择中扮演了重要角色。医学影像分割（如分割脑肿瘤、肝脏、肺结节等）需要从高维影像数据中提取关键特征，以提升分割模型的精度和效率。决策树通过构建树形结构，筛选对分割任务最重要的特征，降低数据维度，同时提供可解释的规则。本文将从原理、实
机器学习概述炀水机器学习人工智能
一、机器学习算法与流程（一）、机器学习的主要流程：1.明确分析目标，2.数据收集，3.数据预处理，4.建模分析，5.结果评估，6.部署使用以及学习更新。1.明确分析目标：客观反映用户需求，通过对各类人群的深入分析，为相关部门制订资费、服务、市场策略提供基础。2.数据收集：收集相关的数据，充足、全面的高质量数据是机器学习的基础。3.数据预处理：数据可能存在着噪声、不一致、异常、个人隐私保护等各类问题
rust的指针作为函数返回值是直接传递，还是先销毁后创建？ wudixiaotie 返回值
这是我自己想到的问题，结果去知呼提问，还没等别人回答，我自己就想到方法实验了。。 fn main() { let mut a = 34; println!("a's addr:{:p}", &a); let p = &mut a; println!("p's addr:{:p}", &a
java编程思想 -- 数据的初始化百合不是茶 java 数据的初始化
1.使用构造器确保数据初始化 /* *在ReckInitDemo类中创建Reck的对象 */ public class ReckInitDemo { public static void main(String[] args) { //创建Reck对象 new Reck(); } }
[航天与宇宙]为什么发射和回收航天器有档期 comsci
地球的大气层中有一个时空屏蔽层,这个层次会不定时的出现,如果该时空屏蔽层出现,那么将导致外层空间进入的任何物体被摧毁,而从地面发射到太空的飞船也将被摧毁... 所以,航天发射和飞船回收都需要等待这个时空屏蔽层消失之后,再进行 &
linux下批量替换文件内容商人shang linux 替换
1、网络上现成的资料　　格式: sed -i "s/查找字段/替换字段/g" `grep 查找字段 -rl 路径` 　　linux sed 批量替换多个文件中的字符串　　sed -i "s/oldstring/newstring/g" `grep oldstring -rl yourdir` 　　例如：替换/home下所有文件中的www.admi
网页在线天气预报 oloz 天气预报
网页在线调用天气预报 <%@ page language="java" contentType="text/html; charset=utf-8" pageEncoding="utf-8"%> <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transit
SpringMVC和Struts2比较杨白白 springMVC
1. 入口 spring mvc的入口是servlet，而struts2是filter（这里要指出，filter和servlet是不同的。以前认为filter是servlet的一种特殊），这样就导致了二者的机制不同，这里就牵涉到servlet和filter的区别了。参见：http://blog.csdn.net/zs15932616453/article/details/8832343 2
refuse copy, lazy girl! 小桔子 copy
妹妹坐船头啊啊啊啊！都打算一点点琢磨呢。文字编辑也写了基本功能了。。今天查资料，结果查到了人家写得完完整整的。我清楚的认识到： 1.那是我自己觉得写不出的高度 2.如果直接拿来用，很快就能解决问题 3.然后就是抄咩~~ 4.肿么可以这样子，都不想写了今儿个，留着作参考吧！拒绝大抄特抄，慢慢一点点写！
apache与php整合 aichenglong php apache web
一 apache web服务器 1 apeche web服务器的安装 1)下载Apache web服务器 2)配置域名(如果需要使用要在DNS上注册) 3)测试安装访问http://localhost/验证是否安装成功 2 apache管理 1)service.msc进行图形化管理 2)命令管理，配
Maven常用内置变量 AILIKES maven
Built-in properties ${basedir} represents the directory containing pom.xml ${version} equivalent to ${project.version} (deprecated: ${pom.version}) Pom/Project properties Al
java的类和对象百合不是茶 JAVA面向对象类对象
java中的类： java是面向对象的语言，解决问题的核心就是将问题看成是一个类，使用类来解决 java使用 class 类名来创建类，在Java中类名要求和构造方法，Java的文件名是一样的创建一个A类： class A{ } java中的类：将某两个事物有联系的属性包装在一个类中，再通
JS控制页面输入框为只读 bijian1013 JavaScript
在WEB应用开发当中，增、删除、改、查功能必不可少，为了减少以后维护的工作量，我们一般都只做一份页面，通过传入的参数控制其是新增、修改或者查看。而修改时需将待修改的信息从后台取到并显示出来，实际上就是查看的过程，唯一的区别是修改时，页面上所有的信息能修改，而查看页面上的信息不能修改。因此完全可以将其合并，但通过前端JS将查看页面的所有信息控制为只读，在信息量非常大时，就比较麻烦。
AngularJS与服务器交互 bijian1013 JavaScript AngularJS $http
对于AJAX应用（使用XMLHttpRequests）来说，向服务器发起请求的传统方式是：获取一个XMLHttpRequest对象的引用、发起请求、读取响应、检查状态码，最后处理服务端的响应。整个过程示例如下： var xmlhttp = new XMLHttpRequest(); xmlhttp.onreadystatechange
[Maven学习笔记八]Maven常用插件应用 bit1129 maven
常用插件及其用法位于：http://maven.apache.org/plugins/ 1. Jetty server plugin 2. Dependency copy plugin 3. Surefire Test plugin 4. Uber jar plugin 1. Jetty Pl
【Hive六】Hive用户自定义函数(UDF) bit1129 自定义函数
1. 什么是Hive UDF Hive是基于Hadoop中的MapReduce，提供HQL查询的数据仓库。Hive是一个很开放的系统，很多内容都支持用户定制，包括：文件格式：Text File，Sequence File 内存中的数据格式： Java Integer/String, Hadoop IntWritable/Text 用户提供的 map/reduce 脚本：不管什么
杀掉nginx进程后丢失nginx.pid，如何重新启动nginx ronin47 nginx 重启 pid丢失
nginx进程被意外关闭，使用nginx -s reload重启时报如下错误：nginx: [error] open() “/var/run/nginx.pid” failed (2: No such file or directory)这是因为nginx进程被杀死后pid丢失了，下一次再开启nginx -s reload时无法启动解决办法：nginx -s reload 只是用来告诉运行中的ng
UI设计中我们为什么需要设计动效 brotherlamp UI ui教程 ui视频 ui资料 ui自学
随着国际大品牌苹果和谷歌的引领，最近越来越多的国内公司开始关注动效设计了，越来越多的团队已经意识到动效在产品用户体验中的重要性了，更多的UI设计师们也开始投身动效设计领域。但是说到底，我们到底为什么需要动效设计？或者说我们到底需要什么样的动效？做动效设计也有段时间了，于是尝试用一些案例，从产品本身出发来说说我所思考的动效设计。一、加强体验舒适度嗯，就是让用户更加爽更加爽的用你的产品。
Spring中JdbcDaoSupport的DataSource注入问题 bylijinnan java spring
参考以下两篇文章： http://www.mkyong.com/spring/spring-jdbctemplate-jdbcdaosupport-examples/ http://stackoverflow.com/questions/4762229/spring-ldap-invoking-setter-methods-in-beans-configuration Sprin
数据库连接池的工作原理 chicony 数据库连接池
随着信息技术的高速发展与广泛应用，数据库技术在信息技术领域中的位置越来越重要，尤其是网络应用和电子商务的迅速发展，都需要数据库技术支持动态Web站点的运行，而传统的开发模式是：首先在主程序（如Servlet、Beans）中建立数据库连接；然后进行SQL操作，对数据库中的对象进行查询、修改和删除等操作；最后断开数据库连接。使用这种开发模式，对
java 关键字 CrazyMizzz java
关键字是事先定义的，有特别意义的标识符，有时又叫保留字。对于保留字，用户只能按照系统规定的方式使用，不能自行定义。 Java中的关键字按功能主要可以分为以下几类：（1）访问修饰符 public,private,protected p
Hive中的排序语法 daizj 排序 hive order by DISTRIBUTE BY sort by
Hive中的排序语法 2014.06.22 ORDER BY hive中的ORDER BY语句和关系数据库中的sql语法相似。他会对查询结果做全局排序，这意味着所有的数据会传送到一个Reduce任务上，这样会导致在大数量的情况下，花费大量时间。与数据库中 ORDER BY 的区别在于在hive.mapred.mode = strict模式下，必须指定 limit 否则执行会报错。
单态设计模式 dcj3sjt126com 设计模式
单例模式（Singleton）用于为一个类生成一个唯一的对象。最常用的地方是数据库连接。使用单例模式生成一个对象后，该对象可以被其它众多对象所使用。 <?phpclass Example{ // 保存类实例在此属性中 private static&
svn locked dcj3sjt126com Lock
post-commit hook failed (exit code 1) with output: svn: E155004: Working copy 'D:\xx\xxx' locked svn: E200031: sqlite: attempt to write a readonly database svn: E200031: sqlite: attempt to write a
ARM寄存器学习 e200702084 数据结构 C++c C#F#
无论是学习哪一种处理器，首先需要明确的就是这种处理器的寄存器以及工作模式。 ARM有37个寄存器，其中31个通用寄存器，6个状态寄存器。 1、不分组寄存器（R0-R7）不分组也就是说说，在所有的处理器模式下指的都时同一物理寄存器。在异常中断造成处理器模式切换时，由于不同的处理器模式使用一个名字相同的物理寄存器，就是
常用编码资料 gengzg 编码
List<UserInfo> list=GetUserS.GetUserList(11); String json=JSON.toJSONString(list); HashMap<Object,Object> hs=new HashMap<Object, Object>(); for(int i=0;i<10;i++) {
进程 vs. 线程 hongtoushizi 线程 linux 进程
我们介绍了多进程和多线程，这是实现多任务最常用的两种方式。现在，我们来讨论一下这两种方式的优缺点。首先，要实现多任务，通常我们会设计Master-Worker模式，Master负责分配任务，Worker负责执行任务，因此，多任务环境下，通常是一个Master，多个Worker。如果用多进程实现Master-Worker，主进程就是Master，其他进程就是Worker。如果用多线程实现
Linux定时Job：crontab -e 与 /etc/crontab 的区别 Josh_Persistence linux crontab
一、linux中的crotab中的指定的时间只有5个部分：* * * * * 分别表示：分钟，小时，日，月，星期，具体说来：第一段代表分钟 0—59 第二段代表小时 0—23 第三段代表日期 1—31 第四段代表月份 1—12 第五段代表星期几，0代表星期日 0—6 如： */1 * * * * 每分钟执行一次。 *
KMP算法详解 hm4123660 数据结构 C++算法字符串 KMP
字符串模式匹配我们相信大家都有遇过，然而我们也习惯用简单匹配法（即Brute-Force算法)，其基本思路就是一个个逐一对比下去，这也是我们大家熟知的方法，然而这种算法的效率并不高，但利于理解。假设主串s="ababcabcacbab",模式串为t="
枚举类型的单例模式 zhb8015 单例模式
E.编写一个包含单个元素的枚举类型[极推荐]。代码如下： public enum MaYun {himself; //定义一个枚举的元素，就代表MaYun的一个实例private String anotherField;MaYun() {//MaYun诞生要做的事情//这个方法也可以去掉。将构造时候需要做的事情放在instance赋值的时候：/** himself = MaYun() {*
Kafka+Storm+HDFS ssydxa219 storm
cd /myhome/usr/stormbin/storm nimbus &bin/storm supervisor &bin/storm ui &Kafka+Storm+HDFS整合实践kafka_2.9.2-0.8.1.1.tgzapache-storm-0.9.2-incubating.tar.gzKafka安装配置我们使用3台机器搭建Kafk
Java获取本地服务器的IP 中华好儿孙 java Web 获取服务器ip地址
System.out.println("getRequestURL:"+request.getRequestURL()); System.out.println("getLocalAddr:"+request.getLocalAddr()); System.out.println("getLocalPort:&quo

条件随机场学习笔记

条件随机场学习笔记

前言

条件随机场进阶一

条件随机场进阶二

条件随机场进阶三

概率计算问题

参数学习算法

预测算法

Code Time

参考文献

你可能感兴趣的:(机器学习,机器学习入门)