OliverLee456

条件随机场_统计学习方法_学习笔记

前言

书中最后一章----条件随机场（Conditional Random Field，CRF）是目前为止学习到的比较抽象的一个模型了。网络上许多关于书中的此部分内容的博客、学习资源等都是照本宣科，因此学习这部分内容耗费了不少的精力。接下来结合我个人的理解来谈谈条件随机场。

因为符号较多，务必清楚每个符号代表的确切含义。

1 一个例子

2 条件随机场原理

2.1 概率无向图模型（马尔科夫随机场）

2.1.1 理解模型

2.1.2 模型的因子分解

2.2 条件随机场的定义

2.3 条件随机场的表示

2.3.1 参数化形示

2.3.2 简化形式

2.3.3 矩阵形式

3 条件随机场三个基本问题

3.1 概率计算问题

3.2 学习算法

3.3 预测算法

4 小结

5 总结

1 一个例子

之前按照书中结构出发，直接从原理学习条件随机场，真是晦涩难懂。因此在这里为了接下来的方便叙述，结合一个例子来描述条件随机场。这篇博客：https://blog.csdn.net/dcx_abc/article/details/78319246的例子举得不错，下面举的例子参考该博客。

条件随机场与上一章的隐马尔科夫模型要解决的都是标注问题。标注问题与分类问题的一个不同之处在于，标注问题的数据是具备时序特征的：即输入的是数据一个序列，而输出的数据也是一个序列。

假设现在要做一个词性的标注工作：即根据一个句子，标注出这个句子每个单词的词性。如“Monkey like eat big banana”，那么输入数据为 X = {Monkey，like，eat，big，banana}，希望得到输出的标注词性为 Y = {名词，动词，动词，形容词，名词}。前者输入序列称为观测序列，而后者输出序列称为状态序列。

在上一章提到过，隐马尔科夫模型是生成模型（直接对于P(X,Y)进行建模，相当于描述了模型的生成过程），而条件随机场则属于判别模型（直接对P(Y|X)建模），直接根据条件概率选择概率最大的作为结果（会多次涉及到其与隐马尔科夫的对比）。因此，条件随机场解决问题的思路为：当模型完成学习（参数确定）之后，对于给定的观测（输入）序列，根据设置的特征函数，计算其所有可能出现的状态（输出）序列的出现概率，选取概率最大的输出序列作为结果。特征函数可以看作是衡量结果出现概率高低的标准。

因此，条件随机场的核心便在于特征函数，确定了特征函数也就确定了一个条件随机场。观察上面的例子，其实不难归纳到两大类的特征：其一是单词本身具有的特征，如单词是Monkey，那么就认为该单词是名词的可能性很大；其二是单词序列间的特征，如 big 后面接 banana，即形容词后面出现名词的概率较大。同样，条件随机场也是从这两方面来考虑特征函数：其一从状态本身出发考虑，称为状态特征；其二从状态前后的相关关系进行考虑，称为转移特征，即描述相邻时刻的相关程度。通常利用 t 来代表转移特征（transfer），s 来代表状态特征（status）。

根据不同的情况，可以指定不同的特征函数。一般而言，特征函数的取值为 0 或者 1。例如制定以下特征函数：

1. 转移特征特征函数： $t_{1}(y_{i-1},y_{i},x,i)=\left\{\begin{matrix} 1,y_{i}=adj.,y_{i-1}=n.,i=3,4,5\\0,else \end{matrix}\right.$

表示在时刻3或4或5时，若前一个状态为形容词，当前状态为名词，那么该特征函数取值为1，否则为0。类似地，我们可以定义 $t_{2}$ 、 $t_{3}$ 、...、 $t_{k}$ 个转移特征函数。

2. 状态特征函数： $s_{1}(y_{i},x,i)=\left\{\begin{matrix} 1,y_{i}=n.,x_{i}='monkey',i=1,2,3,4,5\\0,else \end{matrix}\right.$

表示在时刻1或2或3或4或5时，若当前观测为 'monkey'，且当前状态为名词，那么该特征函数取值为1，否则为0。类似地，我们可以定义 $s_{2}$ 、 $s_{3}$ 、...、 $s_{l}$ 个状态特征函数。

特征函数根据实际情况来建立，可以发现特征函数建立的规则非常灵活，几乎是想如何设定就设定，这就为条件随机场提供了非常强大的可扩展性。这也是条件随机场能够得到广泛应用的一个重要原因。

需要明白的是，特征函数与特征函数是具备差异的。比如说认为特征函数 $s_{1}$ ：单词 monkey对应着标注是名词，比特征函数 $t_{1}$ ：形容词后面接名词的概率要大。因此不仅有一组特征函数，每个特征函数还应具备一个权值来衡量他们之间的差异。

因此，对于每一个可能出现的状态序列，假设为 y，那么根据特征函数集和输入数据集 x，可以写出一个关于特征函数的求和，来代表这个状态序列出现的非规范化概率：

即为： $P(y|x)=\sum_{i,k}\lambda _{k}t_{k}(y_{i-1},y_{i},x,i)+\sum_{i,l}\mu _{k}s_{k}(y_{i},x,i)$

上式注意两层求和：每个特征函数对于每个时刻求和，之后再对于所有特征函数进行求和。上面这个式子也可以理解为，该观测序列 y 的分数，分数越高代表其出现的可能性越大。我们明白，一个概率分布必须具备两个基本条件：其一非负；其二和为 1。上述式子只所以称为非规范化概率或者分数，就是因为其不满足这两个特征。因此我们将其规范化，从而得到概率。结合常用的技巧，解决非负问题加一个 e 作为底数即可，使和为 1，那么除以这个和即可。因此根据非规范化概率写出规范化概率如下：

即为： $P(y|x)=\frac{1}{Z(x)}exp\left \{ \sum_{i,k}\lambda _{k}t_{k}(y_{i-1},y_{i},x,i)+\sum_{i,l}\mu _{k}s_{k}(y_{i},x,i) \right \}$

归一化函数表示对所有可能出现的状态序列 y 的非规范化概率求和结果。

具体地： $Z(x)=\sum_{y}exp\left \{ \sum_{i,k}\lambda _{k}t_{k}(y_{i-1},y_{i},x,i)+\sum_{i,l}\mu _{k}s_{k}(y_{i},x,i) \right \}$

可根据实际情况，选择使用非规范化概率或者是规范化概率。

因此，给定了特征函数也就给定了一个条件随机场，针对一个观测输入序列 x ，对所有可能出现的状态序列 y 都计算其出现的概率，选择概率最大的一个作为结果输出，从而完成标注。

因此可以将上面一句话写的仔细点：确定了一组特征函数以及其相应的权重也就确定了一个条件随机场模型。

以上这个例子可以帮助我们初探条件随机场。其实上述这个例子只是条件随机场的一个情况，称为线性链条件随机场（因为状态序列、观测序列都为线性关系）。线性链条件随机场其实也是实际中用的最多的模型，也是这章内容中讨论的模型。接下来的第二节，会从原理上面谈谈对于条件随机场的理解。

2 条件随机场原理

先参考书中，给出条件随机场的定义：条件随机场是给定一组输入随机变量条件下，另一组输出随机变量的条件概率分布模型，其特点是假设输出随机变量构成马尔科夫随机场。

看完定义可以有以下直观理解：其一，跟隐马尔科夫模型类似，数据为序列数据；其二，与隐马尔科夫不同，求解的条件概率分布模型，也就是说是一个判别模型算法。看完定义感觉不明白的便是马尔科夫随机场了，这也是条件随机场的核心之处。

其实看完第一节的例子，肯定会有很多的疑问，例如特征函数为什么这样建立等等。条件随机场的原理其实很晦涩难懂，但是如果绕开原理不谈，又很难理解其建模的合理性。因此，这里我还是采取书中的思路：从问题源头看起，来谈谈我的理解。

2.1 概率无向图模型（马尔科夫随机场）

2.1.1 理解模型

首先给出一个直观理解，然后再解释。

概率无向图模型，又称为马尔科夫随机场，是一个可以由无向图表示的联合概率分布。

首先介绍概率图模型。概率图模型是由图表示的概率分布。一个图G 由边集合与节点集合构成，可写作，其中 V 代表节点集合，E 代表边集合。假设存在着一组随机变量 $Y_{1},Y_{2},...,Y_{n}$ ，且这组随机变量能够得到一个联合分布 $P(Y_{1},Y_{2},...,Y_{n})$ ，如果能够存在着一张图 G，G中的每个节点分别代表着每个随机变量 $Y_{i}(i=1,2,...,n)$ ，而边 $e\in E$ 代表着随机变量之间的概率依赖关系，那么称该模型为概率图模型。

最直观的理解便是，若一组随机变量有 n 个，那么其对应的概率图模型的节点也有 n 个；若两个随机变量之前存在概率依赖关系，那么在图中表示这两个随机变量的两个节点便会存在一条边（例如 $Y_{1}$ 与 $Y_{2}$ 共同发生，那么 $Y_{1}$ 与 $Y_{2}$ 便有一条边相邻）。即以图的方式来表示这组随机变量。

那么如果图是无向图，是不是就是概率无向图模型呢？还并不是这样。给出概率无向图的定义：设有联合分布 $P(Y_{1},Y_{2},...,Y_{n})$ ，其可由一个无向图 G 进行表示。若此联合概率分布 $P(Y_{1},Y_{2},...,Y_{n})$ 满足成对或者局部或者全局马尔科夫性，则称此联合概率分布为概率无向图模型，或马尔科夫随机场。也就是说，不仅仅是无向图，而且重点在于表示该联合概率分布的无向图应满足成对或者局部或者全局马尔科夫性，此时才能构成马尔科夫性。

成对、局部、全局的马尔科夫性定义是等价的。因此，在这里只选取全局马尔科夫性进行叙述（其余有兴趣查阅原书）：设有节点集合A，B是在无向图 G 中被节点集合 C 分开的任意节点集合，如下图所示。

节点集合A、B、C对应的随机变量分别是 $Y_{A}$ 、 $Y_{B}$ 、 $Y_{C}$ 。全局马尔科夫性是指给定 $Y_{C}$ 条件下， $Y_{A}$ 与 $Y_{B}$ 是条件独立的：即满足下式：

结合表示图与定义，不难得到马尔科夫性描述的是节点之间的这么一种关系：即节点只与其相邻的节点有关系，与不相邻的节点没关系；换句话说，一个随机变量只与其有概率依赖的随机变量有关，与其没有概率依赖的随机变量无关。写出这句话把我自己都逗乐了，因为这完全是一句废话嘛。其实在上面这句话中忽略了一个重要因素，那就是条件独立。也就是说，有关系与没关系的依据是在某一条件下进行判断。姑且先这样理解。

2.1.2 模型的因子分解

根据这一节内容最开始对于条件随机场的定义，我们知道输出的随机变量的联合概率分布应该是一个马尔科夫随机场。那么该如何求解其联合概率分布呢？马尔科夫场的一个最大特点便是易于分解，也就是可将该联合概率分解其若干个联合概率的乘积，化整为零，这样便利于我们进行计算。在叙述模型的分解时，先介绍团与最大团的概念。

若在无向图 G 中，若存在着一个节点子集 A，对于 A 中任意两个节点在 G 中均有边连接，那么这个节点子集 A 称为一个团（clique）。能够取得的最多节点个数的团则称为最大团。如下图所示：

图中的团有： $\left \{ Y_{1},Y_{2} \right \}$ 、 $\left \{ Y_{2},Y_{3} \right \}$ 、 $\left \{ Y_{1},Y_{3} \right \}$ 、 $\left \{ Y_{3},Y_{4} \right \}$ 、 $\left \{ Y_{2},Y_{4} \right \}$ 、 $\left \{ Y_{1},Y_{2} ,Y_{3} \right \}$ 、 $\left \{ Y_{2},Y_{3} ,Y_{4} \right \}$ 。

其中最大团有： $\left \{ Y_{1},Y_{2} ,Y_{3} \right \}$ 、 $\left \{ Y_{2},Y_{3} ,Y_{4} \right \}$ 。

结合马尔科夫场的马尔科夫性以及图中最大团的定义，那么我们便可以利用最大团进行分解了：假设 C 为 G 中的最大团， $Y_{C}$ 表示该最大团对于的随机变量的集合，用 $\Psi _{C}(C)$ 表示该最大团 C 上的函数，那么就可将总的联合概率分布分解为所有最大团的连乘：

其中，为了保证其为一个概率分布，Z 为规范化因子，具体如下：

马尔科夫场的因子分解主要是要使我们明白，可以根据马尔科夫性，将总的待求的联合概率分解为若干个最大团对应着的函数的连乘形式。

2.2 条件随机场的定义

先进行一般条件随机场的定义：设 X 与 Y 是随机变量，通常而言，X 对应着输入序列即观测序列，而 Y 对应着输出序列即状态序列。若随机变量 Y 构成一个由无向图 G 表示的马尔科夫随机场，即：

上式对于任意节点 v 都成立，则称条件概率分布为条件随机场。其中， $w\neq v$ 表示非当前节点 v 的节点集； $w \sim v$ 表示图中与 v 有边相连接的节点集。

对于上式的一个直观理解即为：在给定输入数据 X 以及随机变量 Y 构成一个马尔科夫随机场的条件下，某个随机变量 $Y_{i}$ 发生的条件概率只和与其有概率依赖的随机变量有关，与其余随机变量无关。这样的话，在建模的时候，对于某个随机变量而言，就只考虑和其有关系的变量了。

其实这和隐马尔科夫模型有相似之处。在隐马尔科夫模型中，假设当前状态只与上一个状态有关，而一般形式的条件随机场相当于将其进行了扩展：当前状态可能不仅与上一个状态有关，可能会与多个有关状态有关系。

可能也发现了，当随机变量 $Y_{i}$ ，也就是状态之间的关系很复杂时，那么一般形式的条件随机场其实也是很复杂的。因此，在实际中，使用线性链条件随机场的情况也很常见。顾名思义，线性链条件随机场即假设马尔科夫随机场符合线性链的结构。一个线性链的例子如下图所示：

观察上图可发现，原本的概率无向图现在简化为了一条线性的链，其中每个随机变量 $Y_{i}$ 只与它前后相邻的随机变量有关。而输入的序列 X 与每个 $Y_{i}$ 都有关系。

在定义中，并没有要求 X 和 Y 具备相同的结构。但是为了简化模型，常常认为 X 和 Y 具备相同的结构，如下所示：

看这个图好像有点熟悉，咋一看不是和隐马尔科夫模型一样吗？每个观测对应一个状态，当前状态由上一个状态决定且当前状态决定下一个状态，即当前状态与前后两个两个状态都有关系。其实不然，注意上图，这里的 Y 表示状态，而 X 表示的是观测序列，箭头由 X 指向 Y，可以理解在 X 的条件下 Y 的概率，即条件概率 P(Y|X) ，这是典型的判别模型思路；而隐马尔科夫模型是一个生成模型，生成模型并不直接针对 P(Y|X) 建模，记得在隐马尔科夫模型中，模型的三个核心要素其中之一便是由隐藏的状态 Y 推出观测 X 的观测概率分布矩阵，即条件概率 P(X|Y)。因此若画出隐马尔科夫模型的建模过程，那么箭头的方向应该由 Y 指向 X。

结合以上，给出线性链条件随机场的定义：若在给定观测随机变量序列 $X=\left \{ X_{1}, X_{2},..., X_{n}\right \}$ ，状态随机变量序列 $Y=\left \{ Y_{1}, Y_{2},..., Y_{n}\right \}$ 满足下列马尔科夫性：

那么称条件概率分布 P(Y|X)为线性链条件随机场。

接下来讨论的内容都只针对于线性链条件随机场。其实看完上面还是很抽象，一个显然的问题便是如何具体的计算每个的概率值呢？接下来会叙述条件随机场的表现形式。即采用第一节提到的状态特征和转移特征来进行表示，至于如何从上述原理过渡到采用特征函数进行表达，书中并没有进行说明。可能比较复杂，也不用再深挖了。

2.3 条件随机场的表示

此节内容符号较多，注意不同符号表示的确切含义。

2.3.1 参数化形示

设 P(Y|X) 为线性链条件随机场，当 X 取值为 x，Y取值为 y 时，条件概率 P(Y=y|X=x)有如下形式：

(2.1)

具体地（表示对所有可能出现的状态序列进行求和得到归一化参数）：

与第一节例子中定义的类似。 $t_{k}(y_{i-1},y_i,x,i)$ 表示自己定义的某个转移特征，该转移特征与上一个状态，当前状态，输入序列，当前时刻四个参数有关，且具备权重 $\lambda _k$ ，共定义了 k 个转移特征； $s_{l}(y_i,x,i)$ 表示自己定义的某个状态特征，该状态特征与当前状态。输入序列、当前时刻三个参数有关，且具备权重 $\mu _l$ ，共定义了 l 个状态特征。将这些特征进行求和可以得到类似于评价概率高低的一个“分数”，这个“分数”称为非规划化概率。将分数通过取 e 为底数，并除以归一化参数 Z(x)，使其变为真正概率，此时称为规范化概率。常常为了简化计算，有时候计算到非规范化概率就可以了。

参数化表示是比较直观，也比较好理解与使用的一种形式。

其实在这里，我看到一篇博客说，他认为线性链条件随机场是有向图模型。因为就看其参数化表示方式而言，当前的转移特征只与当前状态和上一个状态有关，看上去的确像是一个有向图，按照链的顺序而传递。其实我觉得线性链条件随机场仍然是一个无向图模型。因为注意到在马尔科夫场中，描述的是当前节点只与与其有边相连的节点有关。就转移特征函数而言，当前状态和上一个状态影响当前的转移特征，而当前状态和下一个状态又影响着下一个时刻的转移特征，不就意味着当前状态和上一个以及下一个状态都有关吗？转移特征函数的计算方式是将这个关系分成上一个状态和当前状态、当前状态和下一个状态这两个部分来计算，因此其实质我认为还是一个无向图模型。

2.3.2 简化形式

为了方便一些理论的推导和证明，也可以用简化形式来表达条件随机场。

注意在公式（2.1）中，有两个求和的计算，一是某个特征函数先对于所有状态进行求和，而是对于所有特征函数都进行求和。因此得到的一个简化思路便是：第一，重定义特征函数，使得这个特征函数对于各个时刻的状态都有定义，从局部状态转为全局状态，这样就省略了内层的那个求和；第二，将转移特征函数和状态特征函数及其权值用一个统计的符号进行描述。

下面进行简化。设有 $K_{1}$ 个转移特征， $K_{2}$ 个状态特征，总特征个数 $K =K_{1}+K_{2}$ ，引入以下记法：

然后将特征函数对于每个时刻的状态求和，记：

注意虽然上面两个记法都用的是，但是里面参数不一样代表的是不同函数。为了与书中符号保持一致，就不改写了，姑且理解为“多态”吧。这在下面的符号记法也会多次用到，注意区分。

引入 $\omega _{k}$ 来表示特征的权值：

于是，便可将公式（2.1）简化为如下形式：

若以 $\omega$ 表示权值向量，即：

表示全局特征向量，即：

那么可将其改写为 $\omega$ 与内积的形式，即：

（2.2）

其中：

2.3.3 矩阵形式

假设给出的条件随机场如上一节内积表示形式，即公式（2.2），可将条件随机场利用矩阵的形式进行表示。利用矩阵来表示条件随机场，需要引入标记：起点标记；终点标记。那么此时我们考虑的时刻便是，共计个时刻。回头看转移特征的定义：转移特征考虑的是前一个状态和当前状态。因此对于时刻开始，每一个时刻都按照如下所示定义一个 m*m 的矩阵（m为状态的取值个数），共计定义个矩阵。

看以上定义，不难得到时刻的 $M_{i}(x)$ 矩阵代表的是该时刻的所有可能的非规范化概率。具体地，对于第 i 个时刻的 $M_{i}(x)$ 矩阵，其中的第 j 行第 k 列元素代表着前一个时刻状态取值为 j，当前时刻状态取值为 k 的非规范化概率。（注意区分 $M_{i}(x)$ 矩阵与 $M_{i}(y_{i-1},y_i|x)$ 。 $M_{i}(x)$ 为一个m*m矩阵，而 $M_{i}(y_{i-1},y_i|x)$ 为矩阵的一个元素，可以就理解为一个值）

因此，可将内积形式的条件随机场，利用 n+1 个 $M_{i}(y_{i-1},y_i|x)$ 的乘积表示：

注意这里，规范化因子的求法。是 n+1 个 $M_{i}(x)$ 矩阵相乘的(start,stop)元素：

也就是说若起始状态取值为 j，终止状态取值为 k，那么即为这 n+1 个 $M_{i}(x)$ 相乘得到的结果矩阵里面的元素（j，k）。

看一个例子，来加深条件随机场的矩阵形式的理解。给定一个观测序列 x，状态序列 y，共有三个待求时刻，标记的取值集合 $y_i\in \left \{ 1,2 \right \}$ ，假设，，各个位置的随机矩阵 $M_{1}(x)$ 、 $M_{2}(x)$ 、 $M_{3}(x)$ 、 $M_{4}(x)$ 如下所示：

试求状态序列 y 以 start 为起始状态，以 end 为终止状态的所有路径的非规范化概率及规范化因子。

注意这里，因此对于时刻时的矩阵 $M_{1}(x)$ 而言，前一个时刻已经固定，所以第二行为0。同理对于而言，其取值已经固定位状态 1，所以第一列为 1 （我觉得第一列为相等的常数即可，取值为 1 是为了方便计算）而第二列为0。

也就是说，给定了起始状态和终止状态，求中间时刻状态的所有路径的非规范化概率。可以将状态路径绘制如下图所示：

每个时刻状态有两个取值，共计三个时刻，那么共计 $2^{3}=8$ 条路径，结合状态矩阵可以直接写出每个路径 $y=\left \{ 1,1,1 \right \},...,y=\left \{ 2,2,2 \right \}$ 的非规范化概率，如下所示：

那么规范化因子即为上面8条路径的非规范化概率之和，即为：

如果你将各个位置的随机矩阵 $M_{1}(x)$ 、 $M_{2}(x)$ 、 $M_{3}(x)$ 、 $M_{4}(x)$ 连乘一下，你会发现得到的结果矩阵的第1行第1列（因为这里起始状态与终止状态都为1）的元素的值恰好与规范化因子相等。

3 条件随机场三个基本问题

类似于隐马尔科夫模型，条件随机场也有3个基本问题：

（1）概率计算问题。当给定条件随机场 P(Y|X)，输入序列 x 和输出序列 y，计算时刻 i 的状态取值概率，时刻 i-1与时刻 i 的状态取值概率 $P(Y_{i-1}=y_{i-1},Y_i=y_i|x)$ 以及相应的数据期望等问题。

（2）学习问题。即估计条件随机场的参数问题。具体地，即为特征函数的权重和特征函数内包含的参数的估计。

（3）预测问题。给定条件随机场和输入序列 x，预测最有可能的状态序列 y。

因为其中有许多流程和思想与隐马尔科夫模型类似，所以以下内容就写得稍微简单一些。

3.1 概率计算问题

其实从上一章的最后一个部分----条件随机场的矩阵表示，就大概知道了条件随机场与隐马尔科夫模型或多或少的相似性。这篇博客我也在一直做二者对比。接下来的概率计算也类似于隐马尔科夫的思路。采用前向-后向算法进行求解。具体前向算法、后向算法的思路不再赘述，有疑惑的话回头再看看隐马尔科夫模型中的前向算法、后向算法的推导。因为前向、后向向量的定义联系到条件随机场的矩阵表示，因此注意到总的时刻序列为 $\small i=0,1,2,3,...,n,n+1$ ，共计 n+2 个时刻。

首先，进行前向向量的定义。对于初始时刻 i = 0的前向向量定义如下（注意，定义中的 1 表示的皆为向量）：

对于接下来的时刻前向向量定义如下：

某个时刻 i 的前向向量表示的是：时刻 i 状态取值为 $\small y_i$ 且到位置 i 的前面时刻的非规范化概率。注意到前向向量应该是一个 m 维向量（假设状态的取值为 m 个）。又可将前向向量简化为如下形式：

同样地，定义后向向量如下：

同样可简化写作如下形式：

由此，规范化因子也不难求了，即为 i = n 的前向向量或者是 i = 1 时刻后向向量（并不意味着起始时刻和终止时刻，注意到我们的时刻序列为 $\small i=0,1,2,3,...,n,n+1$ ）。如下所示：

根据前向-后向算法，就可以得到以下的概率计算了：

3.2 学习算法

这篇博客之中主要讨论的是线性链条件随机场，其实际上是定义在时序数据之上的对数线性模型。因此常用的极大似然法和正则化极大似然法都可以对其进行模型参数的求解。

根据训练数据集，可求得经验联合概率分布 $\small \tilde{P}(X,Y)$ ，写出训练数据的对数似然函数为：

这里注意 $\small \tilde{P}(X,Y)$ 是指数而不是乘积。可以理解为总共发生了 $\small \tilde{P}(X,Y)$ 次，因此为 $\small \tilde{P}(X,Y)$ 个事件相乘，即为指数而不是乘积。上式中的 $\small P_w(y|x)$ 是待求参数的一个条件随机场，具体地：

求解上述的对数似然的函数的优化算法有改进的迭代尺度法（IIS）、梯度下降法以及拟牛顿法等等。由于推导的过程较为繁琐，以下不再叙述了，有兴趣参照原书。之后应该会单独就某个优化算法加深学习并记下学习笔记。

3.3 预测算法

同样地，预测算法也采用 Viterbi算法思路进行求解。结合一个例子来阐述。

设有一组标注问题，输入观测序列为 $\small X=(X_1,X_2,X_3)$ ，输出标记序列为 $\small Y=(Y_1,Y_2,Y_3)$ ，标记取值集合为 $\small Y\in \left \{ 1,2 \right \}$ ，假设特征 $\small t_k,s_l$ 和相应的权值 $\small \lambda _k,\mu _l$ 的取值如下：

将其简写为：

参照转移特征 $\small t_1$ ，为了方便，以下都做了简写（状态的取值要么为 1，要么为 0）：

在上述例子中，求解最有可能的标记序列（状态序列）：

1. 第一个时刻各个状态非规范化概率求解：

（1）第一个状态为 1的非规范化概率： $\small s_1*\mu_1=1*1=1$ 。

（2）第一个状态为 2的非规范化概率： $\small s_2*\mu_2=1*0.5=0.5$ 。

第一个时刻的非规范化概率只涉及到状态特征。

2. 第二个时刻各个状态非规范化概率求解：

（1）由状态1转为状态1的非规范化概率： $\small 1+t_2*\lambda_2 + s_3*\mu_3=1+0.5+0.8=2.3$ 。

（2）由状态2转为状态1的非规范化概率： $\small 0.5+t_4*\lambda_4+s_3*\mu_3=0.5+0.5+0.8=1.8$ 。

因此，在时刻2处，状态1的非规范化概率为2.3，由上一个时刻状态1转移而来。

（1）由状态1转为状态2的非规范化概率： $\small 1+t_1*\lambda_1 + s_2*\mu_2=1+1+0.5=2.5$ 。

（2）由状态2转为状态2的非规范化概率： $\small 0.5+s_2*\mu_2=0.5+0.5=1$ 。

因此，在时刻2处，状态2的非规范化概率为2.5，由上一个时刻状态1转移而来。

从第二个时刻开始，非规范化概率不仅涉及到状态特征，还涉及到转移特征。

3. 第三个时刻各个状态非规范化概率求解：

（1）由状态1转为状态1的非规范化概率： $\small 2.3+ s_3*\mu_3=2.3+0.8=3.1$ 。

（2）由状态2转为状态1的非规范化概率： $\small 2.5+t_3*\lambda_3+s_3*\mu_3=2.5+1+0.8=4.3$ 。

因此，在时刻3处，状态1的非规范化概率为4.3，由上一个时刻状态2转移而来。

（1）由状态1转为状态2的非规范化概率： $\small 2.3+t_1*\lambda_1 + s_4*\mu_4=2.3+1+0.5=3.8$ 。

（2）由状态2转为状态2的非规范化概率： $\small 2.5+t_5*\lambda_5+s_4*\mu_4=2.5+0.2+0.5=3.2$ 。

因此，在时刻3处，状态2的非规范化概率为3.8，由上一个时刻状态1转移而来。

参照隐马尔科夫中例子一样，这里同样也绘制一个每个时刻的状态图，如下：

可以得到在时刻 $\small i=3$ 时，最大的非规范化概率为4.3。因此进行回溯，得到的最优状态序列即为 $\small y=\left \{ 1,2,1 \right \}$ ，即为上图中的红线所示。

4 小结

初探条件随机场感觉的确比较抽象。条件随机场的笔记前前后后也花费了不少时间。

条件随机场模型建模所做的一个核心假设便是假设输出变量（状态序列）构成一个马尔科夫随机场，针对于线性链条件随机场而言，通过具化的状态特征以及转移特征来实现对于状态序列之间相互的概率依赖关系的描述。因此线性链条件随机场实质上是针对于序列数据的一个对数线性模型。

线性链条件随机场与隐马尔科夫模型有着许多联系。但是条件随机场的状态函数的定义十分灵活，这就使其解决的问题更加的广泛，可以说是隐马尔科夫模型能解决的问题条件随机场都能解决，反之却不一定正确。而且，从二者解决问题的思路来比较，也可以比较出判别模型算法和生成模型算法的解决问题思路的异同。

5 总结

写完条件随机场的笔记，<<统计学习方法>>一书也接近了尾声了，也算是一个小节点吧，前前后后利用了几个月来进行书中内容的学习（自学还是比较吃力），学完之后获益颇多、感受颇深，感叹李航老师所著的此书逻辑清晰、论证合理，虽然对于入门者而言并不是很友好，但是对于想要加深对于机器学习理解的初学者而言则是一本很不错的学习资料。

写完这八章的学习笔记，这时的感觉就像我喜欢听的一首歌一样：酣畅淋漓、<<不吐不快>>。

你可能感兴趣的:(机器学习笔记)

【机器学习笔记Ⅰ】9 特征缩放巴伦是只猫机器学习机器学习笔记人工智能
特征缩放（FeatureScaling）详解特征缩放是机器学习数据预处理的关键步骤，旨在将不同特征的数值范围统一到相近的尺度，从而加速模型训练、提升性能并避免某些特征主导模型。1.为什么需要特征缩放？(1)问题背景量纲不一致：例如：特征1：年龄（范围0-100）特征2：收入（范围0-1,000,000）梯度下降的困境：量纲大的特征（如收入）会导致梯度更新方向偏离最优路径，收敛缓慢。量纲小的特征（如
【机器学习笔记Ⅰ】10 特征工程
特征工程（FeatureEngineering）详解特征工程是机器学习和数据科学中的核心环节，旨在通过对原始数据的转换、组合和提取，构建更适合模型的高质量特征。其质量直接决定模型性能上限（“数据和特征决定了模型的上限，而算法只是逼近这个上限”）。1.特征工程的核心目标提升模型性能：增强特征与目标变量的相关性。降低计算成本：减少冗余特征，加速训练。改善泛化能力：避免过拟合，提高鲁棒性。2.特征工程的
机器学习知识点复习上（保研、复试、面试）百面机器学习笔记
机器学习知识点复习上一、特征工程1.为什么需要对数值类型的特征做归一化？2.文本表示模型3.图像数据不足的处理方法二、模型评估1.常见的评估指标2.ROC曲线3.为什么在一些场景中要使用余弦相似度而不是欧氏距离？4.过拟合和欠拟合三、经典算法1.支持向量机SVM2.逻辑回归3.决策树四、降维1.主成分分析（PrinalComponentsAnalysis,PCA）降维中最经典的方法2.线性判别分析
【机器学习笔记 Ⅱ】9 模型评估巴伦是只猫机器学习机器学习笔记人工智能
评估机器学习模型是确保其在实际应用中有效性和可靠性的关键步骤。以下是系统化的评估方法，涵盖分类、回归、聚类等任务的评估指标和技术：一、分类模型评估1.基础指标2.高级指标ROC-AUC：通过绘制真正例率（TPR）vs假正例率（FPR）曲线下面积评估模型整体性能。AUC=1：完美分类；AUC=0.5：随机猜测。适用于二分类及多分类（OvR或OvO策略）。混淆矩阵：可视化模型在各类别上的具体错误（如将
【机器学习笔记 Ⅱ】7 多类分类巴伦是只猫机器学习机器学习笔记分类
1.多类分类（Multi-classClassification）定义多类分类是指目标变量（标签）有超过两个类别的分类任务。例如：手写数字识别：10个类别（0~9）。图像分类：区分猫、狗、鸟等。新闻主题分类：政治、经济、体育等。特点互斥性：每个样本仅属于一个类别（区别于多标签分类）。输出要求：模型需输出每个类别的概率分布，且概率之和为1。实现方式One-vs-Rest(OvR)：训练K个二分类器（
【机器学习笔记 Ⅱ】4 神经网络中的推理
推理（Inference）是神经网络在训练完成后利用学到的参数对新数据进行预测的过程。与训练阶段不同，推理阶段不计算梯度也不更新权重，仅执行前向传播。以下是其实现原理和代码示例的完整解析：1.推理的核心步骤加载训练好的模型参数（权重和偏置）。前向传播：输入数据逐层计算，得到输出。后处理：根据任务类型解析输出（如分类取概率最大值，回归直接输出）。2.代码实现（Python+NumPy）(1)定义模型
【机器学习笔记 Ⅲ】3 异常检测算法巴伦是只猫机器学习机器学习笔记算法
异常检测算法（AnomalyDetection）详解异常检测是识别数据中显著偏离正常模式的样本（离群点）的技术，广泛应用于欺诈检测、故障诊断、网络安全等领域。以下是系统化的解析：1.异常类型类型描述示例点异常单个样本明显异常信用卡交易中的天价消费上下文异常在特定上下文中异常（如时间序列）夏季气温突降至零下集体异常一组相关样本联合表现为异常网络流量中突然的DDOS攻击流量2.常用算法(1)基于统计的
【机器学习笔记 Ⅲ】4 特征选择巴伦是只猫机器学习机器学习笔记人工智能
特征选择（FeatureSelection）系统指南特征选择是机器学习中优化模型性能的关键步骤，通过筛选最相关、信息量最大的特征，提高模型精度、降低过拟合风险并加速训练。以下是完整的特征选择方法论：1.特征选择的核心目标提升模型性能：去除噪声和冗余特征，增强泛化能力。降低计算成本：减少训练和预测时间。增强可解释性：简化模型，便于业务理解。2.特征选择方法分类(1)过滤法（FilterMethods
机器学习笔记二-回归
回归是统计学和机器学习中的一种基本方法，用于建模变量之间的关系，特别是用一个或多个自变量（输入变量）来预测一个因变量（输出变量）的值。回归分析广泛应用于预测、趋势分析和关联研究中。根据目标和数据的性质，可以使用不同类型的回归方法。1.回归的基本概念：自变量（IndependentVariable）:也称为预测变量、解释变量，是模型中的输入变量，用于预测或解释因变量的变化。因变量（Dependent
【机器学习笔记 Ⅱ】11 决策树模型巴伦是只猫机器学习机器学习笔记决策树
决策树模型（DecisionTree）详解决策树是一种树形结构的监督学习模型，通过一系列规则对数据进行分类或回归。其核心思想是模仿人类决策过程，通过不断提问（基于特征划分）逐步逼近答案。1.核心概念节点类型：根节点：起始问题（最佳特征划分点）。内部节点：中间决策步骤（特征判断）。叶节点：最终预测结果（类别或数值）。分支：对应特征的取值或条件判断（如“年龄≥30？”）。2.构建决策树的关键步骤(1)
【机器学习笔记 Ⅱ】10 完整周期
机器学习的完整生命周期（End-to-EndPipeline）机器学习的完整周期涵盖从问题定义到模型部署的全过程，以下是系统化的步骤分解和关键要点：1.问题定义（ProblemDefinition）目标：明确业务需求与机器学习任务的匹配性。关键问题：这是分类、回归、聚类还是强化学习问题？成功的标准是什么？（如准确率>90%、降低10%成本）输出：项目目标文档（含评估指标）。2.数据收集（DataC
【机器学习笔记Ⅰ】13 正则化代价函数
正则化代价函数（RegularizedCostFunction）详解正则化代价函数是机器学习中用于防止模型过拟合的核心技术，通过在原始代价函数中添加惩罚项，约束模型参数的大小，从而提高泛化能力。以下是系统化的解析：1.为什么需要正则化？过拟合问题：当模型过于复杂（如高阶多项式回归、深度神经网络）时，可能完美拟合训练数据但泛化性能差。解决方案：在代价函数中增加对参数的惩罚，抑制不重要的特征权重。2.
【机器学习笔记Ⅰ】6 多类特征巴伦是只猫机器学习机器学习笔记人工智能
多类特征（Multi-classFeatures）详解多类特征是指一个特征（变量）可以取多个离散的类别值，且这些类别之间没有内在的顺序关系。这类特征是机器学习中常见的数据类型，尤其在分类和回归问题中需要特殊处理。1.核心概念(1)什么是多类特征？定义：特征是离散的、有限的类别，且类别之间无大小或顺序关系。示例：颜色：红、绿、蓝（无顺序）。城市：北京、上海、广州（无数学意义的大小关系）。动物类别：猫
机器学习笔记——支持向量机 star_and_sun 机器学习笔记支持向量机
支持向量机参数模型对分布需要假设（这也是与非参数模型的区别之一）间隔最大化，形式转化为凸二次规划问题最大化间隔间隔最大化是意思：对训练集有着充分大的确信度来分类训练数据，最难以分的点也有足够大的信度将其分开间隔最大化的分离超平面的的求解怎么求呢？最终的方法如下1.线性可分的支持向量机的优化目标其实就是找得到分离的的超平面求得参数w和b的值就可以了注意，最大间隔分离超平面是唯一的，间隔叫硬间隔1.1
【机器学习笔记Ⅰ】7 向量化巴伦是只猫机器学习机器学习笔记人工智能
向量化（Vectorization）详解向量化是将数据或操作转换为向量（或矩阵）形式，并利用并行计算高效处理的技术。它是机器学习和数值计算中的核心优化手段，能显著提升代码运行效率（尤其在Python中避免显式循环）。1.为什么需要向量化？(1)传统循环的缺陷低效：Python的for循环逐元素操作，速度慢。代码冗长：需手动处理每个元素。示例：计算两个数组的点积（非向量化）a=[1,2,3]b=[4
机器学习笔记：MATLAB实践 techDM 机器学习笔记 matlab Matlab
在机器学习领域，MATLAB是一种功能强大且广泛使用的工具，它提供了许多内置函数和工具箱，方便开发者进行各种机器学习任务。本文将介绍一些常见的机器学习任务，并提供相应的MATLAB源代码示例。数据预处理在进行机器学习之前，通常需要对原始数据进行预处理。这包括数据清洗、特征选择、特征缩放和数据划分等步骤。%导入数据data=readmatrix('data.csv');%数据清洗cleaned_da
机器学习笔记【Week9】 kuiini 人工智能机器学习人工智能
一、异常检测问题动机在现实中，我们经常会遇到“异常检测”的任务：识别罕见、异常、不符合正常模式的数据点。例：工业设备故障检测，银行欺诈识别，异常流量检测等。核心特点：异常样本稀少，难以用监督学习训练模型。二、高斯分布建立算法前，需要假设每个特征满足高斯（正态）分布。在单一特征xjx_jxj上：p(xj;μj,σj2)=12π σjexp⁡(−(xj−μj)22σj2)p(x_j;\mu_j,\si
吴恩达机器学习笔记（1）—引言大饼酥人工智能机器学习人工智能吴恩达
目录一、欢迎二、机器学习是什么三、监督学习四、无监督学习一、欢迎机器学习是当前信息技术领域中最令人兴奋的方向之一。在这门课程中，你不仅会学习机器学习的前沿知识，还将亲手实现相关算法，从而深入理解其内部机理。事实上，机器学习已广泛渗透进我们的日常生活。例如，每次你使用Google、Bing进行搜索，或用Facebook、Apple的图像识别功能识别朋友，甚至邮箱中的垃圾邮件过滤器，背后都离不开机器学
斯坦福CS229机器学习笔记-Lecture2-线性回归+梯度下降+正规方程组 Teeyohuang 机器学习 CS229-吴恩达机器学习笔记 CS229 吴恩达机器学习
声明：此系列博文根据斯坦福CS229课程，吴恩达主讲所写，为本人自学笔记，写成博客分享出来博文中部分图片和公式都来源于CS229官方notes。CS229的视频和讲义均为互联网公开资源Lecture2这一节主要讲的是三个部分的内容：·LinearRegression（线性回归）·GradientDescent（梯度下降）·NormalEquations（正规方程组）1、线性回归首先给了一个例子，如
机器学习笔记周志华第一章绪论 Olivia_ll learning note machine learning machine learning
概念和术语属性空间（attributespace)/样本空间（samplespace)/输入空间：属性张成的空间特征向量（featurevector):一个示例标记（label):关于示例结果的信息样例（example)：拥有了标记信息的示例标记空间（labelspace)/输出空间：所有标记的集合监督学习（supervisedlearning)分类（classification)——预测离散值回
机器学习笔记【Week6】 kuiini 人工智能机器学习人工智能
一、模型结果下一步训练模型得到结果后，常面临：模型性能不理想，下一步如何改进？通过对训练误差和验证误差的观察，判断是高偏差（欠拟合）还是高方差（过拟合）。一般步骤：计算训练误差和验证误差，不包含正则项。判断两者的大小和差距。根据判断选择策略：情况训练误差验证误差结论改进方向欠拟合（高偏差）高高模型能力不足增加特征，减小正则化过拟合（高方差）低高泛化能力差增加训练数据，增加正则化二、评估假设的误差训
机器学习笔记：时域和频域变换灰暗世界% 机器学习笔记机器学习笔记人工智能
加窗操作使用内置的STFT/ISTFT接口这种方法利用torch.stft（内部采用rfft）和torch.istft完成变换，同时借助加窗（例如Hann窗）保证帧内加窗并采用重叠相加（常用50%重叠）实现完美重构。窗口长度可以灵活设置，例如64或32。这种方式利用了PyTorch内置的STFT与ISTFT函数，它们内部使用了rfft/irfft，同时支持加窗并且能够保证重构出的信号长度与输入一致
机器学习笔记——特征工程好评笔记机器学习人工智能深度学习 AIGC 算法岗校招实习
大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本笔记介绍机器学习中常见的特征工程方法、正则化方法和简要介绍强化学习。文章目录特征工程（FzeatureEngineering）1.特征提取（FeatureExtraction）手工特征提取（ManualFeatureExtraction）：自动特征提取（AutomatedFeatureExtraction）：2.特征选择
AIGC视频生成模型：ByteDance的PixelDance模型好评笔记 AIGC 深度学习人工智能计算机视觉机器学习 transformer 论文阅读
大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本文详细介绍ByteDance的视频生成模型PixelDance，论文于2023年11月发布，模型上线于2024年9月，同时期上线的模型还有Seaweed（论文未发布）。热门专栏机器学习机器学习笔记合集深度学习深度学习笔记合集优质专栏回顾：机器学习笔记深度学习笔记多模态论文笔记AIGC—图像文章目录热门专栏机器学习深度学习
Meta的AIGC视频生成模型——Emu Video 好评笔记 AIGC 深度学习人工智能机器学习 transformer 校招面试八股
大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本文详细介绍Meta的视频生成模型EmuVideo，作为Meta发布的第二款视频生成模型，在视频生成领域发挥关键作用。优质专栏回顾：机器学习笔记深度学习笔记多模态论文笔记AIGC—图像文章目录论文摘要引言相关工作文本到图像（T2I）扩散模型视频生成/预测文本到视频（T2V）生成分解生成方法预备知识EmuVideo生成步骤图
Python机器学习笔记（二十五、算法链与管道） FreedomLeo1 Python机器学习机器学习算法 python make_pipeline Pipeline named_steps属性
对于许多机器学习算法，特定数据表示非常重要。首先对数据进行缩放，然后手动合并特征，再利用无监督机器学习来学习特征。因此，大多数机器学习应用不仅需要应用单个算法，而且还需要将许多不同的处理步骤和机器学习模型链接在一起。Pipeline类可以用来简化构建变换和模型链的过程。将Pipeline和GridSearchCV结合起来，可以同时搜索所有处理步骤中的参数。举例：使用MinMaxScaler对can
Python机器学习笔记（二十三模型评估与改进-网格搜索） FreedomLeo1 Python机器学习机器学习 python 支持向量机交叉验证网格搜索 scikit-learn
上一次学习了评估一个模型的泛化能力，现在继续学习通过调参来提升模型的泛化性能。scikit-learn中许多算法的参数设置，在尝试调参之前，重要的是要理解参数的含义。找到一个模型的重要参数（提供最佳泛化性能的参数）的取值是一项棘手的任务，但对于几乎所有模型和数据集来说都是必要的。scikit-learn中有一些标准方法可以帮我们完成调参。最常用的方法就是网格搜索（gridsearch），它主要是指
吴恩达机器学习笔记：特征与多项式回归ちゆきー机器学习笔记回归
1.特征和多项式回归如房价预测问题，ℎθ(x)=θ0+θ1×frontage+θ2×deptℎx1=frontage（临街宽度），x2=deptℎ（纵向深度），x=frontage∗deptℎ=area（面积），则：hθ(x)=θ0+θ1xh_\theta(x)=\theta_0+\theta_1xhθ(x)=θ0+θ1x线性回归并不适用于所有数据，有时我们需要曲线来适应我们的数据，比如一个二次方
吴恩达机器学习笔记：多维梯度下降实践ちゆきー机器学习笔记计算机视觉
1.特征放缩在我们面对多维特征问题的时候，我们要保证这些特征都具有相近的尺度，这将帮助梯度下降算法更快地收敛。以房价问题为例，假设我们使用两个特征，房屋的尺寸和房间的数量，尺寸的值为0-2000平方英尺，而房间数量的值则是0-5，以两个参数分别为横纵坐标，绘制代价函数的等高线图能看出图像会显得很扁，梯度下降算法需要非常多次的迭代才能收敛。解决的方法是尝试将所有特征的尺度都尽量缩放到-1到1之间。如
吴恩达机器学习笔记：监督学习ちゆきー机器学习笔记学习
1.回归我们用一个例子介绍什么是监督学习把正式的定义放在后面介绍。假如说你想预测房价。前阵子，一个学生从波特兰俄勒冈州的研究所收集了一些房价的数据。你把这些数据画出来，看起来是这个样子：横轴表示房子的面积，单位是平方英尺，纵轴表示房价，单位是千美元。那基于这组数据，假如你有一个朋友，他有一套750平方英尺房子，现在他希望把房子卖掉，他想知道这房子能卖多少钱。我们应用学习算法，可以在这组数据中画一条
ztree设置禁用节点 3213213333332132 JavaScript ztree json setDisabledNode Ajax
ztree设置禁用节点的时候注意，当使用ajax后台请求数据,必须要设置为同步获取数据，否者会获取不到节点对象，导致设置禁用没有效果。 $(function(){ showTree(); setDisabledNode(); });
JVM patch by Taobao bookjovi java HotSpot
在网上无意中看到淘宝提交的hotspot patch，共四个，有意思，记录一下。 7050685：jsdbproc64.sh has a typo in the package name 7058036：FieldsAllocationStyle=2 does not work in 32-bit VM 7060619：C1 should respect inline and
将session存储到数据库中 dcj3sjt126com sql PHP session
CREATE TABLE sessions ( id CHAR(32) NOT NULL, data TEXT, last_accessed TIMESTAMP NOT NULL, PRIMARY KEY (id) ); <?php /** * Created by PhpStorm. * User: michaeldu * Date
Vector 171815164 vector
public Vector<CartProduct> delCart(Vector<CartProduct> cart, String id) { for (int i = 0; i < cart.size(); i++) { if (cart.get(i).getId().equals(id)) { cart.remove(i);
各连接池配置参数比较 g21121 连接池
排版真心费劲，大家凑合看下吧，见谅~ Druid DBCP C3P0 Proxool 数据库用户名称 Username Username User 数据库密码 Password Password Password 驱动名
[简单]mybatis insert语句添加动态字段 53873039oycg mybatis
mysql数据库,id自增,配置如下： <insert id="saveTestTb" useGeneratedKeys="true" keyProperty="id" parameterType=&
struts2拦截器配置云端月影 struts2拦截器
struts2拦截器interceptor的三种配置方法方法1. 普通配置法 <struts> <package name="struts2" extends="struts-default"> &
IE中页面不居中，火狐谷歌等正常 aijuans IE中页面不居中
问题是首页在火狐、谷歌、所有IE中正常显示，列表页的页面在火狐谷歌中正常，在IE6、7、8中都不中，觉得可能那个地方设置的让IE系列都不认识，仔细查看后发现，列表页中没写HTML模板部分没有添加DTD定义，就是<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3
String,int,Integer,char 几个类型常见转换 antonyup_2006 html sql .net
如何将字串 String 转换成整数 int? int i = Integer.valueOf(my_str).intValue(); int i=Integer.parseInt(str); 如何将字串 String 转换成Integer ? Integer integer=Integer.valueOf(str); 如何将整数 int 转换成字串 String ? 1.
PL/SQL的游标类型百合不是茶显示游标(静态游标)隐式游标游标的更新和删除 %rowtype ref游标(动态游标)
游标是oracle中的一个结果集,用于存放查询的结果; PL/SQL中游标的声明; 1,声明游标 2,打开游标(默认是关闭的); 3,提取数据 4,关闭游标注意的要点:游标必须声明在declare中,使用open打开游标,fetch取游标中的数据,close关闭游标隐式游标:主要是对DML数据的操作隐
JUnit4中@AfterClass @BeforeClass @after @before的区别对比 bijian1013 JUnit4 单元测试
一.基础知识 JUnit4使用Java5中的注解（annotation），以下是JUnit4常用的几个annotation： @Before：初始化方法对于每一个测试方法都要执行一次（注意与BeforeClass区别，后者是对于所有方法执行一次）@After：释放资源对于每一个测试方法都要执行一次（注意与AfterClass区别，后者是对于所有方法执行一次
精通Oracle10编程SQL(12)开发包 bijian1013 oracle 数据库 plsql
/* *开发包 *包用于逻辑组合相关的PL/SQL类型（例如TABLE类型和RECORD类型）、PL/SQL项（例如游标和游标变量）和PL/SQL子程序（例如过程和函数） */ --包用于逻辑组合相关的PL/SQL类型、项和子程序，它由包规范和包体两部分组成 --建立包规范：包规范实际是包与应用程序之间的接口，它用于定义包的公用组件，包括常量、变量、游标、过程和函数等 --在包规
【EhCache二】ehcache.xml配置详解 bit1129 ehcache.xml
在ehcache官网上找了多次，终于找到ehcache.xml配置元素和属性的含义说明文档了，这个文档包含在ehcache.xml的注释中！ ehcache.xml ： http://ehcache.org/ehcache.xml ehcache.xsd ： http://ehcache.org/ehcache.xsd ehcache配置文件的根元素是ehcahe ehcac
java.lang.ClassNotFoundException: org.springframework.web.context.ContextLoaderL 白糖_ java eclipse spring tomcat Web
今天学习spring+cxf的时候遇到一个问题：在web.xml中配置了spring的上下文监听器： <listener> <listener-class>org.springframework.web.context.ContextLoaderListener</listener-class> </listener> 随后启动
angular.element boyitech AngularJS AngularJS API angular.element
angular.element 描述: 包裹着一部分DOM element或者是HTML字符串，把它作为一个jQuery元素来处理。（类似于jQuery的选择器啦）如果jQuery被引入了，则angular.element就可以看作是jQuery选择器，选择的对象可以使用jQuery的函数；如果jQuery不可用，angular.e
java-给定两个已排序序列，找出共同的元素。 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class CommonItemInTwoSortedArray { /** * 题目：给定两个已排序序列，找出共同的元素。 * 1.定义两个指针分别指向序列的开始。 * 如果指向的两个元素
sftp 异常，有遇到的吗？求解 Chen.H java jcraft auth jsch jschexception
com.jcraft.jsch.JSchException: Auth cancel at com.jcraft.jsch.Session.connect(Session.java:460) at com.jcraft.jsch.Session.connect(Session.java:154) at cn.vivame.util.ftp.SftpServerAccess.connec
[生物智能与人工智能]神经元中的电化学结构代表什么? comsci 人工智能
我这里做一个大胆的猜想,生物神经网络中的神经元中包含着一些化学和类似电路的结构,这些结构通常用来扮演类似我们在拓扑分析系统中的节点嵌入方程一样,使得我们的神经网络产生智能判断的能力,而这些嵌入到节点中的方程同时也扮演着"经验"的角色.... 我们可以尝试一下...在某些神经
通过LAC和CID获取经纬度信息 dai_lm lac cid
方法1：用浏览器打开http://www.minigps.net/cellsearch.html，然后输入lac和cid信息(mcc和mnc可以填0)，如果数据正确就可以获得相应的经纬度方法2：发送HTTP请求到http://www.open-electronics.org/celltrack/cell.php?hex=0&lac=<lac>&cid=&
JAVA的困难分析 datamachine java
前段时间转了一篇SQL的文章（http://datamachine.iteye.com/blog/1971896），文章不复杂，但思想深刻，就顺便思考了一下java的不足，当砖头丢出来，希望引点和田玉。 -----------------------------------------------------------------------------------------
小学5年级英语单词背诵第二课 dcj3sjt126com english word
money 钱 paper 纸 speak 讲，说 tell 告诉 remember 记得，想起 knock 敲，击，打 question 问题 number 数字，号码 learn 学会，学习 street 街道 carry 搬运，携带 send 发送，邮寄，发射 must 必须 light 灯，光线，轻的 front
linux下面没有tree命令 dcj3sjt126com linux
centos p安装 yum -y install tree mac os安装 brew install tree 首先来看tree的用法 tree 中文解释：tree 功能说明：以树状图列出目录的内容。语　　法：tree [-aACdDfFgilnNpqstux][-I <范本样式>][-P <范本样式
Map迭代方式，Map迭代，Map循环蕃薯耀 Map循环 Map迭代 Map迭代方式
Map迭代方式，Map迭代，Map循环 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年
Spring Cache注解+Redis hanqunfeng spring
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redis</artifactId>
Guava中针对集合的 filter和过滤功能 jackyrong filter
在guava库中，自带了过滤器(filter)的功能，可以用来对collection 进行过滤，先看例子： @Test public void whenFilterWithIterables_thenFiltered() { List<String> names = Lists.newArrayList("John"
学习编程那点事 lampcy 编程 android PHP html5
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
架构师之流处理---------bytebuffer的mark,limit和flip nannan408 ByteBuffer
1.前言。如题，limit其实就是可以读取的字节长度的意思，flip是清空的意思，mark是标记的意思。 2.例子. 例子代码: String str = "helloWorld"; ByteBuffer buff = ByteBuffer.wrap(str.getBytes()); Sy
org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1, column 1 Everyday都不同 $转义 el表达式
最近在做Highcharts的过程中，在写js时，出现了以下异常：严重: Servlet.service() for servlet jsp threw exception org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1,
用Java实现发送邮件到163 tntxia java实现
/* 在java版经常看到有人问如何用javamail发送邮件？如何接收邮件？如何访问多个文件夹等。问题零散，而历史的回复早已经淹没在问题的海洋之中。本人之前所做过一个java项目，其中包含有WebMail功能，当初为用java实现而对javamail摸索了一段时间，总算有点收获。看到论坛中的经常有此方面的问题，因此把我的一些经验帖出来，希望对大家有些帮助。此篇仅介绍用
探索实体类存在的真正意义 java小叶檀 POJO
一. 实体类简述实体类其实就是俗称的POJO,这种类一般不实现特殊框架下的接口，在程序中仅作为数据容器用来持久化存储数据用的 POJO（Plain Old Java Objects）简单的Java对象它的一般格式就是 public class A{ private String id; public Str