zhoubl668

随机场（Random field）

一、随机场定义

http://zh.wikipedia.org/zh-cn/随机场

随机场（Random field）定义如下：

在概率论中, 由样本空间Ω = {0, 1, …, G − 1}ⁿ取样构成的随机变量X_i所组成的S = {X₁, …, X_n}。若对所有的ω∈Ω下式均成立，则称π为一个随机场。π(ω) > 0.

一些已有的随机场如：马尔可夫随机场(MRF), 吉布斯随机场 (GRF), 条件随机场 (CRF), 和高斯随机场。

二、马尔可夫随机场（Markov Random Field）

也有人翻译为马尔科夫随机场，它包含两层意思：一是什么是马尔可夫，二是什么是随机场。

马尔可夫一般是马尔可夫性质的简称。它指的是一个随机变量序列按时间先后关系依次排开的时候，第N+1时刻的分布特性，与N时刻以前的随机变量的取值无关。拿天气来打个比方。如果我们假定天气是马尔可夫的，其意思就是我们假设今天的天气仅仅与昨天的天气存在概率上的关联，而与前天及前天以前的天气没有关系。其它如传染病和谣言的传播规律，就是马尔可夫的。

随机场包含两个要素：位置（site），相空间（phase space）。当给每一个位置中按照某种分布随机赋予相空间的一个值之后，其全体就叫做随机场。我们不妨拿种地来打个比方。“位置”好比是一亩亩农田； “相空间”好比是种的各种庄稼。我们可以给不同的地种上不同的庄稼，这就好比给随机场的每个“位置”，赋予相空间里不同的值。所以，俗气点说，随机场就是在哪块地里种什么庄稼的事情。

好了，明白了上面两点，就可以讲马尔可夫随机场了。还是拿种地打比方，如果任何一块地里种的庄稼的种类仅仅与它邻近的地里种的庄稼的种类有关，与其它地方的庄稼的种类无关，那么这些地里种的庄稼的集合，就是一个马尔可夫随机场。

马尔可夫随机场，描述了具有某种特性的集合。拿种地打比方，如果任何一块地里种的庄稼的种类仅仅与它邻近的地里种的庄稼的种类有关，与其它地方的庄稼的种类无关，那么这些地里种的庄稼的集合，就是一个马尔可夫随机场。

2.1、马尔科夫随机场 - 什么是随机过程

在当代科学与社会的广阔天地里，人们都可以看到一种叫作随机过程的数学模型：从银河亮度的起伏到星系空间的物质分布、从分子的布朗运动到原子的蜕变过程，从化学反应动力学到电话通讯理论、从谣言的传播到传染病的流行、从市场预测到密码破译，随机过程理论及其应用几乎无所不在。人类历史上第一个从理论上提出并加以研究的过程模型是马尔科夫链，它是马尔科夫对概率论乃至人类思想发展作出的又一伟大贡献。

出于扩大极限定理应用范围的目的，马尔科夫在本世纪初开始考虑相依随机变量序列的规律，并从中选出了最重要的一类加以研究。1906年他在《大数定律关于相依变量的扩展》一文中，第一次提到这种如同锁链般环环相扣的随机变量序列，其中某个变量各以多大的概率取什么值，完全由它前面的一个变量来决定，而与它更前面的那些变量无关。这就是被后人称作马尔科夫链的著名概率模型。也是在这篇论文里，马尔科夫建立了这种链的大数定律。

2.2、马尔科夫随机场 - 什么是马尔科夫随机过程和马尔科夫链

用一个通俗的比喻来形容，一只被切除了大脑的白鼠在若干个洞穴间的蹿动就构成一个马尔科夫链。因为这只白鼠已没有了记忆，瞬间而生的念头决定了它从一个洞穴蹿到另一个洞穴；当其所在位置确定时，它下一步蹿往何处与它以往经过的路径无关。这一模型的哲学意义是十分明显的，用前苏联数学家辛钦（1894－1959〕的话来说，就是承认客观世界中有这样一种现象，其未来由现在决定的程度，使得我们关于过去的知识丝毫不影响这种决定性。这种在已知“现在”的条件下，“未来”与“过去”彼此独立的特性就被称为马尔科夫性，具有这种性质的随机过程就叫做马尔科夫过程，其最原始的模型就是马尔科夫链。

这即是对荷兰数学家惠更斯（Ch. Huygens, 1629－1659）提出的无后效原理的概率推广，也是对法国数学家拉普拉斯（P. S. Laplace, 1749－1827）机械决定论的否定。

这里应该指出，尽管拉普拉斯对概率论的早期发展作出过重大贡献，但是他的部分哲学观点是不利于这门学科的深入发展的。十八世纪以来，随着牛顿力学的彻底胜利，一种机械唯物主义的决定论思潮开始在欧洲科学界蔓延，鼓吹最力者就是拉普拉斯。1759年他在巴黎高等师范学院发表了一篇题为《概率论的哲学探讨》的演讲，淋漓尽致地表达出了这种思想。他说：“假如有人知道了某一时刻支配自然的一切力，以及它的一切组成部分的相对位置，又假如他的智力充分发达，能把这一切数据加以充分的分析，把整个宇宙中从最巨大的天体到最微小的原子的一切运动完全包括在一个公式里面，这样对他就没有什么东西是不确定的了，未来也好，过去也好，他都能纵览无遗。”1812年，拉普拉斯又进一步提出“神圣计算者”的观念，认为这个理想的数学家只须知道世界某一时刻的初始状态，就可以从一个无所不包的微分方程中算出过去和未来的一切状态。换句话说，他认为任意系统在 t > t0时的状态 x可由其初始时刻 t0和初始状态 x0唯一决定。这可真是笔判终身、细评流年，数学家可以摆个卦摊了。马尔科夫的概率模型从根本上否定了系统中任一状态 x与其初始状态 x0之间的因果必然性，从而也否定了“神圣计算者”的神话。

还应该指出，马尔科夫所建立的概率模型不但具有深刻的哲学意义，而且具有真实的物质背景，在他的工作之前或同时，一些马尔科夫链或更复杂的随机过程的例子已出现在某些人的研究中，只不过这些人没有自觉地认识到这类模型的普遍意义或用精确的数学语言表述出来罢了。例如苏格兰植物学家布朗 ( R. Brown, 1773－1858) 于1827年发现的悬浮微粒的无规则运动、英格兰遗传学家高尔顿（F.Galton, 1822－1911) 于1889年提出的家族遗传规律、荷兰物理学家埃伦费斯特 ( P. Ehrenfest, 1880－1933) 于1907年关于容器中分子扩散的实验，以及传染病感染的人数，谣言的传播，原子核中自由电子的跃迁，人口增长的过程等等，都可用马尔科夫链或过程来描述。也正是在统计物理、量子力学、遗传学以及社会科学的若干新课题、新事实面前，决定论的方法显得百孔千疮、踵决肘见。

有趣的是，马尔科夫本人没有提到他的概率模型在物理世界的应用，但是他利用了语言文学方面的材料来说明链的性质。在《概率演算》第四版中，他统计了长诗《叶甫盖尼·奥涅金》中元音字母和辅音字母交替变化的规律：这是长诗开头的两句，意为：“我不想取悦骄狂的人生，只希望博得朋友的欣赏。”诗人那火一般的诗篇在数学家那里变成了一条冷冰冰的锁链：在这条锁链上只有两种链环，C代表辅音、代表元音（为了使问题简化起见，不仿把两个无音字母算作辅音）。马尔科夫分别统计了在C后面出现C和的概率p和1－p，以及在后出现C和的概率q和1－q，把结果与按照俄语拼音规则计算出的结果进行比较，证实了语言文字中随机的（从概率的意义上讲）字母序列符合他所建立的概率模型。

完成了关于链的大数定律的证明之后，马尔科夫又开始在一系列论文中研究链的中心极限定理。1907年他在《一种不平常的相依试验》中证明了齐次马尔科夫链的渐近正态性；1908年在《一个链中变量和的概率计算的极限定理推广》中作了进一步的推广；1910年他发表了重要的论文《成连锁的试验》，在其中证明了两种情况的非齐次马尔科夫链的中心极限定理。与此同时他在一些假定的前提下证明了模型的各态历经性，成为在统计物理中具有重要作用的遍历理论中第一个被严格证明的结果。遍历理论亦称ergodic理论, 是奥地利物理学家玻耳兹曼（L. Boltzmann, 1844－1906) 于1781年提出来的，其大意是：一个系统必将经过或已经经过其总能量与当时状态相同的另外的任何状态。

马尔科夫链的引入，在物理、化学、天文、生物、经济、军事等科学领域都产生了连锁性的反应，很快地涌现出一系列新的课题、新的理论和新的学科，并揭开了概率论中一个重要分支－－随机过程理论蓬勃发展的序幕。

2.3、马尔科夫随机场 - 马尔科夫随机场的通俗解释

马尔可夫随机场（Markov Random Field）包含两层意思。

马尔可夫性质：它指的是一个随机变量序列按时间先后关系依次排开的时候，第N+1时刻的分布特性，与N时刻以前的随机变量的取值无关。拿天气来打个比方。如果我们假定天气是马尔可夫的，其意思就是我们假设今天的天气仅仅与昨天的天气存在概率上的关联，而与前天及前天以前的天气没有关系。其它如传染病和谣言的传播规律，就是马尔可夫的。

随机场：当给每一个位置中按照某种分布随机赋予相空间的一个值之后，其全体就叫做随机场。我们不妨拿种地来打个比方。其中有两个概念：位置（site），相空间（phase space）。“位置”好比是一亩亩农田；“相空间”好比是种的各种庄稼。我们可以给不同的地种上不同的庄稼，这就好比给随机场的每个“位置”，赋予相空间里不同的值。所以，俗气点说，随机场就是在哪块地里种什么庄稼的事情。

马尔可夫随机场：拿种地打比方，如果任何一块地里种的庄稼的种类仅仅与它邻近的地里种的庄稼的种类有关，与其它地方的庄稼的种类无关，那么这些地里种的庄稼的集合，就是一个马尔可夫随机场。

2.4、马尔科夫随机场 - 马尔科夫过程的数学描述

马尔科夫过程

马尔科夫随机场

2.5、马尔科夫随机场 - 马尔科夫链的数学描述

马尔科夫链

马尔科夫随机场

2.6、马尔科夫随机场 - 马尔科夫随机场的数学描述

马尔科夫随机场

2.7、马尔科夫随机场 - 参考资料

1.http://zhidao.baidu.com/question/61399759.html?fr=qrl
2.http://www.hudong.com/wiki/马尔科夫#9
3.http://www.cad.zju.edu.cn/home/siuleung/download/Markov.ppt
4.http://define.cnki.net/define_result.aspx?searchword=随机场
5.http://ks.cn.yahoo.com/question/1590000221191.html

http://www.hudong.com/wiki/马尔科夫随机场

三、条件随机场

最近一种新的分类方法“条件随机场”被用于中文分词和词性标注等词法分析工作，一般序列分类模型常常采用隐马模型（HMM），像基于类的中文分词。但隐马模型中存在两个假设：输出独立性假设和马尔可夫性假设。其中，输出独立性假设要求序列数据严格相互独立才能保证推导的正确性，而事实上大多数序列数据不能被表示成一系列独立事件。而条件随机场则使用一种概率图模型，具有表达长距离依赖性和交叠性特征的能力，能够较好地解决标注（分类）偏置等问题的优点，而且所有特征可以进行全局归一化，能够求得全局的最优解。

条件随机场(Conditional random fields)，是一种判别式图模型，因为其强大的表达能力和出色的性能，得到了广泛的应用。从最通用角度来看，CRF本质上是给定了观察值集合 (observations)的马尔可夫随机场。在这里，我们直接从最通用的角度来认识和理解CRF，最后可以看到，线性CRF和所谓的高阶CRF，都是某种特定结构的CRF。

3.1、随机场

简单地讲，随机场可以看成是一组随机变量的集合（这组随机变量对应同一个样本空间）。当然，这些随机变量之间可能有依赖关系，一般来说，也只有当这些变量之间有依赖关系的时候，我们将其单独拿出来看成一个随机场才有实际意义。

3.2、Markov随机场(MRF)

这是加了Markov性质限制的随机场。首先，一个Markov随机场对应一个无向图。这个无向图上的每一个节点对应一个随机变量，节点之间的边表示节点对应的随机变量之间有概率依赖关系。因此，Markov随机场的结构本质上反应了我们的先验知识——哪些变量之间有依赖关系需要考虑，而哪些可以忽略。 Markov性质是指，对Markov随机场中的任何一个随机变量，给定场中其他所有变量下该变量的分布，等同于给定场中该变量的邻居节点下该变量的分布。这让人立刻联想到马式链的定义：它们都体现了一个思想：离当前因素比较遥远(这个遥远要根据具体情况自己定义）的因素对当前因素的性质影响不大。

Markov性质可以看作是Markov随机场的微观属性，那么其宏观属性就是其联合概率的形式。

假设MRF的变量集合为
S=｛y1,…yn},
P(y1,…yn)= 1/Z * exp{-1/T * U(y1,..yn)},
其中Z是归一化因子，即对分子的所有y1,..yn求和得到。U(y1,..yn)一般称为energy function, 定义为在MRF上所有clique-potential之和。T称为温度，一般取1。什么是click-potential呢? 就是在MRF对应的图中，每一个clique对应一个函数，称为clique-potential。这个联合概率形式又叫做Gibbs distribution。Hammersley and Clifford定理表达了这两种属性的等价性。
如果click- potential的定义和clique在图中所处的位置无关，则称该MRF是homogeneous；如果click-potential的定义和 clique在图中的朝向(orientation)无关，则称该MRF是isotropic的。一般来说，为了简化计算，都是假定MRF即是 homogeneous也是iostropic的。

3.3、从Markov随机场到CRF

现在，如果给定的MRF中每个随机变量下面还有观察值，我们要确定的是给定观察集合下，这个MRF的分布，也就是条件分布，那么这个MRF就称为 CRF(Conditional Random Field)。它的条件分布形式完全类似于MRF的分布形式,只不过多了一个观察集合x，即P(y1,..yn|x) = 1/Z(x) * exp{ -1/T * U(y1,…yn,x)。U(y1,..yn,X)仍旧是click-potential之和。

3.4、训练

通过一组样本，我们希望能够得到CRF对应的分布形式，并且用这种分布形式对测试样本进行分类。也就是测试样本中每个随机变量的取值。

在实际应用中，clique-potential主要由用户自己定义的特征函数组成，即用户自己定义一组函数，这些函数被认为是可以用来帮助描述随机变量分布的。而这些特征函数的强弱以及正向、负向是通过训练得到的一组权重来表达的，这样，实际应用中我们需要给出特征函数以及权重的共享关系(不同的特征函数可能共享同一个权重),而clicque-potential本质上成了对应特征函数的线性组合。这些权重就成了CRF的参数。因此，本质上，图的结构是用户通过给出特征函数的定义确定的（例如，只有一维特征函数，对应的图上是没有边的)还有，CRF的分布成了对数线性形式。

看到这个分布形式，我们自然会想到用最大似然准则来进行训练。对其取log之后，会发现，表达式是convex的，也就是具有全局最优解——这是很让人振奋的事情。而且，其梯度具有解析解，这样可以用LBFGS来求解极值。

此外，也可以使用最大熵准则进行训练，这样可以用比较成熟的GIS和IIS算法进行训练。由于对数线性的分布形式下，最大熵准则和最大似然准则本质上是一样的，所以两者区别不是很大。

此外，由于前面两种训练方法在每一轮迭代时，都需要inference,这样会极大地降低训练速度。因此普遍采用另一种近似的目标函数，称为伪似然。它用每个随机变量的条件分布(就是给定其他所有随件变量的分布)之积来替代原来的似然函数，根据markov性质，这个条件分布只和其邻居有关(Markov Blanket),这样在迭代过程中不需要进行全局的inference,速度会得到极大的提升。我自己的经验表明，当特征函数很多取实数值时，伪似然的效果跟最大似然的差不多，甚至略好于后者。但对于大量二元特征(binary-valued)，伪似然的效果就很差了。

3.5、推断

如前所述，训练的过程中我们需要概率推断，分类的时候我们需要找出概率最大的一组解，这都涉及到推断。这个问题本质上属于图模型上的概率推断问题。对于最简单的线性框架的结构，我们可以使用Viterbi算法。如果图结果是树形的，可以采用信念传播(belief propogation),用sum-product得到概率，用max-product得到最优的configuration.但是对于任意图，这些方法就无效了。一种近似的算法，称为loopy-belief propogation,就是在非树形结构上采用信念传播来进行推断，通过循环传播来得到近似解。这么做据说在某些场合下效果不错。但是，在训练时如果采用近似推断的话，可能会导致长时间无法收敛。
基于任意图上的概率推断算法称为junction tree。这个算法能够保证对任意图进行精确推理。它首先把原来的图进行三角化，在三角化的图上把clique按照某种方式枚举出来作为节点（实际上就是合并特征函数),clicque之间如果有交集，对应的节点之间就有边，这样就得到一个新的图，通过对这个图求最大生成树，就得到了Junction tree. 最后在junction tree上进行信念传播可以保证得到精确解。

本质上这3中算法都属于动态规划的思想。Viterbi的想法最直观，信念传播首先将特征函数都转换为factor，并将其与随机变量组合在一起形成 factor-graph, 这样在factor-graph上用动态规划的思想进行推断（即做了一些预处理)。junction tree的做法是通过合并原有的特征函数, 形成一种新的图，在这个图上可以保证动态规划的无后效性，于是可以进行精确推理。(做了更为复杂的预处理)值得注意的是，junction tree虽然极大地避开了组合爆炸，但由于它要合并特征函数并寻找clique, 用户的特征函数如果定义的维数过大，它得到新的clique也会很大，这样在计算的时候还是会很低效，因为在推断的过程中它需要遍历所有clique中的配置，这和clique的大小是呈指数级的。所以，用户要避免使用维数过高的特征。

3.6、CRF及其应用

条件随机域模型是一种无向图模型，它是在给定需要标记的观察序列的条件下，计算整个标记序列的联合概率分布，而不是在给定当前状态条件下，定义下一个状态的状态分布。即给定观察序列O,求最佳序列S。

1 链式条件随机场模型的图结构

2 条件随机场模型的分解式

3 原理：

（1）目标函数：基于最大熵原则进行建模，定义样本条件熵

（2）约束条件：

以团为单位定义特征

约束特征的样本期望与模型期望相同：

另外：

（3）求解：运用拉格朗日乘数法，求解出条件随机场的分布形式如下：

4 与其他算法的比较

优点：

（1）CRF没有HMM那样严格的独立性假设条件，因而可以容纳任意的上下文信息。特征设计灵活（与ME一样）————与HMM比较

（2）同时，由于CRF计算全局最优输出节点的条件概率，它还克服了最大熵马尔可夫模型标记偏置（Label-bias）的缺点。————与MEMM比较

（3）CRF是在给定需要标记的观察序列的条件下，计算整个标记序列的联合概率分布，而不是在给定当前状态条件下，定义下一个状态的状态分布。

————与ME比较

缺点：训练代价大、复杂度高

5 应用

常见的序列标注问题，如分词、词性标注等等。via

固定链接: 随机场-Random Field | 丕子 +复制链接

四、HMM,MEMM,CRF模型的比较

这三个模型都可以用来做序列标注模型。但是其各自有自身的特点，HMM模型是对转移概率和表现概率直接建模，统计共现概率。而MEMM模型是对转移概率和表现概率建立联合概率，统计时统计的是条件概率。MEMM容易陷入局部最优，是因为MEMM只在局部做归一化，而CRF模型中，统计了全局概率，在做归一化时，考虑了数据在全局的分布，而不是仅仅在局部归一化，这样就解决了MEMM中的标记偏置的问题。

举个例子，对于一个标注任务，“我爱北京天安门“，

标注为" s s b e b c e"

对于HMM的话，其判断这个标注成立的概率为 P= P(s转移到s)*P('我'表现为s)* P(s转移到b)*P('爱'表现为s)* ...*P().训练时，要统计状态转移概率矩阵和表现矩阵。

对于MEMM的话，其判断这个标注成立的概率为 P= P(s转移到s|'我'表现为s)*P('我'表现为s)* P(s转移到b|'爱'表现为s)*P('爱'表现为s)*..训练时，要统计条件状态转移概率矩阵和表现矩阵。

对于CRF的话，其判断这个标注成立的概率为 P= F(s转移到s,'我'表现为s)....F为一个函数，是在全局范围统计归一化的概率而不是像MEMM在局部统计归一化的概率。

五.无向图模型

转（http://isip.buaa.edu.cn/lichen/?p=192）
本文翻译自Conditional Random Fields: An Introduction. Hanna M. Wallach February 24, 2004

可以把条件随机场看成是一个无向图模型或者在观察变量序列上的马尔科夫随机场。形式化地定义，是无向图，其中的节点对应中的一个元素。如果每个随机变量满足马尔科夫性质，那么就是一个条件随机场。理论上图可以是任意结构，只要它体现了标签序列之间的条件独立性。尽管如此，在对序列建模的时候，最简单和常见的图结构是其中的序列节点即的各个元素排成一条链状（简单的一阶模型）。如下图所示：

5.1 潜在函数

基于条件独立的概念，条件随机场的图结构可以用于把分布于上的联合概率函数分解成多个严格为正的实值函数（潜在函数）的乘积。这些实值函数需要进行标准化以满足概率函数的特质。根据无向图条件独立性定义，如果中两个节点不相邻（无边连接它们），那么由这两个节点代表的随机变量在给定其他随机变量的情况下就是条件独立的。潜在函数必须保证联合概率函数的可分解性，也就是说，条件独立的随机变量不能出现在同一个潜在函数中。直观地看，要满足这个条件就要求每个这样的潜在函数在仅定义在图中的一个最大团（clique）中的节点对应的随机变量上。这就保证了没有潜在函数会引用不直接相邻的两个节点，而属于同一个团的节点之间的关系也变得明了。在上图的链式CRF中，每个潜在函数仅仅定义在相邻的标签节点对和上。

注意，单独的潜在函数是没有直接上的概率意义，它仅仅代表其定义上的这些随机变量之间的一种约束关系。但它们的乘积却影响了全局的概率。全局概率较高的模型更有可能满足这些局部约束关系。
来自: http://hi.baidu.com/ming_roady/blog/item/2a47d558e7e633242934f02e.html

六、条件随机场

转（http://isip.buaa.edu.cn/lichen/?p=208）
本文翻译自Conditional Random Fields: An Introduction. Hanna M. Wallach February 24, 2004

Lafferty et al定义在给出观察序列的条件下某个标签序列的条件概率是一系列潜在函数的乘积（归一化后）。每个潜在函数有如下的形式：

其中是定义在整个观察序列和第和位置上的标签的转移特征函数；是定义在第位置上的标签和整个观察序列上的状态特征函数；和则需要通过训练参数估计得出。

在定义这些特征函数的前，我们首先构建一系列定义于观察序列上实值特征，这些特征用于描述训练数据的经验分布的某些特点。这些特点符合模型的分布。一个这样特征的例子如下：
图片

每个特征函数选择这样的某个实值观察特征作为它的值。对于状态特征函数，如果当前的状态是某个特定的值，该特征函数取值为；对于转移特征函数，如果当前的状态和前一状态是某特定值，它就取值。因此所有的特征函数都是实值函数。例如，考虑下面的转移特征函数：
图片（也见上图）
在接下来的章节，我们采用下面的简写：

记：

其中代表状态特征函数或者转移特征函数 . 这样我们就可以把给出一个观察序列，某个标注序列的条件概率写成如下形式：

是个归一化因子。是不是似曾相似，对了，这个条件概率和最大熵模型中的目标函数是一样的。

来自: http://hi.baidu.com/ming_roady/blog/item/4563ceeda500d1df2e2e2102.html

七、随机场 random field

　　随机场，多维时间随机过程(stochastic Proo乏s谊nlultidi叮rnsional tnne)，多维参数随机过程(stocll是巧tic pro璐5 witll am川tidi- n℃r‘ional pardll犯ter) 一种定义在多维空间点集上的随机函数(random nmctjon).随机场是随机函数的一个重要例子(见随机元(ralldom elezllent))，在各种应用中常常遇到. 依赖于三个空问坐标x，y，:(以及时间t)的随机场的例子是湍流的速度分量、气压和溢度场(见tl〕). 依赖于两个坐标x和夕的随机场例子是一个波状的海面或粗糙的板表面的高度:(见fZ」).在按地球尺度的大范围大气过程的研究中，地面压力场和其他气象特征有时看作球面上的随机场，等等. 一般形式的随机场理论几乎等同于随机函数的一般理论.人们只能对各种带有附加性质的特殊类型的随机场得到更有趣的具体结果.那些附加性质简化了对它们的研究.齐次随机场(m幻dom fie】d，homo罗- 卿us)是这样一类随机场，定义在具有变换群G的齐次空间S上并且具有性质:在S的任意一个有限点组上场的值的概率分布，或场的平均值及点对上值的二阶矩，当G的元素作用到它们的自变量上时是不变的.在Euchde空间R“，k=l，2，…，或在R人的具有整值坐标的格点集Z人上的齐次随机场，当G取成一切可能的(或所有整值的)平行变换的群时是平稳随机过程(statiol釜Lry stocl蝴tic pro眯)的自然推广，有关平稳随机过程的许多结果可用类似的方式搬到这种齐次随机场上.在应用上(特别，对流体力学，见【1】)有极大兴趣的是R3或RZ上的称之为各向同性的齐次随机场，其中G是相应空间的各向同性变换群.齐次随机场的一个重要特点是无论对场本身还是它的相关函数都存在特殊形式的谱分解(例如，见 t31，[41，汇川;亦见随机函数的谱分解(s详ct抢】 decomPos币on of an川domf加Ction)). 吸引着很大注意力的另外一类随机场是定义在R介的某一区域K上的Ma拌oB随机场(Markov抢ndom 6e】ds).随机场U(x)是初习评oB的条件;粗略地说，是对一个具有边界r的开集Q的充分大的族，对任意。>0，取定这个场在r的。邻域rE上的值的条件下，随机变量族{u(x):x任Q\r“}和{U(x): x6T\厂;独立，其中T是在K中Q的闭包的余集 (或在广义MaPKoB性的情形，两个随机变量族相互不相关，例如见【SJ).可以把这一概念推广到L- Ma拌oB随机场，上述独立性(或正交性)只需将任意宽度的。邻域r“换作特殊厚度类型的边界r+L. M技PKoB随机场和L一MaPKoB场的理论在量子场论和统计物理学中有许多重要的应用(见汇6]，「7」).由统计物理问题产生的另外一类随机场是Gib比随机场，它的概率分布可以用gb怡分布(Gib忱distribution) (例如，见【7」，汇8}，【10〕)来表示.定义场砒随机场的一种方便的方式包含一族在一有限区域内场的值的条件概率分布(相对于这个区域外部的一切固定值).必须注意，把平滑流形S上的随机场看作一个厂‘义随机场的特殊情形常常是方便的.这种随机场可能在一个指定的点不存在值，但其平滑值U(甲)可解释作在某个平滑检验函数中(x)空间D上定义的随机线性泛函.广义随机场(特别是广义Ma哪oB随机场)在物理应用中广泛地被使用.在广义随机场 (random field，罗nemll左过)理论的范围内，通过考虑场U(职)，其中，(x)满足丁，(x)己、一。，相对于平稳增最随机过程(stochasticp~俪tll s扭加na理~nts)，也可以定义局部齐次(以及局部齐次且局部各向同性)随机场，见〔10]，〔川.在湍流的统计理论中这样的场起着重要的作用(例如，见11〕.19]). 【补注】对Gib比场和Ma琳朋场亦见【A2]一IA3]，随机场的估计理论在〔A4]一〔A51中有讨论，关于随机场的极限定理见fAS]，

八、马尔可夫随机场（Markov Random Field）

包含两层意思。一是什么是马尔可夫，二是什么是随机场。

随机场包含两个要素：位置（site），相空间（phase space）。当给每一个位置中按照某种分布随机赋予相空间的一个值之后，其全体就叫做随机场。我们不妨拿种地来打个比方。“位置”好比是一亩亩农田；“相空间”好比是种的各种庄稼。我们可以给不同的地种上不同的庄稼，这就好比给随机场的每个“位置”，赋予相空间里不同的值。所以，俗气点说，随机场就是在哪块地里种什么庄稼的事情。

九、条件随机场（Conditional random fields，CRFs）

与最大熵模型相似，条件随机场（Conditional random fields，CRFs）是一种机器学习模型，在自然语言处理的许多领域（如词性标注、中文分词、命名实体识别等）都有比较好的应用效果。条件随机场最早由John D. Lafferty提出，其也是Brown90的作者之一，和贾里尼克相似，在离开IBM后他去了卡耐基梅隆大学继续搞学术研究，2001年以第一作者的身份发表了CRF的经典论文 “Conditional random fields: Probabilistic models for segmenting and labeling sequence data”。

条件随机场理论（CRFs）可以用于序列标记、数据分割、组块分析等自然语言处理任务中。在中文分词、中文人名识别、歧义消解等汉语自然语言处理任务中都有应用，表现很好。

目前基于 CRFs 的主要系统实现有 CRF，FlexCRF，CRF++

缺点：训练代价大、复杂度高

—预备知识
—产生式模型和判别式模型（Generative model vs. Discriminative model）
—概率图模型
—隐马尔科夫模型
—最大熵模型

机器学习方法的两种分类：产生式模型和判别式模型

假定输入x, 类别标签y

—产生式模型（生成模型）估计联合概率 P(x, y), 因可以根据联合概率来生成样本 —: HMMs
—判别式模型（判别模型）估计条件概率 P(y|x), 因为没有x的知识，无法生成样本，只能判断分类: SVMs,CRF,MEM
一个举例：
(1,0), (1,0), (2,0), (2, 1)
产生式模型：

p(x, y)：
P(1, 0) = 1/2, P(1, 1) = 0, P(2, 0) = 1/4, P(2, 1) = 1/4.

判别式模型：
P(y|x)：
P(0|1) = 1, P(1|1) = 0, P(0|2) = 1/2, P(1|2) = 1/2
—o和s分别代表观察序列和标记序列
—产生式模型
—     构建o和s的联合分布p(s,o)
—判别式模型
—     构建o和s的条件分布p(s|o)
—产生式模型中，观察序列作为模型的一部分；
—判别式模型中，观察序列只作为条件，因此可以针对观察序列设计灵活的特征。
产生式模型：无穷样本==》概率密度模型 = 产生模型==》预测
判别式模型：有限样本==》判别函数 = 预测模型==》预测
    一般认为判别型模型要好于生成型模型，因为它是直接根据数据对概率建模，而生成型模型还要先求两个难度相当的概率
概率图模型
—用图的形式表示概率分布
—基于概率论中贝叶斯规则建立起来的，解决不确定性问题，可以用于人工智能、数据挖掘、语言处理文本分类等领域

图模型是表示随机变量之间的关系的图，图中的节点表示随机变量，缺少边表示条件独立假设。因此可以对联合分布提供一种紧致表示
—根据边是否有方向，有两种主要的图模型
◦无向图：亦称马尔科夫随机场(Markov Random Fields, MRF’s)或马尔科夫网络(Markov Networks)
◦有向图：亦称贝叶斯网络(Bayesian Networks)或信念网络(Belief Networks, BN’s).
◦还有混合图模型，有时称为链图(chain graphs)
—我们不妨拿种地来打个比方。其中有两个概念：位置（site），相空间（phase space）。“位置”好比是一亩亩农田；“相空间”好比是种的各种庄稼。我们可以给不同的地种上不同的庄稼，这就好比给随机场的每个“位置”，赋予相空间里不同的值。所以，俗气点说，随机场就是在哪块地里种什么庄稼的事情。
—简单地讲，随机场可以看成是一组随机变量的集合（这组随机变量对应同一个样本空间）。当给每一个位置中按照某种分布随机赋予相空间的一个值之后，其全体就叫做随机场。
—当然，这些随机变量之间可能有依赖关系，一般来说，也只有当这些变量之间有依赖关系的时候，我们将其单独拿出来看成一个随机场才有实际意义。
—具有马尔科夫性质
—体现了一个思想：离当前因素比较遥远(这个遥远要根据具体情况自己定义）的因素对当前因素的性质影响不大。

条件随机场模型是一种无向图模型，它是在给定需要标记的观察序列的条件下，计算整个标记序列的联合概率分布，而不是在给定当前状态条件下，定义下一个状态的状态分布。即给定观察序列O,求最佳序列S。

CRF其实就是一种在生产模型基础上的判别模型？

条件随机场模型是由Lafferty在2001年提出的一种典型的判别式模型。它在观测序列的基础上对目标序列进行建模,重点解决序列化标注的问题条件随机场模型既具有判别式模型的优点,又具有产生式模型考虑到上下文标记间的转移概率,以序列化形式进行全局参数优化和解码的特点,解决了其他判别式模型(如最大熵马尔科夫模型)难以避免的标记偏置问题。

目前基于 CRFs 的主要系统实现有 CRF，FlexCRF，CRF++

缺点：训练代价大、复杂度高

关于条件随机场的参考文献及其他资料，Hanna Wallach在05年整理和维护的这个页面“conditional random fields”非常不错，其中涵盖了自01年CRF提出以来的很多经典论文（不过似乎只到05年，之后并未更新）以及几个相关的工具包(不过也没有包括CRF++），但是仍然非常值得入门条件随机场的读者参考。

一般序列分类模型常常采用隐马模型(HMM), 像基于类的中文分词, 但隐马模型中存在两个假设: 输出独立性假设和马尔可夫性假设. 其中, 输出独立性假设要求序列数据严格相互独立才能保证推导的正确性, 而事实上大多数序列数据不能被表示成一系列独立事件. 而条件随机场则使用一种概率图模型, 具有表达长距离依赖性和交叠性特征的能力, 能够较好地解决标注(分类)偏置等问题的优点, 而且所有特征可以进行全局归一化, 能够求得全局的最优解.

条件随机场是一个无向图上概率分布的学习框架, 由Lafferty 等首先引入到自然语言处理的串标引学习任务中来. 最常用的一类CRF是线性链CRF, 适用于我们的分词学习. 记观测串为W=w1w2…wn, 标记串(状态)序列 Y=y1y2…yn, 线性链CRF对一个给定串的标注, 其概率定义为:

。。。。。。

其中, Y是串的标注序列, W是待标记的字符, fk是特征函数, λk是对应的特征函数的权值, 而t是标记, Z(W)是归一化因子, 使得上式成为概率分布.

CRF模型的参数估计通常使用L-BFGS算法来完成. CRF的解码过程, 也就是求解未知串标注的过程, 需要搜索计算该串上的一个最大联合概率, 即:

Y* = arg max(y)P(Y|W)

在线性链CRF上, 这个计算任务可以用一般的Viterbi算法来有效地完成.

目前我发现的关于CRF的实现有:

* CRF++(http://crfpp.sourceforge.net/)

* Pocket CRF(http://sourceforge.net/project/showfiles.php?group_id=201943)

图像分析、随机场和动态蒙特卡罗方法（英文版）

李子清书 Markov Random Field Modeling in Image Analysis

条件随机场http://wenku.baidu.com/view/de5c860a79563c1ec5da71e2.html

本文来自CSDN博客，转载请标明出处：http://blog.csdn.net/wen718/archive/2010/10/23/5960820.aspx

条件随机场：http://www.docin.com/p-92971531.html

你可能感兴趣的:(算法,tree,Random,自然语言处理,语言,任务)

数据库 DML 语句详解：语法与注意事项步行cgn 数据库数据库 oracle
数据库DML语句详解：语法与注意事项DML（DataManipulationLanguage，数据操作语言）用于操作数据库中的数据，主要包括SELECT、INSERT、UPDATE、DELETE等语句。下面我将详细说明每种操作的语法、使用场景和关键注意事项。一、SELECT查询语句基本语法SELECT[DISTINCT]column1,column2,...FROMtable_name[WHERE
【2025最新】AI大模型项目实战教程大揭秘！超详细攻略，手把手带你飞，记得收藏！大模型教程人工智能产品经理大模型大模型教程大数据大模型学习程序员
一、大模型开发整理流程1.1、什么是大模型开发我们将开发以大语言模型为功能核心、通过大语言模型的强大理解能力和生成能力、结合特殊的数据或业务逻辑来提供独特功能的应用称为大模型开发。开发大模型相关应用，其技术核心点虽然在大语言模型上，但一般通过调用API或开源模型来实现核心的理解与生成，通过PromptEnginnering来实现大语言模型的控制，因此，虽然大模型是深度学习领域的集大成之作，大模型开
VB.NET在2021年后有哪些更新=待验证专注VB编程开发20年数据库 VB c#.net 开发语言
在2021年后，VB.NET随着VisualStudio和.NET平台的更新持续演进，主要在.NET6（2021年11月）、.NET7（2022年11月）和.NET8（2023年11月）中引入了以下特性和改进：1.语言特性增强文件范围的命名空间（.NET6）允许在文件顶部声明单个命名空间，无需大括号，减少缩进：vbNamespaceMyNamespace.FileScoped'整个文件的代码都属于
.NET多线程任务实现的几种方法及线程等待全面分析百锦再@新空间包罗万象 .net android task Thread 线程并发线程池
文章目录1.引言2..NET多线程编程基础2.1线程概念回顾2.2.NET线程模型概述3.多线程任务实现方法3.1Thread类实现3.2ThreadPool实现3.3TaskParallelLibrary(TPL)3.4Parallel类3.5BackgroundWorker组件3.6Async/Await模式3.7各种方法的比较与选择4.线程等待机制详解4.1基本等待方法4.2同步原语4.3异
遥感影像数据处理-大图滑窗切分为小图 GIS潮流遥感语义分割
功能需求据所周知，遥感影像的尺寸有大有小，大的达到几万x几万像素，而图像分割算法模型在训练中尺寸适中，比如256x256，512x512，1024x1024等等，如果直接将遥感影像的原图输入模型中进行训练，大概率会提示内存和显存不足，因此针对遥感影像的模型训练，一般都需要将影像裁剪为小图。裁剪后的效果图如下：解决思路基于上面的需求，写了一套裁剪算法流程。主要考虑的是在裁剪过程中，从左往右、从上到下
数据结构学习——KMP算法 uwvwko 算法数据结构学习 c++kmp
//KMP算法#include#include#include#includeusingnamespacestd;//next数组值的推导voidgetNext(string&str,vector&next){intstrlong=str.size();//next数组的0位为0next[0]=0;//i为当前字符的位置，从1位（第2个开始）inti=1;//length为当前字符之前的最长匹配子
数据结构学习——树的储存结构 uwvwko 数据库学习算法树
三种表示法：双亲表示法，孩子表示法，孩子兄弟表示法双亲表示法//树结构——双亲表示法#includeusingnamespacestd;structTree{stringdata;Tree*parent;//双亲指针Tree*firstchild;//第一个孩子指针Tree*nextsibling;//下一个兄弟指针};voidCreateTree(Tree*&root,stringdata,Tr
npm run dev报错突然暴富的我 || 比较富的我 npm 前端 node.js
1.引言1.1什么是npmrundevnpmrundev是一个在Node.js项目中常用的命令，它允许开发者运行一个预定义的脚本，通常用于启动开发服务器或者执行开发环境的构建任务。这个命令是通过package.json文件中的scripts部分定义的，例如："scripts":{"dev":"nodemonapp.js"}在这个例子中，dev脚本使用nodemon工具来监控app.js文件的更改，
JavaScript性能优化代码示例突然暴富的我 || 比较富的我 javascript
JavaScript性能优化实战大纲性能优化的核心目标减少加载时间、提升渲染效率、降低内存占用、优化交互响应代码层面的优化实践避免全局变量污染，使用局部变量和模块化开发减少DOM操作频率，批量处理DOM更新使用事件委托替代大量事件监听器优化循环结构，减少不必要的计算使用WebWorkers处理密集型计算任务内存管理策略及时清除不再使用的对象引用避免内存泄漏，注意闭包使用场景使用弱引用（WeakMa
【有源码】基于爬虫+python的美食数据分析与可视化flask热门美食推荐系统的设计与实现 Q2643365023 Python 大数据 python 爬虫计算机毕设选题毕业设计源码计算机毕设项目数据分析美食推荐系统
注意：该项目只展示部分功能，如需了解，文末咨询即可。本文目录1.开发环境2系统设计2.1设计背景2.2设计内容3系统展示3.1功能展示视频3.2系统页面4更多推荐5部分功能代码1.开发环境开发语言：Python采用技术：flask、爬虫数据库：MySQL开发环境：PyCharm2系统设计2.1设计背景在现代社会中，人们对美食的兴趣和需求日益增长。互联网和社交媒体的普及使得各种美食信息、评论和推荐变
小程序领域开发语言的基础教程小程序开发2020 小程序开发语言 ai
小程序领域开发语言的基础教程：从0到1轻松入门关键词：小程序开发、WXML、WXSS、JavaScript、双线程模型、生命周期、组件化摘要：本文是针对小程序开发语言的零基础入门指南，通过生活类比、代码示例和实战案例，详细讲解小程序核心开发语言（WXML/WXSS/JavaScript）的原理、协作方式及实际应用。无论你是前端新手还是想转行小程序开发的小白，都能通过本文掌握小程序开发的“三板斧”，
【C++】— c++入门基础孙同学_ C++c++
1.C++的第一个程序首先C++兼容C语言的大多数语法，所以用C语言实现Helloworld！同样也可以运行。用C语言实现Helloworld！#includeintmain(){printf("Helloworld！\n");return0;}用C++实现Helloworld！#includeusingnamespacestd;intmain(){coutnamespace的作用namespac
文本数据增强-同义词替换、随机交换、随机插入、随机删除
根据zhangy代码改写，主要针对千言问题匹配进行文本数据增强。依赖安装pipinstalljiebapipinstallsynonymseda.pyimportjiebaimportsynonymsimportrandomfromrandomimportshufflerandom.seed(2019)#停用词列表，默认使用哈工大停用词表f=open('stopwords/hit_stopword
python递归实现乘法_算法-递归 weixin_39817012 python递归实现乘法
我们在前面学习过递归函数，递归函数采用的就是递归算法，前面我们通过最常见的菲波那切数列去学习了递归函数，这一节我们再来详细了解一下递归算法。1.递归算法递归算法(英语：recursionalgorithm)在计算机科学中是指一种通过重复将问题分解为同类的子问题而解决问题的方法。递归式方法可以被用于解决很多的计算机科学问题，因此它是计算机科学中十分重要的一个概念，递归算法有三个特点：1)递归的过程一
自然语言处理(NLP)中的文本生成控制技术 AI天才研究院 AI大模型企业级应用开发实战 Agentic AI 实战 AI人工智能与大数据自然语言处理 easyui 人工智能 ai
自然语言处理(NLP)中的文本生成控制技术关键词：文本生成、可控生成、语言模型、Prompt工程、解码策略、条件控制、评估指标摘要：本文深入探讨自然语言处理中文本生成控制技术的最新进展。我们将从基础概念出发，系统分析各种控制方法的原理和实现，包括Prompt设计、解码策略优化、条件控制机制等核心内容。文章将结合数学模型、算法实现和实际案例，全面展示如何实现高质量、可控的文本生成，并探讨该领域面临的
算法-基础算法-枚举算法（Python）总裁余(余登武) 算法与数据结构算法 leetcode
文章目录前言解题思路题目1两数之和2计数质数前言枚举算法（EnumerationAlgorithm）：也称为穷举算法，指的是按照问题本身的性质，一一列举出该问题所有可能的解，并在逐一列举的过程中，将它们逐一与目标状态进行比较以得出满足问题要求的解。在列举的过程中，既不能遗漏也不能重复。枚举算法的核心思想是：通过列举问题的所有状态，将它们逐一与目标状态进行比较，从而得到满足条件的解。由于
Kotlin语言的循环实现东华泰包罗万象 golang 开发语言后端
Kotlin语言的循环实现在编程中，循环结构是一个非常重要的概念，它允许我们重复执行一段代码，直到满足特定条件为止。Kotlin作为一种现代的编程语言，提供了简洁而强大的循环语法，使得开发者能够高效地实现各种循环操作。本文将详细介绍Kotlin中的循环结构，包括for、while、dowhile以及相应的应用实例和最佳实践。一、Kotlin的循环类型Kotlin主要支持三种类型的循环：for循环w
高性能计算（HPC）计算：Fortran 语言如何助力有限元、流体力学、结构力学、复合材料、增材制造仿真？源代码杀手高性能计算HPC专栏制造人工智能
Fortran语言在科学计算领域拥有悠久而坚实的历史，尤其在有限元分析（FEA）、流体力学（CFD）、结构力学、复合材料建模以及增材制造仿真（AdditiveManufacturingSimulation）等工程仿真方向具有不可替代的作用。以下从这几个方向具体说明Fortran如何助力仿真工作：一、有限元分析（FEA）Fortran在有限元分析中的应用可谓根深蒂固，许多商用和开源FEA求解器如AB
Ultralytics YOLO 库介绍与使用指南东北豆子哥人工智能/机器学习 YOLO
文章目录UltralyticsYOLO库介绍与使用指南主要特点安装基本使用1.使用预训练模型进行推理2.训练自定义模型3.验证模型4.导出模型高级功能1.使用不同任务模型2.使用自定义数据集3.跟踪对象(结合ByteTrack)常见问题解决性能优化技巧UltralyticsYOLO库介绍与使用指南UltralyticsYOLO是一个流行的计算机视觉库，专注于实现和优化YOLO(YouOnlyLoo
C语言的未来：C23标准的崭新篇章步子哥【软考】系统架构设计师 c语言开发语言
在编程语言的浩瀚星空中，C语言无疑是一颗璀璨的恒星。自1972年诞生以来，它以其简洁、高效的特性，成为无数程序员的心头好。从操作系统到嵌入式设备，C语言的身影无处不在。而如今，C语言迎来了它的最新标准——C23（ISO/IEC9899:2024）。这次更新不仅是一次技术上的革新，更是对现代编程需求的深刻回应。从过去到未来：C语言的演化之路C语言的标准化始于1989年（C89），随后经历了多次更新：
论软件设计方法及其应用怎么可能-怎么可能系统架构软件设计方法
20250427-作题目软件设计（SoftwareDesign，SD)根据软件需求规格说明书设计软件系统的整体结构、划分功能模块、确定每个模块的实现算法以及程序流程等，形成软件的具体设计方案。软件设计把许多事物和问题按不同的层次和角度进行抽象，将问题或事物进行模块化分解，以便更容易解决问题。分解得越细，模块数量也就越多，设计者需要考虑模块之间的耦合度。请围绕“论软件设计方法及其应用”论题，依次从以
DiNA：扩张邻域注意力 Transformer AI专题精讲 Paper阅读 transformer 人工智能
摘要Transformer正迅速成为跨模态、跨领域和跨任务中应用最广泛的深度学习架构之一。在计算机视觉领域，除了持续发展的纯transformer架构，分层transformer也因其优越的性能和在现有框架中易于集成而受到广泛关注。这类模型通常采用局部化的注意力机制，如滑动窗口的NeighborhoodAttention（NA）或SwinTransformer的ShiftedWindowSelfA
从 O(n³) 到按需计算：Swift 玩转稀疏矩阵乘法网罗开发 Swift swift 矩阵开发语言
文章目录摘要描述解题思路代码实现（Swift）分析这个代码是怎么做的？示例测试与输出结果时间复杂度空间复杂度总结摘要在大多数算法题里，矩阵乘法都不算太陌生了。但一旦题目提示“稀疏矩阵”——也就是大部分值都是0的那种，这就提示我们：有优化空间。这篇文章就用Swift带大家一步步搞懂怎么写一个更高效的稀疏矩阵乘法逻辑，顺便聊聊背后的思路。描述我们手上有两个矩阵，A和B，想把它们乘起来。和普通乘法不同的
Android面试准备之Android基础北诺南兮 android java 面试
一、Handler机制创建一个Handler//提示已过时Handlerhandler=newHandler();Handlerhandler=newHandler(Looper.myLooper());隐式指定Looper的Handler初始化方法已被Android11报过时，根据注释，是由于不指定Looper在一些场景下会导致任务丢失或程序崩溃，比如没有Looper的线程。publicstat
使用SQL-Ollama与自然语言交互SQL数据库的指南 antja_ 数据库 sql
#使用SQL-Ollama与自然语言交互SQL数据库的指南##技术背景介绍随着人工智能技术的发展，能够使用自然语言与SQL数据库交互的需求越来越大。这种技术可以帮助用户轻松访问和操作数据库，而无需深刻理解SQL语法。SQL-Ollama是一个专门设计的模板，利用Zephyr-7b模型，通过Ollama在本地运行推理，使这一过程变得简单而高效。##核心原理解析SQL-Ollama通过将自然语言转换为
R语言与C语言混合编程：在R语言中调用C语言函数数据探索 r语言 c语言开发语言 R语言
R语言与C语言混合编程：在R语言中调用C语言函数介绍：R语言是一种用于统计分析和数据可视化的高级编程语言，而C语言是一种通用的、强大的编程语言。在某些情况下，我们可能需要在R语言中调用C语言函数以提高性能或实现特定的功能。本文将介绍如何在R语言中调用C语言函数的方法，并提供相应的源代码示例。步骤：为了在R语言中调用C语言函数，我们需要执行以下步骤：编写C语言函数：首先，我们需要编写我们想要在R中调
Perl, Go 开发征信修复技巧及实操方案APP Geeker-2025 perl golang
以下是一个基于Perl和Go开发的征信修复技巧及实操方案APP的系统化设计方案，结合两种语言的优势及金融科技领域的合规要求：---###一、征信修复业务流程与功能设计|**流程阶段**|**核心功能**|**技术实现**||--------------------|-----------------------------|-------------------------------------
Git常见使用北珣. git
基本操作创建仓库1.先创建一个文件,再进入到对应的文件夹中#创建文件mkdir[file_name]#进入该文件cd[file_name]2.创建对应的Git仓库(在对应的文件夹内)#创建对应的仓库gitinit#可以查看当前文件内的内容llfile_name#查看tree目录tree.git/配置本地仓库必须要配置的配置项:nameemail为了方便操作,推荐在初始化仓库之后就进行配置#配置gi
倾向得分匹配的stata命令_R语言系列1：倾向得分匹配 weixin_39995108 倾向得分匹配的stata命令
1PSM简介倾向评分匹配(PropensityScoreMatching，简称PSM)是一种统计学方法，用于处理观察研究(ObservationalStudy)的数据。在观察研究中，由于种种原因，数据偏差(bias)和混杂变量(confoundingvariable)较多，倾向评分匹配的方法正是为了减少这些偏差和混杂变量的影响，以便对实验组和对照组进行更合理的比较。这种方法最早由PaulRosen
java 签名 ecdsa_数字签名算法ECDSA 哈全文 java 签名 ecdsa
一介绍ECDSA：EllipticCurvDigstalSignatureAlgorithm椭圆曲线数字签名算法。速度快、强度高、签名短二参数说明三代码实现packagecom.imooc.security.ecdsa;importjava.security.KeyFactory;importjava.security.KeyPair;importjava.security.KeyPairGene
log4j对象改变日志级别 3213213333332132 java log4j level log4j对象名称日志级别
log4j对象改变日志级别可批量的改变所有级别，或是根据条件改变日志级别。 log4j配置文件： log4j.rootLogger=ERROR,FILE,CONSOLE,EXECPTION #log4j.appender.FILE=org.apache.log4j.RollingFileAppender log4j.appender.FILE=org.apache.l
elk+redis 搭建nginx日志分析平台 ronin47 elasticsearch kibana logstash
elk+redis 搭建nginx日志分析平台 logstash,elasticsearch,kibana 怎么进行nginx的日志分析呢？首先，架构方面，nginx是有日志文件的，它的每个请求的状态等都有日志文件进行记录。其次，需要有个队列，redis的l
Yii2设置时区 dcj3sjt126com PHP timezone yii2
时区这东西，在开发的时候，你说重要吧，也还好，毕竟没它也能正常运行，你说不重要吧，那就纠结了。特别是linux系统，都TMD差上几小时，你能不痛苦吗？win还好一点。有一些常规方法，是大家目前都在采用的1、php.ini中的设置，这个就不谈了，2、程序中公用文件里设置，date_default_timezone_set一下时区3、或者。。。自己写时间处理函数，在遇到时间的时候，用这个函数处理（比较
js实现前台动态添加文本框，后台获取文本框内容 171815164 文本框
<%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://w
持续集成工具 g21121 持续集成
持续集成是什么？我们为什么需要持续集成？持续集成带来的好处是什么？什么样的项目需要持续集成？... 持续集成(Continuous integration ,简称CI)，所谓集成可以理解为将互相依赖的工程或模块合并成一个能单独运行
数据结构哈希表(hash)总结永夜-极光数据结构
1.什么是hash 来源于百度百科: Hash，一般翻译做“散列”，也有直接音译为“哈希”的，就是把任意长度的输入，通过散列算法，变换成固定长度的输出，该输出就是散列值。这种转换是一种压缩映射，也就是，散列值的空间通常远小于输入的空间，不同的输入可能会散列成相同的输出，所以不可能从散列值来唯一的确定输入值。简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。
乱七八糟程序员是怎么炼成的
eclipse中的jvm字节码查看插件地址： http://andrei.gmxhome.de/eclipse/ 安装该地址的outline 插件后重启，打开window下的view下的bytecode视图 http://andrei.gmxhome.de/eclipse/ jvm博客： http://yunshen0909.iteye.com/blog/2
职场人伤害了“上司” 怎样弥补 aijuans 职场
由于工作中的失误，或者平时不注意自己的言行“伤害”、“得罪”了自己的上司，怎么办呢？　　在职业生涯中这种问题尽量不要发生。下面提供了一些解决问题的建议：　　一、利用一些轻松的场合表示对他的尊重　　即使是开明的上司也很注重自己的权威，都希望得到下属的尊重，所以当你与上司冲突后，最好让不愉快成为过去，你不妨在一些轻松的场合，比如会餐、联谊活动等，向上司问个好，敬下酒，表示你对对方的尊重，
深入浅出url编码 antonyup_2006 应用服务器浏览器 servlet weblogic IE
出处：http://blog.csdn.net/yzhz 杨争 http://blog.csdn.net/yzhz/archive/2007/07/03/1676796.aspx 一、问题：编码问题是JAVA初学者在web开发过程中经常会遇到问题，网上也有大量相关的
建表后创建表的约束关系和增加表的字段百合不是茶标的约束关系增加表的字段
下面所有的操作都是在表建立后操作的,主要目的就是熟悉sql的约束,约束语句的万能公式 1,增加字段(student表中增加姓名字段) alter table 增加字段的表名 add 增加的字段名增加字段的数据类型 alter table student add name varchar2(10); &nb
Uploadify 3.2 参数属性、事件、方法函数详解 bijian1013 JavaScript uploadify
一.属性属性名称默认值说明 auto true 设置为true当选择文件后就直接上传了，为false需要点击上传按钮才上传。 buttonClass ” 按钮样式 buttonCursor ‘hand’ 鼠标指针悬停在按钮上的样子 buttonImage null 浏览按钮的图片的路
精通Oracle10编程SQL(16)使用LOB对象 bijian1013 oracle 数据库 plsql
/* *使用LOB对象 */ --LOB(Large Object)是专门用于处理大对象的一种数据类型，其所存放的数据长度可以达到4G字节 --CLOB/NCLOB用于存储大批量字符数据，BLOB用于存储大批量二进制数据，而BFILE则存储着指向OS文件的指针 /* *综合实例 */ --建立表空间 --#指定区尺寸为128k,如不指定，区尺寸默认为64k CR
【Resin一】Resin服务器部署web应用 bit1129 resin
工作中，在Resin服务器上部署web应用，通常有如下三种方式：配置多个web-app 配置多个http id 为每个应用配置一个propeties、xml以及sh脚本文件配置多个web-app 在resin.xml中,可以为一个host配置多个web-app <cluster id="app&q
red5简介及基础知识白糖_ 基础
简介 Red5的主要功能和Macromedia公司的FMS类似，提供基于Flash的流媒体服务的一款基于Java的开源流媒体服务器。它由Java语言编写，使用RTMP作为流媒体传输协议，这与FMS完全兼容。它具有流化FLV、MP3文件，实时录制客户端流为FLV文件，共享对象，实时视频播放、Remoting等功能。用Red5替换FMS后,客户端不用更改可正
angular.fromJson boyitech AngularJS AngularJS 官方API AngularJS API
angular.fromJson 描述: 把Json字符串转为对象使用方法: angular.fromJson(json); 参数详解: Param Type Details json string JSON 字符串返回值: 对象, 数组, 字符串或者是一个数字示例: <!DOCTYPE HTML> <h
java-颠倒一个句子中的词的顺序。比如： I am a student颠倒后变成：student a am I bylijinnan java
public class ReverseWords { /** * 题目：颠倒一个句子中的词的顺序。比如： I am a student颠倒后变成：student a am I.词以空格分隔。 * 要求： * 1.实现速度最快,移动最少 * 2.不能使用String的方法如split,indexOf等等。 * 解答：两次翻转。 */ publ
web实时通讯 Chen.H Web 浏览器 socket 脚本
关于web实时通讯，做一些监控软件。由web服务器组件从消息服务器订阅实时数据，并建立消息服务器到所述web服务器之间的连接，web浏览器利用从所述web服务器下载到web页面的客户端代理与web服务器组件之间的socket连接，建立web浏览器与web服务器之间的持久连接；利用所述客户端代理与web浏览器页面之间的信息交互实现页面本地更新，建立一条从消息服务器到web浏览器页面之间的消息通路
[基因与生物]远古生物的基因可以嫁接到现代生物基因组中吗? comsci 生物
大家仅仅把我说的事情当作一个IT行业的笑话来听吧..没有其它更多的意思如果我们把大自然看成是一位伟大的程序员,专门为地球上的生态系统编制基因代码,并创造出各种不同的生物来,那么6500万年前的程序员开发的代码,是否兼容现代派的程序员的代码和架构呢?
oracle 外部表 daizj oracle 外部表 external tables
oracle外部表是只允许只读访问，不能进行DML操作，不能创建索引，可以对外部表进行的查询，连接，排序，创建视图和创建同义词操作。 you can select, join, or sort external table data. You can also create views and synonyms for external tables. Ho
aop相关的概念及配置 daysinsun AOP
切面(Aspect): 通常在目标方法执行前后需要执行的方法（如事务、日志、权限），这些方法我们封装到一个类里面，这个类就叫切面。连接点（joinpoint） spring里面的连接点指需要切入的方法，通常这个joinpoint可以作为一个参数传入到切面的方法里面（非常有用的一个东西）。通知（Advice）通知就是切面里面方法的具体实现，分为前置、后置、最终、异常环
初一上学期难记忆单词背诵第二课 dcj3sjt126com english word
middle 中间的，中级的 well 喔，那么；好吧 phone 电话，电话机 policeman 警察 ask 问 take 拿到；带到 address 地址 glad 高兴的，乐意的 why 为什么 China 中国 family 家庭 grandmother (外)祖母 grandfather (外)祖父 wife 妻子 husband 丈夫 da
Linux日志分析常用命令 dcj3sjt126com linux log
1.查看文件内容 cat -n 显示行号 2.分页显示 more Enter 显示下一行空格显示下一页 F 显示下一屏 B 显示上一屏 less /get 查询"get"字符串并高亮显示 3.显示文件尾 tail -f 不退出持续显示 -n 显示文件最后n行 4.显示头文件 head -n 显示文件开始n行 5.内容排序 sort -n 按照
JSONP 原理分析 fantasy2005 JavaScript jsonp jsonp 跨域
转自 http://www.nowamagic.net/librarys/veda/detail/224 JavaScript是一种在Web开发中经常使用的前端动态脚本技术。在JavaScript中，有一个很重要的安全性限制，被称为“Same-Origin Policy”（同源策略）。这一策略对于JavaScript代码能够访问的页面内容做了很重要的限制，即JavaScript只能访问与包含它的
使用connect by进行级联查询 234390216 oracle 查询父子 Connect by 级联
使用connect by进行级联查询 connect by可以用于级联查询，常用于对具有树状结构的记录查询某一节点的所有子孙节点或所有祖辈节点。来看一个示例，现假设我们拥有一个菜单表t_menu，其中只有三个字段：
一个不错的能将HTML表格导出为excel,pdf等的jquery插件 jackyrong jquery插件
发现一个老外写的不错的jquery插件，可以实现将HTML 表格导出为excel,pdf等格式，地址在： https://github.com/kayalshri/ 下面看个例子，实现导出表格到excel,pdf <html> <head> <title>Export html table to excel an
UI设计中我们为什么需要设计动效 lampcy UI UI设计
关于Unity3D中的Shader的知识首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，
如何禁止页面缓存 nannan408 html jsp cache
禁止页面使用缓存~ ------------------------------------------------ jsp:页面no cache： response.setHeader("Pragma","No-cache"); response.setHeader("Cache-Control","no-cach
以代码的方式管理quartz定时任务的暂停、重启、删除、添加等 Everyday都不同定时任务管理 spring-quartz
【前言】在项目的管理功能中，对定时任务的管理有时会很常见。因为我们不能指望只在配置文件中配置好定时任务就行了，因为如果要控制定时任务的 “暂停” 呢？暂停之后又要在某个时间点 “重启” 该定时任务呢？或者说直接 “删除” 该定时任务呢？要改变某定时任务的触发时间呢？ “添加” 一个定时任务对于系统的使用者而言，是不太现实的，因为一个定时任务的处理逻辑他是不
EXT实例 tntxia ext
（1）增加一个按钮 JSP: <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); Stri
数学学习在计算机研究领域的作用和重要性 xjnine Math
最近一直有师弟师妹和朋友问我数学和研究的关系，研一要去学什么数学课。毕竟在清华，衡量一个研究生最重要的指标之一就是paper,而没有数学，是肯定上不了世界顶级的期刊和会议的，这在计算机学界尤其重要！你会发现，不论哪个领域有价值的东西，都一定离不开数学！在这样一个信息时代，当google已经让世界没有秘密的时候，一种卓越的数学思维，绝对可以成为你的核心竞争力. 无奈本人实在见地