Demon的黑与白

EM算法及其推广学习笔记

前言

在学习隐马尔科夫模型时，在学习算法中指出了Baum-Welch算法，来实现对隐马尔科夫模型参数的求解。在该学习算法中用到了EM算法，因此我们先来看看EM算法到底是何方神圣。可自己在学习EM算法时，又遇到了一个坑，什么是极大似然函数？因此，本文先介绍极大似然函数的相关概念，然后再对EM算法进行物理映射和实际数学推导。本文需要大量概率论知识，在数学推导关键处会贴出相关参考资料和博文，以备后期查询使用。

思考

什么是极大似然函数，用来解决什么实际问题？
EM算法是什么，用来解决什么问题？

正文

极大似然估计

1.概念
在已知试验结果（即是样本）的情况下，用来估计满足这些样本分布的参数，把可能性最大的那个参数 θ 作为真实 θ∗ 的参数估计。

2.实例
在学习极大似然函数时，一直在思考用什么样的例子才能把概念讲清楚。其实最大的困惑便在于似然估计是假设你有了一堆样本，你需要根据这些样本来猜出某些概率参数，从而使得这些样本在你面前的概率最大。用公式表示为：

max θ P (X; θ)

这里显然做了一个最基本假设，即出现在我们面前的样本表征了最真实的物理世界，没有之一，且不考虑外界噪声对样本的干扰。现在，咱们举一个实际的例子，来理解似然估计的物理含义。

假设我们已知得肺癌的概率为总体的0.2，而不得肺癌的概率为0.8。在得肺癌中的人群中，我们又做了相应的统计，即抽烟人群占0.7，而不抽烟人群只有0.3。在没有肺癌的人群中，抽烟者占0.2，不抽烟者占0.8。然而很不幸，在真实世界中，我们遇到了一个倒霉蛋，他得了肺癌。问题来了，他是不是抽烟呢？

这个例子不算是真正的似然估计最贴切的实例，但基本思想可以拿来表征一下，方便下面对公式的理解。很显然，得肺癌背后的概率模型显然和抽烟相关性很大，即想要得肺癌的概率最大，模型必须拟合到 θ=0.7 ，使得获肺癌的概率最大。因此，我们可以大胆猜测，该肺癌患者是吸烟人群。详细的关于似然函数的物理含义可以参看博文从最大似然到EM算法浅解。

我们先给出数学定义，极大似然估计可以分为离散型和连续型两类。

3.离散型
设 x 为离散型随机变量， θ=(θ1,θ2,...,θk) 为多维参数向量，如果随机变量 x1,x2,...,xn 相互独立且概率计算式为 P(x=xi)=P(xi;θ1,...,θk) ，则 P(X=x1,x2,...,xn)=∏ni=1P(xi;θ1,...,θk) .我们就把该式子记作 L(θ)=∏ni=1P(xi;θ1,...,θk) ，称此函数为似然函数。似然函数值的大小意味着该样本值出现的可能性的大小，既然已经得到了样本值 X=(x1,x2,...,xn) ，那么它出现的可能性应该是较大的，即似然函数的值也应该是较大的，因而最大似然估计就是选择使 L(θ) 达到最大值的那个 θ 作为真实 θ∗ 的估计。

4.连续型
设 x 为连续型随机变量，概率密度函数为 f(xi;θ1,θ2,...,θk),x1,x2,...,xn 为该总体中抽出的样本，同样的如果 x1,x2,...,xn 相互独立且同分布，于是样本的联合概率密度为 L(θ)=∏ni=1f(x1;θ1,θ2,...,θk) ，大致过程同离散型一样。

5.应用举例
继续来看例子，假设进行一个实验，实验次数为10次，每次实验成功率为0.2，那么不成功的概率为0.8，用 y 来表示成功的次数。由于前后的实验是相互独立的，所以可以计算得到成功的次数的概率密度为：

f (y; θ = 0.2) = 10 ! y ! ( 10 - y ) ! (0.2) y (1 - 0.2) 10 - y, y = 0, 1, . . ., 10.

该式子分为两项因子，10次实验中有 y 次成功，那么即在10次中随意挑选 y 个成功的实验，即 Cy10 ；第二项为10次实验中，y次实验成功的概率。更一般地，我们可以把每次实验成功的概率当作一个变量 θ ，则上式可以写为：

f (y; θ) = 10 ! y ! ( 10 - y ) ! θ y (1 - θ) 10 - y, y = 0, 1, . . ., 10.

显然，

f(y;θ) 是关于随机变量

y 和概率参数

θ 的函数，记作，

L(θ)=f(y;θ) 。我们这里由于y是已知变量，所以似然函数只关于参数

θ 变化。

当 θ=0.2 时，我们可以得到y取不同值的概率分布情况，如下图所示：

当 θ=0.7 时，我们可以得到y取不同值的概率分布情况，如下图所示：

好了，现在假设我们在实验室，开始完成某个实验，我们并不知道该实验成功的概率是多少，但做了10次实验后，我们只成功了2次，用高中的拿点概率知识拿来求解，那不就是实验成功率为0.2。的确，但由于实验次数相当的小，这里的0.2并非是真正的概率，而只是我们实验成功的频率。如抛一枚硬币，抛个10次，可能正面朝上的频率为0.6，但我们都知道，实际正面朝上的概率为0.5。那如何让频率接近0.5呢，不断的增加实验次数即可，你抛个2万次试试。所以我们不能简单的就把这个问题中求解的0.2作为我们的答案，我们也不可能大量重复实验来统计该实验成功率。遇到这种情况，我们便用到了似然估计方法。

如上给出了似然函数：

L (θ) = f (y; θ) = 10 ! y ! ( 10 - y ) ! θ y (1 - θ) 10 - y, y = 0, 1, . . ., 10.

现在我们已知实验次数为2，我们要求

θ 使得该似然函数取到极大值，求极值问题只需要对

θ 求导即可，如果是多参量，那么可以对它求偏导，得到似然方程组，同样能求出想要的解。

L' (θ) = 10 ! 2 ! ( 10 - 2 ) ! θ 2 (1 - θ) 8 = 2 - 10 θ = 0

求得

θ=0.2 。咦，算出来的答案是一样的，这不是多此一举嘛，但上述实验成功次数背后的参数

θ 模型是一维的，即我们可以用“肉眼”来直接看出答案，假如我们这次不是观察实验成功次数，来猜实验成功率，我换个问题问，假设我们班男生身高符合高斯分布，即男生身高概率密度函数符合高斯分布，给你一群男生的身高，请告诉我高斯分布的方差和均值分别是多少？这种情况下，其背后的

θ=[μ,π] 含有两个参数，简单的靠肉眼观察显然无法给出答案，因此我们需要借助数学工具，来理论化的证明说，当看到这一群男生的身高时，我们能找到参数

θ=[μ,π] 使得出现这群男生身高的概率最大，注意是这群而不是那群！言外之意就是说， θ 参数能够对男生进行分类！隐约看出了EM算法中的一些思想。

我们再把上述问题复杂一下，假设我们现在重复上述实验过程，即第一次，重复实验10次，观察到实验成功次数为1次；第二次，重复实验10次，观察实验成功次数为2次。问：你能告诉我实验成功的次数为几次吗？还是用数学严格的进行求解一次！

这里我们有两个观察值，即随机变量 y1=1,y2=2 ，两个随机变量符合相互独立的条件，所以由概率公式得：

P (y 1, y 2; θ) = 10 ! 1 ! ( 10 - 1 ) ! θ (1 - θ) 9 \times 10 ! 2 ! ( 10 - 2 ) ! θ 2 (1 - θ) 8

同样的，要求

θ 使得似然函数取极大值，我们需要对等式进行求导，问题来了，这是2个观察值，n个观察值进行求导，那这复杂得根本无法计算。因此简单的想法就是把求导的乘法法则能够映射到求导的加法法则，因此便有了对数似然函数的引出，即取

log 函数，得：

L (θ) = log P (X; θ)

这样对上式进行求导便方便很多，更关键的是，求解出来的

θ 值与原先的概率分布函数是等价的。

\partial ln P ( y 1 , y 2 ; θ ) \partial θ = 1 θ - 9 1 - θ + 2 θ - 8 1 - θ = 0

求得

θ=0.15 。即试验成功的概率为0.15。

6.总结
最大似然估计，只是一种概率论在统计学的应用，它是参数估计的方法之一。说的是已知某个随机样本满足某种概率分布，但是其中具体的参数不清楚，参数估计就是通过若干次实验，观察其结果，利用结果推出参数的大概值。对似然的理解是基于最基本的假设，我们得到的观察结果是在某个参数模型下出现概率最大的。我们并不考虑，实际当实验成功率为0.7时，我们观察两次，分别只观察到10次实验中成功1次和2次。这种情况在某种环境下可能会发生，但倘若发生，我们就认为参数 θ=0.15 ，而不是0.7。
求最大似然函数估计值的一般步骤：
1. 写出似然函数
2. 对似然函数取对数，并整理
3. 求导数
4. 解似然方程

上述内容摘自博文–最大似然估计学习总结——MadTurtle，有省略的部分也有补充的部分。

EM算法

1.定义
概率模型有时即含有观测变量，又含有隐变量或潜在变量。如果概率模型的变量都是观测变量，那么给定数据，可以直接用极大似然估计法，或贝叶斯估计法估计模型参数。但是，当模型含有隐变量时，就不能简单地使用这些估计方法。EM算法就是含有隐变量的概率模型参数的极大似然估计法，或极大后验概率估计法。我们仅讨论极大似然估计，极大后验概率估计与其类似。（隐含了一个问题，概率模型中当存在隐变量时，就无法直接用极大似然估计法进行求解，这是为什么？）

2.三硬币模型
假设有3枚硬币，分别记作A，B，C。这些硬币正面出现的概率分别是 π,p,q .进行如下投掷试验：先掷硬币A，根据其结果选出硬币B或硬币C，正面选硬币B，反而选硬币C；然后掷选出的硬币，掷硬币的结果，出现正面记作1，出现反面记作0；独立地重复n次试验（这里，n=10），预测结果如下：

1, 1, 0, 1, 0, 0, 1, 0, 1, 1

假设智能观测到掷硬币的结果，不能观测掷硬币的过程。问如何估计三硬币正面出现的概率，即三硬币模型的参数。

同样的，先用先前似然估计方法来求解一波，看看能否给出答案。假设我们知道了一个观测值：

P (y | θ) = \sum z P (y, z | θ) = \sum z P (z | θ) P (y | z, θ) 取 y = 0, 1

直接用

θ=(π,p,q) 得

P (y | θ) = π p y (1 - p) 1 - y + (1 - π) q y (1 - q) 1 - y

该式子中

y 为已知，其他参数均位置，假设我们知道观察序列的第一次投掷结果为1，因此把

y=1 代入得

P (y | θ) = π p + (1 - π) q

以极大似然方法进行求解，分别对参数

π,p,q 进行求导，你会发现对

π 求导，求出

p=q 来，对

p,q 分别求导求出

π=0和π=1 ，显然是没有解析解。因此，传统的似然估计方法是无法解决上述三硬币模型的问题。这也是为什么EM算法提出的原因，即它能解决传统求导解决不了的问题。（遗留一个问题和一个证明，三硬币模型中是由于

π 的出现，使得似然方程无解？是一旦隐藏变量出现，就无法求解似然方程嘛？如何证明。）

这里，随机变量 y 是观测变量，表示一次试验观测的结果是1或0；随机变量 z 是隐变量，表示未观测到的掷硬币A的结果； θ=(π,p,q) 是模型参数。这一模型是以上数据的生成模型。注意，随机变量 y 的数据可以预测，随机变量 z 的数据不可观测。（我们无法得知掷硬币A是正面还是反面，信息缺失，数学建模，无法求出解析解？）

将观测数据表示为 Y=(Y1,Y2,...,Yn)T ，未观测数据表示为 Z=(Z1,Z2,...,Zn)T ，则观测数据的似然函数为

P (Y | θ) = \sum z P (Z | θ) P (Y | Z, θ)

即

P (Y | θ) = \prod j = 1 n [π p y j (1 - p) 1 - y j + (1 - π) q y j (1 - q) 1 - y j]

考虑求模型参数

θ=(π,p,q) 的极大似然估计，即

θ^= a r g max θ log P (Y | θ)

log 函数中有加法，对参数进行求偏导显然是困难的。因此，我们需要另辟蹊径来求解该似然函数的极大值。也就是该似然函数并非是单纯的观测随机变量的概率分布函数，而是隐藏了不可观测变量的概率分布，显然如果并不知道每个样本背后隐藏变量的值，那么求解出来的参数是无意义的。

回到身高分布问题，我们现在假设在全校抽中了100个男生，100个女生，男生和女生的身高都符合正态分布，即背后的概率模型为正态分布概率密度函数，对样本进行统计时，我们标注了他是男生，她是女生，且观测到了每个人的身高，据此我们就可以列出一个关于男生和女生的似然函数，根据似然估计方法，我们通过求导的方式便能求解出模型的参数 θ=(μ,δ)T 。

但假设我们在全校抽中了200个人，但背后我们却没有统计它们的性别，如果把这200个人当作同一群人进行似然函数的建模求解，那显然是不太明智的，因为我们都知道，性别的差异对身高的影响是相当大的，我们非要把女生当男生，并由此计算出模型的参数来，再通过该模型预测出来的男生身高，就显得不那么准确了。所以，在针对隐藏变量的情况下，我们需要考虑性别这样的因素，这也就有了EM算法提出的意义。

在对问题进行分析时，其实我们是可以不用考虑隐藏变量的因素的？但诸如隐马尔可夫模型中的学习问题时，很显然它有隐含的状态，那么进行参数学习时，我们就需要用到EM算法。同样地，三硬币模型也明确的告诉我们含有隐藏变量，因此也必须使用EM算法进行求解。

刚才说了，对含有隐藏变量的似然函数是无法用求导的方式进行求解的，我们先把式子写出来，即

L (θ) = \sum i log p (x (i); θ) = \sum i log \sum z (i) p (x (i), z (i); θ)

EM算法是一种解决存在隐含变量优化问题的有效方法。既然不能直接最大化

L(θ) ，我们可以不断地建立

l 的下界（E步），然后优化下界（M步）。

对于每一个样例 i ，让 Qi 表示该样例隐含变量 z 的某种分布， Qi 满足的条件是 ∑zQi(z)=1,Qi(z)≥0. 比如要将学校抽的200人进行聚类，假设隐藏变量 z 是身高，那么就是连续的高斯分布。如果按照隐藏变量是男女，那么就是伯努利分布。可以有前面阐述的内容得到下面的公式：

\sum i log p (x (i); θ) = \sum i log \sum z (i) p (x (i), z (i); θ) = \sum i log \sum z (i) Q i (z (i)) p ( x ( i ) , z ( i ) ; θ ) Q i ( z ( i ) ) \geq \sum i \sum z (i) Q i (z (i)) log p ( x ( i ) , z ( i ) ; θ ) Q i ( z ( i ) )

第一步和第二步比较直接，就是分子分母同乘以一个相等的函数。第二步和第三步利用了Jesson不等式，具体的推导过程请参看博文- EM算法原理。

这个过程可以看作是对 L(θ) 求了下界。对于 Qi 的选择，有多种可能，哪种更好呢？假设 θ 给定，那么 L(θ) 的值就决定于 Qi(z(i) 和 p(x(i),z(i);θ) 。我们可以通过调整这两个概率是下界不断上升，以逼近 L(θ) 的真实值，那么什么时候算是调整好了呢？当不等式变成等式时，说明我们调整后的概率都能够等价于 L(θ) 了。按照这个思路，我们要找到等式成立的条件。根据Jessen不等式，要想让等式成立，需要让随机变量变成常数值，这里得到：

p ( x ( i ) , z ( i ) ; θ ) Q i ( z ( i ) ) = C

C为常数，不依赖于

z(i) 。对此式子做进一步推导，我们知道

∑ZQi(z(i))=1 ，可以推导得：

Q i (z (i)) = p (z (i) | x (i); θ)

对推导过程感兴趣的，可以继续参看博文- EM算法原理。

这里简单提一下取常数的物理含义，上图即为

log 函数，而在

log 函数上两个点，可以分别用

p(x(i),z(i);θ)Qi(z(i)) 和

p(x(j),z(j);θ)Qj(z(j)),i,j 分别表示不同的样本，要让Jessen不等式成立，显然需要让这两点重合，才能取得等号。具体的解释请参看视频教程七月在线-18分钟理解EM算法。

刚开始接触这个 L(θ) 不理解为什么要让下界函数和 L(θ) 等号成立，然后再开始对新的下界函数进行求极值的过程，并且求极值过程能够逼近 L(θ) 的极值，不急，咱们来看看博文从最大似然到EM算法浅解的解释，参看下图：

E步的过程，就是调整 Q(z) 使得下界 J(Z,Q) 不断上升，直到与 L(θ) 在 θ 点重合，找到了下界函数后，固定 Q(z) ，对参数进行迭代，找到 J(Z,θ) 的极大值，反复上述操作，从而逼近 L(θ) 的极大值。（两个问题， θ 怎么变？该过程为何收敛？）参看书本《统计学习方法》第159页

算法（EM算法）

输入：观测变量数据Y，隐变量数据Z，联合分布 P(Y,Z|θ) ，条件分布 P(Z|Y,θ)
输出：模型参数 θ
(1) 选择参数的初值 θ(0) ，开始迭代；
(2) E步：记 θ(0) 为第 i 次迭代参数 θ 的估计值，在第 i+1 次迭代的E步，计算

$Q (θ, θ (i)) = \sum Z log P (Y, Z | θ) P (Z | Y, θ (i))$
这里， P(Z|Y,θ(i)) 是在给定观测数据Y和当前的参数估计 θ(i) 下隐变量数据Z的条件概率分布。
(3) M步：求使得 Q(θ,θ(i)) 极大化的 θ ，确定第 i+1 次迭代的参数的估计值 θ(i+1)
$θ (i + 1) = a r g max θ Q (θ, θ (i))$
(4) 重复第(2)步和第(3)步，直到收敛。

Q函数的推导在书本《统计学习方法》第159页。

行文至此，除了在数学上能够强行“理解”证明的过程，但实际的物理问题却始终无法对应到这些形式化的符号中去，暂且把这些恼人数学放一边，来看看针对某些特定的实际问题，算法是如何解决的，没准能够从中理解一些数学公式的实际含义。

Code Time

双硬币模型

假设有两枚硬币A、B，以相同的概率随机选择一个硬币，进行如下的抛硬币实验：共做5次实验，每次实验独立的抛十次，结果如图中a所示，例如某次实验产生了H、T、T、T、H、H、T、H、T、H，H代表正面朝上。

假设试验数据记录员可能是实习生，业务不一定熟悉，造成a和b两种情况

a表示实习生记录了详细的试验数据，我们可以观测到试验数据中每次选择的是A还是B

b表示实习生忘了记录每次试验选择的是A还是B，我们无法观测实验数据中选择的硬币是哪个

问在两种情况下分别如何估计两个硬币正面出现的概率？

这是实习生a记录的情况，由于这里数据的背后参考模型已知（已分好类），因此用极大似然估计方法就能分别求出 θ^A和θ^B 的概率来。与上文第一节中的例子完全类似。

这是实习生b记录的情况，令人糟糕的是数据的背后参考模型混淆在了一起，我们无法得知它们这几组实验数据是由A抛的还是由B抛的，因为这里隐含了一个该组数据是A还是B的分类问题。抛开数学对隐含变量的复杂求解过程，我们可以先给出一个思路来解决上述问题。

第一，既然我们不清楚是A类还是B类，但假定我们初始化了A类硬币抛正面的概率和B类硬币抛正面的概率，这两者的概率是随意定的，但由于两者概率可以存在差异，假设 P(y=H;θA)>P(y=H;θB) ，那么一个明显的特征就是，由于能观察到10次硬币中有几次是成功的，我们可以基于这次观察，给出 P(z=A|Y;θA,θB) 的概率，上式的含义是可以根据两个参数的初值求出，在给定观察序列的情况下，它属于A类还是B类的概率。用公式可以表示为：

P (z | Y; θ A, θ B) = P ( Y , z ; θ A , θ B ) P ( Y ; θ A , θ B )

其中，z表示单个观察到的随机变量，此处z=A or B（属于分类问题），Y表示观察序列，即

Y=(y1,y2,...,y10)T 。由此，给定观察序列后，我们可以算出属于A类的概率和属于B类的概率，那么很显然CoinA 和CoinB 不再是属于你有我没有，你没有我有的敌对关系，因为我自己都还不是很清楚是不是A类，由此10个硬币，我们就根据概率进行一次平均分配咯，这样CoinA 和CoinB 在一次观察结果时，都能得到属于自己的那一份，非常的和谐。这一部分便是求期望的过程，即对于第一个观察序列中，10次抛硬币过程中5次为正面朝上，令

yj=5 ，由此可以得到关于隐含变量的数学期望

E(z)=0.45∗5+0.55∗5 ，“+”号的左边右边，分别表示CoinA的分配和CoinB的分配。分配的份额根据z函数的分布给定，z函数的分布规则根据缺失的信息进行建模，解由初始参数求出。

因此分类问题，给出了每个CoinA 和CoinB 的分配额，有了所有观察值CoinA和CoinB的分配额，我们就可以单独的对CoinA和CoinB进行最大似然估计方法。求出来的新参数，再求z函数，求期望，求参数，如此迭代下去，直到收敛到某一结果。

算法实现

在双硬币模型中，对某个种类硬币投掷10次中成功n次概率模型 P(y|θ)=(10n)θn(1−θ)(10−n),y=0,1,...,10 符合伯努利分布。

前期准备工作
我们可以实际的操作一把，来看看在python中如何可视化伯努利分布。前期环境搭建：
1. 安装python扩展包：scipy,matplotlib,seaborn,ipywidgets。
- 在安装扩展包过程中遇到了一些课，如安装scipy，用pip直接安装遇到安装失败的情况，如果有类似的情况可以参考链接[Python]Windows7 x64安装numpy和scipy
2. 安装ipython，貌似在python3.5版本中，自带了ipython。
- 安装完毕，在cmd中敲入ipython notebook，开始编程之旅

进入游览器

点击new按钮后，新增python3按钮，进入下一界面

实际编写
接下类就可以进行我们实际的操作了，首先引入一些必须的科学计算包：

import numpy as np
from scipy import stats
import matplotlib.pyplot as plt
import seaborn as sns
from ipywidgets import interact, FloatSlider
%matplotlib inline

编写伯努利分布函数

a=range(11)
def plot_binomial(p=0.5):
    fig, ax = plt.subplots(figsize=(4,3))
    y = [0]*11
    for i in a:
        y[i-1] =  stats.binom.pmf(i, 10, p)
    ax.bar(a,y,label="$p = %.1f$" % p)
    ax.set_ylabel('PMF of $k$ heads')
    ax.set_xlabel('$k$')
    ax.set_ylim((0,0.5))
    ax.set_xlim((0,10))
    ax.legend()
    return fig

可视化伯努利分布函数

interact(plot_binomial, p=FloatSlider(min=0.0,max=1.0,step=0.1,value=0.2))

可视化界面如下

这是在p=0.2的情况下的伯努利分布函数，代回双硬币模型中去，当观察到10次实验中只有2次成功了，那么该 θ 参数便是0.2。因为只有当 θ=0.2 时，10次实验中出现成功次数为2次的概率最大。

回到实习生b，由数据可得观察矩阵为：

observations = np.array([[1,0,0,0,1,1,0,1,0,1],
                         [1,1,1,1,0,1,1,1,1,1],
                         [1,0,1,1,1,1,1,0,1,1],
                         [1,0,1,0,0,0,1,1,0,0],
                         [0,1,1,1,0,1,1,1,0,1]])

实际每组观察数据属于A类，B类的隐藏状态为：

coins_id = np.array([False,True,True,False,True])

那么在观察数组中，属于A类的数组为：

observations[coins_id]

输出结果为：

array([[1, 1, 1, 1, 0, 1, 1, 1, 1, 1],
       [1, 0, 1, 1, 1, 1, 1, 0, 1, 1],
       [0, 1, 1, 1, 0, 1, 1, 1, 0, 1]])

在所有属于A类的数组中，总的实验成功次数为：

np.sum(observations[coins_id])

输出结果为：

所以说，针对属于A类的硬币，它的参数 θA ：

1.0*np.sum(observations[coins_id])/observations[coins_id].size

输出结果为：

0.80000000000000004

同理，对于属于B类的硬币，它的参数为 θB ：

1.0*np.sum(observations[~coins_id])/observations[~coins_id].size

输出结果为：

0.45000000000000001

EM算法步骤

首先来看看，针对第一组观察数据，每一步的数据是如何求出的。

# 对于实验成功率为0.6的情况，10次中成功5次的概率
coin_A_pmf_observation_1= stats.binom.pmf(5,10,0.6)
coin_A_pmf_observation_1

# 均是针对第一组观察数据的情况
coin_B_pmf_observation_1= stats.binom.pmf(5,10,0.5)
coin_B_pmf_observation_1

# 针对第一组观察数据中，属于A类硬币投掷的概率p(z=A|Y,theta)
normalized_coin_A_pmf_observation_1 = coin_A_pmf_observation_1/(coin_A_pmf_observation_1+coin_B_pmf_observation_1)
print ("%0.2f" %normalized_coin_A_pmf_observation_1)

# 针对第一组观察数据中，属于B类硬币投掷的概率p(z=B|Y,theta)
normalized_coin_B_pmf_observation_1 = coin_B_pmf_observation_1/(coin_A_pmf_observation_1+coin_B_pmf_observation_1)
print ("%0.2f" %normalized_coin_B_pmf_observation_1)

#求期望过程
weighted_heads_A_obervation_1 = 5*normalized_coin_A_pmf_observation_1
print ("Coin A Weighted count for heads in observation 1: %0.2f" %weighted_heads_A_obervation_1)
weighted_tails_A_obervation_1 = 5*(1-normalized_coin_A_pmf_observation_1)
print ("Coin A Weighted count for tails in observation 1: %0.2f" %weighted_tails_A_obervation_1)
weighted_heads_B_obervation_1 = 5*normalized_coin_B_pmf_observation_1
print ("Coin B Weighted count for heads in observation 1: %0.2f" %weighted_heads_B_obervation_1)
weighted_tails_B_obervation_1 = 5*(1-normalized_coin_B_pmf_observation_1)
print ("Coin B Weighted count for tails in observation 1: %0.2f" %weighted_tails_B_obervation_1)

单步EM算法，迭代一次算法实现步骤

def em_single(priors,observations):
    """
    performs a single Em step
    Arguments
    ---------
    priors:[theta_A,theta_B]
    observations:[m X n matrix]

    Returns
    -------
    new_priors:[new_theta_A,new_theta_B]
    """
    counts ={
    'A':{
    'H':0,'T':0},'B':{
    'H':0,'T':0}}
    theta_A = priors[0]
    theta_B = priors[1]

    # E setp
    for observation in observations:
        len_observation = len(observation)
        # 对数组求和 head =1，tail =0
        num_heads = observation.sum()
        num_tails = len_observation - num_heads
        # 如果属于A类，A的分布概率 和属于B类的分布概率
        contribution_A = stats.binom.pmf(num_heads,len_observation,theta_A)
        contribution_B = stats.binom.pmf(num_heads,len_observation,theta_B)
        # z分布概率
        weight_A = contribution_A /(contribution_A+contribution_B)
        weight_B = contribution_B /(contribution_A+contribution_B)

        # Incrementing counts
        counts['A']['H'] += weight_A*num_heads
        counts['A']['T'] += weight_A*num_tails
        counts['B']['H'] += weight_B*num_heads
        counts['B']['T'] += weight_B*num_tails

    # M setp
    new_theta_A = counts['A']['H']/(counts['A']['H']+counts['A']['T'])
    new_theta_B = counts['B']['H']/(counts['B']['H']+counts['B']['T'])

    return [new_theta_A, new_theta_B]

迭代一次输出结果为：

em_single([0.6,0.5],observations)
# 结果
[0.71301223540051617, 0.58133930831366265]

收敛算法

def em(observations,prior,tol=1e-6,iterations=1000):
    import math
    iteration = 0
    while iteration 0] -new_prior[0])
        if delta_change < tol:
            break
        else:
            prior = new_prior
            iteration +=1
    return [new_prior,iteration]

最终结果为：

em(observations, [0.6,0.5])
# 结果
[[0.79678875938310978, 0.51958393567528027], 14]

详细代码请参看博文Programatically understanding Expectation Maximization algorithm

最终实习生b的EM算法得出的结果，跟实习生a得出的参数还是非常相近的，但EM算法跟初始值的设置有着很大的关系，不信，修改[06,0.5]多尝试尝试。

针对EM算法的所有相关内容都已经阐述完毕了，在学习过程中，遇到了许多坑，诸如数学公式与实际的问题没法完全一一对应，但个人认为，自家数学功底不够深厚时，唯有参照实际情况，来解决一个实际问题，多加练习，在日后回过头来看数学定义时，没准能够恍然大悟。解决双硬币模型的思想是很简单的，但对当细节问题进行深入理解时，本文还有很多不足，如算法如何收敛，为何收敛，算法E-step为何是求期望。待补足数学上的漏洞或者经历过大量实践后，有望能够解决，未完待续。

参考文献

从最大似然到EM算法浅解
最大似然估计学习总结——MadTurtle
EM算法原理
七月在线-18分钟理解EM算法
EM算法及其推广 - 码农场

你可能感兴趣的:(机器学习,机器学习入门,机器学习)

机器学习课堂4线性回归模型+特征缩放木尘152132 机器学习线性回归 python
一、实验2-2，线性回归模型，计算模型在训练数据集和测试数据集上的均方根误差代码：#2-2线性回归模型importpandasaspdimportnumpyasnpimportmatplotlib.pyplotasplt#参数设置iterations=3000#迭代次数learning_rate=0.0001#学习率m_train=3000#训练样本的数量flag_plot_lines=False
【机器学习】模型拟合 CH3_CH2_CHO 什么？！是机器学习！！机器学习人工智能欠拟合过拟合
1、欠拟合1.1现象欠拟合是机器学习和统计建模中的一种常见问题，表现为模型无法充分捕捉数据中的潜在规律和模式。无论是训练数据还是测试数据，模型的预测误差都居高不下。在实际应用中，欠拟合的模型往往显得过于简单和粗糙，无法对数据进行有效的拟合和描述。1.2原因模型过于简单是导致欠拟合的主要原因：例如，使用直线去拟合具有明显曲线趋势的数据，或者使用低阶多项式去拟合高阶的复杂函数关系。这种情况下，模型的表
基于Python的智能决策支持系统：实现智能化决策的关键要素 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型自然语言处理人工智能语言模型编程实践开发语言架构设计
文章目录基于Python的智能决策支持系统：实现智能化决策的关键要素11.背景介绍2.核心概念与联系数据收集与预处理模型构建与训练决策规则生成与优化决策结果评估与反馈3.核心算法原理具体操作步骤数据挖掘算法机器学习算法优化算法4.数学模型和公式详细讲解举例说明线性回归模型最小二乘法5.项目实践：代码实例和详细解释说明6.实际应用场景金融领域医疗领域供应链管理智能制造7.工具和资源推荐编程语言和开发
下一代模型技术演进与场景应用突破智能计算研究中心其他
内容概要当前模型技术正经历多维度的范式跃迁，可解释性模型与自动化机器学习（AutoML）成为突破传统黑箱困境的核心路径。在底层架构层面，边缘计算与量子计算的融合重构了算力分配模式，联邦学习技术则为跨域数据协作提供了安全可信的解决方案。主流框架如TensorFlow和PyTorch持续迭代优化能力，通过动态参数压缩与自适应超参数调优策略，显著提升模型部署效率。应用层创新呈现垂直化特征，医疗诊断模型通
TypeScript语言的计算机视觉苏墨瀚包罗万象 golang 开发语言后端
使用TypeScript进行计算机视觉：一个现代化的探索引言随着人工智能和机器学习的快速发展，计算机视觉（ComputerVision）成为了一个极具活力的研究领域。计算机视觉旨在使计算机能够“看”和“理解”数字图像或视频中的内容。近年来，TypeScript作为一种现代化的编程语言，因其类型安全和更好的开发体验，逐渐在前端和后端开发中得到了广泛应用。本文将探讨如何使用TypeScript进行计算
人工智能之数学基础：数学对人工智能技术发展的作用每天五分钟玩转人工智能机器学习深度学习之数学基础人工智能深度学习机器学习神经网络自然语言处理数学
本文重点数学是人工智能技术发展的基础，它提供了人工智能技术所需的数学理论和算法，包括概率论、统计学、线性代数、微积分、图论等等。本文将从以下几个方面探讨数学对人工智能技术发展的作用。概率论和统计学概率论和统计学是人工智能技术中最为重要的数学分支之一。概率论和统计学的应用范围非常广泛，包括机器学习、数据挖掘、自然语言处理、计算机视觉等领域。在人工智能技术中，概率论和统计学主要用于处理不确定性的问题，
人工智能之数学基础：线性子空间每天五分钟玩转人工智能机器学习深度学习之数学基础人工智能深度学习线性代数线性子空间线性空间
本文重点在前面的课程中，我们学习了线性空间，本文我们我们在此基础上学习线性子空间。在应用中，线性子空间的概念被广泛应用于信号处理、机器学习、图像处理等领域。子空间的性质子空间是线性空间的一部分，它需要满足下面的性质：设V是数域F上的线性空间，W是V的一个非空子集。如果W对于V中的加法运算和数乘运算也构成F上的一个线性空间，则称W为V的线性子空间（或称向量子空间）。具体来说，设V是一个线性空间，W是
详解离线安装Python库爱编程的喵喵 Python基础课程 python 离线安装 requirements
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了详解离线安装Python库，希望能对
ESG证书：AI预测未来十年职场人的黄金入场券 ESG学习圈 pandas python django
当ChatGPT开始撰写ESG报告，当机器学习模型精准预测企业碳排放轨迹，一场由AI驱动的ESG革命正在颠覆传统可持续发展领域。根据彭博新能源财经预测，到2030年全球ESG资产管理规模将突破50万亿美元，而AI技术将成为撬动这个万亿级市场的核心杠杆。一、AI透视下的ESG黄金时代在微软开发的AI模型ESG-NOW系统中，通过分析全球4300家上市公司近十年的环境数据，成功预测2025年新能源行业
【Dive Into Stable Diffusion v3.5】1：开源项目正式发布——深入探索SDv3.5模型全参/LoRA/RLHF训练 Donvink 大模型 #AIGC stable diffusion AIGC 人工智能机器学习深度学习
目录1引言2项目简介3快速上手3.1下载代码3.2环境配置3.3项目结构3.4下载模型与数据集3.5运行指令3.6核心参数说明3.6.1通用参数3.6.2优化器/学习率3.6.3数据相关4结语1引言在人工智能和机器学习领域，生成模型的应用越来越广泛。StableDiffusion作为其中的佼佼者，因其强大的图像生成能力而备受关注。今天，我的开源项目DiveIntoStableDiffusionv3
知识库在意图识别中扮演着**数据支撑**和**语义理解辅助**的双重角色 PersistDZ 大数据与AI 人工智能
知识库在意图识别中扮演着数据支撑和语义理解辅助的双重角色，而训练智能客服的意图识别Agent需要结合知识库的结构化数据与机器学习技术。以下是详细解析：一、知识库在意图识别中的作用1.提供标注数据意图标签定义：知识库中存储了预先定义的意图分类体系（如“订单查询”“退换货”“投诉”等），为模型提供明确的训练目标。标注样本：知识库包含大量用户对话历史及其对应的意图标签，是训练监督学习模型的核心数据源。2
近期计算机领域的热点技术 0dayNu1L 云计算量子计算人工智能
随着科技的飞速发展，计算机领域的新技术、新趋势层出不穷。本文将探讨近期计算机领域的几个热点技术趋势，并对它们进行简要的分析和展望。一、人工智能与机器学习人工智能（AI）和机器学习（ML）是近年来计算机领域最为热门的话题之一。AI和ML技术已经广泛应用于图像识别、自然语言处理、智能推荐等领域，并取得了显著的成果。随着技术的不断进步，AI和ML将更深入地渗透到各个行业，为人类社会带来更多便利和效益。在
计算机专业毕业设计题目推荐（新颖选题）本科计算机科学专业相关毕业设计选题大全✅ 会写代码的羊毕设选题课程设计计算机网络毕设选题毕设系统毕设题目计算机科学专业
文章目录前言最新毕设选题（建议收藏起来）本科计算机科学专业相关的毕业设计选题毕设作品推荐前言2025全新毕业设计项目博主介绍：✌全网粉丝10W+,CSDN全栈领域优质创作者，博客之星、掘金/华为云/阿里云等平台优质作者。技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、大数据、机器学习等设计与开发。主要内容：免费功能设计
Linux安装Anaconda和Jupyter 硬水果糖人工智能 Linux linux jupyter 运维
一、了解Anaconda和Jupyter引言：Anaconda是一个流行的开源数据科学平台，广泛用于数据分析、机器学习、人工智能等领域。它是一个集成了大量科学计算和数据科学工具的Python和R编程语言环境。Anaconda的主要目标是简化数据科学和机器学习的开发流程，提供一个易于安装和管理的环境。而预装了大量常用的Python和R库，这些库涵盖了数据科学的各个方面，包括：数据分析：Pandas、
ChatGPT、DeepSeek、GIS与Python机器学习强强联合！地质灾害风险评估、易发性分析、信息化建库及灾后重建 WangYan2022 DeepSeek ChatGPT 地下水地质灾害 DeepSeek ChatGPT GIS 灾后重建
在地质灾害频繁肆虐的当下，精准开展风险评价刻不容缓。如今，一门极具创新性的教程震撼登场，它将ChatGPT、DeepSeek等前沿技术与GIS、Python以及机器学习深度交融，为学员打造出前所未有的学习体验，助力大家在地质灾害风险评价领域强势突围，一路领先。前沿技术融合，铸就智能学习核心动力教程最闪耀的亮点之一，便是大胆引入了ChatGPT和DeepSeek技术。它们恰似无所不能的“数据魔法师”
Hessian 矩阵是什么 ZhangJiQun&MXP 教学 2021 AI python 2024大模型以及算力矩阵线性代数算法人工智能机器学习
Hessian矩阵是什么目录Hessian矩阵是什么Hessian矩阵的性质及举例说明**1.对称性****2.正定性决定极值类型****特征值为2（正），因此原点(0,0)(0,0)(0,0)是极小值点。****3.牛顿法中的应用****4.特征值与曲率方向****5.机器学习中的实际意义**一、定义与公式二、实例分析Hessian矩阵是多元函数二阶偏导数构成的方阵，用于分析函数局部曲率、判断极
LoRA中黑塞矩阵、Fisher信息矩阵是什么 ZhangJiQun&MXP 教学 2021 论文 2024大模型以及算力矩阵机器学习人工智能 transformer 深度学习算法线性代数
LoRA中黑塞矩阵、Fisher信息矩阵是什么1.三者的核心概念黑塞矩阵（Hessian）二阶导数矩阵，用于优化问题中判断函数的凸性（如牛顿法），或计算参数更新方向（如拟牛顿法）。Fisher信息矩阵（FisherInformationMatrix,FIM）统计学中衡量参数估计的不确定性，反映数据中包含的关于参数的信息量。在机器学习中常用于自然梯度下降（NaturalGradientDescent
神经网络基础之正则化硬水果糖人工智能神经网络人工智能机器学习
引言：正则化（Regularization）是机器学习中一种用于防止模型过拟合技术。核心思想是通过在模型损失函数中添加一个惩罚项（PenaltyTerm），对模型的复杂度进行约束，从而提升模型在新数据上的泛化能力。一、正则化目的防止过拟合：当模型过于复杂（例如神经网络层数过多、参数过多）时，容易在训练数据上“记忆”噪声或细节，导致在测试数据上表现差。简化模型：正则化通过限制模型参数的大小或数量，迫
决策树算法全解析：从零基础到Titanic实战，一文搞定机器学习经典模型吴师兄大模型 0基础实现机器学习入门到精通算法机器学习决策树人工智能深度学习编程开发语言
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
图像处理篇---图像预处理 Ronin-Lotus 图像处理篇深度学习篇程序代码篇图像处理人工智能 opencv python 深度学习计算机视觉
文章目录前言一、通用目的1.1数据标准化目的实现1.2噪声抑制目的实现高斯滤波中值滤波双边滤波1.3尺寸统一化目的实现1.4数据增强目的实现1.5特征增强目的实现：边缘检测直方图均衡化锐化二、分领域预处理2.1传统机器学习（如SVM、随机森林）2.1.1特点2.1.2预处理重点灰度化二值化形态学操作特征工程2.2深度学习（如CNN、Transformer）2.2.1特点2.2.2预处理重点通道顺序
【大模型科普】AIGC技术发展与应用实践（一文读懂AIGC）人工智能
【专栏介绍】⌈⌈⌈人工智能与大模型应用⌋⌋⌋人工智能（AI）通过算法模拟人类智能，利用机器学习、深度学习等技术驱动医疗、金融等领域的智能化。大模型是千亿参数的深度神经网络（如ChatGPT），经海量数据训练后能完成文本生成、图像创作等复杂任务，显著提升效率，但面临算力消耗、数据偏见等挑战。当前正加速与教育、科研融合，未来需平衡技术创新与伦理风险，推动可持续发展。文章目录一、AIGC概述（一）什么是
【产品小白】什么是AI产品经理百事不可口y 产品经理的一步一步人工智能产品经理学习产品运营内容运营用户运营
一、AI产品经理的定义与角色定位AI产品经理是人工智能技术与商业应用之间的核心桥梁，负责将复杂的AI技术转化为满足市场需求的产品。需同时具备技术理解力、商业洞察力和用户思维，既要参与算法选型与数据建模，又要定义产品功能与市场策略，是贯穿产品全生命周期的关键角色。与传统互联网产品经理相比，AI产品经理的独特之处在于：技术深度参与：需理解机器学习、自然语言处理（NLP）、计算机视觉等技术原理，并参与数
数据增强：扩充数据集提升模型泛化能力 AI天才研究院计算 AI大模型企业级应用开发实战 ChatGPT 计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍1.1.数据增强的重要性在机器学习领域，模型的泛化能力至关重要。一个泛化能力强的模型能够在未见数据上表现良好，而过拟合的模型则会在训练数据上表现出色，但在新数据上表现糟糕。数据增强是一种有效提升模型泛化能力的技术，它通过对现有数据进行各种变换，人为地扩充数据集，从而增加训练数据的数量和多样性。1.2.数据增强的应用场景数据增强广泛应用于各种机器学习任务中，包括：图像识别:对图像进行旋转
数据增强：扩充数据集，提升模型的鲁棒性 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 LLM大模型落地实战指南计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
数据增强：扩充数据集，提升模型的鲁棒性1.背景介绍1.1数据集的重要性在机器学习和深度学习领域中,数据集是训练模型的基础。高质量的数据集对于构建准确、鲁棒的模型至关重要。然而,在现实世界中,获取大量高质量的数据通常是一个巨大的挑战。数据采集过程耗时耗力,而且成本高昂。此外,某些领域的数据存在隐私和安全问题,难以获取。1.2数据集不足的挑战当数据集规模有限时,模型很容易过拟合,无法很好地推广到新的、
使用TensorFlow、OpenCV和Pygame实现图像处理与游戏开发 UwoiGit tensorflow opencv pygame
在本篇文章中，我们将介绍如何结合使用TensorFlow、OpenCV和Pygame来进行图像处理和游戏开发。这三个工具在机器学习、计算机视觉和游戏开发领域都非常流行，并且它们的结合可以提供强大的功能和无限的创造力。我们将逐步介绍如何安装和配置这些工具，并提供相关的源代码示例。安装TensorFlowTensorFlow是一个基于数据流图的开源机器学习框架，提供了丰富的工具和库来构建和训练各种深度
机器学习之KMeans算法知舟不叙机器学习算法 kmeans
文章目录引言1.KMeans算法简介2.KMeans算法的数学原理3.KMeans算法的步骤3.1初始化簇中心3.2分配数据点3.3更新簇中心3.4停止条件4.KMeans算法的优缺点4.1优点4.2缺点5.KMeans算法的应用场景5.1图像分割5.2市场细分5.3文档聚类5.4异常检测6.Python实现KMeans算法7.总结引言KMeans算法是机器学习中最经典的无监督学习算法之一，广泛应
机器学习流程—数据预处理清洗不二人生机器学习机器学习人工智能数据预处理
文章目录机器学习流程—数据预处理清洗定义问题数据预处理数据加载与展示重复数据处理数据类型空值处理无关特征删除数据分布删除异常值生成标签和特征数据分割机器学习流程—数据预处理清洗数据处理是将数据从给定形式转换为更可用和更理想的形式的任务，即使其更有意义、信息更丰富。使用机器学习算法、数学建模和统计知识，整个过程可以自动化。这个完整过程的输出可以是任何所需的形式，如图形、视频、图表、表格、图像等等，具
Apache Storm：实时数据处理的闪电战 Aaron_945 Java apache storm 大数据
文章目录ApacheStorm原理拓扑结构数据流处理容错机制官网链接基础使用安装与配置编写拓扑提交与运行高级使用状态管理窗口操作多语言支持优点高吞吐量低延迟可扩展性容错性总结ApacheStorm是一个开源的分布式实时计算系统，它允许你以极高的吞吐量处理无界数据流。Storm被广泛用于实时分析、在线机器学习、连续计算等多种场景。本文将深入探讨ApacheStorm的原理、基础使用、高级特性及其优点
Python 机器学习基础之学习基础环境搭建仙魁XAN Python 机器学习基础+实战案例 python 学习开发语言机器学习 machine learning
Python机器学习基础之学习基础环境搭建目录Python机器学习基础之学习基础环境搭建一、简单介绍二、什么是机器学习三、python环境的搭建1、Python安装包下载2、这里以下载Python3.10.9为例3、安装Python3.10.94、检验python是否安装成功，win+R快捷打开运行，输入cmd，打开cmd四、Pycharm环境搭建1、下载Pycharm安装包2、安装Pycharm
【机器学习】主成分分析法（PCA）若兰幽竹机器学习机器学习信息可视化人工智能
【机器学习】主成分分析法（PCA）一、摘要二、主成分分析的基本概念三、主成分分析的数学模型五、主成分分析法目标函数公式推导（`梯度上升法`求解目标函数）六、梯度上升法求解目标函数第一个主成分七、求解前n个主成分及PCA在数据预处理中的处理步骤（后续实现）一、摘要本文主要讲述了主成分分析法（PCA）的原理和应用。PCA通过选择最重要的特征，将高维数据映射到低维空间，同时保持数据间的关系，实现降维和去
SQL的各种连接查询 xieke90 UNION ALL UNION 外连接内连接 JOIN
一、内连接概念：内连接就是使用比较运算符根据每个表共有的列的值匹配两个表中的行。内连接（join 或者inner join ） SQL语法： select * fron
java编程思想--复用类百合不是茶 java 继承代理组合 final类
复用类看着标题都不知道是什么,再加上java编程思想翻译的比价难懂,所以知道现在才看这本软件界的奇书一:组合语法:就是将对象的引用放到新类中即可代码: package com.wj.reuse; /** * * @author Administrator 组
[开源与生态系统]国产CPU的生态系统 comsci cpu
计算机要从娃娃抓起...而孩子最喜欢玩游戏.... 要让国产CPU在国内市场形成自己的生态系统和产业链,国家和企业就不能够忘记游戏这个非常关键的环节.... 投入一些资金和资源,人力和政策,让游
JVM内存区域划分Eden Space、Survivor Space、Tenured Gen，Perm Gen解释商人shang jvm内存
jvm区域总体分两类，heap区和非heap区。heap区又分：Eden Space（伊甸园）、Survivor Space(幸存者区)、Tenured Gen（老年代-养老区）。非heap区又分：Code Cache(代码缓存区)、Perm Gen（永久代）、Jvm Stack(java虚拟机栈)、Local Method Statck(本地方法栈)。 HotSpot虚拟机GC算法采用分代收
页面上调用 QQ oloz qq
<A href="tencent://message/?uin=707321921&Site=有事Q我&Menu=yes"> <img style="border:0px;" src=http://wpa.qq.com/pa?p=1:707321921:1></a>
一些问题文强chu 问题
1.eclipse 导出 doc 出现“The Javadoc command does not exist.” javadoc command 选择 jdk/bin/javadoc.exe 2.tomcate 配置 web 项目 ..... SQL:3.mysql * 必须得放前面否则 select&nbs
生活没有安全感小桔子生活孤独安全感
圈子好小，身边朋友没几个，交心的更是少之又少。在深圳，除了男朋友，没几个亲密的人。不知不觉男朋友成了唯一的依靠，毫不夸张的说，业余生活的全部。现在感情好，也很幸福的。但是说不准难免人心会变嘛，不发生什么大家都乐融融，发生什么很难处理。我想说如果不幸被分手(无论原因如何)，生活难免变化很大，在深圳，我没交心的朋友。明
php 基础语法 aichenglong php 基本语法
1 .1 php变量必须以$开头 <?php $a=” b”; echo ?> 1 .2 php基本数据库类型 Integer float/double Boolean string 1 .3 复合数据类型数组array和对象 object 1 .4 特殊数据类型 null 资源类型(resource) $co
mybatis tools 配置详解 AILIKES mybatis
MyBatis Generator中文文档 MyBatis Generator中文文档地址： http://generator.sturgeon.mopaas.com/ 该中文文档由于尽可能和原文内容一致，所以有些地方如果不熟悉，看中文版的文档的也会有一定的障碍，所以本章根据该中文文档以及实际应用，使用通俗的语言来讲解详细的配置。本文使用Markdown进行编辑，但是博客显示效
继承与多态的探讨百合不是茶 JAVA面向对象继承对象
继承 extends 多态继承是面向对象最经常使用的特征之一：继承语法是通过继承发、基类的域和方法 //继承就是从现有的类中生成一个新的类，这个新类拥有现有类的所有extends是使用继承的关键字：在A类中定义属性和方法； class A{ //定义属性 int age； //定义方法 public void go
JS的undefined与null的实例 bijian1013 JavaScript JavaScript
<form name="theform" id="theform"> </form> <script language="javascript"> var a alert(typeof(b)); //这里提示undefined if(theform.datas
TDD实践（一） bijian1013 java 敏捷 TDD
一.TDD概述 TDD：测试驱动开发，它的基本思想就是在开发功能代码之前，先编写测试代码。也就是说在明确要开发某个功能后，首先思考如何对这个功能进行测试，并完成测试代码的编写，然后编写相关的代码满足这些测试用例。然后循环进行添加其他功能，直到完全部功能的开发。
[Maven学习笔记十]Maven Profile与资源文件过滤器 bit1129 maven
什么是Maven Profile Maven Profile的含义是针对编译打包环境和编译打包目的配置定制，可以在不同的环境上选择相应的配置，例如DB信息，可以根据是为开发环境编译打包，还是为生产环境编译打包，动态的选择正确的DB配置信息 Profile的激活机制 1.Profile可以手工激活，比如在Intellij Idea的Maven Project视图中可以选择一个P
【Hive八】Hive用户自定义生成表函数(UDTF) bit1129 hive
1. 什么是UDTF UDTF，是User Defined Table-Generating Functions，一眼看上去，貌似是用户自定义生成表函数，这个生成表不应该理解为生成了一个HQL Table，貌似更应该理解为生成了类似关系表的二维行数据集 2. 如何实现UDTF 继承org.apache.hadoop.hive.ql.udf.generic
tfs restful api 加auth 2.0认计 ronin47
　　目前思考如何给tfs的ngx-tfs api增加安全性。有如下两点：　　一是基于客户端的ip设置。这个比较容易实现。　　二是基于OAuth2.0认证，这个需要lua，实现起来相对于一来说，有些难度。　　现在重点介绍第二种方法实现思路。　　前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGe
jdk环境变量配置 byalias java jdk
进行java开发，首先要安装jdk，安装了jdk后还要进行环境变量配置： 1、下载jdk（http://java.sun.com/javase/downloads/index.jsp），我下载的版本是：jdk-7u79-windows-x64.exe 2、安装jdk-7u79-windows-x64.exe 3、配置环境变量：右击"计算机"-->&quo
《代码大全》表驱动法-Table Driven Approach-2 bylijinnan java
package com.ljn.base; import java.io.BufferedReader; import java.io.FileInputStream; import java.io.InputStreamReader; import java.util.ArrayList; import java.util.Collections; import java.uti
SQL 数值四舍五入小数点后保留2位 chicony 四舍五入
1.round() 函数是四舍五入用，第一个参数是我们要被操作的数据，第二个参数是设置我们四舍五入之后小数点后显示几位。 2.numeric 函数的2个参数，第一个表示数据长度，第二个参数表示小数点后位数。例如：　　select cast(round(12.5,2) as numeric(5,2))
c++运算符重载 CrazyMizzz C++
一、加+，减-，乘*，除/ 的运算符重载 Rational operator*(const Rational &x) const{ return Rational(x.a * this->a); } 在这里只写乘法的，加减除的写法类似二、<<输出,>>输入的运算符重载 &nb
hive DDL语法汇总 daizj hive 修改列 DDL 修改表
hive DDL语法汇总１、对表重命名 hive> ALTER TABLE table_name RENAME TO new_table_name; 2、修改表备注 hive> ALTER TABLE table_name SET TBLPROPERTIES ('comment' = new_comm
jbox使用说明 dcj3sjt126com Web
参考网址：http://www.kudystudio.com/jbox/jbox-demo.html jBox v2.3 beta [ 点击下载] 技术交流QQGroup：172543951 100521167 [2011-11-11] jBox v2.3 正式版 - [调整&修复] IE6下有iframe或页面有active、applet控件
UISegmentedControl 开发笔记 dcj3sjt126com
// typedef NS_ENUM(NSInteger, UISegmentedControlStyle) { // UISegmentedControlStylePlain, // large plain &
Slick生成表映射文件 ekian scala
Scala添加SLICK进行数据库操作，需在sbt文件上添加slick-codegen包 "com.typesafe.slick" %% "slick-codegen" % slickVersion 因为我是连接SQL Server数据库，还需添加slick-extensions，jtds包 "com.typesa
ES-TEST gengzg test
package com.MarkNum; import java.io.IOException; import java.util.Date; import java.util.HashMap; import java.util.Map; import javax.servlet.ServletException; import javax.servlet.annotation
为何外键不再推荐使用 hugh.wang mysql DB
表的关联，是一种逻辑关系，并不需要进行物理上的“硬关联”，而且你所期望的关联，其实只是其数据上存在一定的联系而已，而这种联系实际上是在设计之初就定义好的固有逻辑。在业务代码中实现的时候，只要按照设计之初的这种固有关联逻辑来处理数据即可，并不需要在数据库层面进行“硬关联”，因为在数据库层面通过使用外键的方式进行“硬关联”，会带来很多额外的资源消耗来进行一致性和完整性校验，即使很多时候我们并不
领域驱动设计 julyflame VO DAO 设计模式 DTO po
概念： VO（View Object）：视图对象，用于展示层，它的作用是把某个指定页面（或组件）的所有数据封装起来。 DTO（Data Transfer Object）：数据传输对象，这个概念来源于J2EE的设计模式，原来的目的是为了EJB的分布式应用提供粗粒度的数据实体，以减少分布式调用的次数，从而提高分布式调用的性能和降低网络负载，但在这里，我泛指用于展示层与服务层之间的数据传输对
单例设计模式 hm4123660 java Singleton 单例设计模式懒汉式饿汉式
单例模式是一种常用的软件设计模式。在它的核心结构中只包含一个被称为单例类的特殊类。通过单例模式可以保证系统中一个类只有一个实例而且该实例易于外界访问，从而方便对实例个数的控制并节约系统源。如果希望在系统中某个类的对象只能存在一个，单例模式是最好的解决方案。 &nb
logback zhb8015 log logback
一、logback的介绍 Logback是由log4j创始人设计的又一个开源日志组件。logback当前分成三个模块：logback-core,logback- classic和logback-access。logback-core是其它两个模块的基础模块。logback-classic是log4j的一个改良版本。此外logback-class
整合Kafka到Spark Streaming——代码示例和挑战 Stark_Summer spark storm zookeeper PARALLELISM processing
作者Michael G. Noll是瑞士的一位工程师和研究员，效力于Verisign，是Verisign实验室的大规模数据分析基础设施（基础Hadoop）的技术主管。本文，Michael详细的演示了如何将Kafka整合到Spark Streaming中。期间， Michael还提到了将Kafka整合到 Spark Streaming中的一些现状，非常值得阅读，虽然有一些信息在Spark 1.2版
spring-master-slave-commondao 王新春 DAO spring dataSource slave master
互联网的web项目，都有个特点：请求的并发量高，其中请求最耗时的db操作，又是系统优化的重中之重。为此，往往搭建 db的一主多从库的数据库架构。作为web的DAO层，要保证针对主库进行写操作，对多个从库进行读操作。当然在一些请求中，为了避免主从复制的延迟导致的数据不一致性，部分的读操作也要到主库上。（这种需求一般通过业务垂直分开，比如下单业务的代码所部署的机器，读去应该也要从主库读取数