EM算法及对GMM的参数估计（EM算法的R实现 vs R mclust包）

EM算法与高斯混合模型（GMM）

EM算法是一种迭代算法，1977年由Dempster等人总结提出，用于含有隐变量（hidden variable）的概率模型参数的极大似然估计，或极大后验概率估计。EM算法的每次迭代由2步组成：

E-step：求期望（expectation）
M-step：最大化（maximization）

所以该算法称为期望极大算法（expectation maximization algorithm），简称EM算法。EM算法的一个重要应用是高斯混合模型（GMM）的参数估计。这里以学习笔记的方式，梳理EM算法在GMM参数估计中的主要过程，记录如下：

【k-mixture GMM的概率分布】

$P (X | Θ) = \sum l = 1 k α l N (X | θ l) = \sum l = 1 k α l N (X | μ l, Σ l)$

其中， Θ={α1,...,αk;θ1,...,θk}={α1,...,αk;μ1,...,μk;Σ1,...,Σk} ， αl 代表各高斯的权重， ∑kl=1αl=1 。因此，由 k 个高斯分布分模型组成的GMM可以理解为：这 k 个高斯分布以不同的权重，组合成一个混合模型，混合模型产生的每一个样本点 xi 都受到 k 个高斯分布的不同影响，影响的大小由权重 αl 决定。举个不太恰当的例子帮助理解：

$A 、 B 国的混血女 + C 、 D 国的混血男 = 子女 1 + . . . + 子女 n$

其中， A、B、C、D 代表4个不同的高斯分布，它们以一定的权重形成一个高斯混合模型，这个模型生出来的每一个子女i ，都会受到 A、B、C、D 四国血统的影响，影响的大小由 A、B、C、D 结合时所给出基因多少（权重）决定。
【k-mixture GMM的对数似然函数】

$L (Θ | X) = l o g P (X | Θ) = l o g [\sum l = 1 k α l N (X | μ l, Σ l)] = l o g [\prod i = 1 n \sum l = 1 k α l N (x i | μ l, Σ l)] = \sum I = 1 n [l o g (\sum l = 1 k α l N (x i | μ l, Σ l))]$

我们的目标是求出使 L(Θ|X) 最大的各个高斯参数，即
$Θ M L E = a r g m a x Θ {l o g P (X | Θ)}$ 但是： log 中带有 ∑ 符号不利于求导；求导后令其为零也很难得到参数集 Θ 中的众多参数。
【EM算法的基本思想】

当无法一步到位地将 ΘMLE 求出来时，可以通过迭代的方式，从初始参数 Θ(1) → Θ(2) → … → Θ(f) ，直到下一次迭代更新，参数的变化十分小，即可认为其收敛，并得到最优参数 Θ(f) 。

既然是要使对数似然函数最大化，那么每一步迭代都必须保证：

log[P(X|Θ(g+1))]≥log[X|P(Θ(g))]

并且，EM算法给出的关于 Θ(g+1) 和 Θ(g) 之间满足的关系是：

Θ(g+1)=argmaxΘ(∫zP(Z|X,Θ(g))logP(X,Z|Θ)dz)

其中， Θ(g) 是上一次迭代得到的参数， Θ(g+1) 是下一次迭代更新的参数。 Z 称为隐变量，它是一种不可观测的辅助变量。隐变量的添加必须满足：
1. 加入隐变量后能够简化模型的解法
2. 在概率模型中，加入隐变量后不能改变数据的边缘分布，即要满足 P(X|Θ)=∫zP(X|Z,Θ)P(Z|Θ)dz
【GMM中的隐变量 Z={z1,z2,...,zn} 】

观测数据 xi （ i=1,2,...,n ）是这样产生的：首先依照各高斯的权重 αl ，选出第 l 个高斯分布，然后依照第 l 个高斯的概率分布 N(X|θl) 生成观测数据 xi 。这时观测数据 xi （ i=1,2,...,n ）是已知的，反映观测数据 xi 属于哪一个高斯分模型的数据是未知的，将这个未知的、观测不到的数据称为隐变量 zi （ i=1,2,...,n ）。显然， zi∈{1,2,...,k} 。

$x i \to z i ：样本点 x i 属于第 z i 个高斯分布$
【EM算法的收敛性】

EM算法的核心就是按照 Θ(g+1) 和 Θ(g) 之间的等式关系，不断去更新参数，并且能保证每一次更新，都使得对数似然函数逐渐增大。证明EM算法的收敛性：

$P (X | Θ) = P ( X , Z | Θ ) P ( Z | X , Θ )$

等式两边取对数并以 P(Z|X,Θ(g)) 为概率分布求期望：

$E [l o g P (X | Θ)] = E [l o g P (X, Z | Θ)] - E [l o g P (Z | X, Θ)]$

则等式左边写为：

$\int z P (Z | X, Θ (g)) l o g P (X | Θ) d z = l o g P (X | Θ) \int z P (Z | X, Θ (g)) d z = l o g P (X | Θ)$

等式右边写为：

$\int z P (Z | X, Θ (g)) l o g P (X, Z | Θ) d z - \int z P (Z | X, Θ (g)) l o g P (Z | X, Θ) d z = Q (Θ, Θ (g)) - H (Θ, Θ (g))$

由Jensens不等式可以证明 H(Θ(g),Θ(g))≥H(Θ,Θ(g))，∀Θ

从而对于任意一次迭代更新参数 Θ(g+1) ，都有 H(Θ(g),Θ(g))≥H(Θ(g+1),Θ(g))

因此，只要 argmax{Q(Θ,Θ(g))} ，就能保证对数似然函数的最大化。注意 Q 函数中， Θ(g) 是上一次迭代后得到的固定常数，而 Θ 是一个变量，作 argmax 不会改变 Θ(g) 的值。
【EM算法的核心定义：E-step】

上述 Q(Θ,Θ(g)) 可以看作函数 logP(X,Z|Θ) 以概率分布 P(Z|X,Θ(g)) 求期望，其定义如下：
1. 观测值与隐变量的联合概率：
  
  $P (X, Z | Θ) = \prod i = 1 n p (x i, z i | Θ) = \prod i = 1 n p (x i | z i, Θ) p (z i | Θ) = \prod i = 1 n α z i N (x i | μ z i, Σ z i)$
2. 在对应观测值已知的情况下，该观测值来源于哪个高斯的条件概率：
  
  $P (Z | X, Θ (g)) = \prod i = 1 n p (z i | x i, Θ (g)) = \prod i = 1 n α z i N ( x i | μ z i , Σ z i ) \sum k l = 1 α l N ( x i | μ l , Σ l )$
【求解 Θ(g+1) ：M-step】

将上述函数的定义代入 Q(Θ,Θ(g)) ，求导令其为零，得到 Θ(g+1) 的值：

$α (g + 1) l = \sum n i = 1 p ( l | x i , Θ ( g ) ) n$

$μ (g + 1) l = \sum n i = 1 x i p ( l | x i , Θ ( g ) ) \sum n i = 1 p ( l | x i , Θ ( g ) )$

$Σ (g + 1) l = \sum n i = 1 [ x i - μ ( i + 1 ) l ] [ x i - μ ( i + 1 ) l ] T p ( l | x i , Θ ( g ) ) \sum n i = 1 p ( l | x i , Θ ( g ) )$

其中， p(l|xi,Θ(g)) 称为responsibility probability，它是指当得到样本点 xi 后，该样本点属于第 l 个高斯分布的概率。

GMM参数估计示例

【模拟样本】指定2个高斯分布的参数，并令其以0.4和0.6的权重随机生成5000个样本

# 生成n=5000的样本samp
set.seed(637351)
n <- 5000

# 权重0.4，高斯参数N(3，1)
alpha1 <- 0.4
miu1   <- 3
sigma1 <- 1

# 权重0.6，高斯参数N(-2，4)
alpha2 <- 0.6
miu2   <- -2
sigma2 <- 2

n1 <- floor(n*alpha1)
n2 <- n-n1

samp <-numeric(n)
samp[1:n1] <- rnorm(n1, miu1, sigma1)
samp[(n1+1):n] <- rnorm(n2, miu2, sigma2)

# 高斯混合模型的密度函数图
hist(samp, freq = FALSE)
lines(density(samp), col = 'red')

EM算法的R实现

【EM求解】现在假设手里只有样本samp，已知其来自2个高斯分布（可以分成2类），但各高斯的参数和权重未知，用EM算法求解：

# 设定高斯分布的个数，准备空矩阵
k <- 2
prob <- matrix(rep(0, k*n), nrow = n)
weight <- matrix(rep(0, k*n), nrow = n)

# 初始权重alpha平均分配，高斯参数miu、sigma由均匀分布随机产生
alpha <- c(0.5, 0.5)
miu   <- runif(k)
sigma <- runif(k)

# EM算法实现
for (step in 1:200) {
  # E-step：求第i个样本来自第j个高斯的概率
  for (j in 1:k) {
    prob[, j]   <- sapply(samp, dnorm, miu[j], sigma[j])
    weight[, j] <- alpha[j] * prob[, j]
  }
  row_sum <- rowSums(weight)
  prob    <- weight/row_sum

  # 记录上一次迭代的参数
  oldalpha <- alpha
  oldmiu   <- miu
  oldsigma <- sigma

  # M-step：最大化是通过求导令其为零的方法，这里直接给出参数优化结果
  for (j in 1:k) {
    sum1     <- sum(prob[, j])
    sum2     <- sum(samp*prob[, j])
    alpha[j] <- sum1/n
    miu[j]   <- sum2/sum1
    sum3     <- sum(prob[, j]*(samp-miu[j])^2)
    sigma[j] <- sqrt(sum3/sum1)
  }

  # 设阈值：当上一步迭代得到的参数与下一步迭代得到的参数变化很小，即认为收敛
  threshold <- 1e-5
  if (sum(abs(alpha - oldalpha)) < threshold & 
      sum(abs(miu - oldmiu))     < threshold & 
      sum(abs(sigma - oldsigma)) < threshold) break
  cat('step', step, 'alpha', alpha, 'miu', miu, 'sigma', sigma, '\n')
}

【迭代结果】省略部分迭代过程，经125次迭代后，得到最优参数：权重为 0.402 的高斯 N(2.98，0.962) ，权重为 0.598 的高斯 N(−2.05，1.952) 。

step 1 alpha 0.9276533 0.07234668 miu -0.02635882 -0.06741285 sigma 3.062992 0.6167386 
step 2 alpha 0.9616189 0.03838105 miu -0.02227273 -0.2061188 sigma 3.010045 0.664219 
step 3 alpha 0.9771787 0.02282128 miu -0.02167226 -0.3571784 sigma 2.986799 0.6915781 
step 4 alpha 0.9853229 0.0146771 miu -0.02206765 -0.5168036 sigma 2.97487 0.7053047 
step 5 alpha 0.9899198 0.01008019 miu -0.02270511 -0.6798185 sigma 2.968202 0.7097974 
step 6 alpha 0.9926533 0.007346716 miu -0.02331694 -0.8416411 sigma 2.96425 0.7089913 
step 7 alpha 0.9943434 0.005656624 miu -0.02380939 -0.9995759 sigma 2.961799 0.7057652 
step 8 alpha 0.9954167 0.004583325 miu -0.0241567 -1.152648 sigma 2.96022 0.7015791 
step 9 alpha 0.9961051 0.003894859 miu -0.02435778 -1.300695 sigma 2.959172 0.6968685 
step 10 alpha 0.9965391 0.003460889 miu -0.02441699 -1.443691 sigma 2.958461 0.6916394 
...
step 120 alpha 0.4016976 0.5983024 miu 2.982002 -2.051124 sigma 0.9602173 1.948754 
step 121 alpha 0.4016951 0.5983049 miu 2.98201 -2.051108 sigma 0.9602116 1.948766 
step 122 alpha 0.401693 0.598307 miu 2.982017 -2.051095 sigma 0.9602069 1.948776 
step 123 alpha 0.4016913 0.5983087 miu 2.982022 -2.051084 sigma 0.9602031 1.948785 
step 124 alpha 0.4016899 0.5983101 miu 2.982027 -2.051075 sigma 0.9602 1.948791 
step 125 alpha 0.4016888 0.5983112 miu 2.98203 -2.051068 sigma 0.9601974 1.948797

【GMM聚类】现在已经得到2个高斯分布的权重和参数，因此可以对样本进行归类，亦即将得到的参数在E-step重新计算一遍：

prob1    <- dnorm(samp, miu[1], sigma[1])
prob2    <- dnorm(samp, miu[2], sigma[2])
sum_prob <- alpha[1]*prob1+alpha[2]*prob2

# 第i个样本来自第1个高斯的概率
weight1 <- (alpha[1]*prob1)/sum_prob

# 第i个样本来自第2个高斯的概率
weight2 <- (alpha[2]*prob2)/sum_prob

# 比较样本点来自第1、2个高斯的概率，哪个概率大归入哪一类
z <- ifelse(weight1 > weight2, 1, 2)

# z的计算也可以用如下for循环
for (i in 1:n) {
  if (weight1[i] > weight2[i]) {
    z[i] <- 1
  } else if (weight1[i] < weight2[i]) {
    z[i] <- 2
  } else {
    z[i] <- 0
  }
}
# 查看归入1、2类的样本个数
table(z)

【聚类结果】属于第1类的样本点有2081个，占 20815000=0.4162 ；属于第2类的样本点有2919个，占 29195000=0.5838 。

z
   1    2 
2081 2919

【代码理解】在【EM算法求解】、【GMM聚类】步骤中的部分代码计算，可以理解如下：

EM算法及对GMM的参数估计（EM算法的R实现 vs R mclust包）_第2张图片

# 【EM求解】对应代码
prob[, j] <- sapply(samp, dnorm, miu[j], sigma[j])
# 【GMM聚类】对应代码
prob1 <- dnorm(samp, miu[1], sigma[1])
prob2 <- dnorm(samp, miu[2], sigma[2])

EM算法及对GMM的参数估计（EM算法的R实现 vs R mclust包）_第3张图片

# 【EM求解】对应代码
weight[, j] <- alpha[j] * prob[, j]

EM算法及对GMM的参数估计（EM算法的R实现 vs R mclust包）_第4张图片

# 【EM求解】对应代码
row_sum <- rowSums(weight)
# 【GMM聚类】对应代码
sum_prob <- alpha[1]*prob1+alpha[2]*prob2

# 【EM求解】对应代码
prob <- weight/row_sum
# 【GMM聚类】对应代码
weight1 <- (alpha[1]*prob1)/sum_prob
weight2 <- (alpha[2]*prob2)/sum_prob

R mclust包

mclust包提供了利用GMM对数据进行聚类分析的方法。其中函数Mclust()是进行EM聚类的核心函数，它的基本调用格式为：

Mclust(data, G = NULL, modelNames = NULL, prior = NULL, 
       control = emControl(), initialization = NULL, 
       warn = mclust.options("warn"), ...)

其中，data是待处理数据集；G为预设类别数，默认值为1至9，即由软件根据BIC的值在1-9中选择最优值。下面直接用mclust包的函数对生成samp的GMM进行估计：

library(mclust)
em <- Mclust(samp)
summary(em, parameters = T)

【估计结果】得到的最优参数：权重为 0.405 的高斯 N(2.97，0.94) ，权重为 0.595 的高斯 N(−2.07，3.74) 。

----------------------------------------------------
Gaussian finite mixture model fitted by EM algorithm 
----------------------------------------------------

Mclust V (univariate, unequal variance) model with 2 components:

 log.likelihood    n df       BIC       ICL
       -11817.8 5000  5 -23678.18 -24140.79

Clustering table:
   1    2 
2910 2090 

Mixing probabilities:
        1         2 
0.5950857 0.4049143 

Means:
        1         2 
-2.071201  2.971525 

Variances:
        1         2 
3.7377492 0.9364023

参考资料：
统计学习方法
EM算法的R实现和高斯混合模型
R语言实战：机器学习与数据分析
Package ‘mclust’
聚类(1)——混合高斯模型 Gaussian Mixture Model

面试问题001 li星野刷题面试开发语言 linux
进程和线程的区别进程是资源分配和调度的基本单位。线程是程序执行的最小单位，线程是进程的子任务，是进程内的执行单元。一个进程至少有一个线程，一个进程可以运行多个线程，这些线程共享同一块内存。资源开销：进程：由于每个进程都有独立的内存空间，创建和销毁进程的开销较大。进程间切换需要保存和恢复整个进程的状态，因此上下文切换的开销较高。线程：线程共享相同的内存空间，创建和销毁线程的开销较小。线程间切换只需要
坚持绘画的半年后 LayBuddha
只需要全情的投入过程，剩下的就交给时间。图片发自App图片发自App图片发自App图片发自App
我的天赋优势正圆玉润
继一周前给一个四年级小女孩做了催眠之后，今天又给一个朋友做了催眠。事实证明，催眠功夫没丢，已经形成了肌肉记忆。越来越认识到，这就是我的天赋优势，我善于做催眠，善于安慰人，善于做教育，做这些事情时的我有强烈的内驱力，感到轻松自在，也毫不费力。我需要好好把它发扬光大。
2022-03-13 做一束暖暖的光
一、中原焦点团队杜冰冰焦点初15期坚持分享第1053天2022年3月13日二、坚持读书分享第984天《活法》第25---36页强势群体与弱势群体强势群体指经济收入较高，有一定社会地位，在生活时尚和消费潮流方面，属于主导地位的阶层。强势群体需要具备一、身体力强。二、有大量的资源。社会资源丰富。三、做任何事情都积极主动。弱势群体的特征一、体弱多病。二、社交圈比较窄。三、做任何事情被动安于现状。比如年轻
【网上商城项目结构】启山智软商城源码小程序 java
文章目录前言一、网站前台二、运营商后台三、商家管理后台四、系统架构五、数据库设计六、关键技术总结前言网上商城项目结构通常包括网站前台、运营商后台和商家管理后台三个子系统，以及多个功能模块，如门户、搜索、购物车、订单、秒杀、个人中心等。在设计网上商城项目结构时，需要从用户需求和企业运营两个维度考虑，确保系统既能为用户提供良好的购物体验，又能满足企业高效管理的需求。以下是对网上商城项目结构的详细介绍：
一场梦修源正本
西江月·世事一场大梦[宋代]苏轼世事一场大梦，人生几度秋凉？夜来风叶已鸣廊。看取眉头鬓上。酒贱常愁客少，月明多被云妨。中秋谁与共孤光。把盏凄然北望。世上万事恍如一场大梦，人生经历了几度新凉的秋天？到了晚上，风吹动树叶发出的声音，响彻回廊里，看看自己，眉头鬓上又多了几根银丝。酒并非好酒，却为客少发愁，月亮虽明，却总被云遮住。在这中秋之夜，谁能够和我共同欣赏这美妙的月光？我只能拿起酒杯，凄然望着北方。
如何把文案变成“印钞机” 西亚西
把文案变成印钞机，这是《爆款文案》作者关键明老师一直在做的事情。他是前奥美金牌广告人，他写出了走心文案的一套系统和4大步骤。让每一个想学文案的人都能够从中获益。大家称关键明老师为文案圈的神级人物，知道关老师的人就知道，这个夸奖并不夸张。但是关老师为什么有现在如此高的成就？相信很多人想知道答案。首先关老师非常非常的利他。我现在链接到的很多人，其实都是从关老师那里知道。苏北老师，阿糖，安迪，还有许多同
大数据新视界 --大数据大厂之数据挖掘入门：用 R 语言开启数据宝藏的探索之旅青云交大数据新视界数据库大数据数据挖掘 R 语言算法案例未来趋势应用场景学习建议大数据新视界
亲爱的朋友们，热烈欢迎你们来到青云交的博客！能与你们在此邂逅，我满心欢喜，深感无比荣幸。在这个瞬息万变的时代，我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客，正是这样一个温暖美好的所在。在这里，你们不仅能够收获既富有趣味又极为实用的内容知识，还可以毫无拘束地畅所欲言，尽情分享自己独特的见解。我真诚地期待着你们的到来，愿我们能在这片小小的天地里共同成长，共同进步。本博客的精华专栏：Ja
Python前沿技术：机器学习与人工智能 4.0啊 Python 人工智能 python 机器学习
Python前沿技术：机器学习与人工智能一、引言随着科技的飞速发展，机器学习和人工智能（AI）已经成为了计算机科学领域的热门话题。Python作为一门易学易用且功能强大的编程语言，已经成为了这两个领域的首选语言之一。本文将深入探讨Python在机器学习和人工智能领域的应用，以及一些前沿技术和工具。二、Python机器学习基础2.1机器学习概述机器学习是人工智能（AI）的一个关键子集，它的核心在于让
非农必定利多黄金回调已然就绪 1293多头大胆跟进程曼志
非农必定利多黄金回调已然就绪1293多头大胆跟进市场分析这是曼志的工作，这能展现曼志的实力，这是曼志该做的。相反，往往是曼志的客户的反应让曼志动容，曼志做这行跌跌撞撞也有近10年了，看过太多太多，想过太多太多，但是初心不变，盈亏不是曼志能完美掌控的，行情不好曼志有时候也无能为力，但曼志只是想和市场上广大的投资者贯彻一下曼志的投资理念，我们在投资，不想被市场淘汰。那我们分析师呢，曼志在帮助各位投资者
Vite项目中eslint的简单配置 DT—— 其他 javascript 前端代码规范
1.创建一个vite项目使用包管理工具创建一个vite项目。npminitvite@latest#或者使用yarncreateyarncreatevite#或者使用pnpmpnpmcreatevite2.安装eslintnpminstalleslint-D#或者使用yarnyarnaddeslint-D#或者使用pnpmpnpmaddeslint-D3.初始化eslint配置文件在项目根目录下运行
【网络安全 | 代码审计】JFinal之DenyAccessJsp绕过秋说网络安全 web安全 java 代码审计漏洞挖掘
未经许可，不得转载。文章目录前言代码审计推理绕过Tomcat解析JSP总结概念验证阐发前言JFinal是一个基于Java的轻量级MVC框架，用于快速构建Web应用程序。它的设计理念是追求极简、灵活、高效，旨在提高开发效率，减少冗余代码的编写，适合中小型项目以及对性能有较高要求的项目。在较新的JFinal版本中，默认情况下无法直接通过浏览器地址栏输入.jsp文件名来访问对应的JSP文件。也就是说，主
【生活小记录】记录一下今天我是怎么度过的吧！(2022134) 恋上清咖
每周都是盼着休息日快点到来，可是这一天来了无论怎么过总会觉得这一天没过好！觉得如果再给我一次机会我一定会过得更好！就这样每一个休息日都在这样周而复始的状态中过去了！所以我就想好好记录一下这一天，我倒要看看这一天怎么过才算是过得好，才算是让自己满意的一天！好吧！开始记录：起床时间：早上7点，小猫咪依然是在平常6点零五分的时刻对着我叫了两声让我起床，毕竟休息日嘛！怎可辜负这能睡懒觉的美好时光，一巴掌把
卡车一键启动功能的发展和应用情况‌ zsmydz888 卡车一键启动智能钥匙卡车无钥匙启动系统汽车 ‌汽车的舒适进入汽车一键式启动系统‌
随着汽车技术的不断进步，卡车的一键启动功能已经逐渐普及。一键启动不仅提高了驾驶的便利性，还提升了卡车的整体档次和舒适度移。移动管家卡车一键启动无钥匙进入手机智能控制、‌高端配置相结合，为司机提供更加便捷和舒适的驾驶体验。卡车智能一键启动系统相比传统钥匙启动方式，一键启动功能可以节省操作时间、提高启动效率，让驾驶更加便捷。一键启动是近年来汽车带的一种按键启动方式，顾名思义，只需按下一个按键就可以实现
车联网智能终端GB/T 32960国标协议规范、国标新能源车联网终端GB/T32960标准T-BOX应用 zsmydz888 车联网解决方案汽车T-Box车机硬件
新能源车联网终端T-BOX符合GB/T32960,标准国标车载智能网联终端4GTBOX，利用车身总线Can2.0控制协议实现终端与汽车的信息交互，结合北斗GPS卫星定位技术、4G蜂窝网络、Internet网传技术，提供多种信息达成对车辆安全防护，通过强大的服务平台可以实现对车辆进行实时远程监管作用，可以为企业和私家车主提供定位、跟踪、防盗、轨迹回放、车况监测和驾驶行为分析等功能，也可以广泛应用于个
《女配生存法则》｜1.拯救恶毒女配柒日酒馆
图源网络，侵权删1.买个早餐都能摔，沐晚晚发誓今天是她最惨的一天，偏偏现在的她无暇顾及摔的原因。周围的风快速流动，带给她刺骨的疼，她已经睁不开眼睛了，不止是因为害怕被这猛风戳瞎眼睛，更是因为她不想知道自己离死亡还有多远。“天地良心，我以后再也不买早餐了，让我死的好看点……”沐晚晚用尽全身力气大喊着，她已经不奢望自己能活着了。不知道过了多久，沐晚晚脑中的各种想法都归于平静，“原来死后还有意识啊。”感
秋假第一天妙芷
图片发自App今天早晨我们还没有起床，两个孩子就欢欢喜喜的都跳到我们的床上。然然后叽叽喳喳笑个不停。约定俗成的老大躺在我们中间，老二躺在我的身边。一人捧着我一胳膊美滋滋的。好像我的胳膊就是长在他们身上似的。今天老大放假。我还想老二送到学校有没有难度？结果老二说今天小学放假，幼儿园没有放假，我要上幼儿园。老大就说今天我要送弟弟上幼儿园，听从了爸爸的指令，老二很快的穿完衣服了，吃了早饭。吃过早饭，我们
玩赚商店看广告可以赚钱吗？广告单价5毛日赚100+是真是假清风导师
玩赚平台看广告赚钱一个广告5毛日入100+是真的吗?玩赚商店广告赚钱项目怎么样?玩赚APP是一款广告+任务聚合模式赚钱兼职软件，也是目前全网最为优质的广告赚钱软件，不光单价高而且持续稳定、平台提现门槛极低，所以无论是静态或者做团队都是特别好的选择!这边网友的反馈，如果没有团队就是一个手机设备日赚两位数是比较轻松的，像一些时间多的网友多劳多得，甚至录得了日入50+更高的利润!（原创内容抄袭必究）一、
芭睿芭睿：开启生物护肤之门缔造美丽奇迹 3adced8f1ee8
生物护肤并不是营销噱头，是人类对生物科学的一种新认识和新体验。美国JDD皮肤科药学临床杂志在其2014年第13刊中就写道：护肤品已经从低端的物理防护和中等精细化学上升到了生物护肤时代。一个偶然的机会，在一次世界高级化妆品配方师闭门研讨会中，强微特公司的生物科学家们当时了解到：“在世界化妆品原料中，90%以上是化学合成原料，生物原料只占比不到10%，但恰恰是这10%能够真正引导皮肤自我修护”。强微特
【K8S】kubernetes集群架构与组件奇奇怪怪^ 云 Linux IT 运维服务器 linux
文章目录【K8S】kubernetes集群架构与组件kubernetes组件**master组件**node组件整体流程POD终止过程【K8S】kubernetes集群架构与组件kubernetes组件K8S是属于主从设备模型(Master-slave架构)，即有Master节点负责集群的调度、管理和运维，Slave节点是集群中的运算工作负载节点在K8S中，主节点一般被称为Master节点，而从节
Visual Studio中的Android模拟器使用详解 wurui8 android android studio android android应用
关注微信号：javalearns随时随地学Java或扫一扫随时随地学JavaMicrosoft本周发布了VisualStudio2015预览版,里面包含Android开发工具.安装的时候,如果选Android开发,VisualStudio会把调试Android应用程序用的VisualStudio模拟器也装上.在介绍这个新模拟器之前,我们先来聊一聊,为什么需要一个新的Android模拟器–当然,你也
Rust: duckdb和polars读csv文件比较 songroom rust 开发语言后端
duckdb在数据分析上，有非常多不错的特质。1、快；2、客户体验好，特别是可以同时批量读csv（在一个目录下的csv等文件）。polars的性能比pandas有非常多的超越。但背后的一些基于arrow的技术栈有很多相同之类。今天想比较一下两者在csv数据读写的情况。一、文件准备csv样本内容，是N行9列的csv标准格式，有字符串，有浮点数，有整型。具体如下：本次准备了两个csv文件，一个大约是2
面对电子产品的诱惑，我们真的是很无力！2019-04-22 武哥a
早晨孩子上学走了之后，我跟爱人一起吃饭。餐桌上聊起来这些天孩子使用手机的情况。我是已经觉得有点黔驴技穷了，真的是没有办法。他总是能够找到各种各样的理由，把爱人的手机拿在手里，趁着我不注意就开始玩。每次我从外面回来，一进门就看到他在玩手机。我从楼上下来，一看到他就是在玩手机，我对这个事情真的是绞尽脑汁深恶痛绝了。我们围绕这个问题早上交流了很长时间，我也看到了自身的问题，喜欢走极端，总是喜欢用压迫逼迫
我的成长感恩日记1354篇解忧树洞Y
今天又是美好的一天，今天七点起来，起来喝了一杯温开水。然后开始跳绳,今天跳了一千,现在感觉到不是很累了,早餐煮了赤小豆黑米粥，还有三个白煮鸡蛋，感觉真好吃,中午也是吃赤小豆黑米粥，还有炒了两个鸡蛋，感觉真好，简单又好吃。今天师姐打电话给我说，叫我陪她去兴业注销卡，我说不想去，你叫李欣陪你去吧！晚上叫朋友请我们吃了羊肉，太久没有吃了，我吃了好多哦！也吃了好饱，今天晚上跟儿子视频，又听到儿子咳嗽了，咳
第十天：坐在家中浪中国丹山人
别老刷抖音、快手了，手都刷成抖手了还刷。点开下面的连接看一下，大好河山尽在掌握。宅在家里一样可以信马由缰过草原、风驰电掣穿戈壁、翻山越岭登雪山、乘风破浪游海岛、佛心禅音拜寺庙、三六一度看古迹、走街串巷访民居，气定神闲逛都市。疫情不时成点状突发，考虑到有时大家可能宅得无聊了，国家将国内外500多个景点，做成全景3D模式，喜欢哪个点哪个，还有导游讲解，让你身临其境。体验足不出户的旅游方式。这就是中国！
放慢我的脚步，等待你们成长吴永菊
三、沉下心下来，潜心研究学生实况。孩子们讲故事时的精彩表现，与老师协作阅读绘本故事后的回答反响。及学习识字单元的消化能力，学习数学时的思维敏捷。舞蹈时的动感。这一切都充分说明了孩子的学习天赋是非常棒的。也正是看到孩子们的这些优势，让我高估孩子们的接受能力。错误的安排的拼音教学进度，当教拼音教到两拼音节的拼音时，我才感到从未有过的挫败感，当教学了两节课后，孩子们几乎不敢开口尝试拼读时，我几乎要崩溃了
常用类库 Guava 简介豆瑞瑞 java
简介GoogleGuava是一个由Google开发的Java开源函数库。前身是GoogleCollectionsLibrary，提供了许多简化工具，如缓存、连接器、过滤器、关联数组等仓库代码GitCode-全球开发者的开源社区,开源代码托管平台参考https://github.com/google/guavahttps://github.com/google/guava/wikiRedisStre
寒假学生日记（八）笑笑8
腾龙作品2019年1月26日星期六离过年还有九天，春节是什么日子？是辞旧迎新的日子，家家户户都要扫屋子，我们家当然也不例外。扫屋时，我和爸爸、妈妈、哥哥谁都没有闲，都在忙着打扫，我整理着我天天写作业的桌子，整理桌子上的书本，把他们放在该放的地方，再把收纳箱内到所有物品到出来，然后进行分类，整理齐的把他们摆在收纳箱内，桌上整理完后，整理桌下，把隔层里的东西都拿出来，整整齐齐的放在箱内，最后搬进杂物间
2018.6.21 【46】大海说天真蓝啊
学电使人头秃图片发自App早上起来看到床单上一大滩血，但我有很困，避开血又睡了一个小时才起床，扯床单去洗，又拿刷子和漂白粉肥皂趴在床上刷床垫上的血印，中午吃完饭回来拿吹风筒吹床垫的时候半天不干，吹的我特别累，吹风筒关了我就窝在床边睡着了，然后我听到墨墨说我咋这样就睡了，醒来又吹了一会又困了，不知道怎么腿耷拉出来又躺着睡着了，我今天真的特别虚弱，浑身都没劲儿。我们寝室四个人都来例假，不能开空调，特别
JAVA相关知识 M_灵均 java jvm 开发语言
JAVA基础知识说一下对象创建的过程？类加载检查：当Java虚拟机（JVM）遇到一个类的new指令时，它首先检查这个类是否已经被加载、链接和初始化。如果没有，JVM会通过类加载器（ClassLoader）加载这个类。分配内存：JVM为新对象分配内存。这个内存分配是在堆（Heap）上进行的，堆是JVM用来存储对象实例的地方。分配内存的大小在类加载时就已经确定，因为类的结构（包括字段和方法）已经确定。
分享100个最新免费的高匿HTTP代理IP mcj8089 代理IP 代理服务器匿名代理免费代理IP 最新代理IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ 120.198.243.130:80,中国/广东省 58.251.78.71:8088,中国/广东省 183.207.228.22:83,中国/
mysql高级特性之数据分区 annan211 java 数据结构 mongodb 分区 mysql
mysql高级特性 1 以存储引擎的角度分析，分区表和物理表没有区别。是按照一定的规则将数据分别存储的逻辑设计。器底层是由多个物理字表组成。 2 分区的原理分区表由多个相关的底层表实现，这些底层表也是由句柄对象表示，所以我们可以直接访问各个分区。存储引擎管理分区的各个底层表和管理普通表一样(所有底层表都必须使用相同的存储引擎)，分区表的索引只是
JS采用正则表达式简单获取URL地址栏参数 chiangfai js 地址栏参数获取
GetUrlParam:function GetUrlParam(param){ var reg = new RegExp("(^|&)"+ param +"=([^&]*)(&|$)"); var r = window.location.search.substr(1).match(reg); if(r!=null
怎样将数据表拷贝到powerdesigner (本地数据库表) Array_06 powerDesigner
================================================== 1、打开PowerDesigner12，在菜单中按照如下方式进行操作 file->Reverse Engineer->DataBase 点击后，弹出 New Physical Data Model 的对话框 2、在General选项卡中 Model name:模板名字，自
logbackのhelloworld 飞翔的马甲日志 logback
一、概述 1.日志是啥？当我是个逗比的时候我是这么理解的：log.debug()代替了system.out.print(); 当我项目工作时，以为是一堆得.log文件。这两天项目发布新版本，比较轻松，决定好好地研究下日志以及logback。传送门1：日志的作用与方法： http://www.infoq.com/cn/articles/why-and-how-log 上面的作
新浪微博爬虫模拟登陆随意而生新浪微博
转载自：http://hi.baidu.com/erliang20088/item/251db4b040b8ce58ba0e1235 近来由于毕设需要，重新修改了新浪微博爬虫废了不少劲，希望下边的总结能够帮助后来的同学们。现行版的模拟登陆与以前相比，最大的改动在于cookie获取时候的模拟url的请求
synchronized 香水浓 java thread
Java语言的关键字，可用来给对象和方法或者代码块加锁，当它锁定一个方法或者一个代码块的时候，同一时刻最多只有一个线程执行这段代码。当两个并发线程访问同一个对象object中的这个加锁同步代码块时，一个时间内只能有一个线程得到执行。另一个线程必须等待当前线程执行完这个代码块以后才能执行该代码块。然而，当一个线程访问object的一个加锁代码块时，另一个线程仍然
maven 简单实用教程 AdyZhang maven
1. Maven介绍 1.1. 简介 java编写的用于构建系统的自动化工具。目前版本是2.0.9，注意maven2和maven1有很大区别，阅读第三方文档时需要区分版本。 1.2. Maven资源见官方网站；The 5 minute test，官方简易入门文档；Getting Started Tutorial，官方入门文档；Build Coo
Android 通过 intent传值获得null aijuans android
我在通过intent 获得传递兑现过的时候报错，空指针,我是getMap方法进行传值，代码如下 1 2 3 4 5 6 7 8 9 public void getMap(View view){ Intent i =
apache 做代理报如下错误：The proxy server received an invalid response from an upstream baalwolf response
网站配置是apache＋tomcat,tomcat没有报错，apache报错是： The proxy server received an invalid response from an upstream server. The proxy server could not handle the request GET /. Reason: Error reading fr
Tomcat6 内存和线程配置 BigBird2012 tomcat6
1、修改启动时内存参数、并指定JVM时区（在windows server 2008 下时间少了8个小时）在Tomcat上运行j2ee项目代码时，经常会出现内存溢出的情况，解决办法是在系统参数中增加系统参数： window下，在catalina.bat最前面 set JAVA_OPTS=-XX:PermSize=64M -XX:MaxPermSize=128m -Xms5
Karam与TDD bijian1013 Karam TDD
一.TDD 测试驱动开发（Test-Driven Development,TDD）是一种敏捷（AGILE）开发方法论，它把开发流程倒转了过来，在进行代码实现之前，首先保证编写测试用例，从而用测试来驱动开发（而不是把测试作为一项验证工具来使用）。 TDD的原则很简单： a.只有当某个
[Zookeeper学习笔记之七]Zookeeper源代码分析之Zookeeper.States bit1129 zookeeper
public enum States { CONNECTING, //Zookeeper服务器不可用，客户端处于尝试链接状态 ASSOCIATING, //？？？ CONNECTED, //链接建立，可以与Zookeeper服务器正常通信 CONNECTEDREADONLY, //处于只读状态的链接状态，只读模式可以在
【Scala十四】Scala核心八：闭包 bit1129 scala
Free variable A free variable of an expression is a variable that’s used inside the expression but not defined inside the expression. For instance, in the function literal expression (x: Int) => (x
android发送json并解析返回json ronin47 android
package com.http.test; import org.apache.http.HttpResponse; import org.apache.http.HttpStatus; import org.apache.http.client.HttpClient; import org.apache.http.client.methods.HttpGet; import
一份IT实习生的总结 brotherlamp PHP php资料 php教程 php培训 php视频
今天突然发现在不知不觉中自己已经实习了 3 个月了，现在可能不算是真正意义上的实习吧，因为现在自己才大三，在这边撸代码的同时还要考虑到学校的功课跟期末考试。让我震惊的是，我完全想不到在这 3 个月里我到底学到了什么，这是一件多么悲催的事情啊。同时我对我应该 get 到什么新技能也很迷茫。所以今晚还是总结下把，让自己在接下来的实习生活有更加明确的方向。最后感谢工作室给我们几个人这个机会让我们提前出来
据说是2012年10月人人网校招的一道笔试题-给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。将重物放到天平左侧，问在两边如何添加砝码 bylijinnan java
public class ScalesBalance { /** * 题目： * 给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。（假设N无限大，但一种重量的砝码只有一个） * 将重物放到天平左侧，问在两边如何添加砝码使两边平衡 * * 分析： * 三进制 * 我们约定括号表示里面的数是三进制，例如 47=(1202
dom4j最常用最简单的方法 chiangfai dom4j
要使用dom4j读写XML文档,需要先下载dom4j包,dom4j官方网站在 http://www.dom4j.org/目前最新dom4j包下载地址:http://nchc.dl.sourceforge.net/sourceforge/dom4j/dom4j-1.6.1.zip 解开后有两个包,仅操作XML文档的话把dom4j-1.6.1.jar加入工程就可以了,如果需要使用XPath的话还需要
简单HBase笔记 chenchao051 hbase
一、Client-side write buffer 客户端缓存请求描述：可以缓存客户端的请求，以此来减少RPC的次数，但是缓存只是被存在一个ArrayList中，所以多线程访问时不安全的。可以使用getWriteBuffer()方法来取得客户端缓存中的数据。默认关闭。二、Scan的Caching 描述： next( )方法请求一行就要使用一次RPC,即使
mysqldump导出时出现when doing LOCK TABLES daizj mysql mysqdump 导数据
　　执行　mysqldump -uxxx -pxxx -hxxx -Pxxxx database tablename > tablename.sql　导出表时，会报 mysqldump: Got error: 1044: Access denied for user 'xxx'@'xxx' to database 'xxx' when doing LOCK TABLES 解决
CSS渲染原理 dcj3sjt126com Web
从事Web前端开发的人都与CSS打交道很多，有的人也许不知道css是怎么去工作的，写出来的css浏览器是怎么样去解析的呢？当这个成为我们提高css水平的一个瓶颈时，是否应该多了解一下呢？一、浏览器的发展与CSS
《阿甘正传》台词 dcj3sjt126com
Part Ⅰ: 《阿甘正传》Forrest Gump经典中英文对白 Forrest: Hello! My names Forrest. Forrest Gump. You wanna Chocolate? I could eat about a million and a half othese. My momma always said life was like a box ochocol
Java处理JSON dyy_gusi json
Json在数据传输中很好用，原因是JSON 比 XML 更小、更快，更易解析。在Java程序中，如何使用处理JSON，现在有很多工具可以处理，比较流行常用的是google的gson和alibaba的fastjson，具体使用如下： 1、读取json然后处理 class ReadJSON { public static void main(String[] args)
win7下nginx和php的配置 geeksun nginx
1. 安装包准备 nginx : 从nginx.org下载nginx-1.8.0.zip php：从php.net下载php-5.6.10-Win32-VC11-x64.zip， php是免安装文件。 RunHiddenConsole: 用于隐藏命令行窗口 2. 配置 # java用8080端口做应用服务器，nginx反向代理到这个端口即可 p
基于2.8版本redis配置文件中文解释 hongtoushizi redis
转载自： http://wangwei007.blog.51cto.com/68019/1548167 在Redis中直接启动redis-server服务时, 采用的是默认的配置文件。采用redis-server xxx.conf 这样的方式可以按照指定的配置文件来运行Redis服务。下面是Redis2.8.9的配置文
第五章常用Lua开发库3-模板渲染 jinnianshilongnian nginx lua
动态web网页开发是Web开发中一个常见的场景，比如像京东商品详情页，其页面逻辑是非常复杂的，需要使用模板技术来实现。而Lua中也有许多模板引擎，如目前我在使用的lua-resty-template，可以渲染很复杂的页面，借助LuaJIT其性能也是可以接受的。如果学习过JavaEE中的servlet和JSP的话，应该知道JSP模板最终会被翻译成Servlet来执行；而lua-r
JZSearch大数据搜索引擎颠覆者 JavaScript
系统简介：大数据的特点有四个层面：第一，数据体量巨大。从TB级别，跃升到PB级别；第二，数据类型繁多。网络日志、视频、图片、地理位置信息等等。第三，价值密度低。以视频为例，连续不间断监控过程中，可能有用的数据仅仅有一两秒。第四，处理速度快。最后这一点也是和传统的数据挖掘技术有着本质的不同。业界将其归纳为4个“V”——Volume，Variety，Value，Velocity。大数据搜索引
10招让你成为杰出的Java程序员 pda158 java 编程框架
如果你是一个热衷于技术的 Java 程序员，那么下面的 10 个要点可以让你在众多 Java 开发人员中脱颖而出。　　 1. 拥有扎实的基础和深刻理解 OO 原则　　对于 Java 程序员，深刻理解 Object Oriented Programming（面向对象编程）这一概念是必须的。没有 OOPS 的坚实基础，就领会不了像 Java 这些面向对象编程语言
tomcat之oracle连接池配置小网客 oracle
tomcat版本7.0 配置oracle连接池方式：修改tomcat的server.xml配置文件： <GlobalNamingResources> <Resource name="utermdatasource" auth="Container" type="javax.sql.DataSou
Oracle 分页算法汇总 vipbooks oracle sql 算法 .net
这是我找到的一些关于Oracle分页的算法，大家那里还有没有其他好的算法没？我们大家一起分享一下！ -- Oracle 分页算法一 select * from ( select page.*,rownum rn from (select * from help) page -- 20 = (currentPag

EM算法及对GMM的参数估计（EM算法的R实现 vs R mclust包）

EM算法与高斯混合模型（GMM）

GMM参数估计示例

EM算法的R实现

R mclust包

你可能感兴趣的:(EM算法及对GMM的参数估计（EM算法的R实现 vs R mclust包）)