机器学习之EM算法

文章目录

  • 前言
  • 一、 EM算法
    • 1.1 问题描述
    • 1.2 EM 算法
  • 总结


前言

EM算法是机器学习中常用的一种算法,说是算法,其实更像是一种思想。EM算法分为两步,E、M,E是做期望,M是求解参数模型。


一、 EM算法

1.1 问题描述

机器学习之EM算法_第1张图片

1.2 EM 算法

机器学习之EM算法_第2张图片
机器学习之EM算法_第3张图片


总结

上面的学生属于男生还是女生我们称之为隐含参数,女生和男生的身高分布参数称为模型参数。

EM 算法解决这个的思路是使用启发式的迭代方法,既然我们无法直接求出模型分布参数,那么我们可以先猜想隐含参数(EM 算法的 E 步),接着基于观察数据和猜测的隐含参数一起来极大化对数似然,求解我们的模型参数(EM算法的M步)。由于我们之前的隐含参数是猜测的,所以此时得到的模型参数一般还不是我们想要的结果。我们基于当前得到的模型参数,继续猜测隐含参数(EM算法的 E 步),然后继续极大化对数似然,求解我们的模型参数(EM算法的M步)。以此类推,不断的迭代下去,直到模型分布参数基本无变化,算法收敛,找到合适的模型参数。

一个最直观了解 EM 算法思路的是 K-Means 算法。在 K-Means 聚类时,每个聚类簇的质心是隐含数据。我们会假设 K 个初始化质心,即 EM 算法的 E 步;然后计算得到每个样本最近的质心,并把样本聚类到最近的这个质心,即 EM 算法的 M 步。重复这个 E 步和 M 步,直到质心不再变化为止,这样就完成了 K-Means 聚类。

你可能感兴趣的:(机器学习,机器学习,算法)