作者:红猴子
链接:https://www.zhihu.com/question/26665048/answer/157852228
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
我来试着回答下吧。
(本文来自我的微信公众号:红猴子,一个工科生涨姿势的号)
马尔可夫链 (Markov Chain)是什么鬼
它是随机过程中的一种过程,一个统计模型,到底是哪一种过程呢?好像一两句话也说不清楚,还是先看个例子吧。
先说说我们村智商为0的王二狗,人傻不拉几的,见人就傻笑,每天中午12点的标配,仨状态:吃,玩,睡。这就是传说中的状态分布。
你想知道他n天后中午12点的状态么?是在吃,还是在玩,还是在睡?这些状态发生的概率分别都是多少? (知道你不想,就假装想知道吧~~学习真的好累~~)
先看个假设,他每个状态的转移都是有概率的,比如今天玩,明天睡的概率是几,今天玩,明天也玩的概率是几几,还是先看个图吧,更直观一些。
这个矩阵就是转移概率矩阵P,并且它是保持不变的,就是说第一天到第二天的转移概率矩阵跟第二天到第三天的转移概率矩阵是一样的。(这个叫时齐,不细说了,有兴趣的同学自行百度)。
有了这个矩阵,再加上已知的第一天的状态分布,就可以计算出第N天的状态分布了。
S1 是4月1号中午12点的的状态分布矩阵 [0.6, 0.2, 0.2],里面的数字分别代表吃的概率,玩的概率,睡的概率。
那么
4月2号的状态分布矩阵 S2 = S1 * P (俩矩阵相乘)。
4月3号的状态分布矩阵 S3 = S2 * P (看见没,跟S1无关,只跟S2有关)。
4月4号的状态分布矩阵 S4 = S3 * P (看见没,跟S1,S2无关,只跟S3有关)。
...
4月n号的状态分布矩阵 Sn = Sn-1 * P (看见没,只跟它前面一个状态Sn-1有关)。
-------------------------------------------------------------------------------------------------------------------------
总结:马尔可夫链就是这样一个任性的过程,它将来的状态分布只取决于现在,跟过去无关!
就把下面这幅图想象成是一个马尔可夫链吧。实际上就是一个随机变量随时间按照Markov性质进行变化的过程。
-----------------------------更新-------------------------------
有人问到 S2 的计算过程,那我就贴上来吧,不关心的同学可以忽略。
这是我手写的计算过程。
编辑于 2017-05-20
赞同 30738 条评论
分享
收藏感谢收起
知乎用户
81 人赞同了该回答
我估计你问的是“马尔可夫链模型”。因为马尔可夫模型(Markov models)包括四种:
这四个概念都非常大,背后无数篇sci和中外专项教科书支撑。左上角是“马尔可夫链”,算是最基础的概念。所以不可能要求一个答案中四个都讲清楚。
-------------------------------------------
先说两个概念:
1、马尔可夫过程
2、马尔可夫链
1、马尔可夫过程:很多事情的发生,和之前的铺垫或经历没有任何关系。比如投硬币,第一次投硬币,无论是正面还是反面,对于第二次投硬币的结果没有任何影响。但是第一次和第二次投硬币,有个时间顺序;只是这个时间顺序,并没有对这两件事情各自有什么影响。这就是马尔可夫过程——“在已经知道过程‘现在’的条件下,其‘将来’不依赖‘过去’”。
2、马尔可夫链:时间、状态都是离散的马尔可夫过程称为马尔可夫链。(“离散”就是不连续,是“点”,而不是“线”。比如每一年对应一个值,但不可以把这些值用“线”连接起来)
之后是公式:
1、马尔可夫过程:
简单说,你需要知道时间t,你要做的事情x,符合公式要求,就可以验证它的马尔可夫性。
2、马尔可夫链模型:
跟上面的公式的区别,就是加了一个条件,就是要求时间和状态是离散的(基本上就是整数),满足这个条件,满足公式要求,就可以用马尔可夫链模型解决问题。
------------------------------------------
你问题中说通俗易懂,那就很难详细具体。
你怎么定义“详细具体”?还想知道隐形的吗?想知道马尔可夫转移吗?还是那些领域使用?这个模型的形成过程?想知道这个模型的历史?模型本身,比较详细的在这里Markov Modeling,也不难,这个也不是教材,有兴趣可以看。
《概率与数理统计》(浙大版),这是中文讲解的比较好的本科相关专业入门级教材。上面写的非常非常清楚,也不难懂,是大部分本科专业的基础教材。如果读一遍实在读不懂,多读几遍。
编辑于 2016-09-16
赞同 814 条评论
分享
收藏感谢收起
牧野公子
谦谦君子,卑以自牧
12 人赞同了该回答
正好手边有之前做个的一个小PPT,分享下。
参考:
https://www.cnblogs.com/pinard/p/6632399.htmlwww.cnblogs.com
编辑于 2018-06-01
赞同 122 条评论
分享
收藏感谢收起
知乎用户
10 人赞同了该回答
引用一句经典的话,不知道谁说的,好好体会
马尔科夫——今天的事情只取决于昨天,而明天的事情只取决于今天,与历史毫无关联
编辑于 2017-09-04
赞同 10添加评论
分享
收藏感谢
泰初君
泰初有无,无有无名。
4 人赞同了该回答
http://setosa.io/ev/markov-chains/
编辑于 2017-12-12
赞同 42 条评论
分享
收藏感谢
比景
区块链&机器学习
2 人赞同了该回答
天气预报,大家非常熟悉。明天是什么天气,后天是什么天气,大后天是什么天气。每天(独立的天)的天气,在数学上可以用随机变量表达。整个这些天是一个过程,叫做随机过程。数学记号
如果将下一个状态的依赖条件,简化成:仅取决于当前状态,和之前其他状态无关。那么,这个随机过程就是马尔可夫链。数学表达:
状态和状态之间的转移概率(是状态,不是具体哪天),就可以用转移概率矩阵表达了。 每个矩阵子项是:
编辑于 2018-06-08
赞同 2添加评论
分享
收藏感谢
宋爷
混迹于某AI Lab
2 人赞同了该回答
看文字累的话,这里有个一分钟左右的视频可以帮你建立点基本的概念。
「第八夜」李开复、语音识别、排序算法背后的马尔可夫是什么?
编辑于 2017-07-09
赞同 2添加评论
分享
收藏感谢
刘智
没搞明白不奇怪,国内的不管概率论还是线代教程对各个状态相互转换的概率转移矩阵采用行向量的模式,虽然不影响最终计算结果,但不直观很难搞明白背后的原理,推荐国外的教材从头学起
编辑于 2017-08-09
赞同添加评论
分享
收藏感谢
nueert
刚看完别人的回答。
我的个人理解即是一个仿现实的概率模型。这个模型里有多重世界影响输出结果,也即是:
f(x)=y=《f1(x),f2(x),……,fk(x)》。
或者用径向基函数里说的,f(x)是非线性的,但是你把他弄成更多维数,它是线性的的可能性肯定变大。
所以隐马尔可夫链即是找到隐藏的函数规则……