目录
1.算法描述
2.仿真效果预览
3.MATLAB核心程序
4.完整MATLAB
隐马尔可夫模型(Hidden Markov Model,HMM)是一种统计模型,广泛应用在语音识别,词性自动标注,音字转换,概率文法等各个自然语言处理等应用领域。经过长期发展,尤其是在语音识别中的成功应用,使它成为一种通用的统计工具。
隐马尔可夫模型(Hidden Markov Model,HMM)是统计模型,它用来描述一个含有隐含未知参数的马尔可夫过程。其难点是从可观察的参数中确定该过程的隐含参数。然后利用这些参数来作进一步的分析,例如模式识别。是在被建模的系统被认为是一个马尔可夫过程与未观测到的(隐藏的)的状态的统计马尔可夫模型。隐马尔可夫模型是马尔可夫链的一种,它的状态不能直接观察到,但能通过观测向量序列观察到,每个观测向量都是通过某些概率密度分布表现为各种状态,每一个观测向量是由一个具有相应概率密度分布的状态序列产生。所以,隐马尔可夫模型是一个双重随机过程----具有一定状态数的隐马尔可夫链和显示随机函数集。自20世纪80年代以来,HMM被应用于语音识别,取得重大成功。到了90年代,HMM还被引入计算机文字识别和移动通信核心技术“多用户的检测”。HMM在生物信息科学、故障诊断等领域也开始得到应用。
一种HMM可以呈现为最简单的动态贝叶斯网络。隐马尔可夫模型背后的数学是由LEBaum和他的同事开发的。它与早期由RuslanL.Stratonovich提出的最优非线性滤波问题息息相关,他是第一个提出前后过程这个概念的。
在简单的马尔可夫模型(如马尔可夫链),所述状态是直接可见的观察者,因此状态转移概率是唯一的参数。在隐马尔可夫模型中,状态是不直接可见的,但输出依赖于该状态下,是可见的。每个状态通过可能的输出记号有了可能的概率分布。因此,通过一个HMM产生标记序列提供了有关状态的一些序列的信息。注意,“隐藏”指的是,该模型经其传递的状态序列,而不是模型的参数;即使这些参数是精确已知的,我们仍把该模型称为一个“隐藏”的马尔可夫模型。隐马尔可夫模型以它在时间上的模式识别所知,如语音,手写,手势识别,词类的标记,乐谱,局部放电和生物信息学应用。
隐马尔可夫模型可以被认为是一个概括的混合模型中的隐藏变量(或变量),它控制的混合成分被选择为每个观察,通过马尔可夫过程而不是相互独立相关。最近,隐马尔可夫模型已推广到两两马尔可夫模型和三重态马尔可夫模型,允许更复杂的数据结构的考虑和非平稳数据建模。
基于隐马尔科夫模型(HMM)的手机用户行为预测(MMUB)算法结构如下图所示:
这里,我们采用的数据格式如下:
Time1 |
Time2 |
Time3 |
Time4 |
Time5 |
Time6 |
...... |
|
USER1 |
Pos1(1) |
Pos1(2) |
Pos1(3) |
Pos1(4) |
Pos1(5) |
Pos1(6) |
...... |
USER2 |
Pos2(1) |
Pos2(2) |
Pos2(3) |
Pos2(4) |
Pos2(5) |
Pos2(6) |
...... |
USER3 |
Pos3(1) |
Pos3(2) |
Pos3(3) |
Pos3(4) |
Pos3(5) |
Pos3(6) |
...... |
...... |
...... |
...... |
...... |
...... |
...... |
...... |
...... |
USERn |
Posn(1) |
Posn (2) |
Posn (3) |
Posn (4) |
Posn (5) |
Posn (6) |
...... |
即通过采集多个用户在不同时刻的位置,通过算法,来预测后面的位置。即,我们所使用的模型的输入数据类型应该为如下的格式:
Time1 |
Time2 |
Time3 |
Time4 |
...... |
|
USER1 |
Pos1,Ser1(1) |
Pos1,Ser1 (2) |
Pos1,Ser1 (3) |
Pos1,Ser1 (4) |
...... |
USER2 |
Pos2,Ser2 (1) |
Pos2,Ser2 (2) |
Pos2,Ser2 (3) |
Pos2,Ser2 (4) |
...... |
USER3 |
Pos3,Ser3 (1) |
Pos3,Ser3 (2) |
Pos3,Ser3 (3) |
Pos3,Ser3 (4) |
...... |
...... |
...... |
...... |
...... |
...... |
...... |
USERn |
Posn,Sern (1) |
Posn ,Sern (2) |
Posn,Sern (3) |
Posn,Sern (4) |
...... |
模型的输入,即类同如上格式的数据类型。
matlab2022a仿真结果如下:
从仿真结果可知,单独的MMUB+HMM的预测方法,精度并不理想。但是MMUB具有其优势,就是用户行为模型的构建,从而有效的估计每个用户的可能发生的行为。
N1 = 100;%为了防止出现连续状态不变得情况,这里N1设置大点
N2 = 6;
N = N1 + N2; %前N1个用于训练,后N2个用于预测
Times = 1000;
%通过多次循环,计算正确率
for Nu = 1:length(Locaiton_id3)
UNo = Nu;%用户标号
for tim = 1:Times
UNo
tim
Dat = Locaiton_id3{1,UNo}(1+tim:N+tim);
State = unique(Dat);
%Counting the User Behavior Patterns
%Counting the User Behavior Patterns
Alpha = [];
maps = [];
MAP = [];
[Alpha,maps,MAP] = func_find_alpha_table(Dat,Locaiton_id3,State);
%Modeling the User Behaviors,the user’s behavior model can be built based on the resulting counting tables
%状态转移概率%释放概率
%对应算法步骤中计算STATE的步骤,计算moving or steady??
[seq,states] = func_cal_moving_steady(maps(1:N));%这里需要地址映射为自然数
[TRANS_EST,EMIS_EST] = hmmestimate(seq,states);
[r,c] = size(TRANS_EST);
for p1 = 1:r
for p2 = 1:c
if TRANS_EST(p1,p2) == 0
TRANS_EST(p1,p2) = eps;
end
if TRANS_EST(p1,p2) == 1
TRANS_EST(p1,p2) = 1-eps;
end
end
end
%通过vertiber算法计算概率
likelystates = hmmviterbi(seq,TRANS_EST,EMIS_EST);
Ps = length(find(likelystates==1))/N;
Pm = length(find(likelystates==2))/N;
%预测后面时刻的位置
likelihood_next_node = zeros(length(State),length(State));
for i = 1:length(State)
for j = 1:length(State)
if i == j
likelihood_next_node(i,j) = Ps*Alpha{i,j}(1);
else
likelihood_next_node(i,j) = Pm*Alpha{i,j}(1);
end
end
end
Plikelihood_next_node = zeros(length(State),N2);
for k = 1:N2
for i = 1:length(State)
Plikelihood_next_node(i,k) = likelihood_next_node(maps(N1-k+1),i)/(sum(likelihood_next_node(:,i))+eps);
end
[V,I] = max(Plikelihood_next_node(:,k));
for j = 1:size(MAP,1)
if I == MAP(j,2);
POS(k) = MAP(j,1);
end
end
end
NNN(:,tim) = (Dat(N1+1:N)==POS(1:N2)')';
end
for k = 1:N2
Precision1(k,Nu) = sum(NNN(k,:))/Times;
end
end
figure;
Views = [Precision1(:,1),Precision1(:,2),Precision1(:,3)];
bar(Views);
xlabel('Times');
ylabel('Precision');
legend('user #1','user #2','user #3');
title('MMUB');
figure;
Views = [mean(Precision1(:,:),2)];
bar(Views);
xlabel('Times');
ylabel('Precision');
legend('The average of 15 Users');
title('MMUB');
05_014_m
V