您所在位置:网站首页 > 海量文档
 > 高等教育 > 科普读物
使用隐马尔可夫模型的运动笔迹手势识别.doc10页
本文档一共被下载:次,您可全文免费在线阅读后下载本文档。
下载提示
1.本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
2.该文档所得收入(下载+内容+预览三)归上传者、原创者。
3.登录后可充值,立即自动返金币,充值渠道很便利
使用隐马尔可夫模型
最近,隐马尔可夫模型, 二个时常被逃避的问题被考虑。为了要确定模型的最佳数字区域 ,我们计划使用贝耶斯定理的数据标准。 我们描述相对事物的连续模型的贡献比率。对笔迹手势上的实验显示识别率在88% 和100% 之间。
1介绍
在人的环境中,手势似乎是一种自然人与人沟通的行为 [4,10].人像素行动的理解和识别会打开新更加自然人的行动,相对于机械的运动。 这是一个困难的但是具有挑战性的经典问题。 给予的未知行动, 目标是获得到它到一个已知的分像素中。 问题的难度在于组成的行动的参数的表现。参数能在广度和定方位方面改变在那相同的分像素中。
最近,隐马尔可夫模型 [18,17,3]. 在这篇论文中, 我们的兴趣是手势识别的隐马尔可夫模型: 区域的数字的选择, 和选择在一个不连续的或连续的模型。
这第一部分显示了隐马尔可夫模型 , 第二部分是隐马尔可夫模型X.D. Huang, Y. Ariki and M.A. Jack的书[12] 和L.R. rabiner和B.H. Juang tuto的书的指导 [16]. 我们有关的问题被呈现在第三个部分中。 我们推荐一个方法来获得最佳数字区域通过运用贝耶斯定理的数据标准。 最后, 我们讨论选择一个不连续的或一个连续的隐马尔可夫模型。最后的部分是显示对手势识别的结果。
2为手势的隐马尔可夫模型识别
建立手势识别的隐马尔可夫模型的使用是缘于它用于演讲识别的成功。 因为, 手语信号与演讲包含相同的语言学结构 [7],隐马尔可夫模型已经时常被用于语言的识别。 主要地用在连接数据包 [3,11], 这技术开始用于视觉的手势识别。
基于HMM的手势识别尝试是通过Yamato使其他人了解, 三个运动员运行的六个网球轨迹被识别出来。
T. Starner[17] 使用HMM作为识别一本来自美国语言手册的40个字的字汇语言。 手在确定的时间内被一种颜色照相机追踪。 追踪程序提取出物体的位置,形状和轨道。 当使用者被彩色手套装备的时候,Starner获得了99% 的识别率,而当追踪程序使用皮肤彩色的时候是92%。
另外最近, I. Poddar以及其他人。 [15] 实践了用HMM对于天气记者手势的识别。 三个手势被辨认出:“ 画点,画圆 和设计一个区域”. 手势画点和画圆通过手实现, 然而手被设计为打开手势。 在电视上的系统作品的描绘而产生80% 的识别率骗局根据唯一的视觉数据。这一比率上升至92%当手势识别程序与演讲识别一起加倍的时候。 隐马尔可夫马尔可夫R. Nag以及其他人 [14] 第一次实现了对于对一个使用者写原型数字0,1,.。。,9的识别。 一张绘画似的桌子是用于取得手势。 左边-右边的隐马尔可夫2和7区域之间包含的模型被利用。依靠区域的数字,识别率在90% 和98% 之间。
3隐马尔可夫模型理论
因为有许多文件说明了隐马尔可夫 [16,19,12,17], 我们将不详细地说明整个的运算法则但是给于简短的介绍。隐马尔可夫(XT)t 2R+。一系列的区域构成马尔可夫”. 在时间t内,系统区域决定规则XT。隐马尔可夫N个区域组成的在于 :
_ 在被提到的区域之间的转变点阵式如
_ 对于每个区域, 可能性功能被提供给区域i的观察, 指示了bi。 给那些规则的描述是
_ 开始区域的盖然性规则:
对应的隐马尔可夫 .
在一个分像素问题中, 每个一个先前的手势分像素 , Cl,与隐马尔可夫, l。 分像素系统由N个 HMM组成。分像素在二个阶段被完成。第一个阶段是一个训练阶段使HMM叁数从被设定的一笔数据配对。 这组由一些每个像素的例子组成。 第二个步骤计算观察被隐藏马尔可夫
3.1匹配
匹配步骤的目标是估计样板参数L,为了取得最大的相似性。
(1)
K是在设定匹配中例子的数目, , 和是几千个例子。 Baum-Welch的'再判断公式 [12,19] 用来决定i,aij和bi, 再判断叁数i , aij和bi。 Baum-Welch逃避债务运算法则是期待 |最大值化运算法则。 在期待阶段中, 隐藏的数据是他们的有条件期待的。第二步骤取被完成的可能最大值 [5].
3.2 分像素
提供一个观察的序列O,分像素阶段决定像素Cl,例如
(2)
事实上, 在许多情况, 只有可能性P(O|O 2 Cl) 被知道。 Bayes规则允许计算
(3)
在没有先前的分布的像素的信息和观察序列, 我们考虑相等的可能性的所有像素。 这导致:
(4)
然而, 采取对例子写的识别, 问题的一项广泛分析允许对旧可能性的信息的重定义。
发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
用户名:
验证码:
匿名?
发表评论