计算机视觉-运动的表达

运动的一般流程:

计算机视觉-运动的表达_第1张图片

运动的表达

运动轨迹

能否正确表述物体运动状态的关键:
• 特征点的选取 • 轨迹的描述
1.直接按时间顺序连接相邻帧之间的特征点。
2.将特征点的集合逆合成不同的多项式曲线。
3.主曲线

运动轨迹的不足: • 只能粗略地表述物体全局的运动信息; • 无法描述运动细节; • 没有有效地体现时间信息。

时空图表达:
将图像序列的前景运动信息和时间信息用一张图表述。:运动能量图MEI、运动历史图MHI。。。

MEI:帧间差分,得到前景的二值图像,求并集。
缺点:做了相反的动作,仍得到相同的图像。

MHI:越接近当前帧越亮。

时空的分析:
•优点: • 较好地包含了全局运动、形状、时间信息。
•不足之处: • 缺少局部运动信息,不动有效地区分局部变化的动作; • 不动有效地区分速度的变化。

DNN的物体表达,每一层都是某一中表达,最后几层的表达更加有效。

计算机视觉-运动的表达_第2张图片

稀疏、低秩表达

希望a中非零元素尽量少。
计算机视觉-运动的表达_第3张图片

计算机视觉-运动的表达_第4张图片

向量的零范数就是向量中0的个数。
计算机视觉-运动的表达_第5张图片
1范数和0范数的解是一致的。
计算机视觉-运动的表达_第6张图片
离测试样本的欧式距离最近的就是。
稀疏表达还是要根据任务来确定是否有效。

低秩表达:

松弛为合范数来表达。噪声
计算机视觉-运动的表达_第7张图片
行为识别可以看作是时变特征数据的分类问题, 即将待识别的行为序列(测试序列)与预先标 记好的代表典型行为的参考序列进行匹配

基于模板的匹配方法:

输入图像序列提取的特 征与在训练阶段预先保存好的模板进行相似性度量,选择与测试序列距离最小的已知模板的所属 类别作为被测试序列的识别结果。

动态时间规整
是一种时变数据序列匹配方法,常用于微生物 学中的DNA匹配、字符串和符号的比较以及语音 分析等。

计算机视觉-运动的表达_第8张图片
数据尺度的统一来保证图像的长度一样,才可以比较。

基于状态转移图模型的方法

基于状态转移图模型的方法定义每个静态姿势作为一个状 态,这些状态之间通过某种概率联系起来。任何运动序列 可以看作为这些静态姿势的不同状态之间的一次遍历过程, 在这些遍历期间计算联合概率,其最大值被选择作为分类 行为的标准。

常用于行为识别与理解的图模型方法有:  隐马尔可夫及其改进模型  动态贝叶斯网络  人工神经网络  有限状态机  置信网络

显马尔可夫:概率就是状态
隐马尔科夫:假设状态是晴天、阴天…
计算机视觉-运动的表达_第9张图片在已经知道 郊游、看电视等情况下来求得天气的情况就是隐马。(可以知道各种天气下做某些事的概率)

HMM的状态不可直接观测
可观察到的事件与状态并不是一一对应的确定性关系, 而是通过一组概率分布相联系

HMM是一个双重随机过程,两个组成部分:
 马尔可夫链:描述状态的转移,用转移概率描述。
 一般随机过程:描述状态与观察序列间的关系,用 观察概率描述。
计算机视觉-运动的表达_第10张图片
估值问题:
待观测的策列:郊游、看电视、看电视(概率)
就是乘和加。
计算机视觉-运动的表达_第11张图片
解码问题:
给定了模型参数和观测序列。
求解内部状态 S = q0,q1。。。。。S是最合理的。

训练问题

在这里插入图片描述
计算机视觉-运动的表达_第12张图片
对于行为识别:
对于每个动作建立一个隐马模型:打拳,踢腿等等各自建立一个隐马。来一个新的同学,施展一个动作,然后就根据之前的隐马进行预测概率。

计算机视觉-运动的表达_第13张图片

你可能感兴趣的:(计算机视觉)