《基于神经网络和骨骼点特征的人体动作识别》的学习和复现

1,理论部分

本章将介绍一种从骨骼点 数 据 中 提 取 特 征 的 方 法 , 并 采 用 长 短 时 记 忆 网 络 (Long Short-TermMemory,LSTM)作为分类器,对提取的特征进行识别,最后将在 MSR-Action3D、Florence 3D Actionv、UTKinect-Action 三种公开数据集上进行实验,与已有方案对比评估本章方法的性能。
《基于神经网络和骨骼点特征的人体动作识别》的学习和复现_第1张图片
《基于神经网络和骨骼点特征的人体动作识别》的学习和复现_第2张图片
实验结果发现以 F1 骨骼点模比值为特征的动作识别算法识别率优于以 F2 骨骼点向量角为特征的识别算法的识别率,而以 F1+F2 两者组合的联合特征为模型输入的动作识别算法的识别率优于以 F1 为特征的动作识别方法。
《基于神经网络和骨骼点特征的人体动作识别》的学习和复现_第3张图片

《基于神经网络和骨骼点特征的人体动作识别》的学习和复现_第4张图片
证明了以 LSTM 为分类器时 F1+F2 的联合特征为模型输入时效果最优
《基于神经网络和骨骼点特征的人体动作识别》的学习和复现_第5张图片
《基于神经网络和骨骼点特征的人体动作识别》的学习和复现_第6张图片
如图 4-2 所示,MASK 表示带有 masking 机制的 Mask层,BiLSTM 表示双向 LSTM 层,TDP 表示时域 droupout 层,MP 表示时域最大池化层,DP 表示标准 dropout 层,FC 表示全连接层,Softmax 表示 Softmax 函数作激活层
《基于神经网络和骨骼点特征的人体动作识别》的学习和复现_第7张图片

2,代码部分

getpoint文件中代码的 数据传递流程

(是不是叫这个术语?)
《基于神经网络和骨骼点特征的人体动作识别》的学习和复现_第8张图片

MSR 3d action数据集的数据处理与可视化

MSR 3d action数据集的数据处理与可视化 - 知乎
https://zhuanlan.zhihu.com/p/63133269
《基于神经网络和骨骼点特征的人体动作识别》的学习和复现_第9张图片
第一行数据-0.371736 0.371031 2.674849 1.000000代表着左肩的坐标为 (-0.371736, 0.371031,2.674849),置信度为1.000000。

值得注意的是,kinect的坐标系的方向与普通坐标系不同。

《基于神经网络和骨骼点特征的人体动作识别》的学习和复现_第10张图片
视频行为识别之如何来对MSR Action 3D数据集中的骨骼数据进行预处理 - 六毛吧 - CSDN博客
https://blog.csdn.net/qq_37450561/article/details/86544943

过了半个星期~
总算是把 读取数据集文件和数据预处理部分看懂了,又几乎把这部分代码重新写了或者改了一遍,把numpy库重新学了一遍,熟悉了matplotlib库
还做了些挺好玩的事情O(∩_∩)O~~
例如:读取第一个文件a01_s01_e01_skeleton3D,其中一个文件有54帧数据,代表一个连贯动作,一帧有60个数据 = 20个骨骼点 × 3维坐标
所以一个文件共有 20×3×54个有效数据
《基于神经网络和骨骼点特征的人体动作识别》的学习和复现_第11张图片
如显示a01_s01_e01_skeleton3D的
第1帧:
《基于神经网络和骨骼点特征的人体动作识别》的学习和复现_第12张图片
第35帧:
《基于神经网络和骨骼点特征的人体动作识别》的学习和复现_第13张图片
第45帧:
《基于神经网络和骨骼点特征的人体动作识别》的学习和复现_第14张图片
由此看出这个骨架在大概在做喝水的动作?

你可能感兴趣的:(论文)