Leap Motion作为一款手势识别设备,相比于Kniect,优点在于精确度。
在我的毕业设计《场景漫游器》的开发中,Leap Motion的手势控制作为重要的一个环节。以此,谈谈开发中使用Leap Motion进行手势识别的实现方式以及需要注意的地方。
一、对Leap Motion的能力进行评估
在设定手势之前,我们必须知道Leap Motion能做到哪种程度,以免在设定方案之后发现很难实现。这个评估依靠实际对设备的使用体验,主要从三个方面:
1.Leap Motion提供的可视化的手势识别界面
2.SDK文档说明
3.Leap商店中的APP
基本可以的得出:
1.Leap Motion的识别对于水平方向或者以水平方向为基础手势能够较好的识别。
2.对于握拳或者垂直的行为识别会出现误差,这种误差和具体的手势行为有关。
3.不应该过分依赖高精确度,Leap Motion能检测到毫米级别是没错的,但是有时候会把你伸直的手指识别成弯曲的,所以要做好最坏的打算。
二、实际的需要
移动、旋转、点击按钮、缩放和旋转物体、关闭程序、暂停,基本的功能需求是这样。
有一些原则:
1.相同环境下的手势应该接近和方便的转换。旋转和移动的之间的转换应该设计的很自然。
2.手势避免冲突,手势过于相似不是什么好事。比如三个伸直的手指和四个伸直的手指不应该被设计成两个手势。当然这不是绝对的,如果你进行一个缓慢的动作并且动作是面向Leap Motion的摄像头,这时候应该相信它,至少要针对这个手势做一个单独的测试。
三、考虑基本的数据结构和算法的轮廓
Leap Motion的SDK在第一部分的时候已经浏览过,最起码能知道Leap Motion可以包含的信息,从SDK看来这是非常丰富的,既然设计自己的手势,那么最好不要依赖于SKD开发包的炫酷的手势。很可能,这些手势只是官方用来演示或者炫耀的。自己设计手势的基本数据结构也有另外的好处,比如更换了体感设备,但是功能是相似的,这时候只需要更改获取数据的方式就可以了(从一个SDK更换到另一个SDK),而不要修改算法。
算法的轮廓与基本数据有很大的关系。所以数据结构一定要尽量的精简并且允许修改(可能某个算法占据了决定性因素,但是开始没考虑到)。
public class HandAndFingersPoint : MonoBehaviour
{
const int BUFFER_MAX=5;
Controller m_LeapCtrl;
public E_HandInAboveView m_AboveView = E_HandInAboveView.None;
//手指-数据 ,[0]表示左手,[1]表示右手
private Dictionary[] m_FingerDatas = new Dictionary[2];
//buffer,[0]表示左手,[1]表示右手,[,n](n属于0,3,表示第n次缓存)
private Dictionary[,] m_FingerDatasBuffer=new Dictionary[2,BUFFER_MAX];
private int m_CurBufIndex=0;
//palm 0:左手 和1:右手
private PointData[] m_PalmDatas = new PointData[2];
private readonly PointData m_DefaultPointData = new PointData(Vector.Zero, Vector.Zero);
private readonly FingerData m_DefaultFingerData = new FingerData(Vector.Zero,Vector.Zero,Vector.Zero);
HandAndFingersPoint类中剩下的部分是对数据的填充、清除、刷新等方法。E_HandInAboveView记录哪只手先进入Leap Motion的视野,用于设定优先级。
//一个手指的数据包含一个指尖点数据和手指根骨的位置数据
public struct FingerData
{
public PointData m_Point;//指尖的位置和指向
public Vector m_Position;//手指根骨的位置,对于拇指来说是Proximal phalanges近端指骨的位置
public FingerData(PointData pointData, Vector pos)
{
m_Point = pointData;
m_Position = pos;
}
public FingerData(Vector pointPos, Vector pointDir, Vector pos)
{
m_Point.m_Position = pointPos;
m_Point.m_Direction = pointDir;
m_Position = pos;
}
public void Set(FingerData fd)
{
m_Point = fd.m_Point;
m_Position = fd.m_Position;
}
}
//一个点的数据,包括方向和位置
public struct PointData
{
public Vector m_Position;//位置
public Vector m_Direction;//方向
public PointData(Vector pos,Vector dir)
{
m_Position = pos;
m_Direction = dir;
}
public void Set(PointData pd)
{
m_Position = pd.m_Position;
m_Direction = pd.m_Direction;
}
public void Set(Vector pos,Vector dir)
{
m_Position = pos;
m_Direction = dir;
}
}
//先被看到的手
public enum E_HandInAboveView
{
None,
Left,
Right
}
最简单的是伸掌手势,在控制中水平的伸掌用于漫游,垂直的伸掌用于暂停。我发现手掌依赖于手指,而手指包括两个状态——伸直和弯曲。另外,其他的手势,也都是手指的伸直或者弯曲,外加方向的判定累积出各种效果。理所当然的,应该单独写出手指的弯曲和伸直判定算法:
///
/// 该方法提供对于单个手指匹配的算法,如伸直,弯曲
/// 以后可能的改变:对于不同的场景可能要求有所不同,这里的阈值也许会随之改变
///
public class FingerMatch
{
//弯曲状态的角度阈值
static readonly float FingerBendState_Radian = Mathf.PI*4f / 18 ;//40度
//伸直状态的角度阈值
static readonly float FingerStrightState_Radian = Mathf.PI/12;//15度
///
/// 手指伸直的状态,当根骨-指尖的方向和指向的偏差小于阀值时,判定手指为伸直状态。
/// 注意无效的方向为零向量,先判定是零向量
///
/// 对阈值做的微调
///
public static bool StrightState(FingerData fingerData, float adjustBorder=0f)
{
bool isStright =false;
Vector disalDir = fingerData.m_Point.m_Direction;
//如果指尖方向为0向量,表示无效的数据
if (!disalDir.Equals(Vector.Zero))
{
Vector fingerDir = fingerData.m_Point.m_Position - fingerData.m_Position;//指尖位置减去指根位置,由指根指向指尖的向量
float radian = fingerDir.AngleTo(disalDir);
if (radian < FingerStrightState_Radian + adjustBorder)
{
isStright = true;
}
}
return isStright;
}
///
/// 判断一根手指是否处于弯曲状态
///
/// 需要判定的手指数据
/// 弯曲的阈值
///
public static bool BendState(FingerData fingerData, float adjustBorder=0f)//,out float eulerAugle)
{
bool isBend = false;
//eulerAugle = -1f;
Vector disalDir = fingerData.m_Point.m_Direction;
if( !disalDir.Equals(Vector.Zero) )
{
Vector fingerDir = fingerData.m_Point.m_Position - fingerData.m_Position;//指尖位置减去指根位置,指跟到指尖的向量
float radian = fingerDir.AngleTo(disalDir);
//eulerAugle = radian*180/Mathf.PI;
//夹角超过定义的阈值时,认定为弯曲状态
if (radian > FingerBendState_Radian + adjustBorder)
{
isBend = true;
}
}
return isBend;
}
}
基本数据结构相关的操作——HandAndFingersPoint类:源代码GitHub链接
该类使用基本数据,在Unity Editor中运行会展示了一个手掌的轮廓,蓝色表示手指的方向,红色表示手指骨根到掌心和指尖的连线,黄色表示掌心到指尖的连线:
四、手势实现中简要的概括
其他代码都可以在我的GitHub:Leap Motion In Unity3D仓库中获取,在手势的实现中,也包含了一些小的技巧,比如对于动作的匹配要防止手指的颤抖引起的误差,采用离散的数据取样——每隔一定时间做一次取样。
使用和观察这些脚本的方式:可以把这些脚本放在一个GameObject中,通过Leap Motion会看到脚本的属性在匹配成功时会发生变化。另外,脚本中包含了事件的注册功能,换句话说,外部可以向任意的手势注册一个事件,以便手势完成匹配或者到达某种匹配状态时做一些额外的处理。这些脚本现在并不能直接完成我们的需求,如暂停。我们需要在这些手势状态或者动作上做进一步的限定,如根据掌心的方向设定垂直向前的手掌为暂停,水平的手掌为平移之类的。