The Wiley Handbook of Human Computer Interaction一Natural Human‐Robot Interaction

你好!本文章介绍自己对The Wiley Handbook of Human Computer Interaction一书中 Natural Human‐Robot Interaction 章节的学习心得
翻译:https://blog.csdn.net/weixin_43578885/article/details/89173036

1.自然的定义

本章主要讲的是人和机器人自然的交互,那究竟什么是自然呢?
言语、手势、动作、眼神、面部表情等这些互动存在于我们人与人的交流之中,我们很轻松的使用这些方式进行交互,这些就是自然,而比如通过键盘、鼠标进行操控则应该是不包含在此类中的交互。
知道了这些,我们就可以对人和机器人自然的交互进行定义。

2. Natural Human‐Robot Interaction 定义(人和机器人自然的交互)

2.1 第一个定义:
着重于赋予机器人以自然的互动方式回应人们,机器人需要理解人给予的交互动作的意义,而不必学会相同的交互方式。
简单的来说,就是人操控机器人的交互方式,机器人可以不必学会。例如:
The Wiley Handbook of Human Computer Interaction一Natural Human‐Robot Interaction_第1张图片
这是一个清洁机器人,我可以通过语音让它开始工作于停止运行,我以言语的方式进行交互,但它不必以言语回应我,只要它理解了我的意思,开始打扫卫生即可,这种机器人我们称之为自然可控机器人。
对于自然可控机器人,常用的交互方式有手势以及言语。
手势交互:怎么样使用手势进行交互呢?现在对我们来说最简单的设备莫过于kinect。
The Wiley Handbook of Human Computer Interaction一Natural Human‐Robot Interaction_第2张图片
kinect可以骨骼追踪,识别人的手势,这样我们就可以在程序中设定好几个特殊的手势代表不同的工作模式。以上面的清洁机器人为例,
在这里插入图片描述
这个握拳的手势我们设定为开始工作
在这里插入图片描述
这个竖起食指的手势我们设定为停止运行
当清洁机器人的相机识别到我的握拳手势时开始工作,竖起食指时结束工作
言语交互:机器人对语言的理解全依靠的是程序设定,它们不能自己去真正的理解其中的含义。
现在使用最广泛和最简单的的SDS(spoken dialog system)是基于状态的,使用状态机进行建模。
接着以清洁机器人为例:清洁机器人现在有两个状态,开始工作和停止运行。
那么则有该图:
The Wiley Handbook of Human Computer Interaction一Natural Human‐Robot Interaction_第3张图片
此外还可以将多种交互方式结合起来形成Multimodal natural HRI,比如将手势和言语结合起来:Kollar et al. (2012) 提出了一种Multimodal natural HRI系统,它将语音识别和贝叶斯推理中的语言理解与基于RGB-D的手势识​​别结合在一个接待员机器人中,并表明机器人可以在很短的时间内成功地与人交互。

2.2 第二个定义
(至少对于类人机器人来说)侧重于机器人产生预期的行为。如果机器人的外形像一条狗,那我们希望它的所有行为更像一条狗,如果机器人的外形像一个人,那么我们希望它能够像人一样活动,人会根据机器人的外形期望它做相应的行为。
例:
The Wiley Handbook of Human Computer Interaction一Natural Human‐Robot Interaction_第4张图片
这是一个叫Giiro的机器人,它有着小黄人般的可爱造型,眼睛部分会随时对使用者的身姿保持关注,并在发现不妥时语音播报。
The Wiley Handbook of Human Computer Interaction一Natural Human‐Robot Interaction_第5张图片
除此之外:Vázquez,Steinfeld,Hudson和Forlizzi(2014)设计了一项研究,对象是一个类似人的机器人,它要么与一群孩子单独交互,要么跟随着类似羊羔的搭档机器人(Blink)
此次互动共分为11个阶段,从致谢和问候开始,以再见结束。儿童机器人的空间行为的分析表明,它可以通过混合三个高斯函数建模,得到相应的三个空间分布,亲密和私人空间(0.15到1.2m),社会空间(1.2到3.7m),和公共空间(超过3.6),不同的行为活跃在不同的空间距离内。人们对于这种人机交互方式更加接受,更表明人类倾向于人格化的机器人。即Naturally Behaving Robots。

3. 非工程设计机器人

至此,所有的机器人都是使用HRI中的标准工程方法设计的,比如我想制作一个清洁机器人,那么我要根据需求,获取数据,设置模式,有没有一种方法可以让机器人自己变得越来越厉害呢?不用人去设置好每一个步骤。
当然有啦。真正的机器学习技术。
使用机器学习技术让机器人从观看人与人的交互中(人 - 人和人 - 机器人交互数据库的语料库)学习自然交互协议。
比如:购物场景,其中机器人表现为店主。 使用16个Kinect 1传感器收集数据,参与者必须在他们的演讲开始和结束时触摸屏幕。 录制了178个互动,包括1197个客户话语和1233个店主话语,得到这些数据以后,利用学习算法允许机器人基于训练数据预测适当的话语或行为。
这种方法的优点是需要更少的手动调整,使得系统的评估比标准工程方法的情况更简单。 同时,这可能允许更多的迭代,并可以使用类似的机器学习技术来调整机器人的行为。侧重于口头而不是非言语行为。
同时还有三个语料库,提供给有需要的人。
HuHRIC语料库只关注机器人和人类之间的语言对话。它提供了音频文件以及它们的转录本,这些转录本涉及在家庭环境中给机器人下达的命令。
Vernissage语料库使用一个位于房间里的NAO机器人,为多个人类提供关于墙上画作的信息。记录的数据包括NAO的摄像机和三个外部摄像机的视频、参与人员的VICON运动捕捉数据、参与者的近距离交谈麦克风、NAO的麦克风和运动状态。
H3R语料库载有66次会议的记录;其中44项涉及到人与人之间的互动(半自然半非自然),其中一名参与者向另一名参与者解释椅子或自行车的组装/拆卸。另外22次实验记录了参与者对机器人的类似解释,机器人提供基本的相互注视和相互注意控制。

4.总结

这章主要讲的是两种定义的自然交互机器人以及非工程的使用机器学习制作的机器人。以我看来,现在紧缺的是数据,使用机器学习来制作机器人很省力,但是数据的获取却成了一大难题,若是能够有足够的数据,机器人应该会再次进化。

你可能感兴趣的:(The Wiley Handbook of Human Computer Interaction一Natural Human‐Robot Interaction)