Jibo发布SDK,意在让机器人进入家庭

IndieGogo众筹平台上的初创公司Jibo最近发布了一款应用程序开发SDK,又名Skills(技能),可用于开发家用“社交机器人”,主要针对娱乐、教育和物联网集成等市场。

Jibo试图创造一种环境交互式机器人,这种机器人将能识别人的声音和面孔,能讲话,能看懂可视内容,能够活动“胸腔”和“头部”等身体部件。

Jibo SDK旨在帮助开发者使用JavaScript API创建“技能”,该API可供开发者访问Jibo平台提供的使用C/C++开发的各种计算密集型服务。目前开发者可通过Jibo SDK获得的能力包括:

  • 音频和语音技术,可用于识别话语并通过说话作出回应。
  • 视觉处理能力,使其可识别面孔和活动,并在自己的显示设备上展示动态的可视化内容。
  • 通过三个伺服马达实现交互和移动能力。Jibo的目标之一在于让机器人即使变得更加平易近人,让大家创造更丰富,更富于表现力的动作。

有趣的是,Jibo虽然有两个摄像头,但开发者无法直接使用。开发者只能通过空间化呈现(Spatial representation)了解Jibo“看到”的内容。这样可以杜绝有人通过Jibo的摄像头窥探他人。

根据Jibo的SDK开发主管Jonathan Ross介绍,决定使用JavaScript是因为这是一种增长速度最快的语言,在库和编程工具方面有着丰富的生态系统。Jibo SDK本身以Electron为基础构建,其中包含一个动画编辑器,一个行为编辑器,一个语音编辑器,以及一个模拟器。

在与InfoQ的交谈中,该公司的开发推广人Justin Woo和SDK开发主管Jonathan Ross解释说,Jibo可以连接至任何提供公开API的IoT设备,因此可以让其充当“家庭指挥官”。

最初发布的Jibo机器人主要针对热衷于新技术的家庭,例如单身或已经开始做父母的年轻X一代,主要是零零后。考虑到具体应用,我们将其称之为Jibo的“技能”,并把Jibo看作一种能扮演不同角色的家庭伴侣,例如Jibo可以是老师,可以是艺人,可以是家庭指挥官。当你真正把Jibo看作一个能参与到家庭生活的“人”,最终能实现的“技能”几乎是无穷无尽的。

根据Woo和Ross的介绍,Jibo SDK基于行为树(Behavior tree),这种模式很适合用于行为建模,以及各种自主代理程序的控制流,同时还可对当前行为以及决策工作进行协调。

Woo和Ross进一步解释说,Jibo使用了两种云服务:一种用于持久数据存储,这样便可将技能数据安全地备份到云端,防范数据丢失;另一种用于实现与文本无关的音频语音识别和自然语言理解。然而Jibo的语音识别功能并非总是需要使用云服务:

Jibo的唤醒短语“嘿,Jibo”是在本地处理的,只有听到这句话后,后续的语音才需要发到云端处理。其次是持久数据存储,每个技能都对应着Jibo本地内存中一块可读写的受保护区域,Jibo会用安全的方式将这些数据备份到云端,无需担心数据丢失问题。

机器人可以在本地完成一系列任务,包括:视觉、感知、音频定位、语音ID、面孔ID、动作/马达控制、自然语言理解、文本无关的语音识别、文字到语音(Jibo的声音)、图形和音频。

目前Jibo SDK已发布,Jibo设备预计会在2016年底发布。除了SDK,Jibo还发布了一个开发者论坛。

查看英文原文:Jibo Releases SDK Aiming to Bring Robotics into Homes

你可能感兴趣的:(Jibo发布SDK,意在让机器人进入家庭)