原作者:
来源Kinect Hackers Are Changing the Future of Robotics
译者CharlyneChu
Kinect黑客 – 机器人科技未来的变革者
原文作者:Jason Tanz
原文链接:http://www.wired.com/magazine/2011/06/mf_kinect
25年来,机器人科技领域一直被一个基本问题所困扰。机器人要移动,就必须能够创建它所处周围环境的地图,同时能够理解所身处的位置。机器人学家已经开发出了实现这一项功能的工具,名为“同步定位绘图”(simultaneous localization and mapping),或简称SLAM。但市面上用于工具中绘制地图的感应器要么是昂贵的大家伙,要么是计算不精准的便宜货。如果使用激光列阵要花费几千美金,重量能减轻几磅,但却只能拍摄出二维的图像。使用立体相机较为便宜,重量也更轻,同时还能构建3D地图,但美中不足是需要强大的计算能力。这样一来,除非有一种价格合理、简单易用的设计问世,否则自动机器人将就此困于实验室阶段。
就在今年11月4号,有人竟然在电子游戏中发现了这个问题的解决方法。这一天,微软公司发布了一款Xbox 360的外设 - Kinect体感系统。这台价值150美金的设备让玩家通过移动身体就可以控制在游戏中的动作。当世界各地的人们还在惊异于Kinect无需控制器的设计界面时,机器人学家却发现了Kinect中另外的奥妙:一个能实时拍摄3D图像的摄像头,不但重量轻巧而且价格合理。
在Kinect问世的几周内,Youtube网站上充斥了大量通过Kinect控制机器人的视频。一个来自加州大学伯克利分校的研究小组将一台Kinect绑到一台飞行器上 – 一台有着四个推动器的小型直升飞机 – 使飞行器能够绕着房间自动飞行。慕尼黑联邦国防军大学的一伙大学生将Kinect附在一台遥控车上并通过遥控将车从障碍车道中顺利地开出来。来自英国华威大学的团队还制造出了一个可能实现从地震后的废墟中搜寻被困灾民的机器人。“当这么便宜的玩意儿出现时,这一切都成为可能”。来自Willow Garage公司的肯·康利(Ken Conley)说道。Willow Garage公司卖出了一台整合了Kinect系统的开源机器人开发包,标价500美元。(此前的无Kinect版标价28万美元。)“现在人人都能买了。”肯·康利说。
机器人发烧友不是探索Kinect的唯一人群。除了他们,研究人员、视觉设计师、色情片拍摄者纷纷开始在家酝酿一些项目并通过网络将他们的研究成果发布出来。艺术家罗伯特·霍金(Robert Hodgin) 就做了一个可替换无线操控视频的动画程序,使用者可以将自己的身体变成球形的卡通人物或像水银般有反射作用的液滴。德国康斯坦茨大学的两名大学生把Kinect拴到头盔上, 做成了一个供盲人使用的简易导航系统。一家叫TriXXX的公司开发了一个简单的性爱游戏,游戏中玩家用一只怪异的无形手抚摸女人的身体。
上面开发的项目中没有一个是通过微软授权的(尤其是那个性爱游戏)。的确,在过去的几个月,如果你想在Xbox之外使用Kinect,就得安装一个由一群专业黑客鼓捣出来的驱动器。而微软对这一行为的官方回复是从最初的敌视到后来的默许,再转变到现在的大力支持。微软预计将在6月发布一个软件开发包,使得科研人员和业余爱好者能够能容易地利用Kinect的摄像头和麦克风为windows开发程序。微软还允许开发人员使用其高级算法来使机器更好地识别人体并跟踪身体动作,从而开放了此前只能由一小撮博士进行开发的权限。(微软正在进行这个软件开发包商业版的开发,以使基于Kinect技术的全新商业模式的出现成为可能。)
世界主要硬件制造商很早就发现允许用户修改其产品能带来巨大价值,给出厂轮胎换成过性能胎面的人都知道这个道理。许多成功的科技公司鼓励独立开发者为他们的平台开发产品 – 比如Windows平台、Facebook平台和苹果的应用程序商店(App Store)。几年来,这些“改装者”们陆续向市面推出了几项创新产品 – 比如山地自行车、心肺机和花式独木舟 – 这些产品已经逐渐发展成为产业。
如今,这些人已经具备了空前的能力。精密计算机,感应器和加速器都已经成为个人电子设备中不可或缺的元件,在百思买花100块钱不到就能买得到。所以,这类最近只能在研究学府和大公司才能看得到的设备得以飞入寻常百姓家,你只需拥有一部手机、一台烙铁就成了。这极大地改变了“改装者”们的工作性质。“如果你说的时改装一台福特汽车后身的阻流器,那么这是一项明确的工程。”麻省理工斯隆商学院科技创新教授艾瑞克·冯·西伯尔(Eric von Hippel)说道。“但是一台深度照相机、一台加速器或一个GPS芯片能做的不仅是一个应用,而是一个等待开发的新市场。”
DIY制作者们通过把那些价格便宜却威力强大的工具与网络相结合,就会创造出过去只能在高预算的研发实验室中才能出现的各种创新的玩意儿。2009年,一个名叫丹尼尔·瑞茨(Daniel Reetz)的博士生将两台佳能PowerShot A590s照相机改装成了一台高速图书扫描仪。丹尼尔将整个项目的详细过程上传到了DIYbookscanner.org网站上,光顾网站的爱好者们截至目前已经发布了数百个改动方案、建议、升级和全新的设计。开源的MPGuino使用Arduino微控制器来追踪开车时的汽油消耗量,该项目的开源极大地启发了发烧友们。2007年12月,一名要申请卡耐基梅隆博士学位的学生强尼·李(Johnny Chung Lee)在逆向研究了任天堂的Wiimote之后,创造了一种可以对头部位置做出反应的3D 显示。有关他的黑客视频在YouTube网站上获得了数百万的点击。最终,Lee在微软公司的应用科学组获得一份工作,从事Kinect和其他项目的研究。
插图:凯特·佛朗西斯(Kate Francis)/Brown Bird设计
大多数公司对于这种黑客之举的反应介于无视和起诉两种情况之间。当iPhone被破解时(修改iPhone的操作系统,使之能够运行非法应用程序),苹果立即宣布此行为的不合法性。(去年7月,联邦管制人员宣布了破解在千禧年数字版权法下的合法性。) 当一个名叫乔治·霍兹(George Hotz)的黑客发布了能让所有人在PlayStation 3上运行应用程序或操作系统的代码时,索尼公司对他下达了法庭传票,调查了他的PayPal账户,还采集了所有访问他的网站的IP地址,知道今年4月份调解结束。
但也有公司对黑客持欢迎的态度。当iRobot公司得知研究者和爱好者们在重新装配机器人真空吸尘器Roomba时,iRobot公司立即发布了一个专为黑客们改造而设计非真空版本iRobot Create。“用这种方法的确可以提高公司的知名度。”iRobot近期上任的外延项目经理克里森·斯塔普斯(Kristen Stubbs)说道,“人们在用我们研发的机器人和我们的平台做出酷感十足的设计,这意味着公司的高曝光率。”
但到目前为止,还没有哪家公司能使破解像Kinect这样受欢迎的产品那么地容易。Kinect是史上卖的最快的电子产品,在短短四个月的时间积累了一千万的销量。也就意味着有一千万用户在使用深度摄像功能(深度摄像头可测量Kinect和其前面物体之间的距离。)微软正把Kinect上的这些工具开放给他们每一个人,期望他们能运用这些摄像机设计出新的应用程序。“我们正在迈入计算机时代的新纪元,一个未来的世界。”Xbox总经理艾利克斯·基普曼(Alex Kipman)说。他还补充道,Kinect中基于动作操作的人机界面正是未来人们将与计算机和电器交互的雏形。“微软和其他公司的许多人将为这一时刻的来临付出努力。”
卡尔·马楚里斯(Kyle Machulis)的伯克利公寓就像一个罕见的科技博物馆。他的桌子上堆满了各种珍奇的机器: 一台名为Cybiko的青少年专用手持计算机;一台装有40个按钮的Xbox游戏Steel Battalion专用遥控器;两三个触摸时能够跳来跳去不断发出笑声的装置,能造成一种质地的幻觉影像。除了这些,桌子上还摆有一排性趣玩具,示波器和个人信息追踪装置。马楚里斯早就学会如何操控这里大部分的装置,他将驱动源代码发布到了像GitHub这类的黑客网站上,这样编程人员就可以将这些设备连接到其他操作系统或软件上了。“基本上,当前什么硬件设备最新最有意思我就弄什么。” 马楚里斯说。去年秋天,最令马楚里斯感兴趣的莫过于即将上市的Kinect了。两三年前,他曾花费了几周时间做了一个简单的身体跟踪程序。如果他把手抬到合适的位置,就能被计算机识别。Kinect内置的彩色深度摄像头声称可以让这一过程更加简单、更加精确。在Kinect发布当天,马楚里斯匆匆赶到GameStop游戏商店购买,因为他想要成为第一个发布Kinect开源驱动的人。
和马楚里斯一样有这样想法的人不在少数。在他返回自己的公寓的一个小时后,一个来自开源硬件公司Adafruit Industries的名叫利莫尔·弗里德(Limor Fried)的黑客赞助人在网站上贴出了一条消息:公司悬赏1000美金给第一个发布Kinect开源驱动到GitHub网站上的人。这些“改装者”们可以想象能够在Mac, Linux, Windows上,嵌入系统中和机器人上使用Kinect了,公告中提道。“让我们一起破解Kinect,做出酷的东西!”
可不是所有人对这个比赛都表现得兴致高昂。当天下午4点的时候,一名微软发言人通过CNET网站表达了对这场所谓的“Kinect开源大赛”的态度:微软不会纵容任何修改自己产品的行为,并誓言要与执法部门和产品安全部门通力合作,以防Kinect被篡改。Adafruit对此的反应是:将悬赏奖金增至2000美金。四天后,微软又发表了一则声明,指出公司反对任何在非Xbox的设备上使用Kinect的行为并“鼓励用户只在Xbox360上使用Kinect,以获得最佳的体验”。 “这太傻了”,Adafruit团队在网站上回复到,“我们准备将奖金增至3000美金。”
11月9号,马楚里斯的驱动破解工作接近尾声,但花费的时间比预期要长,原因是他需要一台叫USB解析器的设备从Kinect USB传输的数据中抓取的数据,而这台设备要花费大概1000美金。马楚里斯说服了Adafruit公司购买了这台设备,并将数据发布到网上,但是这个过程花费了近一个星期。在Adafruit将抓取的数据发布到网上仅几小时后,马楚里斯和一个在线合作小组就共同研究出了Kinect电机的操作方法以及摄像头的启动方式。马楚里斯在凌晨1点钟准时上床,并确信在他睡觉期间没有其他人在研究。
但马楚里斯忽略了一点:Kinect在美国与欧洲同步上市,而在欧洲上市时正值早晨。当马楚里斯醒来时,一个来自西班牙Bilbao地区名叫维克多·马丁(Hector Martin)的黑客已经领走了奖金。马丁,一个连Xbox设备都没有的人,已经将在他的宏基Aspire电脑中显示的所有颜色源代码和深度摄像头源代码通过视频发布到了网站上。马丁之所以能够神速一般地做到这点原因正是在于微软决定不再将USB 传输的信息进行加密 – 这样就不用像马楚里斯此前那样提取信息了。”整个过程这比我想象得要容易“,马丁说道。"微软说‘我们不会告诉你们Kinect的原理,但是我们不会反对你们自己琢磨’,但能够做到这一点就挺给力了。"
微软这种友好的态度似乎与此前的公开声明大相径庭。在马丁宣告胜利的数日内,没人知道微软将对这种公开挑衅行为将做何反应。Adafruit的创意总监菲尔·特若尼(Phil Torrone)称:"当时我们每个人都感觉会受到微软的指控。"
但是这并没有阻挡黑客们下一步的行动。现在驱动既然已经公布天下,接下来的每一天都会带来创新的惊喜。一家名叫Evoluce的德国公司为Windows专门制造了一台体感控制系统。一组交互设计师想出了一个可以用Kinect将任何平面转化为多指触控界面的方法。用户通过用手指拖动桌子、墙壁或书来控制屏幕上的动作。来自纽约的两个艺术家设计了一个数码玩偶,一只可以随着使用者的胳膊舞动而移动的巨鸟。这些项目被发布到了诸如瘾科技(Engadget), Boing Boing, TechCrunch这样的高人气的网站上,引来大伙的围观。Kinecthacks.com就是专门为实时跟踪这些新科技的最新消息而开设的网站。(截止到5月中旬,已有58页的视频上传到了网站上。)于此同时,马楚里斯和其他编程人员还在继续优化Kinect开源驱动,想办法如何调节彩色摄像头的白平衡,如何控制每秒的帧数,以及如何将它与苹果Mac机兼容。
如果此前黑客还在为微软的下一步行动表示忧心忡忡,这些疑虑在11月19日平息了。这一天,微软的艾利克斯·基普曼(Alex Kipman)出现在了美国国家公共广播电台(NPR)《 Talk of the Nation》节目中的电话采访环节,专门讨论Kinect。节目进行到18分钟的时候,主持人艾瑞·弗莱托(Ira Flatow)读了一则听众的问题:“你能谈一谈破解Kinect的那个家伙吗?” 基普曼很巧妙地回答了这个问题,称:Kinect没有被破解。还没有人知道Xbox的高级算法,也没有人知道对系统作弊的方法。他们做到的仅仅是能连接USB数据线而已,而微软在设计之初就把这个功能开放了。
“也就是说那些人不会有麻烦?” 弗莱托问道。“绝对不会。”基普曼回答。
三个月之后,微软居然态度更加开放。它在官方网站上宣告将发布Kinect软件开发包,以使Kinect变得更容易修改。几个星期内,微软在黑客圈里的名声大噪。微软一反圈中独霸主姿态,为这个又称为世界上最大最成功趋势的开源开发项目提供支持。
还有一个惊喜。在微软研究结果发布的同一天,前负责微软Kinect项目并破解过Wii的黑客强尼·李(Johnny Chung Lee)也发表了一项声明。他在博客上坦言Kinect开源大赛的主意是他在微软工作时想出来的。他写道:他在数月劝说公司为windows开发驱动未果后,找到了Adafruit团队发起这场大赛,奖金由他支付。在软件开发包宣布上市不久,李就离开了微软转投谷歌。现在微软自己都打算将Kinect开放了,他觉得到了将此事公之于众的时候。“这是我花的最值的3000美金。”李在博客中写道。
李的声明宣告了黑客的最终胜利。“以后每当微软发布新产品,估计这些黑客都会想起这次事件。” 特若尼预测,“破解是他们的宗教信仰。”
克雷格·蒙迪(Craig Mundie)坐在位于微软园区一个角落的办公室里,他看起来并没有让人感觉出近期有变动。蒙迪是微软的首席研究分析师,已经在微软供职19年之久。尽管他是公司元老之一,也还是像其他人一样脖子上带着ID。蒙迪会滔滔不绝地跟你当谈论Kinect未来发展的无限潜力,这种所谓的“自然用户界面”摒弃了传统的鼠标和键盘,可以使用户通过身体姿势探索电子世界。“我们想让人机交互更像是人人交互。” 蒙迪说道,“这是我们的目标。”
当话题转到Kinect黑客身上来时,蒙迪变得不那么健谈起来。他对Kinect开源大赛有什么想法吗? “没有“, 他说。“你怎么看Adafruit发起的Kinect破解大赛?” “我没关注。”“你觉得强尼·李是一个什么样的人?”“我不认识他。”“那些将Kinect破解为己所用的黑客好像在使Kinect发挥更优的功能,不是吗?”“这也是我们的计划。”
确实,微软对整个开源大赛的态度是:没什么可看的。根据蒙迪和基普曼所说,微软总是希望黑客亲身体验Kinect,这就是为什么他们将USB解密的原因。微软高层管理人员说,公司一直计划发布软件开发包,但是要等到Kinect发布后才贡献必要的资源。微软那些针对Kinect破解黑客发出的威胁性言论是怎么回事呢?不过是微软的菜鸟公关代表对“黑客”这个词的本能反应罢了。
不管是谁的功劳,反正微软和Kinect黑客的关系出乎意料地进入了热恋般的亲密状态。微软已经公开奉承这些“改造者”们了。公司在宣布二月份将推出软件开发包时关注了一则来自康斯坦兹大学为盲人开发的导航系统展示的消息。“我们可以合作开发”,协助开发软件开发包的微软研究院知名科学家阿努普·古普塔(Anoop Gupta)说道,“我觉得我们能做一些让人觉得惊喜的事。“ 于此同时,黑客们也跃跃欲试了。”我觉得大多数公司没有看到他们开发的产品的外围价值,这是他们的悲哀之处“,海克特·马丁(Hector Martin)说道,他是第一个破解Kinect的黑客,来自西班牙。”可能有上百万的人针对这个产品有更好的主意呢!“
如果微软怀疑自己邀请黑客的行为是否正确,索尼公司近期的举动就是一个客观的参考:在索尼宣布与乔治·霍兹(George Hotz)调解后两个礼拜之内,黑客大举进攻索尼,侵入了PlayStation的机战, Qriocity流媒体服务,在线娱乐分支,及几个其他领地,取得了至少七千万用户的登录和信用卡信息。索尼PlayStation 机战为此停止运营三周之多,抓紧时间进行修理。索尼客户颇为恼火,这使索尼公司的名誉大大受损。尽管犯罪者的身份仍是个谜,但索尼暗示这次侵入事件很可能是有黑客对索尼公司的报复行为。换句话说,拥抱黑客使微软从中受益。而因为惩罚黑客,索尼公司却成为了众矢之的。
越来越多的公司开始采取微软的策略。摩托罗拉日前修订了其安卓系统的解锁政策,宣布未来推出的机型将更加容易修改。索尼爱立信公司建立的一个网页专门帮助黑客解锁电话。今年5月,谷歌公司发布了安卓开放附件开发包,可以让改造者们自己制造能运行安卓系统的设备。(索尼的PlayStation分部也试图加入大军。在3月2日,在他对霍兹提出了指控的同时,也宣布了它会为PlayStation Move Controller发布软件开发包以鼓励开发者开发出更多以前想都没有想过的应用程序。)
微软并没有在等待黑客解锁Kinect的潜在功能。公司已投入数百万美元研制适用于传统家庭使用的机型。研发团队已经制作出了一个支持Kinect的全息性成像台原型,可以将图像用3D的方式投入到真实的世界中,并可以触碰产生反应。其他工作人员在整合Kinect的摄像头与先进的光学器件,来制作一种能向不同的取景器发射不同图像的LCD显示屏。微软已经着手准备Kinect软件第一个主要升级,届时将可以支持拍摄面部表情和身体动作。所有这些工作都耗费大量资金和数小时的人力劳动,这些工作都是组织性松散的黑客们所完成不了的,至少现在还不可能。
这是因为高端的光学器件,这些下一代LCD显示屏,和全息性成像台原型要花费大量的金钱,要弄明白如何建造他们也会花费大量的时间和紧密的合作。但是想来曾几何时,那些深度摄像头的价格也曾高得让人望尘莫及,而Kinect却改变了这一现状。随着越来越多的科技商品化,网络越来越能够容易地为团队提供远程合作,黑客队伍的能力将变得越来越强。在每个人都能获得相同资源的情况下,谁的想法好谁就获胜。数百万的爱好者会想出比几千名工程师更有意思的点子。
而这就是强尼·李看待事情的方式。这是一个晴朗的四月下午,李坐在新东家谷歌的奢华咖啡厅Charlie's外面的天井,穿着印有ThickGeek公司出品的猴子T恤衫。尽管他近期因为公布了他与Kinect开源大赛关系而成为了英雄式的人物,此刻却显得沉默寡言。他不想重复与微软进行的那些对话,也不会对微软即将发布软件开发包的决定邀功。“这不重要,重要的是我们有这样一个深受黑客喜欢的有趣的新设备, 而这台设备的发明公司正在拥抱这些聪明人的劳动成果。“ 李笑道,”我认为这给微软带来了光明的前景。"
相关文章: