TNT即Touch & Talk,按着说话,是锤子科技在鸟巢发布会上提出的一种人机交互方式。
我会认为TNT所倡导的交互理念非常值得深入琢磨。
目前在电脑上,最具有影响力的两种交互方式是GUI跟CLI,即图形化的交互界面跟命令行。
首先出现的是命令行,即在终端里面敲打命令,然后电脑执行。
而后mac,windows这两个小偷从施乐窃取了图形界面并将其发扬光大。
现在可能很多人都会认为图形界面更加好用、效率高,因为一切都呈现在眼前,只需要使用鼠标选择、点击便可使用。
随iPhone的出现,触摸屏则是更一步让图形化界面更加人性化,别说人,甚至猫都可能懂得怎么用iPad。
(此处应该有猫使用iPad的动图)
看上去,GUI早就应该一统天下,把命令行赶尽杀绝。
连猫都会用的交互界面必然是好用得不得了,对吧?
对,但好用与高效是两个概念,到目前为止,命令行依旧还是不可替代的。
程序员们,系统管理员们等等,他们会坚持命令行更加高效。
真·程序员是使用命令行控制电脑的,死宅们会这么说。
可能习惯了图形化界面的人们,会觉得这些死宅对命令行的执念不可思议。
鼠标点一下就好了,居然要用键盘去打个命令?!耍酷吧?
不,不是的;我们(我也是程序员一枚)说命令行更加高效,是基于我们真实的体验。
只是,极少有人去系统分析说为什么命令行比图形化界面更加高效,阐述其背后的道理;光靠『现身说法』是不够的,我们不能光说我们觉得命令行高效,而需要从理论的层面去说命令行何以高效。
这里,我就想认真的先来探讨一下命令行何以高效的问题;然后我再来讲为什么我觉得TNT是很有潜力的交互方式,以带来更高效的交互。
图形化界面的局限
图形化界面的优势是,它可以把所有的东西放在我们眼前,然后只要简单的一个点击,便可完成任务。
但这也是图形化界面的劣势,很简单,如果我们需要的东西不在界面上怎么办?
我们就需要不断的去翻,或者一层一层的去点击。
PC上需要被打开的应用、文件的数量很容易便是成百上千,使用文件管理器
用鼠标一个一个的查找,效率必然是非常低的,因为屏幕有限,用户需要不断的点击不同层次的界面,然后查阅、选择。
这样的场景,命令行便会非常高效。
我们可以从选择效率上考虑。
以锤子手机自身为例,当年T1出来的时候,主打的噱头便是『九宫格』的桌面,说管理、启动应用很方便云云。
但问题是,『九宫格』中每一屏幕只能显示9格图标,即便换成『16宫格』,一屏幕十多二十个也就到顶了;也就是说,每一屏最多只能提供20个选择,供筛选;一但应用多余这个数,就必须分屏、分目录,然后就会有查找的成本。
即便,我们只考虑英文字母,命令行每输入一个字母,便能代表26种可能,2个字母便是676,3个便是一万千多。
这可以非常快速的“定位”到某个应用、文件;中文的话,每个字都可以定位到数千种可能。
再辅以模糊搜索,命令行在启动应用、打开文件这事上,效率是会秒杀图形化界面 + 鼠标选择的。
我在mac上永远都不用Finder去开文件的,永远都是按cmd + 空格启动spotlight去做查找。
这里spotlight提供的,其实也是一个“命令行”接口,而不是图形化界面。
在windows里面,我则是按win + Q;效果是类似的。
系统管理员要管理服务器的时候,必然也是会优先考虑使用命令行的界面,因为需要管理的程序、配置项实在是太多了。
使用图形化界面去点击、修改效率是非常底下的;而更尴尬的是,如果某个配置项因为用的人少,管理界面是有可能被被做“漏”了。
这时候,管理员便只能求助于某个命令。
命令行的另一个好处是可以盲打,所有的命令键击会非常准确;就算会打错字,错误率也会远低于我们使用鼠标不动的移动,然后点击屏幕的不同地方。
随着语音识别的进步,语音输入,某种程度上也可以看成是命令行界面的变种。
本质上都是输入“文字”给电脑,只是以前我们用键盘,现在我们可以用语音;无论是打字还是语音,都是会被先系统转化为文字命令之后,再进行处理。
(作为比较,图形化界面,输入的是坐标信息
以及点击
等)
以打开一个应用为例,如果应用的图标在桌面上,嗯,很简单,我们直接点击便能启动,这很方便很高效。
13年年初,我在微博上讨论T1界面的时候,便断言『图标是会被淘汰』的;因为语音可以很准确的用来启动应用。
当年我跟纯银V讨论应用图标
然后,老罗今年终于在鸟巢演示了一把语音启动
应用。
未来方向与过度方案
需要对未来的方向看得清晰,什么是长远方向,什么是临时的过渡方案,这些是需要认知得非常清楚的。
我认为,锤子科技在T1强调九宫格的时候,也应该非常清楚那是过渡的方案。
先推广过渡方案,然后再追求未来,往往代表的是务实,而不是不懂得追求未来;相反,未来的方案推得太快,反倒很容易把自己搞死。
交互
选择是一个交互过程,我们看到一个图形化
界面,是需要去查看
甚至理解
界面上的元素、选项,然后再做出选择。
这一来一去,是需要大脑思考的。
语音的优势
当我们使用语音输入的时候,即便是语音会被转化成为文字,但虽然模糊搜索的进步,或者说AI,它也会变得更加高效。
传统上,当我们使用命令行做输入的时候,每个命令所接受的参数先后次序等等,可能会是非常严谨。而当我们使用语音界面的时候,语法
往往是不重要的,我们跟电脑说一句话,语法引擎会去分析我们言语里面的关键字
,然后归纳成为一个命令
。
订一个明天早上9点的闹钟
订闹钟,明天早上九点响
九点,明天早上,闹闹钟
无论怎么说可能都无所谓,九点
、明天早上
、闹钟
这三个是关键字,AI听到这它们后,基本就能知道我们想干嘛。
如果家里有智能音箱的话,大家不妨试试使用各种不合语法的语音命令去调戏一下;看看智能音响能否听懂。
就我用英文调戏google home的经验,它是完全可以听懂的,因为它只在乎关键字
;它不会在乎我跟它说的是不是语法严谨的英文。
所以,语音会是更加智能的命令行界面
。
命令行的局限
同样的,命令行界面是有局限的,即便是更加智能化的语音。
何况,电脑所听见的语音跟人类能够理解的语音其实还很不一样。
人类,可以听得出来语气、音色等等;但语气与音色在语音被转化成为文字之后,是会被丢弃的。
这是很多智能音响无法区分讲话者是谁的原因;很多只是识别启动词
的时候,会识别一下当前讲话的人,后续就不行了。
人们会觉得讲电话比文字聊天有效率,那是因为我们在讲电话的时候,语气、语速、音调等等会给我们提供很多额外的讯息,这些讯息是在语音转化成为文字的时候会被遗弃掉,这就减少了信息量。
同样的,我们会觉得面对面沟通更加有效,那是因为又多了神情、肢体语言等等更多的讯息;也完全不会有信号不好之类的问题。
所以,是有很多很多信息是命令行界面(包括文字、语音等)等难以承载的;而传递这样的信息,则是别的交互界面的强项。
像之前说的,图形化界面传递的其实是位置坐标,文字就非常难以描述一个位置。
我们考虑这样一个场景:打星际。
打星际
选择一个小兵,从一个位置移动到另一个位置,进行攻击、或者是防守。
这用命令行界面是完全没法搞的,必须得用鼠标,准确是说是鼠标辅以键盘快捷键才能搞定。
职业星际玩家使用键盘鼠标的输入效率是非常高的,APM - 每分钟操作数可以达300以上,也就是说每秒可以做5个操作,平均0.2秒就可能点了一下键盘或者鼠标;这是相当惊人的交互效率。
键盘用于输入命令,建造、编队、切换屏幕等等,都是输入预定指令
;而鼠标是不断的选择地点、全选兵种、移动或者进攻,输入的是位置
以及点击
。
键盘与鼠标的作用是无法相互替代的,玩家必须同时使用
。
TNT所企图做的,便是把键盘输入换成语音,鼠标换成触控;然后由此去构造出一些两者同时使用的应用场景,以求更高的交互效率。