锤子科技TNT分析（上）

TNT即Touch & Talk，按着说话，是锤子科技在鸟巢发布会上提出的一种人机交互方式。

我会认为TNT所倡导的交互理念非常值得深入琢磨。

目前在电脑上，最具有影响力的两种交互方式是GUI跟CLI，即图形化的交互界面跟命令行。

首先出现的是命令行，即在终端里面敲打命令，然后电脑执行。

而后mac，windows这两个小偷从施乐窃取了图形界面并将其发扬光大。

现在可能很多人都会认为图形界面更加好用、效率高，因为一切都呈现在眼前，只需要使用鼠标选择、点击便可使用。

随iPhone的出现，触摸屏则是更一步让图形化界面更加人性化，别说人，甚至猫都可能懂得怎么用iPad。

（此处应该有猫使用iPad的动图）

看上去，GUI早就应该一统天下，把命令行赶尽杀绝。

连猫都会用的交互界面必然是好用得不得了，对吧？

对，但好用与高效是两个概念，到目前为止，命令行依旧还是不可替代的。

程序员们，系统管理员们等等，他们会坚持命令行更加高效。

真·程序员是使用命令行控制电脑的，死宅们会这么说。

可能习惯了图形化界面的人们，会觉得这些死宅对命令行的执念不可思议。

鼠标点一下就好了，居然要用键盘去打个命令？！耍酷吧？

不，不是的；我们（我也是程序员一枚）说命令行更加高效，是基于我们真实的体验。

只是，极少有人去系统分析说为什么命令行比图形化界面更加高效，阐述其背后的道理；光靠『现身说法』是不够的，我们不能光说我们觉得命令行高效，而需要从理论的层面去说命令行何以高效。

这里，我就想认真的先来探讨一下命令行何以高效的问题；然后我再来讲为什么我觉得TNT是很有潜力的交互方式，以带来更高效的交互。

图形化界面的局限

图形化界面的优势是，它可以把所有的东西放在我们眼前，然后只要简单的一个点击，便可完成任务。

但这也是图形化界面的劣势，很简单，如果我们需要的东西不在界面上怎么办？

我们就需要不断的去翻，或者一层一层的去点击。

PC上需要被打开的应用、文件的数量很容易便是成百上千，使用文件管理器用鼠标一个一个的查找，效率必然是非常低的，因为屏幕有限，用户需要不断的点击不同层次的界面，然后查阅、选择。

这样的场景，命令行便会非常高效。

我们可以从选择效率上考虑。

以锤子手机自身为例，当年T1出来的时候，主打的噱头便是『九宫格』的桌面，说管理、启动应用很方便云云。

但问题是，『九宫格』中每一屏幕只能显示9格图标，即便换成『16宫格』，一屏幕十多二十个也就到顶了；也就是说，每一屏最多只能提供20个选择，供筛选；一但应用多余这个数，就必须分屏、分目录，然后就会有查找的成本。

即便，我们只考虑英文字母，命令行每输入一个字母，便能代表26种可能，2个字母便是676，3个便是一万千多。

这可以非常快速的“定位”到某个应用、文件；中文的话，每个字都可以定位到数千种可能。

再辅以模糊搜索，命令行在启动应用、打开文件这事上，效率是会秒杀图形化界面 + 鼠标选择的。

我在mac上永远都不用Finder去开文件的，永远都是按cmd + 空格启动spotlight去做查找。

这里spotlight提供的，其实也是一个“命令行”接口，而不是图形化界面。

在windows里面，我则是按win + Q；效果是类似的。

系统管理员要管理服务器的时候，必然也是会优先考虑使用命令行的界面，因为需要管理的程序、配置项实在是太多了。

使用图形化界面去点击、修改效率是非常底下的；而更尴尬的是，如果某个配置项因为用的人少，管理界面是有可能被被做“漏”了。

这时候，管理员便只能求助于某个命令。

命令行的另一个好处是可以盲打，所有的命令键击会非常准确；就算会打错字，错误率也会远低于我们使用鼠标不动的移动，然后点击屏幕的不同地方。

随着语音识别的进步，语音输入，某种程度上也可以看成是命令行界面的变种。

本质上都是输入“文字”给电脑，只是以前我们用键盘，现在我们可以用语音；无论是打字还是语音，都是会被先系统转化为文字命令之后，再进行处理。

（作为比较，图形化界面，输入的是坐标信息以及点击等）

以打开一个应用为例，如果应用的图标在桌面上，嗯，很简单，我们直接点击便能启动，这很方便很高效。

13年年初，我在微博上讨论T1界面的时候，便断言『图标是会被淘汰』的；因为语音可以很准确的用来启动应用。

当年我跟纯银V讨论应用图标

然后，老罗今年终于在鸟巢演示了一把语音启动应用。

未来方向与过度方案

需要对未来的方向看得清晰，什么是长远方向，什么是临时的过渡方案，这些是需要认知得非常清楚的。

我认为，锤子科技在T1强调九宫格的时候，也应该非常清楚那是过渡的方案。

先推广过渡方案，然后再追求未来，往往代表的是务实，而不是不懂得追求未来；相反，未来的方案推得太快，反倒很容易把自己搞死。

交互

选择是一个交互过程，我们看到一个图形化界面，是需要去查看甚至理解界面上的元素、选项，然后再做出选择。

这一来一去，是需要大脑思考的。

语音的优势

当我们使用语音输入的时候，即便是语音会被转化成为文字，但虽然模糊搜索的进步，或者说AI，它也会变得更加高效。

传统上，当我们使用命令行做输入的时候，每个命令所接受的参数先后次序等等，可能会是非常严谨。而当我们使用语音界面的时候，语法往往是不重要的，我们跟电脑说一句话，语法引擎会去分析我们言语里面的关键字，然后归纳成为一个命令。

订一个明天早上9点的闹钟
订闹钟，明天早上九点响
九点，明天早上，闹闹钟

无论怎么说可能都无所谓，九点、明天早上、闹钟这三个是关键字，AI听到这它们后，基本就能知道我们想干嘛。

如果家里有智能音箱的话，大家不妨试试使用各种不合语法的语音命令去调戏一下；看看智能音响能否听懂。

就我用英文调戏google home的经验，它是完全可以听懂的，因为它只在乎关键字；它不会在乎我跟它说的是不是语法严谨的英文。

所以，语音会是更加智能的命令行界面。

命令行的局限

同样的，命令行界面是有局限的，即便是更加智能化的语音。

何况，电脑所听见的语音跟人类能够理解的语音其实还很不一样。

人类，可以听得出来语气、音色等等；但语气与音色在语音被转化成为文字之后，是会被丢弃的。

这是很多智能音响无法区分讲话者是谁的原因；很多只是识别启动词的时候，会识别一下当前讲话的人，后续就不行了。

人们会觉得讲电话比文字聊天有效率，那是因为我们在讲电话的时候，语气、语速、音调等等会给我们提供很多额外的讯息，这些讯息是在语音转化成为文字的时候会被遗弃掉，这就减少了信息量。

同样的，我们会觉得面对面沟通更加有效，那是因为又多了神情、肢体语言等等更多的讯息；也完全不会有信号不好之类的问题。

所以，是有很多很多信息是命令行界面（包括文字、语音等）等难以承载的；而传递这样的信息，则是别的交互界面的强项。

像之前说的，图形化界面传递的其实是位置坐标，文字就非常难以描述一个位置。

我们考虑这样一个场景：打星际。

打星际

选择一个小兵，从一个位置移动到另一个位置，进行攻击、或者是防守。

这用命令行界面是完全没法搞的，必须得用鼠标，准确是说是鼠标辅以键盘快捷键才能搞定。

职业星际玩家使用键盘鼠标的输入效率是非常高的，APM - 每分钟操作数可以达300以上，也就是说每秒可以做5个操作，平均0.2秒就可能点了一下键盘或者鼠标；这是相当惊人的交互效率。

键盘用于输入命令，建造、编队、切换屏幕等等，都是输入预定指令；而鼠标是不断的选择地点、全选兵种、移动或者进攻，输入的是位置以及点击。

键盘与鼠标的作用是无法相互替代的，玩家必须同时使用。

TNT所企图做的，便是把键盘输入换成语音，鼠标换成触控；然后由此去构造出一些两者同时使用的应用场景，以求更高的交互效率。

锤子科技TNT分析（上）

图形化界面的局限

未来方向与过度方案

交互

语音的优势

命令行的局限

打星际

你可能感兴趣的:(锤子科技TNT分析（上）)