(http://chentingpc.me/article/article.php?id=599)
IT领域实际上是个很大很大的领域,别看它的显式发展时间才六七十年,但是近几个世纪的知识的增长是指数形式的,所以相关的知识的产量非常之大。这意味什么呢?没有全领域专家!没有一个人完全了解IT领域,相比之下,可能有人可以几乎完全懂绘画史、各派画的风格等,但IT领域就不同了,没有全领域专家。事情一多就容易乱,我们就要理清头绪。IT领域的知识如此丰富,问题如此之多,也就需要整理一下它的结构;懂了这些结构,一方面能够很好理解整个领域,另一方面,很多决策——从庸俗的做什么赚钱,到伟大的用什么科技改变世界——都能够有一个更好的“理论”依据。然而这个活需要很多深入的洞察,我混不到三年,但还是想记一记自己的想法,对IT领域的问题结构的作一个自己理解下的粗略解析,没有什么太多构思,就是随笔随便记记。
好的,先从这里谈起。很多人以为做IT就是一定要技术,其实很多问题还不是技术问题!比如推广多银行卡的统一、手机支付等,属于运营或实际利益问题,技术上是没有太大问题的。从IT领域扯开,说远点,事实是,这个世界并不是那么理想的,很多问题,用一个童真的眼观看来是那么简单的,但做起来却完全不是那么回事。比如美国没有全民医保,有近百分十的穷人生活在极大风险中,一场大病可能彻底夺走他们的幸福生活,一个孩子就会说,那就全民医保呗,让大家都能快乐的生活多好,然而,这个奥巴马政府正在努力的为之奋斗的目标却受到许多美国民众的反对,因为医保的钱来自己人民,准确的说来自那些最穷的人以外的人,代表他们的议员们认为那些最穷的人是因为自己的原因(吃太多不干活)变得那么穷。唔,于是这场医改革命在美国打了半个多世纪还尚未解决[1]。扯远了,回归IT领域,原理是类似的。很多技术很先进的事业,但是由于需求不多(如“铱星计划”——全球卫星电话,在南极都能给全国任何地方打电话,但最后严重亏损关闭了)、既有利益划分问题(中国通信业的垄断等)、推广营销、公关、其他市场原因以及体制政策原因等,无法起步或走向失败。
上面说的那些非技术问题虽然似乎听起来似乎并不是很光彩的,但是它们也是必不可少的。在一个理想世界中,人们需要什么,厂家就生产什么,人们的投入越大,得到的相应回报也越大;但现实世界不是,我们不知道人们的需要是什么,需要用市场工具去挖掘与检验,用金钱去引导、去更新、去淘汰。就像股票市场,虽然真正意义上的钱不能生钱,但是资金的流动却使得其他的生产力得到了激发,从而使得钱能生钱。因此,非技术问题中,一部分问题是好的问题,这部分还是主要以市场为主,影响产品走向、技术发展等;还有一部分是坏问题,它们往往由不合理的市场、体制结构造成,干扰产品与技术的发展。前一部分问题的解决者是产业领导人以及在产业中拼搏的每一个人,而后一部分问题的解决者往往是政策制定者(很多时候是制造者)。
一百年前,如果有人希望能够打开网站看世界上发生的各种各样的新闻,那就是天方夜谭。因为那时候没有相关的技术。随着技术的发展,现在很多技术问题成为可能。一个现象产生了,假设技术的发展速度大于非技术问题解决的速度,就得进一步假设,技术能做的事情的闭包(唔。。闭包就是。。所有发生的与可能发生但没发生的事情的全体。。)如果包含了现在已经做了的事情的集合,那么就会有一部分事情,它们可以被完成,但是尚未被做出来;如果你做了其中的一部分,你就用现有技术解决了一个没人解决过的问题,更进一步,如果这个事情是非技术问题中所谓的市场所需求的,并且配上了良好的推广等,那么你很可能就因此发家。这个现象或许是很直白的,甚至不需要那个前提假设,因为人们用现有技术解决未被解决的问题是天天都在发生的事情。为了后面更好地“调用”这个现象,给它起个名字吧,好,就叫“技术闭包原理”吧。
在IT领域,可以更具体的说,什么是技术可解决性问题呢?这些问题往往可以很容易用离散数学结构来建模,容易到你都可以忽略建模这个不步骤。比如,我们要写一个音乐播放器,那么,由于相应的编码解码器技术已经被人解决了,我们可以直接用这些接口去做播放器,要考虑的问题可能是用什么结构来保存播放列表、如何找到一个音乐文件、如何读取音乐文件中的每一帧送到声卡等等。再比如,如果做数据库的索引,用什么结构来保存呢,线性表?B树?B+树?等等。归结起来,可解决性技术问题是那类问题,是利用计算机的离散结构来解决已经被离散建模的问题。当然,这是现状吧,往前推三四十年,很多离散结构的问题都没有解决情况就不大相同了,现在当然也有没解决的离散结构问题,但已经少很多了(那什么问题多了,见下面S4)。最后说说人与技术可解决问题吧,其实,解决这些技术可解决问题是很happy的,如果其他条件满足,真是一举多得,一路走向高富帅的一步,远的说,马克.扎克伯格,如果认识的话,就应该知道当年他做了一个网站——facebook(这。。没什么技术难度吧。),今天就上百亿身家了,近的说,你如果有智能手机(爱疯、安卓,whatever)的话,你完全可以自己写程序来做什么控制空调、电视、冰箱什么的,或hack一些其他功能,做出来肯定high啊,不管赚不赚钱,这在技术上是可行的,就算难但不是什么不可能。所以,做做技术可解决性问题是很怡情的。但,还是别忽略那个知识增长的指数趋势,要做到方方面面的技术可解决性问题是很难的,再加上技术上的后浪推前浪,因此还是会有不少局限,长期只解决这种问题,如果不能够像马克一样发财转为企业家或管理者,那很容易就会被后浪拍死在沙滩上。
相比于技术可解决问题,技术开放问题,在你开始解决的时候,就没有什么保证了。还是用那个“技术闭包原理”来解释,也就是说,你要解决问题,不在当前的技术闭包中,你要解决这个问题,就需要推进技术更近一步。这类问题有什么呢?典型的有人脸识别、语音识别(甚至是下一个S4.理论开放性问题中所描述的问题)什么的、或者IPV6与IPV4完美融合问题什么的。要解决这些问题,需要开发一些新的技术。实际上,从技术可解决问题到技术开放问题并没有太本质的区别,它们很大程度上都是市场驱动的,而且都将立即返回到市场中去。因此它们的执行载体或者说解决这些问题的主要团体往往是大大小小的公司。对应于S2中最后的问题,也就是如果长期做技术可解决问题而没有取得很好的成果(市场认同等),很容易被长江后浪拍死,但是如果在其中加入技术开放性问题,那么,就能在技术这条路上走的更远,更能够保持青春。
在IT领域,有一类问题,是目前还难以用计算机的离散结构来解决的。比如如何让计算机具有创造性思维、,如何让计算机明白自然语言的含义等等。这些问题之所以不是技术开放问题(肯定更不是技术可解决问题了)的原因是人们暂时还没有很好的离散计算模型,而现在的计算机需要给予这种模型来运作。我们可以告诉任何一个正常的人,告诉ta记住我,我明天再这个同一个地方找你,ta是能够明天来到这里然后认出你,但是,计算机就很难了,就算正面认出是你,你侧个身它就不认识了,它看到的是一堆像素点,具体的含义并不理解,如何让它理解,需要一系列模型。反观传统的离散结构,基于那种IF..ELSE..可以描述的离散数理逻辑,它们非常直接的吻合了计算机的离散结构。
(本段都是我的“胡说”,因为那种话看起来应该是在这个领域混了很久的元老级人物说的)我觉得,当前,在IT领域的理论开放问题中最主要与最重要的算是人工智能的问题。这些问题尚且没有理论上的或者说连续数学上的可靠解,还没有办法全面进入技术问题阶段(我相信这个流程已经正在进行,理论上逐渐成熟,技术上慢慢开始发展,不久将来或许就会大举融入市场)。对待这些问题,传统的人工智能学家的思想是直接用离散结构给问题建模,比如基于数理逻辑的推理、电脑下棋、专家系统等,仍然用的是很离散结构的方法去解决人工智能问题,后来,发现这种思路越走越路越窄,能解决的问题太少了,而另一方面,语音图像是大量数据构成的、网络的发展也涌现出很多数据,基于数据驱动、统计理论支撑的智能计算渐渐发展壮大,到现在已经火到在出国留学申请上都反应得竞争非常激烈的情形(典型代表就是机器学习及其应用)。从这个发展的趋势也可以看出来,其实在学术界,思想还是很重要的,因为解决问题的思路的发展是具有很明显思想划分的,如果抓到正确的思想好好做下去,最终是可以获得很好的结果的。
总的来说,理论开放问题,仍然需要用数学模型去描述现实问题,让那些问题首先连续数学可计算,然后再考虑用计算机去计算。这里也不多说了,用一个问题结束这个section吧。你或许心中会有这样一个我曾经有过的疑问:有些东西,比如人的感情与审美,哪有什么固定规则可循,怎么计算呢?这个问题,从另一角度来问或许会更合适:有些东西,比如人的感情与审美,有什么人们尚未找到的规则或机制在控制呢,如何找到一个合适的计算模型呢?
在这篇随笔中,我写了自己对于IT领域的一些小思考。我认为这个领域中的问题结构主要有上述四种:非技术性问题、技术可解决问题、技术开放问题与理论开放问题。事情的解决往往是这样的,一些看似简单的问题一开始被描述成理论开放问题,然后被连续数学建模,进而转换成离散数学结构,然后推向技术开放问题,技术开放问题或容易或困难的解决了离散数学结构的实现,进而以技术可解决问题的形式根据非技术问题的推动与限制将一个个功能推向现实,最终改变人们的生活、改变了世界。虽然其中蕴含许多令某些人激动的创造性的工作以及令某些人激动的巨大商机等,然而,对于相关的从业人员而言,一个不幸的消息是,这个巨大的领域对大多数人还是细致分工的,能够在每一层都通吃的人极少(我所知的就斯坦福的现任(或前任)校长,那个发明MIPS机器的人,还有李开复也算半个吧,他在理论开放问题上的建树是用统计方法做语音识别等,但是开复老师的编程估计就不如那些微软百度的工程师了),但是大多数人来说,往往只会集中在一两层上,第一层是一类,第二三层是一类,第四层是一类,三类要求的知识与能力结构很不相同,因此,从业人员还是要选好自己的方向,规划好自己的路线,才能更好积累自己的优势。
Reference:
[1]晓说:高晓松谈美国医疗制度
(http://chentingpc.me/article/article.php?id=599)