by fanxiushu 2017-11-15 转载或引用请注明原始作者。
既然是漫谈,可能就有些不着边际,。
人工智能其实也不是什么新鲜东西,早在几十年前,电脑技术还很弱的时候,人工智能的概念就伴随产生了。
70年代的科幻电影,那个时候我还没出生,好多都是机器人出现在电影中,比如影响很大的《异形》,
里边的“生化人”,以及代表”电脑母亲“的智能 “云系统” 。
可见在很早前,人们就已经有了概念,并且不断的在研究和探索这方面的内容。
虽然以现在的眼光来看,电影特技显得有点粗陋,但是代表那个年代人们观点和意愿。
既然是很早就出现的技术,为何现在才火起来,其实也不算是现在红火起来,应该在电脑技术发展过程中,
红火过一段时间后,然后又偃旗息鼓,然后又不知何原因又火起来了。
这估计跟人类本性喜欢瞎凑热闹有关,做事总是一阵一阵的。
前段时间拼命瞎凑热闹HTML5,说网页替代传统程序,接着又是云计算,大数据,
这还没完呢,又来人工智能了,似乎有点在大跃进了,真的发展有这么快么?
核心技术还是那么些,换了个概念接着玩起来了!
这次人工智能红火起来也有一定外部原因,
1,电脑技术的突飞猛进,尤其是硬件计算能力的提升。
2,各种外部感知硬件的发展和完善,比如各种图像采集设备,声音采集设备,
光线温度以及其他各种传感器等等凡是从外界采集各种信息的设备。
3,伴随着智能手机普及和大面积应用,这玩意的使用可比电脑方便太多,
随时随地都能方便的联网,跟人聊天,各种在线支付,浏览网页等等,
从而产生了非常多的数据,光是数据量就是几年前的起码几十倍的增长,
分析和处理这些庞大的数据,获取一些有用的信息,就又需要建立起一套更加复杂完善的系统,
云系统和大数据的概念也就运营而生,
云系统和大数据其实也是从原先的分布式技术演化而来,任何技术都不是凭空产生。
4,云系统和大数据分析的建立和完善,更加巩固电脑计算技术,这给人工智能提供了更好的数据来源和计算能力。
而像有些公司,本身就是从做数据起家的,比如google,百度这类做搜索起家的公司,面临的都是庞大的数据,
像Google在全世界起码有几百万台服务器,又有许多自己的数据中心。
这些数据积累对他们进行人工智能的研究和开发有着天生的优势。但是像微软这类技术雄厚的公司也不容小觑。
但是如果资源掌握在少数集团和少数人手中,就容易产生垄断。
垄断就是 “我是老大,我说了算”。这也是挺可怕的现象!
因此得尽量扩展鼓励其他公司尤其小公司参与进来,让多个公司来竞争当”老大“,
当然首先得规范竞争规则,否则等他们玩HIGH了,连杀人放火都敢干,就又回到几千年前的野蛮时代了。
虽然最后谁也当不了“老大”,但是由于竞争欲望驱使,使得产品和技术进步了,这也是好事。
5,再加上电脑技术玩到这种程度,似乎好像遇到了发展瓶颈,没啥新的可玩了,
因此为何不找些刺激点的接着玩下去,于是人工智能又给接着火起来了。
人工智能刺激吗?确实有点,在有些人看来,它可以代替人工作,
会自我思考,像人一样有自我意识和感情。
然而这从目前看来,有些想法是属于鬼扯,属于科幻的内容。
它确实能代替人做某些简单而且重复的工作,人工智能的发展(现代科技的发展)会让有些人失业,
但也有可能增加许多新岗位,这也是人们目前需要积极考虑和解决的问题。
其实机器替代人的工作,很早就已经正在某些岗位进行了,只是这个过程在一点一点的进行,搞的大家都习以为常了。
失业意味着没经济来源,没法养活自己和妻儿,这会造成更大的社会动荡问题。
别指望企业家(或者叫资本家雇主,或者所谓的“少数精英”)给予施舍。
人性本贪,能用更少的人工,更廉价的机器劳力,赚取更多的钱,就不会考虑其他人是死是活。
否则在人类历史发展过程中就不会出现这么多战争和杀戮。
目前人类社会也远远没有达到马克思理论所说的按需分配的高度,不论生产力还是物质都没能达到极大的水平,
也别指望道德水平或什么人性本善来处理这些问题。
需要政府部门来强制解决这些问题以达到利益重新合理分配,起码得是大范围内的合理,
比如严格控制极富寡富的少数人群,减低贫富差距,虽然在现实社会中这挺难的。
因为这类人群和集团掌握大量资源,他们很可能疯狂而无节制的投资和垄断基础产业,
比如房地产,造成这些基础产业疯狂涨价,等于是少数集团和人群绑架了国家或者人类经济命脉。
同时如果政府在其中推波助澜,为了短期政绩和政府税收,情况就更加堪虞。
政府本质是代表大部分人群的利益的,但是政府也是由人构成,
如果出现政府人员跟商人勾结,腐败等一系列问题,这种情况似乎又变得更复杂了,
当发展到一定程度不能自我解决的时候,估计又是暴力来重新构建。
总之人类社会是个挺复杂的课题,也不是本文简单几句话就能说得明白的。
既然人类本身就挺复杂,目前人类对自身的了解和对大脑的了解程度都挺少,
人类对自己大脑的认识程度都不充分,对自我意识的产生都挺糊涂,人类在对大脑研究上并没取得什么突破性的进展。
怎么可能做出具备跟人一样有自我意识,有“我”的概念,能自我思考和决策,有感情有欲望的机器人。
除非出现奇迹或者有非常发达的外星人帮忙,否则还是得循序渐进的研究,天上不会掉馅饼。
这个时间也不是几年能解决,可能是几十年或几百年甚至更长,也有可能研究不出来,以后的事情谁知道。
目前来说,真正让人感到恐惧的是,工作10多年或者几十年的岗位,某天突然发现可以被智能机器取代,
由于多年的工作习惯,已经很难再转行到别的行业,面临的就是失业和无望的人生的情绪。
不要把所谓的”少数精英“跟普通人比较,很多人的能力只能完成基础工作,
这些人让机器替代了,需要别的行业来解决就业问题,这会更加增大其他行业就业压力。
目前又没有达到按需分配的社会水平,光靠政府的那点资助有何用。
当然替换过程应该是循序渐进的,现在的人工智能要达到实际应用还需要一段路要走。
聪明的人类总能找到出路,虽然可能会付出极大的艰辛和牺牲。
人工智能机器工作模式其实就是输入信息,计算机分析决策,做出反馈,基本是按照计算机处理流程技术来实现的。
无非就是输入大量数据,根据算法计算处理,输出结果。
计算机分析决策是核心部分,需要大量的运算和许多的数据作为参照,以及合适的算法,这样才能更加准确做出反馈。
(这很有点像我们在做数据库SQL查询的模糊匹配,当然这个比喻有点简单。)
这就是为什么大数据云计算的兴起引发了人工智能热潮,
大数据的兴起,又少不了智能手机大面积使用而贡献的大量数据的功劳,真是一环扣一环。
这股热潮何时落幕,估计得看能不能带来实际效益。
任何东西都有它核心的部分,人工智能也不例外,它主要包括三个方向:
1,图像识别, (计算机视觉,相当于人眼)
2,语音识别, (计算机听觉,相当于人耳朵)
3,自然语言处理。 (接受人类说话的语言,转换成机器能处理的逻辑,相当于人听到或看到之后,进行相应动作的过程)
由这些东西衍生出许多新的功能,比如人脸识别等,以及各式各样的算法。
这些都不是什么新东西,早在几十年前人们就在研究这些基础的东西了。
而且在各行各业中,也多多少少在使用这些技术的某些功能。
图像识别和语音识别进步的好像还挺快,至少比10多年前好。
记得多年前买的一个手机,也有语音识别,可是怎么用怎么都不准,
现在在手机上说话,基本都能被正确识别成文字。
识别成文字后,一般进行类似google一样的搜索,或者执行相应动作。
然而,一个人对着机器说话(不论是电脑或手机),总感觉自己像个白痴似的,估计是心理作用。
图像和语音识别,就不得不牵涉到各种计算机算法,什么深度学习,各种神经网络模拟。
1943年,心理学家W.S.McCulloch和数理逻辑学家W.Pitts建立了神经网络和数学模型,
称为MP模型。他们通过MP模型提出了神经元的形式化数学描述和网络结构方法,
证明了单个神经元能执行逻辑功能,从而开创了人工神经网络研究的时代。
可见研究历史很长。但是再长也没有人类对数学,物理这些基础学科的研究历史长,
正是这些基础的建立和发展,才能造就如今电脑技术的飞速发展。
(这就是为何在校的学生更应该注重基础知识的培养,虽然它短期不会带来经济收入)。
目前我对这些算法并不了解,也给不了什么有用的见解。
算法虽然是人工智能的灵魂(算法其实是所有软件的灵魂),
但是算法就是算法,都是死的东西,输入数据计算出结果。不是有机物质更不是生命体。
目前炒作的比较厉害的深度学习,它是属于机器学习的一个分支,其实也是很多年前就提出的概念和算法。
机器学习就是模拟机器跟人一样,比如给他一本书,让它一页一页的翻看,记住里边的内容,掌握里边的知识,好像跟人一样。
其实就是给机器一堆数据,让它从这些数据中找到一些规律,然后可以根据这些规律来推演出一些未知数据。
应该说机器学习跟数学中的统计学关系非常密切,从一堆杂乱无章的现象统计归纳出一些规律。
这似乎又跟文章最上边提到的做大数据分析很像,确实如此,否则人工智能也不会跟着大数据的兴起而再次热闹起来。
无论怎样,前提是我们得准备大量的数据,这是进行识别的前提条件,而且数据越多越全面,识别能力就越好。
比如语音识别,我们得准备各种人的说话片段,
中国人的,美国人的,日本人的,韩国人的。。。而且每个国家都有不同地域不同方言,每个人说话风格也可能不一样。
这么多数据如何收集,一可能靠人工主动采集,
二主要是通过人们平时有事没事通过手机电脑等设备说话聊天被动收集到服务端。
(不管你承认还是不承认,许多公司的手机或电脑程序甚至谷歌,微软,苹果都在默默收集你的行为数据,
不管是违法还是合法。大数据时代到了,人的隐私也没了。)
采集到大量人的说话片段之后,还得准备文字库,
文字库应该好采集,都是固定的,全世界就那么几千种语言文字,当然这个数字其实也是挺恐怖的。
有了这些准备后,当某人说了某句话,被录音设备采集到电脑,计算机就会从这些数据中通过某些算法查找最接近的语音,
知道是哪个国家哪个地区的人说的话,拆分和理解说话人的说的单词,
然后找到匹配的文字,(我这理解有点粗浅,大致应该是这样,具体查找匹配等算法应该是挺复杂的,这里边牵涉到机器学习等多种算法)。
找到匹配文字之后,再根据这些文字代表的具体意义执行相应的动作,
当然某些文字代表什么动作这个也是人工智能算法要解决的问题(属于自然语言处理的部分)。
其实还是要靠大量的输入信息来定位,比如“开机”,给他定义成打开电脑,“今天 吃了什么?“ 分析成今天吃了什么食物等等。。。
也就是说,各种行为都是我们预先编码好输入给计算机的,而不是电脑自我意识到 ”今天吃了什么“ 。
比较有意思的是图像识别.
记得以前(估计是刚毕业工作那会)在看到网站有图片验证登录的时候,就在想,
能不能让电脑摄像头扫描这些验证图片,然后认识其中的数字,然后自动填写到网页上,实现自动登录。
当然当时目的不纯,想用程序自动登录某些网站以获取某些方便。
然而当时对图像识别并不熟悉,并不清楚这就是人工智能的一个基础方向。自然更加没能力写这么一个算法来识别网站的验证图片。
即使后来,经过多年的工作,可惜也没在图像领域花什么功夫,基本也处于小白状态,
即便在实现远程桌面的时候,使用H264压缩图像,在惊叹它压缩率之高图像质量也不差,
秒杀那些远程桌面的小块比较,差异传输等算法。
然而却对H264详细算法并不熟悉,只了解其中的 I帧,B帧,P帧,只会使用别人开发的开源库比如ffmpeg,x264等。
(估计不知道多少人跟我一样,只会使用别人辛苦研发出来的东西,而并不理解核心内容更没能力自己实现核心部分。
当然也别希望看到别人提供的接口API简单,就说出很简单研发很容易的这类的笑话)。
目前各种图像开源库,对图像识别都有很大的支持,如果网站的验证图片只是简单的数字或字母或者中文字,已经很容易被识别出来,
这又造成网站开发人员不停的增加验证图片的复杂度,造成如今这种人眼都难识别的局面,真是魔高一丈,道高一尺。
双方都在较量和折腾。
还有许多图像识别的实际应用,比如公路上的电子猫眼的车牌识别,监控领域的防盗识别等等。
图像识别也属于图形图像处理技术的这一范畴,需要我们熟悉基本的图像算法和处理技术。
图像识别就像我们人眼一样,看到周围的场景,输入给人脑分析进而进行判断处理,
图像识别也是这样的处理过程,使用摄像机拍摄下周围环境的一张张图片,输入电脑进行图像处理分析,
进而判断出是什么样的情况,该做出什么动作来回应等。
比如自动驾驶,人形机器人,他们身上都配备多个摄像机,从不同角度采集周围环境图片,
当然他们的身上不止图像传感器,事实上,他们身上有多种传感器,用于采集各种信息。
自动驾驶采集图片识别出前方是人或动物,则采取停止或者避让,如果遇到红绿灯则遵守交通规则,
如果前方有障碍物则选择其他路线避让等等。
不光是摄像头采集图片,还与其他传感器一起进行信息综合分析再来做出决策,光靠摄像头采集的图片有可能不正确。
当然这其中的算法之复杂,是常人难想象的,而且识别率,稳定性也不见得多好,尤其是在复杂的外部环境中。
都还需要大量的实践各种环境和做大量测试,投入大量精力和时间来保证。
短期不会带来实际商业价值。比如自动驾驶还存在法律上的问题,出了事故究竟该谁负责等问题。
而且有些人买车就是为了自己开车很爽,买了自动驾驶车,就感受不到这种乐趣。
我猜测最终的结果(不一定正确)是公共交通工具替换成自动驾驶,比如公交车,出租车,
他们有很强的目的性,都是从A到B,也好控制。私家车上的自动驾驶则作为爱用不用的辅助功能。
还有比较难的就是自然语言的处理,难在我们人类说的话各种各样,
有多种语义,存在歧义。不同环境下,同一句话代表不同意思等等。
这些语言要交给电脑理解并且做出正确回应,是非常难的课题。
我们也可以简单这样做:可以把每种语句,在不同环境含义都输入给电脑。
但是再想想,世界上这么多语言,语言的最小单位是单词,
这些单词又可以构成非常多的语句,这种工作量是非常庞大和不可能的。
因此得想一些好的算法,以尽量减少这种简单统计性的输入办法。
当然也不排除经过许多年人们的机械性努力,就采用简单输入每个语句代表的意思,毕竟虽然语句是很多,但是也是有限的。
建立起来一个庞大的对应关系数据库。到那个时候,机器就能正确理解并处理人类语言了。
说了这么多,其实也就是人工智能也没有些人想象的那么高深。
都是我们在已经使用或者正在使用的电脑技术基础发展而来,
而且有些部分很早就已经作为实际使用的产品做出来了。
文章写的比较粗浅,毕竟我对人工智能没做多深研究,
只是凭着对目前电脑技术(本文中的电脑或计算机包括PC电脑,手机,平板,后台服务器等的总称)
的认识来阐述人工智能,毕竟万变不离其宗。
文中有何不妥之处,请谅解并指出。