浅谈人工智能

人工智能近年来风生水起,各类项目络绎不绝,不带AI,感觉就不拉风,不带智能就不能拉高自己的技术含量和估值。公司的投资团队也接到很多这类项目的计划书,也困惑如何评估这类公司的价值,笔者技术出生,历经了中国互联网的各个时期,写下此文浅谈人工智能。

前言

     人工智能(AI)最早出现应该是在1956年左右,在那个时代,基于工业的发展提出的人工智能概念,其目的应该还是围绕在工业工序中采用人工智能的方式如何取代传统的人工。随后人工智能这个概念在很长的一段时间内都没有人提及,以至于到今天,突然被人提及的时候,很多人感觉这是个新概念。

时代的划分

    中国的互联网发展目前大致可以分为三个阶段,第一个阶段就是非信息化时代;第二个阶段是互联网信息化时代,第三个阶段是移动互联网信息化时代。在第一个阶段,我们的社会形态都是比较传统的,无论是公司的商务运作还是买卖都是线下的;在第二个阶段,随着互联网的发展,modem上网,专线上网等,速度不断的提升,中国进入了互联网信息化时代,开始大量的企业探索进入电子商务时代(不是电商网站,而是公司的业务电子信息化),这个时代,已经开始精彩起来,各类门户网站,各类银行业务线上迁移。这个时期,用户的主要诉求在于获取更多信息,是国人对信息如饥似渴的一个年代,也是逐步消除信息不对称的时期。第三个阶段,就是我们现在所处的移动互联网时代,在这个时代,人们获取信息的方式和习惯也发生了改变,从PC进化到手机。

数据的应用

    在第一个阶段,数据的应用层面及其狭窄,没什么过多可以阐述的。大量数据以纸质单据的形式存在于各自业务主体的内部,如果需要进行统计或者挖掘的话,需要投入大量的人力进行纸质材料的筛查统计工作,不多赘述。

    到了第二阶段,数据的应用开始有了价值,因为互联网的发展,无纸化办公的发展,大量的数据被保存在服务器,存在数据库,此时也是数据体系的形成的时刻,无论是ERP,CRM,WMS,OMS等等系统,这些数据体系即便到了移动互联网时代,也依然被保留下来,但是在第二个阶段,数据的应用,更多的是“数据挖掘”。一些企业开始搭建自己的数据仓库,并且请专业的BI人员开始进行数据挖掘,希望从积累的数据中能挖掘出更大的价值。笔者经历并且参与过这些项目,就实际情况来看,很多公司的数据挖掘最终并没有能够为企业提供足够大的挖掘价值。

    第三个阶段,进入移动互联网时代,也是人工智能开始随着各种风口、概念被提及被鼓吹的年代。之所以会产生这样的结果,是因为在这个时代,大家普遍认同数据的价值,各种互联网公司也拼命的鼓吹或者拉高自己的所谓数据价值。这个时期,数据更加多元化,如果说以前的数据更多的是体现企业的经营效果,比如成本、盈利、毛利率、订单数、用户数等。但是到了移动互联网时代,还有诸如用户行为数据、用户消费数据、用户轨迹数据、用户分布数据、用户画像数据、等等。如此纷繁的数据就给了分析人员更多的维度进行各种分析,进行各种解读,并且进行各种不同的方向的迭代!

人工智能的前提

    前面谈到了数据以及各个时代的数据形态和应用,是想阐述一个观点,人工智能的前提就是数据。所以在数据不足够庞大的情况下,在第一个阶段,第二个阶段,人工智能的概念并没有得到过多的发展,反而是进入移动互联网第三个阶段的时候,大家开始畅想和谈论人工智能。且无论是否正确,至少说明大家都认为数据足够多的情况下,已经可以支撑大家来谈论人工智能。以及可以畅想基于数据的人工智能可以带来什么样的应用了。所以要做人工智能,有数据是首要的前提。

    有了数据就可以做人工智能了吗?或者说就可以做人工智能的应用了吗?答案是不一定。现在的很多互联网公司动辄就说自己拥有大数据,其实我很好奇也很想问他们一句,什么样的数据可以称之为大?我个人认为能够称之为大数据的Data必须有几个前提,从时间维度来说,数据的时间跨度要够长,但是多长才能算够长了呢?就要看数据的积累频次有多高?理论上来说,积累频次越高的数据,时间维度可以更小,而频次越高,时间也越长,这时数据就被放大很多倍。作为大数据来说更合理。举个例子,淘宝的购物频次+N年积累就是一个恐怖的大数据。(如果放开话题讨论,会牵涉到更多的层面,这里只想列举一些基本思路,暂不展开多说)。如果从数据的广度来说,指的是数据范围有多宽?举个例子,很多公司都在说用户画像,可是我们要精准的描述一个用户的画像,就不可能从一个单次的消费行为来进行定性,此时,我们需要很多的数据来进行辅证,比如说,购买的频次,购买的品类,喜欢关注的商品,商品的单价,一个月或者一段时间的消费总额等等。理论上来说,数据的种类越多,范围越广,才能提供多维度的数据分析,这个结果才越靠近真实。


    题外话:目前很流行的python语言,很多招聘python程序员的或者从事python的伙伴们都认为自己是在做人工智能,其实也是因为很多公司想和人工智能靠上边,但是苦于什么数据都没有,所以利用python的爬虫技术去各个网站上爬取相应的数据。丰富自己的所谓大数据,然后才好说自己是一家基于XX大数据的人工智能公司。


    有了大数据,对数据做一些分析就可以称为人工智能吗?人工智能的定义网上也有很多说法,我认为不管怎么定义,人工智能是人为的给机器赋予一些类人的智能,那么智能必然应该是可以学习并且通过学习自我进化并且提升的一种能力。如果没有这个能力,那么所谓智能就是一个噱头仅此而已。

所谓人工智能应用

    目前市场上各种所谓的人工智能的互联网公司,真的是人工智能吗?举一个例子来做说明。比如在人机对话领域,很多公司号称自己的机器能精准识别你的语言,并且和你进行对话交流。但是根据实际的测试结果来看,这些所谓智能不过只是一个数据的匹配查询而已,并非是一种真正的智能。具体流程就是根据语音识别你的问题转化为文字,然后根据文字在数据库进行匹配相应的答案,然后转换为语音播报出来。而一旦同一个问题,你换一种方式提问,很可能回答的问题就答非所问了。因为语音的识别和语义的识别完全就是两回事。

    所以目前我们能看到的大多数人工智能基本上都属于伪智能,各个场景的应用也都基本上是居于数据的分析然后进行数据的匹配。包括大家能看到的比如电商的精准推荐,猜你喜欢等等。

人工智能猜想

    机器的学习能力是一个复杂并且庞大的工程,涉及的部分包括对数据的学习,通过学习对自己的数据模型就行自我修正,自我提升的能力,包括现在提出的神经网络,也是模仿人的决策链条,将一个一个的决策点或者分析点变成神经元,通过一个一个的神经元彼此交互,达到智能的目的。

    人工智能的前提既然是数据,那么我们留下一个猜想,人的情感,情绪,感情,这些东西能否有一天也能数据化?如果真的可以达到,那么是不是有一天人工智能就会和人一样具备了情感,情绪和感情呢?会不会真的到达有一天科幻电影里的情节一样呢?完全说不可能也不一定,毕竟曾经不能数据化的一些东西,现在正在逐步被数据化,标准化。既然是猜想,不妨让我们放开想象。

总结

    人工智能目前正在各个领域,各个场景中被应用,虽然很多是伪智能,但是起码是一种应用的假设和体验以及一次尝试,人工智能的发展也必须有这些前人去踩坑去尝试。对于人工智能,我们应该理性看待,不被噱头所欺骗,也不因此而丧失信心。



    

你可能感兴趣的:(浅谈人工智能)