众人拾柴火焰高,AI也需万人帮

AI,人工智能的简称。这个词已经被大多数人所熟悉了,所以,字面上的意思,在此就不赘述了。

在目前,人工智能的框架有很多,比如Tensorflow,PyTorch,Kears,MXnet,Caffe等。大多数的人工智能框架都是深度学习框架,然而深度学习只是人工智能的众多分支中的一个。除此之外,还有像Spark Mlib 等没有包含深度卷积神经网络,但有丰富的诸如SVM,随机森林等的机器学习框架。

虽然框架众多,有深度学习的,有机器学习的,还有强化学习的,也还有迁移学习的。但是这些纷繁复杂的学习算法,背后都需要2个最为基础的前提,它们分别是:

(1)分布式云计算

(2)数量足够的高质量数据

怎么更为形象的做一个说明呢?以便你能够更加清晰的理解其中的奥秘。

这样的理解很有可能让你豁然开朗:

首先,数量足够的高质量数据犹如成千上万本优质畅销书籍。AI的最终目的是需要从这些书籍中提取并学习到大部分关键的知识,以提升AI的认知水平。那么,问题来了,AI的能力有限,它在最初的时候,大脑的存储假设只有300G的大小,大脑CPU的计算能力十分有限,意味着AI的学习能力有限,如果要将人类迄今为止积累的上百万本有用的书籍知识存储,记忆并消化,AI此时便显得十分“心有余而力不足”。

问题出现了,终究是要去解决的,那么怎么解决呢?AI正如20世纪五六十年代那样,在寒冬之际,正苦恼着,冥思着。忽然,灵感出现了,它开始从“众人拾柴火焰高”这句富有哲理的灵感之中寻求解决方案,不久之后便确实有所突破,它将这上百万本书划分为一万个书架,每个书架上100本书。每个书架上对应有一人负责。总共有1万人一起协同负责阅读这百万本书籍。于是问题便得到解决了。

其实,在20世纪五六十年代,AI早已经有过“众人拾柴火焰高,AI也需万人帮”的解决方案,只是在那个年代,万人方案所需要的分布式技术还没有出世,同时,百万书籍所依赖的数字书籍,即所谓的大数据还没有足够的积累。

众人拾柴火焰高,AI也需万人帮,通常情况下,大多数的AI是分布式计算框架,Tensorflow,PyTorch,Kears,MXnet,Caffe,Spark等都是分布式云计算框架。

单台计算机的单机计算方式,其计算能力在大数据面前显得微不足道,最常见的情况是内存不足,程序卡死,即使有时能够计算出结果,但往往都是很多天之后的事情了。一台计算机不行,那就一万台计算机,一万台不行还可以灵活横向扩展,这总可以解决问题了吧,这确实能够解决大多数的问题,一般情况下,除此之外,还需要处理好这万台计算机之间的沟通和协作,正如一个大型企业内部上万名员工一般,如何分配任务,如何协调资源,解决好了这些类似的问题,AI的确能够高效的改善人类的各个方面。

同时,大数据所积累的数据越来越多,单机的存储也面临巨大的挑战,正如一只篮子的空间有限,无法容纳不断变多的水果。那么,一只篮子不够装,一万只篮子总够装了吧。这样能够解决大部分的问题,可是,如果水果不断增加,正如互联网产生的数据日益增多,从不间断怎么办?这个也简单,篮子也可以灵活增加呗,于是篮子也可以横向扩展,只需要哪个篮子装的什么水果,有专门的机构记录便万事大吉了。

总而言之,AI的整个生命周期绝对不是单打独斗的过程,它依然同大多数人类一样,需要协作,需要沟通,需要团结,既要有独立的能力,独立的思维,又要有互相的互赖的共赢思维。一个人如若做不成AI,不妨想想“众人拾柴火焰高,AI也需万人帮”。


众人拾柴火焰高,AI也需万人帮_第1张图片

你可能感兴趣的:(众人拾柴火焰高,AI也需万人帮)