讲到大数据人工智能不得不提起世界著名改变时代的工业革命。大数据人工智能是继蒸汽机,电力,信息互联网后的第四次技术革命。著名的工业革命详情如下:
第一次革命:18世纪60年代英国发起的蒸汽技术革命,以蒸汽机为代表。
第二次革命:19世纪中期,以欧洲国家,美国,日本发起的电力技术革命,以1866年德国西门子发明的发电机为代表。
第三次革命:20世纪四五十年代,世界各个国家发起的计算机及信息技术革命,以计算机,航天技术,原子能为代表。
第四次革命:21世界初,以大数据人工智能为代表的全新技术革命。2016年3月9日-15日阿尔法狗大战围棋大师李世石开始爆发。
好多人对于新技术完全不能理解,我简单谈谈我的个人理解,关系图如下:
首先大数据是人工智能的基础,没有数据就没有人工智能。只有通过海量的数据分析,利用才会实现人工智能。其次实现人工智能需要有机器学习,深度学习的高深莫测的技术。
机器学习:抵达AI目标的一条路径
机器学习就是用算法真正解析数据,不断学习,然后对世界中发生的事做出判断和预测。研究人员会用大量数据和算法“训练”机器,让机器学会如何执行任务。
深度学习:实现机器学习的技术
“人工神经网络(Artificial Neural Networks)”是另一种算法方法,神经网络(Neural Networks)的构想源自于我们对人类大脑的理解——神经元的彼此联系。
对于数据量庞大,普通架构很难或者说处理出来结果很慢。而我们需要快速高效的处理数据,对数据进行分析,得出有价值的结果。所以有了大数据技术,并且在离线和对数据实时处理上都有相关成熟技术。有待我们深入研究学习。
Hadoop:离线的复杂大数据处理,存储在硬盘上。
Spark:离线快速的大数据处理,存储在内存上。
spark streaming实时大数据处理。
Storm:在线的实时大数据处理,存储在内存是上。
MapReduce:分布式计算,对数据进行切割,计算,合并。(处理数据最核心的分布式计算框架)
HDFS:分布式存储。
Yarn:集群资源管理系统。
如上图可以看出来,分布式计算的核心框架MapReduce是分为map端 和reduce端。map端是对数据进行分割,reduce端是切割后的数据片进行合并,最终得到自己想要的结果。
Spark是开源的类Hadoop MapReduce的通用的并行计算框架,Spark基于map reduce算法实现的分布式计算,拥有Hadoop MapReduce所具有的优点;但自身还有一个优势:rdd(弹性分布式数据集)。
RDD 只读、可分区,这个数据集的全部或部分可以缓存在内存中,在多次计算间重用。 所谓弹性,是指内存不够时可以与磁盘进行交换。这涉及到了RDD的另一特性:内存计算,就是将数据保存到内存中。
Storm是自由开源的分布式实时计算系统,擅长处理海量数据,适用于数据实时处理而非批处理。
storm核心概念:
Nimbus:Storm集群主节点,负责资源分配和任务调度。我们提交任务和截止任务都是在Nimbus上操作的。一个Storm集群只有一个Nimbus节点。
Supervisor:Storm集群工作节点,接受Nimbus分配任务,管理所有Worker。
Worker:工作进程,每个工作进程中都有多个Task。
Task:任务,每个Spout和Bolt都是一个任务,每个任务都是一个线程。
Topology:计算拓扑,包含了应用程序的逻辑。
Stream:消息流,关键抽象,是没有边界的Tuple序列。
Spout:消息流的源头,Topology的消息生产者。
Bolt:消息处理单元,可以过滤、聚合、查询数据库。
Stream grouping:消息分发策略,一共6种,定义每个Bolt接受何种输入。
Reliability:可靠性,Storm保证每个Tuple都会被处理。
2016年6月8日上午9点,在江苏宿迁市曹集乡同庵村居委会首次使用。
2017年6月18日,京东配送机器人在中国人民大学顺利完成首单配送。
“城市大脑”可以通过大数据的分析,来了解车辆频繁地段。从而智能的控制红绿灯的长短时间。有效的提升通行速率,减少拥堵。还可以通过车辆的异常运行轨迹,自动分辨出事故现场,提升交警的出勤效率。基于阿里云的人脸鉴别技术,“城市大脑”还可以通过城市摄像头对人的体态进行分析,识别个体,从而防范肇事者逃离肇事现场,预防碰瓷者的碰瓷行为。
这个项目我们直接可以浏览观看的大数据实时项目。通过这个实时位置定位,我们可以很直观的实时看到世界人口分布。比如我们可以看到中国大部分人口分布在东部并且人口密度比较大,不愧是世界人口第一大国。其次印度,美国,印尼,巴西等国的人口也比较多,排名2,3,4,5也正常。还可以看到欧洲的大部分人分布在西欧,英国,德国,法国,意大利等发达国家都在那块。仔细一看,雄鸡嘴下那个轮廓像虫子的国家,面积不大,人口还不少,世界人口排名第十。其实这些结合现实一看,的确是那样。所以大数据真的很有魅力,能做出意想不到的好的产品。未来必然有一个好的发展。