Hadoop教程

目前在市场上的各种技术,从不同的供应商,包括亚马逊,IBM,微软等来处理大数据。尽管找到了处理大数据的技术,我们研究了以下两类技术:

操作大数据

这些包括像MongoDB系统,提供业务实时的能力,这里主要是数据捕获和存储互动工作。

NoSQL大数据系统的设计充分利用已经出现在过去的十年,而让大量的计算,以廉价,高效地运行新的云计算架构的优势。这使得运营大数据工作负载更容易管理,更便宜,更快的实现。

一些NoSQL系统可以提供深入了解基于使用最少的编码无需数据科学家和额外的基础架构的实时数据模式。

分析大数据

这些包括,如大规模并行处理(MPP)数据库系统和MapReduce提供用于回顾性和复杂的分析,可能触及大部分或全部数据的分析能力的系统。

MapReduce提供分析数据的基础上,MapReduce可以按比例增加从单个服务器向成千上万的高端和低端机的互补SQL提供的功能,这是系统的一种新方法。

这两个类技术是互补的,并经常一起部署。

操作与分析系统

 操作分析

等待时间1 ms - 100 ms1 min - 100 min

并发1000 - 100,0001 - 10

访问模式写入和读取读取

查询选择非选择性

数据范围操作回溯

最终用户顾客数据科学家

技术NoSQLMapReduce, MPP 数据库

大数据的挑战

大数据相关的主要挑战如下:

采集数据

策展

存储

搜索

分享

传输

分析

展示

为了实现上述挑战,企业通常需要企业级服务器的帮助。

要了解学习大数据的可以加群,群号: 834325294,群里有免费的学习资料和视频。

你可能感兴趣的:(Hadoop教程)