大数据人工智能Hadoop--初识Hadoop

1. 大数据,搞事情呢?哪里来的那么多数据?

先说段套话“我们生活在这个大数据爆炸的时代,电子设备中存储的数据总量很难预计。IDC曾经发布报告称,2013年数字世界项目统计得出全球数据总量为4.4ZB,预计在2020年将达到 44ZB.......”。 好了,现在我们来论论,1ZB到底多大?贫穷限制了我的想象力,知识的匮乏限制了我的思维。这个公式貌似是这样的:1ZB=1000EB=1000000PB=10亿Tb=10亿*1024GB=10的21次方个字节。“wow~~~”,“明白了吧?”,“还是不明白”,“不明白就算了,总之你只要知道很多数据就可以了。”

废话不多说了,切入正题。这么庞大的数据群体,目前世界上没有一块硬盘能够存储如此巨大的数据量。那么我们如何很好地处理这些海量数据呢?

2. Hadoop简介

Hadoop是一个由Apache基金会所开发的分布式系统基础架构。
用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。
  Hadoop实现了一个分布式文件系统(Hadoop Distributed File System)

你可能感兴趣的:(大数据人工智能,hadoop架构,hadoop优点,大数据,人工智能,hadoop)