hadoop第一讲

一、 hadoop和hadoop的生态圈

二、 那大数据到底是什么?又为什么要学习它?

GFS --> google file sys
MapReduce
BigTable

解压安装包

配置环境变量

将配置hadoop的安装目录下的

HDFS -》hadoop distrbuted system 易于扩展分布式文件系统

YARN 集群资源统一管理

HDFS

  1. 存储容量大
  2. 自动快速的检测对应硬件错误
  3. 流式反问数据
  4. 移动计算比移动数据更划算
  5. 简单一致性模型
  6. 异构平台可移植

优点
高可靠性
高扩展性
高效性
高容错性

缺点

你可能感兴趣的:(hadoop第一讲)