hadoop

Hadoop生态圈

HDFS:分布式文件系统
YARN:分布式资源调度系统
MAPREDUCE:分布式计算框架

HIVE:数据仓库工具 
HBASE:分布式海量数据库

ZOOKEEPER:分布式协调服务基础组件
MAHOUT:基于mapredue、spark、flink等分布式计算框架的机器学习算法库
OOZIE/AZKABAN:工作流调度平台
SQOOP:数据导入导出工具
FLUME:分布式日志采集框架
spark
storm

hadoop单机版的安装:

参考官网

运行实例:
mkdir input
cp $HADOOP_HOME/etc/hadoop/*.xml ./input
hadoop jar hadoop-mapreduce-examples-2.7.1.jar wordcount /root/input /root/output/00

2、pi
hadoop jar hadoop-mapreduce-examples-2.7.1.jar pi 5 5
3\九宫格
hadoop jar hadoop-mapreduce-examples-2.7.1.jar sudoku /sudoku/sudo.txt

SecondarySort  二次排序
hadoop jar hadoop-mapreduce-examples-2.7.1.jar secondarysort /root/input/ /root/output/out13

hadoop集群的安装步骤

你可能感兴趣的:(Hadoop,安装文档)