初识hadoop

google大数据技术:

MapReduce
BigTable
GFS

HDFS是Google File System(GFS)的开源实现。
MapReduce是Google MapReduce的开源实现。
HBase是Google BigTable的开源实现。

一、大数据相关技术

Hive 降低了使用hadoop的门槛

Hbase相比于传统的关系型数据库 放弃了事务特性,追求更高的扩展和HDFS 提供数据的随机读写和实时访问,实现对表数据的读写功能

zookeeper 监控hadoop集群的节点状态等

二、环境配置

hadoop使用java写的 需要jdk环境
输入:javac 查看java版本

安装jdk apt-get install jdk*

添加环境变量
修改/etc/profile

export JAVA_HOME=/usr/lib/jvm/java-7-openjdk-amd64
export JRE_HOME=/$JAVA_HOME/jre
export CLASSPATH=$JAVA_HOME/lib:$JRE_HOME/lib:$CLASSPATH
export PATH=$JAVA_HOME/bin:$JRE_HOME/bin:$PATH

source /etc/profile

wget命令用来获取hadoop的安装包

wget http://apache.stu.edu.tw/hadoop/common/hadoop-1.2.1/hadoop-1.2.1.tar.gz

修改配置文件
1、hadoop-env.sh 修改$JAVA_HOME
2、core.site,xml 修改配置

  

    hadoop.tmp.dir

    /hadoop

  

  

    dfs.name.dir

    /hadoop/name

  

  

    fs.default.name

    hdfs://localhost:9000

  

3、hdfs-site.xml 修改配置



dfs.data.dir

/hadoop/data


4、mapred-site.xml修改配置



mapred.job.tracker

localhost:9001


再次编辑/etc/profile

export JAVA_HOME=/usr/local/jdk1.8.0_60
export JRE_HOME=$JAVA_HOME/jre
export HADOOP_HOME=/home/server/hadoop/hadoop-1.2.1
export CLASSPATH=$JRE_HOME/lib:$JAVA_HOME/lib:$CLASSPATH
export PATH=$JAVA_HOME/bin:$JRE_HOME/bin:$HADOOP_HOME/bin:$PATH

source一下
输入hadoop生效如下
初识hadoop_第1张图片

发现有一个问题

    Warning: $HADOOP_HOME is deprecated.

解决办法:
/etc/profile 文件最后加上 export HADOOP_HOME_WARN_SUPPRESS=1 ,然后输入命令

    source /etc/profile

使其生效即可。

三、简单操作

格式化文件系统

hadoop namenode -format

格式化之后,输入启动命令:

/hadoop/bin$ sh start-all.sh 

启动后使用命令

jps

查看是否有以下的在运行程序
初识hadoop_第2张图片

忽略bootstrap这个进程

你可能感兴趣的:(hdfs,hadoop)