环境是在vmware7下实现,操作系统是fedora14 (尼玛12、13都有试过,因为yum源的问题,好些rpm包都给自己找,伤不起..)
闲话少说,干活!
1、先保证你的yum源是最新可用的,这样可以省好多事,例如pax, patch, python-setuptools都会被CDH3组件依赖。
2、安装jdk, jre。 但对非RPM版本的不认,在安装CDH3的时候会提示缺少sun-java6。安装rpm包后可继续,但我想会有解决办法,如果哪位有答案请留言,万分感谢!
3、添加cloudera的yum源,当然你是专业的系统工程师且很有闲的话,也可以自己下在管理RPM包。如果不是,咱们赶时间吧!
sudo vim /etc/yum.repos.d/cloudera.repo
添加以下
[cloudera-cdh3u0]
name=Cloudera's Distribution for Hadoop
baseurl=http://cdh3u0.cloudera.com/redhat/cdh/3/
gpgkey = http://cdh3u0.cloudera.com/redhat/cdh/RPM-GPG-KEY-cloudera
gpgcheck = 1
cdh3u0似乎是现时最新的版本,我试过将cdh3u0改成archive,对比一下下载下来的rpm包的版本号,没有任何区别,但archive有次中断不可用,坑死爹了。
4、安装cdh3
sudo yum search hadoop
可以看到hadoop相关的软件包,这里暂时不表,安装之
sudo yum install hadoop-0.20
你也可以根据需求有选择安装hadoop的组件,例如:hadoop-0.20-namenode、 hadoop-0.20-jobtracker
一路yes,安装完毕。( 注:但我估计很多哥们都会有一些依赖的rpm包找不到的情况。先检讨一下自己的人品,然后去找一个最新的yum源或者人肉下载那些rpm包。)
5、安装ssh, 实现无密码登录
sudo yum -y install openssh
sudo service sshd start
sudo chkconfig --level 35 sshd on
# 配置无密码登录
ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa
cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys
chmod 600 ~/.ssh/authorized_keys
# 关闭防火墙
sudo service iptables stop
sudo chkconfig --level 35 iptables off
# 然后登录验证
ssh localhost
# 同理、将master的id_dsa.pub添入slave的authorized_keys
scp ~/.ssh/id_dsa.pub cdh@cdh3-slave1:/home/cdh
# 登录cdh3-slave1
cat ~/id_dsa.pub >> ~/.ssh/authorized_keys
chmod 600 ~/.ssh/authorized_keys
最后说明、安装完毕的只是cdh3的standalone模式,也就是单机模式(此外还有伪分布式模式,和分布式模式),单机下可以执行mapreduce任务,但没有启动hdfs的服务,切换模式需要使用CDH3的配置管理工具alternatives来进行conf切换,它最大的好处是轻松管理hadoop集群的配置。