Hadoop自动化运维之创建deb包

2014第一篇博文,将来也会逐步写成一个系列,新年新气象。


将hadoop及其周边生态系统deb/rpm化对于自动化运维来说意义重大,建立好整个生态的rpm和deb然后再创建本地yum或者apt的源,可大大简化hadoop的部署和运维。实际上,cloudera和hortonworks都是这么做的。


本来想把rpm和deb都写了,不过估计篇幅不够,还是分开吧,先从deb讲起。deb创建比较容易一些,不需要写什么spec脚本。


以hadoop 2.2.0为例,apache官方并不提供基于2.0的rpm和deb,所以我们自己想法去创建自己的修改过的rpm和deb。


一、先下载hadoop编译后的包,大概100多兆,然后解压缩

#wget http://mirrors.cnnic.cn/apache/hadoop/common/hadoop-2.2.0/hadoop-2.2.0.tar.gz
#tar zxf hadoop-2.2.0.tar.gz


二、创建打包需要的文件夹

#mkdir -p /opt/hadoop_2.2.0-1_amd64/DEBIAN
#mkdir -p /opt/hadoop_2.2.0-1_amd64/usr
#mkdir -p /opt/hadoop_2.2.0-1_amd64/etc

其中DEBIAN是放置打包脚本用的,usr和etc是将来打包后将会安装到的路径。最后打包完成后,这里的usr目录对应的就是未来linux系统里面的/usr目录,etc目录对应的就是linux系统的/etc目录。


三、将hadoop里面的东西复制到目的文件夹

第一步解压缩后的hadoop-2.2.0文件夹下应该有如下一些文件夹。

-bin

-etc

--|-hadoop

-sbin

-share

-lib

-libexec

-include

原始tar包里面的hadoop大概的文件夹结构大概是这样的。然后执行复制。

#tar zxf hadoop-2.2.0.tar.gz
#cd hadoop-2.2.0
#cp -rf bin sbin lib libexec share include /opt/hadoop_2.2.0-1_amd64/usr/
#cp -rf etc/hadoop /opt/hadoop_2.2.0-1_amd64/etc/


复制后的打包文件夹/opt/hadoop_2.2.0-1_amd64/目录结构应大致如下


-DEBIAN

-etc

--|-hadoop

-usr

--|-bin

--|-sbin

--|-include

--|-lib

--|-libexec

--|-share


然后开始编写DEBIAN文件夹下的控制文件,ubuntu和debian打包相对rpm简单一些,只需要写几个独立的脚本文件即可。


进入DEBIAN文件夹,先编辑元数据文件control

#cd /opt/hadoop_2.2.0-1_amd64/DEBIAN
#vi control

输入以下内容

Package: hadoop
Version: 2.2.0-GA
Section: misc
Priority: optional
Architecture: amd64
Provides: hadoop
Maintainer: Xianglei
Description: The Apache Hadoop project develops open-source software for reliable, scalable, distributed computing.


保存退出,然后编辑同目录下的conffile,用来监视安装后配置文件的变化,以在卸载的时候保留更改后的配置文件。

#vi /opt/hadoop_2.2.0-1_amd64/DEBIAN/conffile

输入以下内容

/etc/hadoop/core-site.xml
/etc/hadoop/hdfs-site.xml
/etc/hadoop/mapred-site.xml
/etc/hadoop/yarn-site.xml
/etc/hadoop/hadoop-env.sh
/etc/hadoop/yarn-env.sh


继续。还有四个控制文件需要编辑,分别是postinst安装后操作,postrm删除前操作,preinst安装前操作,prerm删除前操作,都是以脚本的形式来编写。放一起写。

#vi postinst
#------
mkdir -p /usr/etc
ln -s /etc/hadoop /usr/etc/hadoop
rm -f /etc/hadoop/hadoop
#------
#vi postrm
#------
/usr/sbin/userdel hdfs 2> /dev/null >/dev/null
/usr/sbin/userdel mapred 2> /dev/null >/dev/null
/usr/sbin/groupdel hadoop 2> /dev/null >dev/null
exit 0
#------
#vi preinst
#------
getent group hadoop 2>/dev/null >/dev/null || /usr/sbin/groupadd -g 123 -r hadoop
/usr/sbin/useradd --comment "Hadoop MapReduce" -u 202 --shell /bin/bash -M -r --groups hadoop --home /var/lib/hadoop/mapred mapred 2> /dev/null || :
/usr/sbin/useradd --comment "Hadoop HDFS" -u 201 --shell /bin/bash -M -r --groups hadoop --home /var/lib/hadoop/hdfs hdfs 2> /dev/null || :
#------
#vi prerm
#------
#不写内容,空即可
#------


这时候基本就完事了,当然,你还需要修改一下hadoop脚本里面的路径输出配置,以适应打包安装后的路径。这个就很简单了,没啥可说的了。


然后在shell里面执行

#cd /opt
#dpkg -b hadoop_2.2.0-1_amd64

然后你将会得到hadoop_2.2.0-1_amd64.deb安装包。用dpkg -i 命令安装试试吧。做饭吃去了,下一次说做apt源和rpm包的办法。


本文出自 “实践检验真理” 博客,谢绝转载!

你可能感兴趣的:(hadoop,运维,rpm,自动化,Deb,生态系统)