hadoop作业

作业要求:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/3223

 

 

 

一、准备一个ubantu 系统

hadoop作业_第1张图片

 

二、创建hadoop用户

 

创建

 

设密码

 

加入sudo权限

 

三、安装MySQL

更新软件资源库

hadoop作业_第2张图片

 

 

 安装mysql

hadoop作业_第3张图片

 

 

开启mysql服务

 

 

 

四、安装java环境

 

下载jdk

hadoop作业_第4张图片

 

配置环境变量

 

 

检验环境变量

hadoop作业_第5张图片

 

 

五、window使用xshell传文件到ubuntu

 

安装ssh

hadoop作业_第6张图片

 

 

启动ssh和验证是否可以远程登录

hadoop作业_第7张图片

 

 

生成密匙

hadoop作业_第8张图片

 

 配置ssh无密码登录

 

 window安装xsehll6

hadoop作业_第9张图片

 

 

点击文件-->新建,输入Ubuntu的ip

hadoop作业_第10张图片

 

 

 连接成功后,点击图中工具栏绿色按钮

hadoop作业_第11张图片

 

 点击取消

hadoop作业_第12张图片

 

 

弹出一个新会话

hadoop作业_第13张图片

 

 把文件拖动到新建会话黑色界面中就可传到Ubuntu。。

hadoop作业_第14张图片

 

 

 

 

 

六、安装hadoop

 

解压

hadoop作业_第15张图片

 

 移动文件到 /usr/local目录

hadoop作业_第16张图片

 

 重命名文件夹

hadoop作业_第17张图片

 

 修改文件夹权限

 

 检查hadoop是否可用

hadoop作业_第18张图片

 

 

七、运行单机模式

 运行grep例子

 

 运行结果

 

 

八、运行伪分布模式

配置文件参考:https://www.cnblogs.com/MissDu/p/8831525.html

 

 修改文件

 hadoop作业_第19张图片

 

core-site.xml文件

hadoop作业_第20张图片

 

hdfs-site.xml文件

 hadoop作业_第21张图片

 

格式化NameNode

 

开启NameNode和DataNode失败,但是JAVA_HOME已经配置了

hadoop作业_第22张图片

 

 在网上找到原因,需要修改hadoop-env.sh文件

 hadoop作业_第23张图片

 

 

 

开启NameNode和DataNode成功

hadoop作业_第24张图片

 

检测是否开启成功,成功则会出现下面进程

 

 

伪分布运行实例

hadoop作业_第25张图片

 

运行结果

 

 可把hdfs的output文件夹复制到本地

hadoop作业_第26张图片

 

你可能感兴趣的:(hadoop作业)