大数据||分布式部署常遇到的问题及基准测试

启动yarn时报错

  • 异常信息


  • 错误原因
    在启动子节点(senior02,senior03)时读取slaves时报错。原因是slaves文件有问题。字符编码的问题。

  • 解决方法
    1、重新创建slaves文件并初始化。touch slaves
    2、重新分发slaves文件到主节点resourcemanager

scp -r etc/hadoop/slaves hadoop-senior02.beifeng.com:/opt/app/hadoop-2.5.0/etc/hadoop/

  • 测试是否可以正常解析


子节点无法启动或者停止

  • 异常信息


  • 错误原因
    没有在slaves中配置子节点。

  • 解决方法
    修改slaves文件,添加子节点域名

集群环境下HDFS上传put文件出错

  • 异常信息


  • 错误原因
    复制文件到子节点时无法正常连接132和133子节点。因为防火墙拦截了请求。

  • 解决办法
    关闭防火墙
    重启后生效
    开启: chkconfig iptables on
    关闭: chkconfig iptables off
    即时生效,重启后失效
    开启: service iptables start
    关闭: service iptables stop

yarn启动认证失败

  • 异常信息


  • 失败原因
    yarn启动的时候需要启动子节点,如果没有设置rsa秘钥认证就会报错。
    两个linux机器之间使用ssh不需要用户名和密码,采用了数字签名RSA或者DSA来完成这个操作

  • 解决办法
    1、在resourceManager主节点生成加密文件

ssh-keygen -t rsa

2、复制公钥到子节点(131、133)

命令:
131节点:ssh-copy-id hadoop-senior.beifeng.com
133节点:ssh-copy-id hadoop-senior.beifeng.com

  • 测试是否可以免密登入

测试命令:
131节点:ssh hadoop-senior.beifeng.com
133节点:ssh hadoop-senior03.beifeng.com


测试结果

基本测试

集成搭建完成后对个服务进行集成测试。服务是否启动,是否可用

  • hdfs
    读写操作

bin/hdfs dfs -mkdir
bin/hdfs dfs -put
bin/hdfs dfs -text

  • yarn
    run jar
  • mapreduce
    bin/yarn jar

基准测试

基准测试是测试集群的性能,

  • 针对hdfs来说 读数据和写数据。压读写速度,测试网络传播速度。测试hdsf的namenode可以管理多少元数据。

  • yarn map的增加或者减少

监控集群软件

  • cloudera Manager :辅助我们部署安装和监控集群、配置、同步、预警等。

你可能感兴趣的:(大数据||分布式部署常遇到的问题及基准测试)