少见的hive集群时间不同步报错。

Diagnostic Messages for this Task:

Container launch failed for container_1603712387555_0006_02_000006 : org.apache.hadoop.yarn.exceptions.YarnException: Unauthorized request to start container.

This token is expired. current time is 1603727129103 found 1603726310194

Note: System times on machines may be out of sync. Check system time and time zones.

        at sun.reflect.NativeConstructorAccessorImpl.newInstance0(Native Method)

        at sun.reflect.NativeConstructorAccessorImpl.newInstance(NativeConstructorAccessorImpl.java:62)

        at sun.reflect.DelegatingConstructorAccessorImpl.newInstance(DelegatingConstructorAccessorImpl.java:45)

        at java.lang.reflect.Constructor.newInstance(Constructor.java:423)

        at org.apache.hadoop.yarn.api.records.impl.pb.SerializedExceptionPBImpl.instantiateExceptionImpl(SerializedExceptionPBImpl.java:171)

        at org.apache.hadoop.yarn.api.records.impl.pb.SerializedExceptionPBImpl.instantiateException(SerializedExceptionPBImpl.java:182)

        at org.apache.hadoop.yarn.api.records.impl.pb.SerializedExceptionPBImpl.deSerialize(SerializedExceptionPBImpl.java:106)

        at org.apache.hadoop.mapreduce.v2.app.launcher.ContainerLauncherImpl$Container.launch(ContainerLauncherImpl.java:163)

        at org.apache.hadoop.mapreduce.v2.app.launcher.ContainerLauncherImpl$EventProcessor.run(ContainerLauncherImpl.java:394)

        at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149)

        at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624)

        at java.lang.Thread.run(Thread.java:748)

FAILED: Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask


错误原因,集群时间不同步;

于是查看挨个查看 ,果然发现有一台时间不同步 


所以重新配置一下时间服务器 ,然后重启该节点


解决了集群时间同步问题1) 时间服务器配置(必须root用户)

  (1)在所有节点关闭ntp服务和自启动

sudo systemctl stop ntpd

sudo systemctl disable ntpd

  (2)在hadoop102上修改ntp配置文件(hadoop102为时间服务器)

sudo vim /etc/ntp.conf

修改内容如下

     (a)修改1(授权192.168.1.0-192.168.1.255网段上的所有机器可以从这台机器上查询和同步时间)

#restrict 192.168.1.0 mask 255.255.255.0 nomodify notrap

改为(去掉注释#)

restrict 192.168.1.0 mask 255.255.255.0 nomodify notrap

(b)修改2(集群在局域网中,不使用其他互联网上的时间)

server 0.centos.pool.ntp.org iburst

server 1.centos.pool.ntp.org iburst

server 2.centos.pool.ntp.org iburst

server 3.centos.pool.ntp.org iburst

改为(全部注释掉)

#server 0.centos.pool.ntp.org iburst

#server 1.centos.pool.ntp.org iburst

#server 2.centos.pool.ntp.org iburst

#server 3.centos.pool.ntp.org iburst

    (c)添加3(当该节点丢失网络连接,依然可以采用本地时间作为时间服务器为集群中的其他节点提供时间同步)

server 127.127.1.0

fudge 127.127.1.0 stratum 10

 (3)在102上修改/etc/sysconfig/ntpd 文件

vim /etc/sysconfig/ntpd

增加内容如下(让硬件时间与系统时间一起同步)

SYNC_HWCLOCK=yes

  Tips:

  系统时间: 一般说来就是我们执行 date命令看到的时间,linux系统下所有的时间调 用(除了直接访问硬件时间的命令)都是使用的这个时间。

  硬件时间: 主板上BIOS中的时间,由主板电池供电来维持运行,系统开机时要读取

                这个时间,并根据它来设定系统时间(注意:系统启动时根据硬件时间

    设定系统时间的过程可能存在时区换算,这要视具体的系统及相关设置而

                定)

 (4)在102重新启动ntpd服务

sudo systemctl start ntpd

 (5)在102设置ntpd服务开机启动

sudo systemctl enable ntpd

2) 其他机器配置(必须root用户)

 (1)在其他机器配置1分钟与时间服务器同步一次

sudo crontab -e

编写定时任务如下:

*/1 * * * * /usr/sbin/ntpdate hadoop102

 (2)修改任意机器时间

date -s "2017-9-11 11:11:11"

 (3)一分钟后查看机器是否与时间服务器同步

date

你可能感兴趣的:(少见的hive集群时间不同步报错。)