故障描述:
在做RHCE的nfs安全协议的时候,总是会出现这个错误提示
检查服务器的nfs-server,以及客户端的nfs-secure服务的状态都是正常的。
服务器的nfs-secure-server服务,在客户端执行mount -a 命令前是正常的。
当客户端执行mount -a 报错的时候,服务器的nfs-secure-server提示下面的错误
上面这个图片的意思就是GSS-API加密服务失败了。原因就是Clock skew too great,意思是因为您的几台服务器时间未同步,且相差巨大,所以krb5p协议通讯失败。需要检查一下各服务器主机的时钟是否同步。
或者是以下这种提示
Ticket expired 的意思就是票过期了,也是时间不同步导致的问题。需要检查一下各服务器主机的时钟是否同步。
1、在classroom、desktop0、server0等三台机器上面执行命令timedatectl status,查看各自的localtime及RTCtime是否一致,发现clssroom的RTCtime与其他两台服务器不一致,而localtime三台机器的时间一致。
2、通过命令执行来时间同步(手动):
在classroom的服务器里面执行,hwclock --systohc (表示系统时间同步到硬件时钟,系统时间放到硬件时钟里面),为保险可以在desktop0以及server0的服务器上面也同样的执行,hwclock --sysstohc。
2、依次关闭(必须使用shutdown命令)desktop0、sever0、classroom等三台服务器,再依次的开启classroom、server0、desktop0等三台服务器。这是因为RTC时钟必须在断电并在硬件系统启动后才能更新到与系统时间同步的状态。
3、执行mount -a 发现可以正常的加载/protected的目录了。
参照下面文章《CentOS 7 设置Kerberos 认证的NFS共享》中的设置时间同步的方法来进行解决。
RHCE 考试其中有一道题是需要配置kerberos 认证的nfs 文件共享,设置nfs共享比较简单,但是keberos服务器的设置虽然不在考点之内,确是需要完成这个实验搭建的重要一环,其实通过几天的资料查找和试验,我发现kerberos的搭建过程并不是很复杂,但是也遇到了一些让人抓耳挠腮的bug, 所以这里将整个过程跟大家分享一下,本文使用的OS版本为 RHEL 7.0, 有问题的地方也请批评指正。
试验的环境共有三台虚拟机构成,其名称和IP 配置如下:
1.安装软件
yum -y install krb5-server krb5-workstation
2.编辑 /etc/krb5.conf 文件, 取消注释所有行,并替换kdc, admin server的设置,这里用default realm EXAMPLE.COM , 最后配置文件如下:
[logging]
default = FILE:/var/log/krb5libs.log
kdc = FILE:/var/log/krb5kdc.log
admin_server = FILE:/var/log/kadmind.log
[libdefaults]
dns_lookup_realm = false
ticket_lifetime = 24h
renew_lifetime = 7d
forwardable = true
rdns = falsei
default_realm = EXAMPLE.COM
default_ccache_name = KEYRING:persistent:%{uid}
[realms]
EXAMPLE.COM = {
kdc = remote.example.com
admin_server = remote.example.com
}
[domain_realm]
.example.com = EXAMPLE.COM
example.com = EXAMPLE.COM
3.修改 /etc/hosts 文件
192.168.57.3 server.example.com remote192.168.57.2 remote.example.com server192.168.57.204 client.example.com client
4.修改 /var/kerberos/krb5kdc/kdc.conf 文件
由于我们使用default realm 所以无需修改此文件,若用另外的realm,需替换此文件中的EXAMPLE.COM
5. 运行命令以下命令创建数据库,并按照提示设置数据库密码
[root@remote ~]# kdb5_util create -s
Loading random data
Initializing database '/var/kerberos/krb5kdc/principal' for realm 'EXAMPLE.COM',
master key name 'K/[email protected]'
You will be prompted for the database Master Password.
It is important that you NOT FORGET this password.
Enter KDC database master key:
6.启动kerberos
systemctl start kerberos kadmin
systemctl enable kerberos kadmin
7.允许防火墙
firewall-cmd --permanent --add-service=kerberos
firewall-cmd --reload
8.运行kadmin.local 来管理kdc 并添加nfs server 和 client的 主机信息
Authenticating as principal root/[email protected] with password.
kadmin.local: addprinc -randkey host/server.example.com
WARNING: no policy specified for host/[email protected]; defaulting to no policy
Principal "host/[email protected]" created.
kadmin.local: addprinc -randkey host/client.example.com
WARNING: no policy specified for host/[email protected]; defaulting to no policy
Principal "host/[email protected]" created.
9.添加nfs server 和 client的 nfs 服务主机和客户端
WARNING: no policy specified for nfs/[email protected]; defaulting to no policy
Principal "nfs/[email protected]" created.
kadmin.local: addprinc -randkey nfs/client.example.com
WARNING: no policy specified for nfs/[email protected]; defaulting to no policy
Principal "nfs/[email protected]" created.
10.运行 listprincs 来检查kdc设置
K/[email protected]
host/[email protected]
host/[email protected]
kadmin/[email protected]
kadmin/[email protected]
kadmin/[email protected]
krbtgt/[email protected]
nfs/[email protected]
nfs/[email protected]
[root@remote ~]#
11.为服务器和客户端生成各自的秘钥文件,并保存在/tmp文件夹下, quit退出
kadmin
kadmin.local: ktadd -k /tmp/server.keytab nfs/server.example.com
[以下省略输出]
kadmin.local: ktadd -k /tmp/client.keytab nfs/client.example.com
[以下省略输出]
kadmin.local: quit
12.配置时间服务器
为了保证kerberos 认证能够进行,需要在三台设备统一时间, 现在设置kdc 为ntp server, 另外两台同步kdc的时间。
安装npt服务
yum -y install ntp
配置 npt服务 /etc/ntp.conf
第15行添加:
restrict 192.168.57.0 mask 255.255.255.0
21 行到26行,设置服务器为自己:
#server 0.rhel.pool.ntp.org iburst
#server 1.rhel.pool.ntp.org iburst
#server 2.rhel.pool.ntp.org iburst
#server 3.rhel.pool.ntp.org iburst
server 127.127.1.0
fudge 127.127.1.0 stratum 11
启动ntp并开机启动
systemctl restart ntpd
systemctl enable ntpd
1.安装软件
yum -y install nfs-utils krb5-workstation pam_krb5
2.编辑/etc/hosts文件,添加三台设备的dns信息
192.168.57.3 server.example.com remote
192.168.57.2 remote.example.com server
192.168.57.204 client.example.com client
3.从kdc服务器拷贝配置文件和keytab秘钥文件并保存在/etc目录下
scp remote:/etc/krb5.conf /etc/krb5.conf
scp remote:/tmp/server.keytab /etc/krb5.keytab
4.设立共享目录 /nfs1
mkdir /nfs1
5.编辑/etc/exports 文件如下
/nfs1 *.example.com(ro,sec=krb5p)
6.修改 /etc/sysconfig/nfs, 第13行的位置以下条目添加 -V 4.2
RPCNFSDARGS="-V 4.2"
7.开启nfs,nfs-secure并设为开机启动
systemctl restart nfs nfs-secure
systemctl enable nfs nfs-secure
8.设置防火墙
firewall-cmd --permanent --add-service=kerberos
firewall-cmd --reload
10.设置时间同步
安装chrony
yun -y install chrony
配置 /etc/chrony.conf
第3行到第7行 修改设置kdc为ntp服务器
#server 0.rhel.pool.ntp.org iburst
#server 1.rhel.pool.ntp.org iburst
#server 2.rhel.pool.ntp.org iburst
#server 3.rhel.pool.ntp.org iburst
server 192.168.57.2 iburst
启动/开机启动chronyd
systemctl restart chronyd
查看同步状态, 显示 NTP synchronized: yes 表示同步成功
时间同步肯能需要几分钟的时间,这里可能要等待以下。
timedatectl status
1.安装软件
yum -y install nfs-utils krb5-workstation pam_krb5
2.编辑/etc/hosts文件,添加三台设备的dns信息
192.168.57.3 server.example.com remote
192.168.57.2 remote.example.com server
192.168.57.204 client.example.com client
3.从kdc服务器拷贝配置文件和keytab秘钥文件并保存在/etc目录下
scp remote:/etc/krb5.conf /etc/krb5.conf
scp remote:/tmp/client.keytab /etc/krb5.keytab
4.创建挂载点/mnt/nfs1
mkdir /mnt/nfs1
5.编辑/etc/fstab 文件实现自动挂载
remote:/nfs1 /mnt/nfs1 nfs defaults,v4.2,sec=krb5p 0 0
6.启动 nfs-secure ,这里注意nfs-server这个服务不要启动,否则可能挂载不了
systemctl restart nfs-secure
7.设置时间同步
步骤同 NFS 服务器端设置 step 9
8. 挂载
mount -a
1.注意事项
防火墙的添加,建议三台虚拟机firewall添加kerberos, nfs服务
NFS server 端启用 nfs-secure 和nfs-server , 客户端只启用 nfs-secure
注意 /etc/hosts 文件的设置,三台虚拟机都需要设置且保障长名字在前面,例如 remote.example.com 在remote的前面
192.168.57.2 remoete.example.com remote
查看日志信息:
kdc 日志: /var/log/krb5kdc.log
nfs server和client的日志显示在: /var/log/messages
2.常见问题
(1)nfs client 报错: No such file or directory:
mount.nfs: mounting remote:/nfs1 failed, reason given by server: No such file or directory
Debug方法
确认/nfs1共享目录确实存在
修改nfs server的共享设置(/etc/exports)为如下
/nfs1 *(ro,sync,sec=krb5p)
重新mount 客户端,如果问题解决,可能是域名解析错误或此处填写错误。
(2)nfs client 报错: access denied:
mount.nfs: access denied by server while mounting remote:/nfs1
Debug方法
查看 NFS server端日志,若显示:
Aug 24 07:54:32 remote rpc.svcgssd[5833]: ERROR: GSS-API: error in handle_nullreq:
gss_accept_sec_context(): GSS_S_FAILURE (Unspecified GSS failure.
Minor code may provide more information) - Ticket not yet valid
或者
Aug 24 12:43:37 remote rpc.svcgssd[5833]: ERROR: GSS-API: error in handle_nullreq:
gss_accept_sec_context(): GSS_S_FAILURE (Unspecified GSS failure.
Minor code may provide more information) - Key table file ‘/etc/krb5.keytab’ not found
是由于NFS Server端的keytab文件有问题,请根据前文介绍重新拷贝keytab文件
(3)nfs client 报错: access denied 且nfs server端无报错:
mount.nfs: access denied by server while mounting remote:/nfs1
Debug方法
查看kdc服务器的日志 /var/log/krb5kdc.log
正常情况应有类似以下输出:
Aug 25 00:23:45 remote.example.com krb5kdc3464: TGS_REQ (6 etypes {18 17 16 23 25 26})
192.168.57.204: ISSUE: authtime 1535127825, etypes {rep=18 tkt=18 ses=18}, nfs/[email protected] for nfs/[email protected]
若出现 server unknown 或者 client unknown 等信息,请
(4)nfs client 报错: access denied 且nfs server端无报错并且kdc日志显示正常:
mount.nfs: access denied by server while mounting remote:/nfs1
这个Bug也是困扰了我三天的bug,确实很难Debug,尝试了各种方法仍找不到原因,因为原因出现在一个很容易被忽略的细节.
Debug方法
重命名NFS server端的keytab文件
mv /etc/krb5.keytab /etc/krb5.keytab.bak
这一步是强迫NFS server报错,无keytab文件,如果此时仍无报错(我遇到的情况),(最后才意识到)由于这个报错是由rpc.svcgssd 这个服务产生的,如上文所示。如果没有报错那原因是因为rpc.svcgssd 没有启动, 至于为什么没有启动我也没有弄清楚。进一步确认的话可以执行命令:
ps -aux | grep rpc.svcgssd
输出应该有以下一行:
root 5833 0.0 0.4 46752 4676 ? Ss Aug24 0:00 /usr/sbin/rpc.svcgssd
如果没有执行以下命令开启:
/usr/sbin/rpc.svcgssd
nfs客户端重新 mount, 这下应该可以从nfs server看到久违的报错信息了。