dhcp failover简配

简介



//建议仔细阅读manual手册

man dhcpd.conf

man 1 omshell

man 3 dhcpdctl  

//内容很丰富……

DHCP FAILOVER
      This  version of the ISC DHCP server supports the DHCP failover protocol as documented in draft-ietf-dhc-failover-07.txt.   This is not a final protocol
      document, and we have not done interoperability testing with other vendors’ implementations of this protocol, so you must not assume that this implemen-
      tation  conforms  to the standard. If you wish to use the failover protocol, make sure that both failover peers are running the same version of the ISC
      DHCP server.


      The failover protocol allows two DHCP servers (and no more than two) to share a common address pool.   Each server will have about half of the available
      IP  addresses  in  the pool at any given time for allocation.   If one server fails, the other server will continue to renew leases out of the pool, and
      will allocate new addresses out of the roughly half of available addresses that it had when communications with the other server were lost.

      It is possible during a prolonged failure to tell the remaining server that the other server is down, in which case  the  remaining  server  will  (over
      time)  reclaim  all  the  addresses the other server had available for allocation, and begin to reuse them.   This is called putting the server into the
      PARTNER-DOWN state.

      You can put the server into the PARTNER-DOWN state either by using the omshell (1) command or by stopping the server, editing the last peer state decla-
      ration in the lease file, and restarting the server.   If you use this last method, be sure to leave the date and time of the start of the state blank:

      failover peer name state {
      my state partner-down;
      peer state state at date;
      }

      When  the other server comes back online, it should automatically detect that it has been offline and request a complete update from the server that was
      running in the PARTNER-DOWN state, and then both servers will resume processing together.

      It is possible to get into a dangerous situation: if you put one server into the PARTNER-DOWN state, and then *that* server goes  down,  and  the  other
      server  comes  back up, the other server will not know that the first server was in the PARTNER-DOWN state, and may issue addresses previously issued by
      the other server to different clients, resulting in IP address conflicts.   Before putting a server into PARTNER-DOWN state, therefore, make  sure  that
      the other server will not restart automatically.

      The  failover protocol defines a primary server role and a secondary server role.   There are some differences in how primaries and secondaries act, but
      most of the differences simply have to do with providing a way for each peer to behave in the opposite way from the other.   So one server must be  con-
      figured as primary, and the other must be configured as secondary, and it doesn’t matter too much which one is which.

。。。

简单实验

primary

192.168.233.2/dhcpd.conf


  1. Ddns-update-style interim;  

  2. ignore client-updates;  

  3. default-lease-time 3600;  

  4. max-lease-time 43200;  

  5. failover peer "myfailover"{  

  6.        primary;  

  7.        address 192.168.233.2;  

  8.        port 647;  

  9.        peer address 192.168.233.3;  

  10.        peer port 647;  

  11.        max-response-delay 30;  

  12.        max-unacked-updates 10;  

  13.        load balance max seconds 3;  

  14.        mclt 1800;  

  15.        split 20;  

  16.        }  

  17. shared-network vlan{  

  18.        subnet 192.168.233.0 netmask 255.255.255.0 {  

  19.                default-lease-time 720;  

  20.                max-lease-time 8640;  

  21.                pool {  

  22.                        failover peer "myfailover";  

  23.                        range 192.168.233.210 192.168.233.250;  

  24.                        option routers 192.168.233.1;  

  25.                        option subnet-mask 255.255.255.0;  

  26.                        option broadcast-address 192.168.233.255;  

  27.                        option domain-name-servers 8.8.8.8;  

  28.                        }  

  29.                }  

  30.        }  


secondary

192.168.233.3/dhcpd.conf


  1. Ddns-update-style interim;  

  2. ignore client-updates;  

  3. default-lease-time 3600;  

  4. max-lease-time 43200;  

  5. failover peer "myfailover" {  

  6.        secondary;  

  7.        address 192.168.233.3;  

  8.        port 647;  

  9.        peer address 192.168.233.2;  

  10.        peer port 647;  

  11.        max-response-delay 30;  

  12.        max-unacked-updates 10;  

  13.        load balance max seconds 3;  

  14. }  

  15. shared-network vlan{  

  16.        subnet 192.168.233.0 netmask 255.255.255.0 {  

  17.                default-lease-time 720;  

  18.                max-lease-time 8640;  

  19.                pool {  

  20.                        failover peer "myfailover";  

  21.                        range 192.168.233.210 192.168.233.250;  

  22.                        option routers 192.168.233.1;  

  23.                        option subnet-mask 255.255.255.0;  

  24.                        option broadcast-address 192.168.233.255;  

  25.                        option domain-name-servers 8.8.8.8;  

  26.                        }  

  27.                }  

  28.        }  

简单结果


  1. [root@svn 192.168.233.2]# lsof -i:67,647  

  2. COMMAND  PID  USER   FD   TYPE DEVICE SIZE/OFF NODE NAME  

  3. dhcpd   1865 dhcpd    7u  IPv4  11964      0t0  UDP *:bootps  

  4. dhcpd   1865 dhcpd    8u  IPv4  11965      0t0  TCP 192.168.233.2:56299->192.168.233.3:dhcp-failover (ESTABLISHED)  

  5. dhcpd   1865 dhcpd    9u  IPv4  11966      0t0  TCP 192.168.233.2:dhcp-failover (LISTEN)  

stop主DHCP服务器之后,在客户端"dhclient -r", 然后"dhclient"再试一下……

测试很重要,想怎么测试都行……尽量满足自己的想法!

其他

目前只是简单实现了failover的内容,另外,如果条件有限,需要用虚拟机实验的话,可以考虑vmware的host-only网卡模式,主要要关闭物理机防火墙!最好关闭

SELinux和ipables(如果不太熟悉的话)!

之后的进一步处理还有很多,如omshell的利用,以及dhcpctl程序的编写,以便更灵活地管理DHCP服务器……


转载一篇不错的文章

Linux下DHCP服务器的灾难备份


概述

动态主机设置协议 (DHCP) 用于为用户提供网络参数配置,其最重要的功能就是动态分配 IP 地址。作为一种核心的网络服务,要求其具有高鲁棒性,高灵活性,简单说就是具有冗余备份功能。传统的简单冗余实现,往往会带来 IP 地址空间不足,无法实现在线切换等问题。目前由 ISC (Internet Software Consortium) 提供的开源 DHCP 软件实现了 Failover( 灾难备份 ) 的功能 , 很好地解决了传统方法带来的问题,在业界得到广泛地应用,特别是 Linux 平台,很早就采用了该实现方法。但实践中由于客户对该功能的理解不够深入,影响了工程中使用,本文归纳了灾难备份中的几个主要概念:服务器状态机转移,IP 地址绑定状态的变更等 , 着重对灾备的原理进行详细介绍 , 有利于用户在工程中充分发挥灾备的强大功能,另外在文末也给出了灾备的简单配置。本文作者参与了 ISC DHCP 在 IBM 平台上的开发和测试工作,希望能够通过本文给读者一定的帮助。

灾备中DHCP服务器的状态机切换

IETF 的 draft-ietf-dhc-failover-07.txt 文档中描述了 DHCP 灾备协议,ISC DHCP 4.1 服务器对这一协议进行了实现,它允许两台服务器共享公共地址池,每个服务器可以分配地址池中一半的地址,这时候我们说两个服务器都处于 NOMAL 状态下。如果其中一台服务器 S1 出现故障,虽然两台机子的通信失败,但另外一台 S2 的 DHCP 服务不会有任何影响,他可以响应已分配地址客户端的 renew 消息,也可以接收新客户端的 discovery 消息,然后基于自己管理的一半地址池,分配给他们可用的地址,这种情况下 S2 会自动切换到 COMMUNICATION-INTERRUPTED 状态。

如果故障服务器 S1 长期无法恢复,我们就需要将 S1 宕机的消息告知 S2(通常是向 S2 发送 omshell 外部命令), 这时候 S2 会等待一个安全期(由配置文件中的 MCLT 定义),保证 S1 服务的 IP 地址都已过期,然后 S2 将会回收先前由 S1 管理的另外一半地址池,对整个地址池进行管理和分配,同时 S2 会自动切换到 PARTNER-DOWN 状态。之后当 S1 恢复时,它会自动检测网络,与 S1 进行通信,然后向 S1 发出同步地址数据库的请求,等同步完成后,两个服务器就会像以前一样各自管理一半的地址池,自动进入 NORMAL 状态。

总之,NORMAL, COMMUNICATION-INTERRUPTED, PARTNER-DOWN 是 DHCP 灾备机制中的三种主要状态机,事实上,灾备切换是一个复杂的过程,其中还包含很多中间状态,比如,RECOVER 状态、RECOVER-DONE 状态、 POTENTIAL-CONFLICT 状态,等等。下图是灾备中主要状态机的切换。

  NORMAL状态下的DHCP服务操作:当 DHCP 服务器处于 NORMAL 状态时,每个服务器都会响应所有的 DISCOVERY 消息,响应来至于自己已分配地址客户端的 REQUEST 消息(REQUEST/RENEWAL 和 REQUEST/REBINDING 除外),而对于地址池中任何客户端的 REQUEST/RENEWAL 和 REQUEST/REBINDING 消息,每个服务器都可以响应。另外,一个服务器 S1 对客户端的消息响应可能会引起其地址数据库的数据更新,比如新分配了地址,时间戳发生变化,或客户端地址过期,这时 S1 会将更新消息(BNDUPD)及更新内容发送给它的 PARTNER 服务器 S2,S2 完成对自己的地址数据库更新后,会向 S1 回复消息(BNDACK);

 COMMUNICATIONS-INTERRUPTED 状态下的DHCP服务操作:当两个服务器处于 COMMUNICATIONS-INTERRUPTED 状态下时,每个服务器都独立地提供 DHCP 服务,而并不假定 PARTNER 服务器已经宕机。事实上,它的 PARTNER 服务器也许工作正常只是通信发生了问题,或者是真的不工作了。在这样的情形下,每个服务器都会响应来自任意客户端的请求消息,而当它们之间的通信恢复后,双方服务器会自动地进行一个地址数据库的同步整合操作;

 PARTNER-DOWN状态下的DHCP服务操作:当一个服务器处于 COMMUNICATIONS-INTERRUPTED 状态下时,该服务器假定它的 PARTNER 处于宕机状态,并基于整个地址池为所有的 DHCP 客户端提供服务。


DHCP地址数据库中的IP地址的状态切换

大多数 DHCP 服务器中,一个 IP 地址能呈现多种状态。灾备工作模式下,对于管辖范围内的所有 IP, 一个服务器和它的 PARTNER 需要共同维护了一份信息一致的地址池数据库,因此在两个服务器之间会进行很多的数据同步工作。一个服务器 S1 的任何地址状态发生变化,比如租约更新,地址过期,地址释放等,都需要 PARTNER S2 同步变化,具体的流程是:S1 将更新消息(BNDUPD)发送到 S2,S2 根据消息对数据库进行相应的更新,完成后再向 S1 回复确认消息(BNDACK)。以下是主要地址状态机的简介以及状态机切换。

   ACTIVE�C 客户端已经获取了该 IP 的租约。

   EXPIRED�C 意味着该 IP 的租约已经过期。在这种状态下,服务器会向 PARTNER 发送更新信息,当收到 PARTNER 端的确认消息(BNDACK)后,服务器把该 IP 的状态进一步置为 FREE,这样就可以对它重新分配了。

   RELEASED�C 意味着客户端向服务器发送了 DHCPRELEASE 的消息。在这种状态下,服务器会向 PARTNER 发送更新信息,当收到 PARTNER 端的更新确认消息(BNDACK)后,服务器把该 IP 的状态进一步置为 FREE。

   FREE�C 当 DHCP 服务器通过 ICMP 探测到某 IP 地址未被使用,并且也不是刚刚被释放或过期的地址,它就将该 IP 设置为 FREE,然后向 PARTNER 发送同步请求,这样该 IP 就可以重新分配了。(注意:如果在 PARTNER-DOWN 状态下,需要等待 MCLT (Maximum Client Lead Time, 该延迟确保其 PARTNER 上维护的地址租约已经过期 ),然后将其 PARTNER 所维护的地址置为 FREE)。

(1) DHCP 服务器处于 PARTNER-DOWN 状态,并且经过了 MCLT 延迟,这时服务器将自动管理整个地址池的 IP,并把把先前由其 PARTNER 维护的地址置为 FREE 状态。


灾备的配置

配置灾备时,我们需要定义 peer, peer 的定义包含灾备协议所需的参数,同时也需要在实施灾备的 pool 中定义 peer 的引用,pool 的定义和使用如下所示:


  1. pool {  

  2. failover peer "foo";  

  3. pool specific parameters  

  4. };  


我们在 DHCP 服务器的配置文件(dhcpd.conf)中进行灾备配置,以下给出了一个基本的例子:


  1. failover peer "foo" {  

  2. /* 是主服务器还是辅助服务器 */  

  3. primary/secondary;      

  4. address 192.168.1.1/vanilla.cn.ibm.com;  

  5. port 519;  

  6.   /* PARTNER 服务器的 IP 或者 FQDN 名字 */  

  7. peer address 192.168.2.1/d60b85ae.cn.ibm.com;  

  8.   /* PARTNER 服务器的端口 */  

  9. peer port 520;        

  10. /* 认定服务器间连接失败的最大时间延迟 */  

  11. max-response-delay 60;      

  12. /* 在未收到 PARTNER 回复时,BNDUPD 消息的最多重发次数 */  

  13. max-unacked-updates 10;  

  14. /* Maximum Client Lead Time. 在灾备方案中,该时间延迟保证 PARTNER 上的 IP 租约已经过期。  

  15. 该参数只能定义在主服务器中。*/  

  16. mclt 3600;  

  17. /* 主辅服务器的地址分割,通常是各一半 */                          

  18. split 128;    

  19. /* 关于负载均衡的参数 */                        

  20. load balance max seconds 3;          

  21.  }  


以下是一个具体的灾备配置例子:

On Primary server:


  1. failover peer "myfailover" {  

  2.  primary; # declare this to be the primary server  

  3.  address 192.168.1.1;  

  4.  port 647;  

  5.  peer address 192.168.1.2;  

  6.  peer port 647;  

  7.  max-response-delay 30;  

  8.  max-unacked-updates 10;  

  9.  load balance max seconds 3;  

  10.  mclt 1800;  

  11.  split 128;  

  12. }  

  13. subnet 192.168.2.0 netmask 255.255.255.0  

  14. {  

  15.   pool {  

  16.      failover peer "myfailover";  

  17.      range 192.168.2.0 192.168.2.255;  

  18.   }  

  19. }  


On Secondary server:


  1. failover peer "myfailover" {  

  2.  secondary; # declare this to be the secondary server  

  3.  address 192.168.1.2;  

  4.  port 647;  

  5.  peer address 192.168.1.1;  

  6.  peer port 647;  

  7.  max-response-delay 30;  

  8.  max-unacked-updates 10;  

  9.  load balance max seconds 3;  

  10. }  

  11. subnet 192.168.2.0 netmask 255.255.255.0  

  12. {  

  13.   pool {  

  14.      failover peer "myfailover";  

  15.      range 192.168.2.0 192.168.2.255;  

  16.   }  

  17. }  


这样 primary server 和 secondary server 组成了一对 failover peer,其地址分别为 192.168.1.1 和 192.168.1.2,它们共同管理子网 192.168.2.0 的地址分配,由于 split 参数是 128,两个服务器各自负责一半的地址分配,primary server 管理 192.168.2.0~192.168.2.127 网段,secondary server 管理 192.168.2.128~192.168.2.255 网段。Normal 状态下,二者独立负责自己所辖的地址段,响应所有的 DHCP 消息,通过相互通信进行地址数据库信息更新,维护一致的地址池状态,当某个服务器 failover 时,另外一个将自动承担起整个 192.168.2.0~192.168.2.127 网段的分配管理工作,而当 failover 服务器重新恢复时,二者会进行一个地址数据库的同步,然后继续共同管理子网 192.168.2.0。整个过程都是系统自动切换,不需任何人工干预,对用户的网络使用不会造成任何影响。

结论

DHCP 服务器的灾备有效地保证了用户网络的稳定性,减少了网络的人工干预,减轻了网络管理员的负担,提高了 IP 资源的使用效率,将会得到更广泛地应用。

。。。。。。。。。。。。。。。。。。。。。。。。。。。

Be patient!Lin-credible!!

。。。。。。。。。。。。。。。。。。。。。。。。。。。


你可能感兴趣的:(linux,DHCP)