什么是RAC集群。

1、集群环境的特殊问题

健忘症:这个问题发生在集群环境配置文件不是集中存放,而是每个节点都有一个本地副本。在集群正常运行时,用户可以在任何节点修改集群的配置,并且这个更改会自动同步到其他节点。但是考虑这样一种场景:两个节点的集群,节点1因为正常的维护需要被关闭,然后在节点2修改了某些配置,然后关闭节点2,启动节点1。因为之前在节点2做的配置修改没有同步到节点1,所以节点1启动后,它仍然是用旧的配置文件工作,这时就会造成配置丢失,也就是所谓的“健忘症”。

要想解决“健忘”问题,最简单的办法就是整个集群只有一份配置,各节点公用这份配置,无论在哪个节点修改配置,都是修改相同的配置文件,这样就是保证修改不会丢失。Oracle采用的方法就是把这个配置文件放在共享存储上,这个文件就是OCR Disk。
[root@racnode2 ~]# cat /etc/oracle/ocr.loc
ocrconfig_loc=+OCR_VOTE
local_only=FALSE

脑列:在集群里,节点间需要通过某种机制(心跳)了解彼此的健康状况,以确保各节点协调工作。假设只是“心跳”出现故障,但各个节点还在正常运行。这时,每个节点都认为其他节点宕机,自己是整个集群环境中的“唯一健在者”,自己应该获得整个集群的“控制权”。在集群环境中,存储设备都是共享的,这就意味着数据灾难,这样一种状况就是“脑列”。
Voting Disk这个文件主要用于记录节点中成员状态,在出现“脑列”时,仲裁哪个Parition获得集群的控制权,而其他Parition必须从集群中剔除。
[grid@racnode1 ~]$ crsctl query css votedisk
##  STATE    File Universal Id                File Name Disk group
--  -----    -----------------                --------- ---------
 1. ONLINE   660450b5dcce4f2dbff0710c018ee835 (/dev/raw/raw1) [OCR_VOTE]
 2. ONLINE   a1fe3ce9ee114f61bf35874d642db9b5 (/dev/raw/raw2) [OCR_VOTE]
 3. ONLINE   4831bafd23404fb2bf89c2825afb9dfa (/dev/raw/raw3) [OCR_VOTE]
找到了 3 个表决磁盘。

2、RAC集群

从逻辑上看,RAC集群由存储层、网络层、集群件层、应用层4层组成。

存储层:RAC是一个多实例、单数据库的系统。数据文件、联机日志、控制文件等文件在集群中只有一份。不管有几个节点,这些节点都平等的使用这些数据文件。
网络层:整个RAC环境中,实际有3个网络存在。一个是由public网卡接入的网络,用于对外提供数据查询等服务;另一个是由private网卡组成的私有网络,用于RAC心跳和cache fusion;第三个是存储设备、光纤交换机、每个节点的HBA卡组成的存储网络。前两个网络上面传输的是IP数据,而后一个网络传输的SCSI数据。
集群件层:在单机环境下,Oracle是运行在OS Kernel之上。OS Kernel负责管理硬件设备,并提供硬件访问接口。Oracle不会直接操作硬件,而是由OS Kernel代替它来完成对硬件的调用请求。到了集群环境下,存储设备是共享的。OS Kernel的设计都是针对单击的,只能控制单击上多个进程间的访问,如果还依赖OS Kernel的服务,就无法保证多个主机之间的协调工作。这时就需要引入额外的控制机制,在RAC中,这个机制就是位于Oracle和OS Kernel之间的Clusterware,它会在OS Kernel之前截获请求,然后和其他节点上Clusterware协商,最终完成上层的请求。
应用层:在介绍这一层时,需要先引入一个名词CRS Resource,整个应用层是由若干 CRS Resource组成的。可以简单的理解,一个Resource通常是一个进程,或者有一组进程组成的完整服务。集群环境之所以能够提供高可用性,是因为集群软件(CRS)对运行于其上的应用进行监视,并在发生异常时进行重启、切换等干预手段。


3、Clusterware和RAC的关系
在整个RAC集群中,实际有两个集群环境存在。一个是由Clusterware软件组成的集群,另一个是由Database组成的集群。其中Clusterware集群负责管理整个集群环境中的硬件资源,并为上层的Database就群提供基础服务。二者之间的关系非常类似于单机环境下应用程序和OS的关系。可以把这个Clusterware集群看作是OS Kernel,那么RAC就是其上的Database应用。或者可以这样说,Clusterware组成的集群把所有的节点虚拟成一个计算机,而RAC又把所有节点上的实例虚拟成一个实例。严格意义上说,RAC特指借组于“某种集群软件产品”搭建出来的一个“多实例、单一数据库”的环境。


4、Oracle RAC 组件

Oracle 集群件由“集群就绪服务”(CRS)使用“Oracle 集群注册表”(OCR)和表决磁盘(Voting Disk)进行管理,OCR 记录和维持集群及节点的成员资格信息,表决磁盘(Voting Disk)在通信故障时充当一个仲裁者(tiebreaker)。

Oracle 安装3 个包装器脚本:init.crsd、init.evmd 和init.cssd。CRS 有5 个组件:

CRSd:CRS守护进程(CRSd)。CRSd 的故障或终止可能导致节点故障,它会自动重启节点,以避免因为节点之间可能存在的通信故障而导致数据丢失。CRSd 在UNIX 平台中以超级用户root 身份运行。

  下面是CRS 的功能列表:
  ● CRS 是从一个名为GRID_HOME 的不同Oracle 主目录安装和运行的(在以前版本中称为ORA_CRS_HOME),它独立于ORACLE_HOME。
  ● CRSd 对资源进行管理,例如启动和停止应用程序资源的服务及故障转移。它生成独立的进程来管理应用程序资源。
  ● CRSd 在启动期间和关闭之后有两种运行模式。在计划内的集群件启动期间,它以reboot 模式启动。在计划外关闭之后,它以restart 模式启动。在reboot 模式中,CRSd 启动受其管理的所有资源。在restart 模式中,它保持原来的状态,并使资源返回关闭前的状态。
  ● CRS 管理Oracle 集群注册表(OCR),并将当前已知状态存储在OCR 中。
  ● CRS 在UNIX 中以root 身份运行,在Windows 上以LocalSystem 身份运行,在发生故障时会自动重新启动。
  ● CRS 需要公共接口、私有接口和虚拟IP(VIP)才能运行。在开始安装CRS 之前,公共和私有接口应当处于运行状态,而且能够相互执行ping 操作。没有这一网络基础设施,就不能安装CRS。

OCSSd:Oracle 集群同步服务守护进程(OCSSd)。OCSSd 的故障会导致计算机重新启动,OCSSd 以oracle 用户身份运行。

  下面的列表总结了OCSSd 的功能:
  ● CSS 提供基本的组服务支持。组服务是一种分布式组成员资格系统,它允许应用程序协调活动,以得出一个公共结果。
  ● 如果可以,那么组服务会使用供应商的集群件组服务。但是,即使没有集群件组服务可用,它也能够独立工作。
  ● 锁服务提供了基本的集群范围内序列化锁定功能。它使用先入先出(FIFO)机制来管理锁定。
  ● 节点服务使用OCR 来存储数据,并在重新配置期间更新信息。它还管理OCR 数据,这些OCR 数据在其他方面是静态的。

EVMd:事件卷管理器守护进程(EVMd)。evmd 进程的终止不会使实例停止。EVMd 以oracle 用户身份运行。

OPROCd:即进程监控器守护进程(OPROCd;在11g R2 版本中废弃)。“Oracle 进程监控器”守护进程(OPROCd)为Oracle 集群件提供了I/O 隔离(fencing)解决方案。

ONS:Oracle 通知服务(ONS)。只要集群资源的状态发生改变,每个集群节点上的ONS 进程就会相互通信,并交换高可用性事件信息。


可以使用以下命令手动启动、停止、启用和禁用Oracle 集群件(必须以超级用户角色运行这些命令):
crsctl stop crs # stops Oracle Clusterware
crsctl start crs # starts Oracle Clusterware
crsctl enable crs # enables Oracle Clusterware

crsctl disable crs # disables Oracle Clusterware


Oracle 在Oracle 11g R2 中引入了“Oracle 高可用性服务”守护进程(OHASd),它启动所有其他Oracle 集群件守护进程。在安装Oracle Grid Infrastructure 期间,Oracle 向/etc/inittab 文件中添加一项,如下所示:
h1:35:respawn:/etc/init.d/init.ohasd run >/dev/null 2>&1 /etc/inittab 文件执行带有run 参数的/etc/init.d/init.ohasd 控制脚本,它生成ohasd.bin可执行文件。集群控制文件的存储位置与11g R1 版本相同(/etc/oracle/scls_scr//root)。/etc/init.d/init.ohasd 控制脚本根据ohasdrun 集群控制文件的值启动OHASd。值restart 导致Oracle 使用$GRID_HOME/bin/ohasd restart 重新启动崩溃的OHASd。值stop指示OHASd 的计划内关机,而值reboot 则导致Oracle 用值restart 更新ohasdrun 文件,使Oracle 重新启动崩溃的OHASd。
放到上下文中来说,在Oracle 11g R2 以上版本中,OHASd 将启动所有其他集群件守护进程,并代替在11g R2 之前版本中用于启动集群件守护进程的init 脚本。一旦启动,OHASd 将启动守护进程资源,使用各自代理的守护进程资源将启动底层集群件代理。

你可能感兴趣的:(rac,集群,database,网络,oracle,存储,os)