转运维的兄弟分享一案例

 运维警示,因心跳超时,1节点被驱逐重启,随后各类资源正常随CRS启动正常。但由于1节点机器是NTP server端,经过长期以来的运行,LINUX内核时间和机器BIOS时间有个差值,且BIOS时间较慢一点,1节点重启LINUX内核时间丢失,系统初始化时LINUX内核读取BIOS时间,读到的时间较原来慢,产生了时间倒退,此时2节点工作正常,但作为NTP client端与NTP server端同步时间时,也被迫产生了时间倒退,两个节点的时间倒退引起了SCN和时间戳的对应关系混乱,数据库实例崩溃。
建议在ntp配置文件增加sync_hwclock=yes或用cron定时写入内核时间到bios避免该问题。

本来1节点重启后应该自动恢复的,却引起RAC两个实例都挂了。

由于LINUX的特性,内核时间的硬件时间是分开的,现在越来越多的X86平台,大家注意下。 

你可能感兴趣的:(oracle)