昨天豆子在做实验,给Hyper-V的集群和交换机添加了一个新的VLAN之后,打算将他作为指定的Live Migration通道,然后手贱,本来应该点击Live Migration,结果我点击的是quick migration,结果直接报错,网上的指导方案很简单,把整个集群 offline,然后点击repair修复即可。然后悲剧就发生了,offline之后,整个集群就完全死掉了,甭管怎么修复,都告诉我DNS有问题。


好吧,DNS有问题那我就重新手动创建了对应的记录,同时授权Full Control的权限,然后重启了主机,这次,DNS的报错没有了,就是告诉我集群名称没法注册。折腾了半天,终于在某论坛发现,这个是windows 2012的一个bug,貌似exchange 2013也有同样的问题,解决方案很简单:


在创建集群之前,手动在AD中创建集群的名字,然后disable掉即可。创建集群的时候,给予同样的名字,然后对应的DNS 记录会自动创建。


不要让集群自动创建AD的记录!

不要手动创建DNS的记录!


问题解决!


PS:

1.如何删除一个有问题的集群:


导出VM;

从集群删除VM;

集群的配置向导里面删除witness disk;

删除其余的集群共享硬盘;

删除集群;

在集群的每个节点服务器上运行以下powershell命令删除相关信息

import-module failovercluster

clear-clusternode


2.创建集群之前应该升级SAN的firmware,可以避免很多意想不到的奇怪问题(例如Live migration不稳定)