proxmox集群故障处理 -中文版-剔除掉所有集群主机,让pve单独运行

首先 可以检查集群状态

pvecm status

可以看到
Error: Corosync config ‘/etc/pve/corosync.conf’ does not exist - is this node part of a cluster?
错误:Corosync config’/etc/pve/Corosync.conf’不存在-此节点是群集的一部分吗?

有可能是这样:
hp2# pvecm status
Quorum information

Date:             Mon Apr 20 12:30:13 2015
Quorum provider:  corosync_votequorum
Nodes:            4
Node ID:          0x00000001
Ring ID:          1/8
Quorate:          Yes

Votequorum information

Expected votes: 4
Highest expected: 4
Total votes: 4
Quorum: 3
Flags: Quorate

Membership information

    Nodeid      Votes Name
0x00000001          1 192.168.15.91
0x00000002          1 192.168.15.92 (local)
0x00000003          1 192.168.15.93
0x00000004          1 192.168.15.94


如果只希望使用所有节点的列表,请使用:
pvecm nodes


使分离的群集网络   添加回节点
将节点添加到具有独立群集网络的群集中时,需要使用link0参数设置该网络上的节点地址:

pvecm add IP-ADDRESS-CLUSTER -link0 LOCAL-IP-ADDRESS-LINK0


如果没得救了?

删除集群节点

登录到其他群集

首先查看主机列表
pvecm nodes

Membership information
Nodeid      Votes Name
     1          1 hp1 (local)
     2          1 hp2
     3          1 hp3
     4          1 hp4

关闭节点hp4的电源后,我们可以安全地将其从集群中删除(在集群主机上执行)。

pvecm delnode hp4

如果操作成功,则不返回任何输出,只需使用pvecm nodes或pvecm status再次检查节点列表。

*如果出于某种原因希望该服务器再次加入同一集群,则必须
从头开始在其上重新安装Proxmox VE
然后加入它,如上一节所述。
*删除节点后,其SSH指纹仍将驻留在其他节点的 known_hosts中。如果在重新加入具有相同IP或主机名的节点后收到SSH错误,请在重新添加的节点上运行一次pvecm updatecerts以更新其整个指纹群集。

在本地主机上分离:(一键命令版本)

systemctl stop pve-cluster #停止pve-cluster
systemctl stop corosync #停止corosync
pmxcfs -l #在本地模式下再次启动集群文件系统:
killall pmxcfs
systemctl start pve-cluster
pvecm expected 1 #设置投票权为7保证虚拟机先运行起来
rm /var/lib/corosync/* #此处删除旧群集中剩余的所有剩余文件

纯净命令版本

systemctl stop pve-cluster 
systemctl stop corosync 
pmxcfs -l 
killall pmxcfs
systemctl start pve-cluster
pvecm expected 1
rm /var/lib/corosync/* 

最后手动删除除了主机之外的节点文件: /etc/pve/nodes

适用于PVE5 ,6

参考自:
https://pve.proxmox.com/pve-docs/chapter-pvecm.html#pvecm_separate_node_without_reinstall

你可能感兴趣的:(proxmox)