背景介绍:
公司有一台物理机:戴尔 R720
CPU: E5 2620 两颗CPU
内存:128G
硬盘:600G 两块,做RAID1 , 系统盘 。 2T 四块 做RAID5, 存储盘。
这台物理机安装了ESXI6.5 虚拟化平台,然后在此基础上,将一台物理机虚拟出多台服务器使用。
在某一天,机房断电之后,服务器的硬盘闪黄灯了。 就是做系统盘的那两块,同时报错。虚拟化平台启动失败。
如果,只是坏了其中一块硬盘,那么可以通过更换硬盘,在利用磁盘阵列恢复数据。但是两块同时坏,就不能恢复了。
这是在找了戴尔服务器销售方的技术人员的指导下操作后得出的结果。结论就是两块盘同时更换,必须得重装系统。
然后从另外一台R720的服务器上抽了两块硬盘,大小和型号是相同的。在戴尔技术人员的指导下对这两块硬盘做了RAID1设置。
然后就是安装系统。当时是安排另一个搞硬件的同事去做这件事,但那个同事是属于其他分公司的。在这台服务器上并没有他们公司的服务在运行。所以对这个事并不上心,一拖再拖, 而我所在的分公司却有使用这个服务器的必要。催促的电话一个接一个。所以,在忍无可忍的情况下,我决定自己动手了。
通过领导那里知道,这台服务器安装的虚拟化平台版本是ESXI6.5,
我本以为必须得先安装底层Windos或者Linux操作系统,然后再安装虚拟化平台,结果领导说,不用安装操作系统,直接安装ESXI.
然后去问百度,关于ESXI6.5和服务器的一些事情。之前没有接触过。完全不知道。
明白了大概的流程:
1.下载ESXI6.5镜像文件。
2.下载一个可以制作启动U盘的软件,比如 UltraISO
3. 拿一个U盘,备份好U盘的数据,格式化U盘,通过 UltraISO 将ESXI6.5镜像文件烧录到U盘制作为ESXI启动U盘。
4.修改服务器启动项,从U盘启动。
5.安装ESXI, 安装过程参考,也感谢这些先辈的贡献:
https://blog.csdn.net/jiuyou91/article/details/128112286
https://wenmayi.com/post/6883.html
下面说说过程中遇到的问题:
第一个:关于戴尔服务器BIOS设置U盘启动的问题:我按一般思路,进入BIOS之后,看到一个BIOS SET菜单,进入,看到有BIOS 模式项,一个是普通BIOS, 一个是UEFI,当前选中的是BIOS, 当时没怎么想,就去看BIOS队列了。结果进去之后发现,没看到我的PE盘。这跟普通电脑套路就不一样了。
我一度怀疑服务器没有认到PE盘,想重启服务器。在退出队列菜单后,看到那个UEFI模式时,我打算试一试,因为我知道PE盘就是靠UEFI模式启动电脑的。于是我把BIOS模式从BIOS改为了UEFI。其他地方没动,然后保存退出重启。系统启动之后就加载了我的ESXI启动盘。运气。
第二个:安装ESXI6.5过程中,遇到报错:说硬盘有其他分区,不能安装。然后百度之后,明白了,因为从其他服务器抽过来的两块硬盘在之前的服务器上是使用过的。有分区表信息。而ESXI要求硬盘是干净的。所以,又去拿了一个平时给电脑装系统的PE盘,插上进PE环境,对系统盘
做了格式化和删除分区的操作。这里说一说这个硬盘,服务器上的物理磁盘有6块,2块是600G的。4块2T的。600G的2块做了RAID1,4块2T做的是RAID5。所以,在PE环境下,用磁盘分区工具进去之后,只能看到两块物理盘。一块容量是580G,另一块是多少T来着,忘了。反正我猜到,580G那个磁盘就是我需要格式化和删除分区的盘,另一个磁盘千万不能动。因为里面放着的是之前虚拟机的数据。还得靠里面的数据恢复虚拟机。如果动了,那虚拟机恢复不了,一切都得重头开始搞,那工作量可就大了。在PE环境下,可以看到580G容量的磁盘下挂载了很多个分区。应该是之前服务器上使用时给划分的。而另一个磁盘下只有一个分区,提示未格式化,别管他。然后先对第一个磁盘的每个分区做格式化,删除分区,保存分区表信息。刚开始打开磁盘分区工具时,它有一个提示,说第一个磁盘下某个分区有地址溢出,应该是之前服务器使用时这两块硬盘还和其他硬盘之间有关联设置,比如做阵列等,现在单独抽离这两块硬盘引起的。问我要不要更正,我犹豫了一下,在看到弹出框下面有一行小字,说更正不会对磁盘进行格式化操作,要更正之后,再手动做格式化操作,我才放心。就怕它更正参数,把我另一块磁盘给更正了。最后,点了更正。一切顺利。
第三个:在把硬盘格式化并删除分区之后重启,然后在重启的过程中,我拔下PE盘,插上ESXI启动盘,系统就卡在了读取ESXI启动盘数据前的那个位置。
光标不闪动,键盘灯正常。第一次,我以为是插拔盘的时机不对,服务器没有加载到U盘,所以在久等无果后,我选择重启服务器,这个时候发现键盘软重启不行。只能对服务器做强制关机再开机。这次任然停留在上一次那个位置。我就想是不是U盘坏了。想用笔记本看看U盘是否正常。把U盘拔下来之后,服务器的启动进程就开始往下走了,因为没有找到UEFI的设备,当然提示没有找到之类的信息,都是英文,猜个大概的意思。 把U盘插入笔记本发现是正常的。然后就想,是不是刚刚格式化磁盘给弄错了。可是感觉不应该啊。我又把U盘插回去。神奇的事情就在这个时候发生了。服务器读到了ESXI启动盘数,正常进去ESXI加载界面了。这个没办法解释。
第四个:在ESXI安装过程中,会让我选择安装硬盘,在选择安装硬盘的界面,可以看见三个有空间的存储设备,一个是RAID1的系统盘,一个是RAID5的存储盘,另一个就是我的U盘。在这个界面上是看不到RAID1和RAID5这些信息的。只能通过容量去判断。这个界面中,在存储盘,也就是容量最大那块盘前面有一个*号,我一度认为这是选中标识。网上找的教程是用虚拟机来演示的,只有一块虚拟硬盘。所以看不出来效果。教程上说直接回车。我翻译了一下这个界面上的英文,它说带有*号的存储设备是带有VFM分区信息的。那就大概可以排除这个*号是选中标识的可能。真正标识选中的,应该就是黄色高亮行代表选中。然后回车表示确认。于是猛提一口气在黄色高亮行移动到580G那块盘上时,按下了回车键。事实证明没错。
第五个:在安装完ESXI之后。按教程进入配置IP环节。我这里记错了IP地址,把IP配置成了2.13,实际是3.12, 在我配置完成之后,用笔记本能ping通。但是WEB管理页面进不去,我以为是笔记本自身的问题,又回工位用台式电脑试了一下,仍然进不去。又回去机房重启了设备,还是进不去。但是能ping通。怀疑是ESXI自身的问题,或者是没激活的原因。但是想想,要激活,也应该是进去了WEB管理页面之后再激活吧。偶然间,发现服务器上贴着的标签上的IP。原来错了。机房有开了DHCP的防火墙,ESXI在安装完成之后,自动获取了IP的。我没注意看。然后把IP改回3.12 , 发现笔记本居然ping不通了。重启ESXI的网卡也一样,最后重启了服务器还是ping不通。就很郁闷。没道理啊。然后我用笔记本ping 3.12的网关不通。 怀疑网关错误,又换了一个3段的网关。还是ping不通。我才想起,ESXI是可以自动获取IP的。通过它自动获取IP地址,就能看到正确的网关。结果发现自己配置的网关并没有问题。于是就先暂时用它自动获取的IP地址,用笔记本ping不通。不死心,跑回工位用台式ping . 结果通了。我才反应过来,笔记本用的是无线网。是100网段的,和3段是不能互访的,有VLAN配置。这个坑货差点害死我。能ping通,然后用浏览器也可以进入WEB管理页面了。至于之前的2段,为什么能ping通但是却进不去WEB管理页面,猜测是IP冲突,有另一台服务器在使用2.13这个IP。至此。算是真正完成ESXI的安装了。
第六个:恢复虚拟机。在能登录WEB页面之后,剩下的事情就是通过存储盘的数据恢复虚拟机服务器了。当然又得问百度。这次,百度上没有找到很贴切的案列,https://www.abackup.com/enterprise-backup/vmware-restore-from-backup-666.html ,是在这个教程中找到的灵感。它说有各种备份还原。而我的情况是没有进行任何一种备份,系统盘换了。这种还能还原嘛。但是看见他说有一种是直接复制某某文件达到备份的目的,那就是说,所谓的备份是不需要特定程序导出特定格式的文件了,那我这原数据还在啊,于是我照着他说的在系统盘下新建了一个文件夹,然后去存储盘下找到我想恢复的虚拟机的文件夹,打算将里面他说到的两个文件复制到系统盘下新建的文件夹中。可是发现其中一个文件的大小居然是800G.我系统盘才580G,完全不能复制。我觉得恢复的可能性不大了。这时,我看到它说从新建的目录中选择要恢复的虚拟机。我想,既然都是从目录里面选择,那我就从存储盘下选择,不把它复制到系统盘下难道不行? 抱着试一试的态度,我就按着它说的步骤,只是在选择文件那个环节,我没有从系统盘下选择,而是直接去存储盘下选择对应的文件。
然后成功了。哈哈。。恢复,开启虚拟机。一切正常。
再说一说版本的问题,这台服务器没发生故障之前是装的ESXI6.5, 我在百度上也是按这个版本号找的。结果下载安装的时候才发现是6.7。 这也正常,网上的东西,都懂。问题就是这个兼容性。百度了一下,说是可以。就算不行,我再重装一个6.5就是了。而且按常理讲,一般都支持向后兼容的吧。结果也证明确实是向后兼容的。