前辈的一些ESX使用经验

说到ESX, 我的体会是一般大型应用, 第一实用的就是VMOTION. 这个对服务器管理提供很大的方便. 象资源调整, 服务器维护. 说起来简单, 但是数据中心里的许多麻烦都是由此而来的.

DRS, 这个大家买的时候都是兴致勃勃的, 用了一阵以后就有一些疑虑. 如果用它的VM自动迁移功能. 迁移是在无人工监督的情形下发生的. 看你信不信的过了. 起码我们发现不少问题. 比如, 带SNAPSHOT的VM, 迁移后可能有问题. 我们是禁止在生产环境中使用SNAPSHOT的, 问题是我们使用了VCB做后备, 而VCB的后备过程要用到SNAPSHOT. 还有, 处于IO和NETWORK高峰期的VM如果VMOTION的话, 有可能, REBOOT, 蓝屏, 在VMDF文件中产生坏块. 这几个都是有用户报告过的问题. 我们自己就碰到过前两种. 也怀疑导致一台VM产生了坏块. 好在DRS可以设置为办自动模式, 它只给迁移提示, 不进行迁移. 我们一般是看提示后, 自己做迁移的决定. 比如你的VM1是ESX1上很忙的SQL, VC提示你将其迁移至ESX2, 我知道迁它有危险, 就在ESX1上找一些不太忙的VM, 将其迁到ESX2, 这样既平衡了负载, 也减少了风险.

HA, 工作不是很稳定. 有时无规律报错. 另外, HA靠心跳来检测ESX彼此之间的运行状态. 如果心跳出问题, 一个可能是ESX会误会另一ESX出故障, 试图启动原来在故障机上的VM. 而自以为被孤立的ESX则可能关闭自己的VM. 造成混乱.

HOUTONG建议ISCSI的不要跟SERVICE CONSOLE在同一链路上, 除了保障ISCSI的PERFORMANCE, 另一个意义也是不要影响管理数据流.

几年前遇到过一个例子, 由于HA(不是VMWARE的东西)的问题, 导致共4000多座席的多个呼叫中心断续故障两天. 至今心有余悸. 在我对ESX系统及网络有十分信心前, 选择先把它(HA)关闭, 呵呵. 没对人说...

你可能感兴趣的:(snapshot,esx,Vmotion,drs,vcb)