说到ESX, 我的体会是一般大型应用, 第一实用的就是VMOTION. 这个对服务器管理提供很大的方便. 象资源调整, 服务器维护. 说起来简单, 但是数据中心里的许多麻烦都是由此而来的.
DRS, 这个大家买的时候都是兴致勃勃的, 用了一阵以后就有一些疑虑. 如果用它的VM自动迁移功能. 迁移是在无人工监督的情形下发生的. 看你信不信的过了. 起码我们发现不少问题. 比如, 带SNAPSHOT的VM, 迁移后可能有问题. 我们是禁止在生产环境中使用SNAPSHOT的, 问题是我们使用了VCB做后备, 而VCB的后备过程要用到SNAPSHOT. 还有, 处于IO和NETWORK高峰期的VM如果VMOTION的话, 有可能, REBOOT, 蓝屏, 在VMDF文件中产生坏块. 这几个都是有用户报告过的问题. 我们自己就碰到过前两种. 也怀疑导致一台VM产生了坏块. 好在DRS可以设置为办自动模式, 它只给迁移提示, 不进行迁移. 我们一般是看提示后, 自己做迁移的决定. 比如你的VM1是ESX1上很忙的SQL, VC提示你将其迁移至ESX2, 我知道迁它有危险, 就在ESX1上找一些不太忙的VM, 将其迁到ESX2, 这样既平衡了负载, 也减少了风险.
HA, 工作不是很稳定. 有时无规律报错. 另外, HA靠心跳来检测ESX彼此之间的运行状态. 如果心跳出问题, 一个可能是ESX会误会另一ESX出故障, 试图启动原来在故障机上的VM. 而自以为被孤立的ESX则可能关闭自己的VM. 造成混乱.
HOUTONG建议ISCSI的不要跟SERVICE CONSOLE在同一链路上, 除了保障ISCSI的PERFORMANCE, 另一个意义也是不要影响管理数据流.
几年前遇到过一个例子, 由于HA(不是VMWARE的东西)的问题, 导致共4000多座席的多个呼叫中心断续故障两天. 至今心有余悸. 在我对ESX系统及网络有十分信心前, 选择先把它(HA)关闭, 呵呵. 没对人说...