如何有效的存储设备呢?仁者见仁、智者见智。不同的人对此可能有不同的答案。在这里,笔者以IBM的DS4000存储设备为例,表达一下笔者自己的观点。也许这些内容能够给各位读者带来一定的帮助。
DS4000存储设备主要有两种管理方式,分别为频带带管理方式和频带外管理方式。这两个名字都是根据 英文直接翻译过来的。所以名字听起来有点别扭。其英文名字分别为in-band和out-of-band。笔者后续的内容是以频带外管理方式为例,谈谈存 储设备管理的技巧以及相关的注意事项。
一、频带外管理方式的特点
频带外管理方式是指通过客户端软件,同时连接到DS4000的两个控制器进行管理的方式。示意图如下。在一台客户端上安装有DS4000的客户端软件。这台主机可以直接通过交换机或者以太网连接到DS4000设备的两个控制器上进行相关的操作。
可见频带外管理的主要特点在于其可以同时连接到DS4000设备的两个控制器接口上。从而用来完成不同 的操作。如一个控制器端口用来进行配置,而另外一个控制器接口用来测试等等。在实际工作中,这个特性能够大大的降低管理员的工作。这也给我们选型提供一定 的参考。在一些比较复杂的存储应用中,最好选择这种可以同时连接多个控制器接口进行管理的存储设备。
二、自动搜索与手工添加二选一
当采用客户端来连接DS4000设备时,需要关注的一个内容是如何在客户端上添加相关的设备。这就好像是在一台服务器上新增了一块网卡。操作系统如何来识别这块网卡呢?一插上系统就会自动识别,还是需要操作人员手工添加呢?不同的操作方式,对于管理员的工作量是不同的。
当管理员通过客户端软件同时连接到DS400设备的两个控制器时,需要添加要管理的DS4000子系 统。有可能企业中有多个DS4000设备,那么管理员到底需要对哪个DS4000设备进行维护呢?这里有两种方式,分别为自动搜索和手工添加。顾名思义, 如果选择自动搜索的话,则客户端软件会自动搜索可用的控制器端口。当企业的存储设备比较多、环境比较复杂的时候,或者说管理员刚刚接手前任的工作时,这个 特性就显得尤其的重要。而选择手动添加的话,需要管理员手工输入两个控制器的IP地址。这往往要求管理员对企业现有的存储环境比较熟悉。知道企业中各台 DS400设备各个控制器接口所对应的IP地址。
另外笔者这里要提醒各位读者,无论是自动搜索还是手工配置时,这中间可能会出现一个小插曲。如果一台 DS4000的控制器不能够搜索到任何的物理硬盘(可能是物理硬盘出现损坏、或者说物理硬盘与控制器之间的连接出现问题、甚至可能是忘记装了物理硬盘), 此时无论是自动搜索还是手工添加,客户端软件都会搜索到两个DS4000子系统。而且每个子系统都只对应一个控制器。即没有同时连接到两个控制器上面。当 采用频外管理的方式时,如果发现这种状况,不要感到意外。管理员应该条件反射的就意识到,这是因为控制其搜索不到物理硬盘的原因。具体是什么原因造成他们 之间的连接出现问题,则就需要管理员进行后续的排查了。根据笔者的经验,很可能是因为控制器和磁盘扩展柜子之间的链路出现问题所造成的。
三、出厂默认的IP地址
像其他网络设备,如路由器一样,DS400存储设备各个控制器接口也会有默认的IP地址。不过这个默认 的IP地址是一把双刃剑。如果管理员采用这个默认的IP地址,无疑在后续维护时,直接采用默认IP地址即可,而不需要重新设置。但是如果采用默认设置的 话,也会带来一定的安全隐患。如攻击者就可能会采用这个默认的IP地址(默认的IP地址相当于对攻击者是公开的),对存储设备发动攻击。
方便与安全两者相比较,笔者选择的还是安全。为此笔者建议,除非有足以让人信服的原因,最好在将 DS4000投入使用之前,更改出厂默认的IP地址。默认情况下,控制器A的IP地址为192.168.128.101;而控制器B的IP地址为 192.168.128.102。存储管理员需要同企业的网络管理员协商,获取两个合法的IP地址,最好也是能够连续的两个。对DS4000的设备IP地 址进行重新配置。
四、警告表示让DS4000的工作状态一目了然
在客户端软件上,可以将企业中所有在使用或者未使用的DS4000子系统都标示在上面。并且系统会根据其工作状态的不同分别以不同的标识来标志。如此的话,DS4000设备工作是否正常,管理员就可以一目了然的看到。
根据其工作状态的不同,存储子系统一般可以分为五个状态,分别为正在与设备联络、无响应、正在修复、需要注意、最佳五个级别。
正在于设备联络状态表示正在与设备联络状态指示窗口已经打开,并且存储管理软件正在于存储子系统建立连 接。正常情况下,他们之间的连接是非常快的。当出现网络异常时,存储管理软件与存储子系统之间的连接就会出现时断时续的情况。此时就可能会出现这个状态。 当遇到这种情况下,存储管理员需要会同网络管理员一起,检查网络连接是否正常,如是否有拥塞的情况等等。
无响应状态是指管理站无法通过它的网路管理连接与存储系统中的一个或者多个控制其进行通信。简单的说, 此时存储管理软件与存储子系统之间的连接是没有问题的。但是不知道是什么原因,存储管理软件无法打开控制器端口与其进行通信。这很可能是控制器端口出现了 物理故障,或者IP地址出现问题。如某个控制器端口的IP地址与其他设备的IP地址相冲突等等。
正在修复状态是DS4000设备一个自我修复的过程。当遇到这种状态时,需要注意这只是一个中间的状 态,即状态可能已经被更正,并且存储子系统正在进入最佳的状态。通常情况下,如果处于这种状态时,管理员不需要进行任何的操作,只需要在旁边看着就行。直 到其状态发生了变化,如又变为无响应状态,再去分析原因即可。
需要注意状态往往是指存储设备上出现了一些非致命的错误,需要管理员进行维护。如可能出现了坏的分区、 或者说磁盘空间快要耗竭时,客户端会指示这个状态。当遇到这种状况时,管理员需要及时的查明原因并解决故障。管理员可以使用系统自带的工具,如 RecoveryGurn来确定造成这个问题的原因,并从日志中获取详细的信息来进行判断。虽然说这些问题可能在短时间内并不是致命的。但是如果放任不管 的话,迟早有一天会出现导致无法收拾的局面。
最佳状态是一个比较理想的情况。其表示存储子系统中每个组件都处于期望的工作状态中。这也是存储管理员所追求的一种状态。
在这里笔者最后需要强调的是,有时候存储设备出现问题并不一定是存储设备自身所造成的。而很有可能是网络或者其他方面的问题。为此存储设备的排错,是一项比较综合性的问题。这也要求遇到小问题时,需要及时的解决。而不要拖下去,让问题变得复杂。
更多精彩内容请关注:
IBM存储化官方微博
IBM存储化官方网站