服务器运维之服务器Raid状态监控报警附监控附脚本

服务器运维之服务器Raid状态监控报警

概述

对于大数据存储,可选的方式有很多,比如分布式存储,服务器软链接,但今天我要说的是硬盘阵列(Raid),它可以把很多硬盘组合成一个大的盘,几百T的存储空间,相信对于大多数公司来说可以用一生了。常用的方式有软组盘,硬组盘。但是企业级常用的还是硬组盘居多。
Raid搭建,这篇文章就谈了,可以去易点知识库 看,地址为https://sun.book77.com这盘文章更想说的是,raid搭建好了,怎么能及时发现故障处理故障。就是raid6也只能坏2块硬盘。如果故障不能及时发现,坏了3块硬盘,你只有找地方取苦把(当然还是有方法找会数据的,不会很麻烦还要花很多钱还要看运气硬盘的健康状态如何。呵呵!!)。大家是不是有点不耐烦了,前面说了这多么废话。好了,下面马上进入今天正题。

Linux系统Riad状态监控

脚本附上:
#!/bin/sh
flag=1
for ste in /sbin/megacli -LDInfo -Lall -aALL |grep "State" |awk '{print $3}'
do
if [ $ste == “Optimal” ]
then
flag=expr $flag + 0
else
flag=expr $flag + 1
fi
done
if [ f l a g − e q 1 ] t h e n e c h o " s t a t u s : g o o d : " flag -eq 1 ] then echo "status:good:" flageq1]thenecho"status:good:"flag" "
else
echo “status:bad:”$flag" "
fi
大家看到了,Bad状态就可以报警了,至于报警工具有很多,常用的zabbix这些都可以,笔者我用的ELK预警插件。关于这个工具后面我再讲。

Windows系统Raid状态监控

直接上ps1脚本:
$statusGood = “status:good:”
$statusBad = “status:bad:”
$raidpos = $args[0]
$subpos = $args[1]
cd “E:\Program Files (x86)\MegaRAID Storage Manager”
s t e = ( . / s t o r c l i 64. e x e / c 0 / ste=(./storcli64.exe /c0/ ste=(./storcli64.exe/c0/raidpos show |findstr “RAID”).split(" ")[ s u b p o s ] i f ( subpos] if ( subpos]if(Status -eq “Optl”) {
echo s t a t u s G o o d statusGood statusGoodste
}
else {
echo s t a t u s B a d statusBad statusBadste
}
脚本需要在系统上安装MegaRAID 工具。

Raid相关知识

硬件Raid工具有很多,常用的有LSI,国产的有联想。Raid可以分为raid0,raid1,raid5,raid6,现在新点支持raid10,raid50,raid60等。我们工作中常用的就是前4个。大家根据业务性质,安全要求,预算等综合选择。
raid0,硬盘1块以上。不提供安全措施。
raid1, 2快盘以上。50%的空间使用率。另外的空间当然是用于数据备份了。
raid5,至少3块盘,n-1/n的空间使用率。1块盘用于备份
raid6,至少3块盘(有的厂商要求至少4块)。n-2/n的空间使用率,2块盘用于备份。

总结

大家在在组盘选择,raid维护上要引起重视。数据是公司最重要的资产哦。后面我陆续会带来关于运维方便的文章。希望大家检阅。哈哈!作者以前写的其他技术文档,由于时间有限还没发布在CSDN。大家有兴趣或者需要可以去看看。文章地址:
https://sun.book77.com/Api/Document/index

你可能感兴趣的:(服务器运维之服务器Raid状态监控报警附监控附脚本)