04-12 稳定性测试压出来的问题--DB partition number

这应该是我首次谈及压力测试和稳定性测试吧,之所以谈及,因为我开始重视此类测试,因为它确实可以发现隐藏很深,而且在功能测试中很难发现的问题。

在我们这个产品中,日志是写进MS SQL SERVER的,默认每个partition大小5G,超过5G自动新建一个partition。满负荷打流量的话,平均每天可以写满2-3个partitions。平时我在负责压力测试和稳定性测试时,最多跑7天,partition数目在10个左右。偶尔一次,我留了一套环境,持续打流量1个月。

问题出现了:

当partition数目超过40个时,所以后续新建的partition全部错误,而且会在一个小时内持续新建partition,写满1.5TB的硬盘。可怕吗?是的。

DEV查看代码,找到了root cause。只有当partition达到了40左右时,才会暴露这个问题。实际上,用户正常使用,一段时间以后是一定会遇到的。

 

这只是其中一个例子。在压力测试和稳定性测试中,我还发现了很多问题,比如内存泄露,句柄泄露,service restart等等。

后续我还会负责这一块,积累很重要啊。

 

你可能感兴趣的:(partition)