2019-01-03

联盟工程算力大解析

全国机房、机柜数量统计

经由技术人员统计:

全国数据机房总量为:542家

各省市分布比例如下:


经测算,在全国542家数据机房中,共设有893758架机柜。


专家解析:根据技术人员抓取结果显示,我国IDC数据机房约有20%空置率。意味着全国近90万架机柜中,约有18万架机柜处于闲置状态。机房资源充足,但未得以有效利用。


技术人员据此估算:倘若将全国约18万空闲机柜全部整合,算力强度将达到前所未有的峰值。

 

 

机房、机架利用率


专家解析:结合机房的类型与规模,可以看到利用率在30%以下的数据中心占10%,30-50%的占29%,50-80%的占31%,80%以上的占30%。



使用年限与机架利用率

 

专家解析:依图所示,越大的数据中心,机房利用率越高。出租托管的数据中心,机房利用率明显高于其他类型。



使用年限与发电时间

专家解析:投产3年以上的数据中心,其发电机启用时间超过10小时的比例大幅增加。



故障中断情况

专家解析:上图显示,有62%的数据中心没有发生因故障中断业务,有6%发生过1小时以内的故障中断,38%的数据中心发生了超过1小时的故障中断。

经分析,以上统计折算为可用性:不到99.99%的数据中心发生过3次以上故障中断。


电量大幅提升


据统计,全国数据中心目前1KW以下耗电量占6%,1-3KW占35%,3-5KW占45%,5KW以上占14%;

技术人员预测,未来所需机柜功率:3KW以下占17%,3-5KW占51%,5-8KW占28%,8KW以上占4%。

专家解析:用电量的提升,为数据中心的建设和运营带来巨大挑战。无论是初始投资,亦或运营成本,势必大幅增加。该问题需重点关注。

问&答

——一个数字社区每秒将产生多少数据量?


消费者产生的消费信息,是包括心跳频率、触摸商品的次数、各类问询记录、交易记录等数据的汇总;

每一节点、每秒钟将产生海量数据流。

 为了让结果更加精确、直观,我们将消费行为拆解,以其中一个动作为例:

技术人员随机抓取某一动作片段;

经测算,该片段每人每秒约产生10M数据量;

每家数字社区最多容纳人数10000人,那么每秒将产生:

10M×10000=100G数据量


——全国闲置机柜可放置多少台服务器?


经技术人员统计,全国共有约90万架机柜

以机柜闲置率约20%计算,全国闲置机柜量约为:

900000架×20%=18万架

经检测,每架机柜可放置8台服务器,全国闲置机柜共可放置:

180000×8台=144万台服务器

——我们需要多少台服务器?


我公司共有数字社区17万家;

每家社区最高容纳人数为1万人

为判断具体需求,技术人员以某大型支付公司算力为借鉴,模拟10000人并发情景:

测试结果显示,一万人每秒约产生100G数据量;

结合服务器性能考虑,需要8台现有能力的服务器方可正常运行;

根据上述测算,于我公司而言,17万数字社区共需要:

170000×8台=136万台服务器


——全国闲置服务器数字社区所需服务器数量对比


在上述测算中,我公司数字社区需要的服务器数目:136万台

全国闲置机柜可放置服务器数目:144万台

结果表明,全国闲置机柜可以满足我公司架设服务器需要。

据此得出结论:整合全国闲置机房算力,以分析万人并发的消费数据计划切实可行。

可以看到,全国数据中心数量充足,且闲置率较高,其算力远未达到饱和状态。我公司工程所需算力,与全国闲置资源高度契合,让整合全国闲置算力的愿景有望付诸现实。只有获取强大的算力支持,才能从目前井喷式海量数据中筛选出有价值信息,进而建立起高效、精准、完备的大数据决策模型。

你可能感兴趣的:(2019-01-03)