联盟工程算力大解析
「全国机房、机柜数量统计」
经由技术人员统计:
全国数据机房总量为:542家
各省市分布比例如下:
经测算,在全国542家数据机房中,共设有893758架机柜。
专家解析:根据技术人员抓取结果显示,我国IDC数据机房约有20%空置率。意味着全国近90万架机柜中,约有18万架机柜处于闲置状态。机房资源充足,但未得以有效利用。
技术人员据此估算:倘若将全国约18万空闲机柜全部整合,算力强度将达到前所未有的峰值。
「机房、机架利用率」
专家解析:结合机房的类型与规模,可以看到利用率在30%以下的数据中心占10%,30-50%的占29%,50-80%的占31%,80%以上的占30%。
「使用年限与机架利用率」
专家解析:依图所示,越大的数据中心,机房利用率越高。出租托管的数据中心,机房利用率明显高于其他类型。
「使用年限与发电时间」
专家解析:投产3年以上的数据中心,其发电机启用时间超过10小时的比例大幅增加。
「故障中断情况」
专家解析:上图显示,有62%的数据中心没有发生因故障中断业务,有6%发生过1小时以内的故障中断,38%的数据中心发生了超过1小时的故障中断。
经分析,以上统计折算为可用性:不到99.99%的数据中心发生过3次以上故障中断。
「电量大幅提升」
据统计,全国数据中心目前1KW以下耗电量占6%,1-3KW占35%,3-5KW占45%,5KW以上占14%;
技术人员预测,未来所需机柜功率:3KW以下占17%,3-5KW占51%,5-8KW占28%,8KW以上占4%。
专家解析:用电量的提升,为数据中心的建设和运营带来巨大挑战。无论是初始投资,亦或运营成本,势必大幅增加。该问题需重点关注。
「问&答」
——一个数字社区每秒将产生多少数据量?
消费者产生的消费信息,是包括心跳频率、触摸商品的次数、各类问询记录、交易记录等数据的汇总;
每一节点、每秒钟将产生海量数据流。
为了让结果更加精确、直观,我们将消费行为拆解,以其中一个动作为例:
技术人员随机抓取某一动作片段;
经测算,该片段每人每秒约产生10M数据量;
每家数字社区最多容纳人数10000人,那么每秒将产生:
10M×10000=100G数据量。
——全国闲置机柜可放置多少台服务器?
经技术人员统计,全国共有约90万架机柜;
以机柜闲置率约20%计算,全国闲置机柜量约为:
900000架×20%=18万架
经检测,每架机柜可放置8台服务器,全国闲置机柜共可放置:
180000×8台=144万台服务器
——我们需要多少台服务器?
我公司共有数字社区17万家;
每家社区最高容纳人数为1万人。
为判断具体需求,技术人员以某大型支付公司算力为借鉴,模拟10000人并发情景:
测试结果显示,一万人每秒约产生100G数据量;
结合服务器性能考虑,需要8台现有能力的服务器方可正常运行;
根据上述测算,于我公司而言,17万数字社区共需要:
170000×8台=136万台服务器。
——全国闲置服务器与数字社区所需服务器数量对比
在上述测算中,我公司数字社区需要的服务器数目:约136万台;
全国闲置机柜可放置服务器数目:约144万台;
结果表明,全国闲置机柜可以满足我公司架设服务器需要。
据此得出结论:整合全国闲置机房算力,以分析万人并发的消费数据计划切实可行。
可以看到,全国数据中心数量充足,且闲置率较高,其算力远未达到饱和状态。我公司工程所需算力,与全国闲置资源高度契合,让整合全国闲置算力的愿景有望付诸现实。只有获取强大的算力支持,才能从目前井喷式海量数据中筛选出有价值信息,进而建立起高效、精准、完备的大数据决策模型。