公器私用--大互联网自建云分析

0. 本文提纲

我做了持续数月的大客户调研完成了本文。

我直聊了几个客户、也拉着友商的售前销售深谈他们的项目,一共6个案例,客户每年有五千万到五个亿的服务器摊销成本或租赁预算。

产品前提:只谈存储和计算,不谈公网和CDN;

我对带宽运营还算了解,我用敬仰和赞叹看CDN产品设计。但带宽价格绕不开运营商政策,而公网技术相对冷僻,如果把带宽掺和进来分析,本文会失去焦点。

客户场景:每年IT开销上亿、拥有专业IT团队的大型互联网公司;

现状描述:是不是和为什么要用自建私有云,自建私有云能否持续下去;

前景展望:抨击云厂商的失职自嗨,描述客户的真需求和新机会。

公器私用--大互联网自建云分析_第1张图片


1. 伪公有云就是自建云

这些大客户都很灵活务实,既会自采也在租赁云厂商的IDC和硬件,所以云厂商经常诡辩这就是公有云订单。

但我认为根本不是公有云和专有云,它们就是自建云或私有云,理由如下:

  1. 都是买断式租赁硬件和透传式租赁IDC,否则哪来这么低的折扣。

  2. 实操这些项目时,云厂商要重点考虑垫资金融成本,完全不考虑资源空置成本和复用收益。

  3. 客户持有该群集的完整维护权限,云厂商要客户授权后才能干活。

  4. 云厂商完全没资格、没欲望、也没切入点去染指客户的技术架构和行为数据。


2. 选择自建的根本原因

一堆“懂王”对着大客户自建云神秘微笑——这是客户技术部门给自己谋生路。

 “啪”的一耳光,为了逃避思考推脱责任,我们就这么揣测和出卖朋友

客户选择自建云的根本原因是“时机正好”和“成本更低”。

互联网大厂认同公有云的起点是2017-2018年,按照这个时间点分析,一切豁然开朗。

  1. 这些客户很早就成立,最迟等到2015年移动互联网大爆发,客户IT需求和规划早就在规划和实践了。

  2. 服务器硬件需要4到5年才报废归零,公有云价格战只是优惠,而自家服务器没报废之前空置就是损失。

  3. 云厂商的大规模资源交付能力是实践锻炼出来的;直到2019年还常见大客户的交付需求又双叒叕被某傻云给延期了;业务不等人,这时大客户还得自己直采和部署服务器。

Be quick,time is mana.
 做本研究的时间也更好,
 恰好卡在这批硬件报废归零的前夜。

从客户角度来看,自建云新增了一点点人力和金融成本,但不用给云厂商留毛利润,所以成本更低。

  1. 客户的运维和架构团队看似人多,但大量上不上云都要保留的岗位。客户专门为自建云配备的IaaS资源运维、主机或容器平台研发人数极少,就算加上外包值班,年人力开销是300-1000万。

  2. 各家云厂商的净利亏损和总体低毛利不假,但落在计算和存储产品上的毛利润非常高。没有这么高毛利就无法覆盖资源空置成本,而如果不保持空置弹性,这一堆公有云也就是私有云了。

  3. 按我调研的样本,减去金融成本和人力开销以后,大客户自建云肯定比租赁公有云成本更低。


3. 自建云的典型用法

大企业自建云时有权威技术团队坐镇,维护了一套内部可信、自身可控环境,各家自建云的用法有下列共性:

  1. 托同城光纤便宜(挖掘机也经常偷懒)的福,自建云可以做多家公有云的仲裁节点和权威数据源。

  2. 因为有公有云过滤需求,自建云承接的算力负载很稳定,存储扩容很淡定。有朋友说自家自建云的资源利用率能到80%,有朋友为资源利用率到30%而自豪,但我觉得这是各家统计口径不同,他们只是模糊的传递“资源利用率比公有云高了好几倍”。

  3. 自建云的功能趋向简单化,用本地盘支撑KVM或容器,用vLAN但不用vxlan,Vrouter等功能简化,监控计费计量配额都是“追认”记账而非实时调度。

  4. 这是自建自用的云平台,客户对该平台的性能和稳定性需求变得简单合理:不会为了追求百分之一的竞标式优化去增加三分之一的成本,也能了解到云内性能和稳定性隐忧而善意容错主动调度。

  5. 对象存储是个意料之中的例外,其依靠自身完美的产品设计,很顺畅的从自建云手里接过了存储的职责。

某些人这种用云的方式嗤之以鼻,用户同样也信心不足,但我对此心怀敬意:

找不准客户需求是产品失焦
炫技表演式卖云是销售失能
做云是为了解决真实IT需求

公器私用--大互联网自建云分析_第2张图片


4. 自建云的阻力障碍

一提到自建云的阻力,我们都可以脑补出规模太大体力太累、采购和管理层瞎指挥等等,但这些理由都不对。

  1. 运维和架构都是聪明人,为了体力上偷懒脑力上异常勤奋。客户在自建实操的时候,应用层善意容错、运维自动化技术、外包施工和厂家维保的效率都很高,所以客户的体力维护的压力并不大。

  2. 客户的技术支撑团队更愿意做高大上的技术,而非这种极简自建云,所以我前文说“用户同样信心不足”。但是客户的采购部门为了成本、管理层为了中立可控和优化财报,他们拿到全面信息以后更鼓励自建云。

客户自建云的真正的阻力是信心不足、供应商价格歧视和团队后继无人。理解客户的深层隐忧,无论是帮其打消顾虑承接服务还是强势引导送你上云都很方便:

  1. 甲方自建云的团队在弱化存在感和求生欲。基础设施团队就是个成本中心,给公司省了这么多钱还总被质疑“搞自建云是为了保住团队”,还不如内部转岗跟着业务团队更容易升职加薪。在无利润采购中,甲方技术人员当鉴定器、背锅侠和裱糊匠,供应商的表面恭维只是个习惯性商务礼仪。

  2. 上游供应商没守住头部大客户和中型客户的平衡。中型客户拿硬件和机柜的价格和大云厂商出现了明显的价格差异,这个差异大到一定程度,自建云就没有成本优势了。我们只能对上游供应商说,唇亡齿寒户破堂危,以地事秦如抱薪救火,大云厂商从你们采购时压低的利润,最终都用于自研硬件自建机房的投入了。

  3. 甲方自建云的人员流失压力极大。做自建云的核心技术和做公有云是类似,甲方技术可以跳槽去云厂商做技术、做产品、做售前售后,而每一份Offer都是加薪50%-200%。不光一线工程师会提桶跑路,近两年我亲眼所见多名甲方团队高管和技术大牛跳槽到云厂商。

我有两篇文章《踏云落地--谈IT就业趋势》 《售后也是话事人》,对客户技术团队的心态难处和行业流动的现状趋势描述还算到位。


5. 云厂商的前景机遇

我本质上是公有云的坚定支持者,自建云在重重压力下仍然存在,都是在证明现有云的效率太低、成本太高了,这是个好消息和大机遇:

  1. 对于销售:客户自购和租赁设备都逐步到期,每一批设备的退役都是一次新的商机。

  2. 对于运营:精细运营云主机和裸金属,提高资源利用率,这条路走得通也有客户买单。

  3. 对于产品:功能降级、模拟私有云、适度披露平台负载,给产品做“减法”更容易鉴别优秀的产品经理

  4. 对于技术:平台足够稳定、负载足够细分,这样才能高效运营和优质产品,技术工作更重要更有挑战性了。

  5. 对于管理:客户不为试错学费买单,不为低效冗余买单,也不为自嗨的复杂功能买单,这是在倒逼云厂商做切实的管理效率提升;友商用增长掩盖庸碌的难度越来越大,会促使投资者们更快结束这个莫名烧钱的阶段。

  6. 关于生态:现在反垄断已经成为国内大气候大趋势,A公司出服务器、B公司出IDC、C公司垫资和运作产权、D公司提供云平台软件,E公司做资源池运维调度、F公司接过客户离职专家的咨询监督责任;而客户花的钱不多,技术老员工也合理安置,这是个有可行性的假设。

云计算是整个IT业的希望,希望我们扬帆远航的时候,嗅过每一股烈风,抓到每一丝商机,最终实现共生共赢。

你可能感兴趣的:(运维,云服务,云存储,产品经理,devops)