一站式智能运维解决方案,企业系统的隐形守护者

时有爆发的疫情,加速引导着用户观影方式的改变。越来越多的用户习惯将观影模式从线下转移到线下。

疫情作为电影行业的“黑天鹅”,让线下影院陷入沉寂,但是却让网络视频平台焕发新生。多家视频平台公布了2022财年Q4的财报,其用户付费数均呈上涨趋势,亏损同比收窄,有些平台在该财年甚至实现了盈利。

由于疫情管控,大多数用户会优先选择线上观影。由于用户线上观影习惯的养成,因此只要有一部电影爆火,就会为平台带来巨大的用户群与营收增长。

但一部部接连爆火的电影,也加速了南瓜电影对于技术升级的思考。

在2021年3月,南瓜用户注册量暴增,日增用户数超800万。流量入口、API、网关等接连告警,紧接着后端服务器、数据库等容量开始吃紧,紧急全链路扩容。虽然最后业务恢复,但整个运维过程花费4小时。

业务高速发展 VS 系统运维带来的压力 作为一家专注于影视精品化运营的垂直类视频的公司,南瓜电影一开始就将自己的系统放在云上。早期业务量不大,遇到故障时会选择手动对不同的服务器进行重新发布。随着业务发展,时常会出现某部影片爆火的情况,用户流量激增,服务器扩容速度缓慢,出现卡顿、报错等情况。

尤其在排查问题过程中,不好定位服务器错误,本地文件过长,数据查询与错误定位成为影响运维效率的最大障碍。

南瓜电影也曾尝试过自建运维系统,希望能系统化地解决当前所面临的运维难题。但在实际操作过程中,南瓜电影发现他们面临着以下几个难点:

首先是成本与时间投入过长,南瓜电影曾尝试过自建K8s的方案,虽然能很好地解决高密部署的难题,但K8s学习与时间成本过高,简单搭环境做测试问题不大,但正儿八经地上线生产

你可能感兴趣的:(运维,云计算,阿里云)