阿里云dataworks/maxcomputer和自建集群的对比

       云平台近几年在飞速发展,有些公司也会把自己的在线业务和离线数据业务迁移到阿里云上,一方面节省研发成本,另一方面服务更加稳定,下面我以自己粗浅的认识对比下两者。

指标 自建集群 云平台
研发要求
自由度
研发配置 数仓/集群搭建 数仓
学习成本
工种配置 数仓组+平台组+大数据产品组+分析组 数据组
主要技术 hive+hbase+spark+datax+storm+调度系统 MR+类HIVE

 

两者使用对比:

          1、功能完善,主要的数据同步、数据计算、调度任务等需求都能满足

          2、底层更加稳定,相较自建集群几乎不会宕机

          3、从同步生产库数据->仓库建模处理->算法实现->生产库都能在一个可视化的工作流完成,自建集群可能需要用多个开源软件

          4、云平台可视化点击操作较多较容易上手,自建集群可能还要学习一段时间

          5、云平台付费就能用,自建集群建设需要时间

          6、云平台有问题找客服解决沟通麻烦,自建集群直接问平台的同事,更容易沟通

          7、云平台对大数据从业者来说能学到的东西较少,自建集群能学到较多的底层东西

 

       随着公司大数据体系的完善,整体使用从0-1逐渐完善,云平台可能处于0.7分的水平,对比的时期很重要。但是也要看公司的研发能力,有的公司可能几年都到不了0.7分的水平。建议自建集群开发者也关注下云平台,取长补短。

 

你可能感兴趣的:(阿里云)