阿里云SLS——云上的辛勤山寨者

阿里云 SLS 和 Amazon Kinesis

今天来到我的三篇日志系统分析文章的最后一篇,云上的日志分析系统。了解对象是云计算的世界第一厂商Amazon和国内第一厂商阿里云。

从技术上来讲,其实前面2篇已经把流式数据系统能分析的基本分析完了。所以还是说说产品及云计算这个概念。

阿里云,简单日志服务,SLS,今年刚推出。从技术来看,基本是仿造Splunk,甚至界面都很像:

阿里云SLS——云上的辛勤山寨者_第1张图片

其他的Logtail工具、正则表达式分析、简单查询(他没有SPL这么强大的查询语言),从功能来看基本能覆盖程序员日常差错和性能分析。从API来看,SLS内部传输日志还是通过google的protobuf进行序列化。SLS后续可以把数据导入ODPS,阿里强大的大数据系统进行离线分析。

从云的API这方面来看,SLS则是仿造Amazon的Kinesis,这是Kinesis的说明书:

阿里云SLS——云上的辛勤山寨者_第2张图片

说几点不足吧:

  1. SLS的API很粗糙,和Amazon那个动辄一两百页的各种API来比少很多,而且,亚马逊在各个环节都实行API化,也就是说阿里这里需要在页面上开通SLS服务,注册分类等等操作,Amazon都可以通过web api来实现。包括搜索过滤等,Amazon也有自己的API。从这点来说,Amazon给用户提供了更多的接口和可能性,这恰恰是一个平台而不是一个产品的特性。详见SteveY对Amazon和Google平台的吐槽

  2. 阿里仅仅支持把数据导入ODPS,或者用户自己拿出来分析,不如Amazon的选择多一些,Amazon前期有S3(存储),RedShift(数据仓库),DynamoDB(NoSql)这3个选择。

  3. 系统的性能,高可用性还无法清晰明确的展现在用户面前,如果我是一个云计算的用户,选择把自己的一些重要的商业逻辑,例如个性化商品推荐、排序等放在云上,SLS能支撑多大的流量?在1年中有多少概率会服务不可用?这其实是云和传统软件的重要差别:云是服务,传统软件是产品,买来的产品出问题,责任更多的在自己这里,买的服务出问题,云厂商的责任就大了。

回过头来看日志系统的需求

日志系统,在大多IT系统中毕竟是一个辅助和支撑系统。除了像Linkin那样,把日志系统提升一个档次到流式数据系统,成为整个公司的数据流核心之外。别的公司的数据核心大多还停留在关系数据库上。会去看日志的,大多是码农和运维。码农和运维主要是能方便的进行单点查错就行,不需要那么炫酷的大数据搜索、聚合、挖掘、报表功能。

所以,这块的发展取决于需求,取决于流式数据系统在整个组织和活动中能起多大的作用。关系数据库是个金矿,所有重要的、直接产生价值的数据都在里面。数据仓库是个银矿,做一些长期的、未来的分析。流式数据系统,对于阿里这样的电商做个性推荐很有用,对于百度这样做广告的很有用,但对于大多中小公司来说,意义并没有那么的大,姑且算个运河吧,需要较大的组织、较长的周期去挖掘治理。

兼谈云计算

先转阿里王文彬的几句话:

王文彬(菲青):云计算市场的成功,关键是看生态。我们正在加紧布局生态体系。云计算生态圈和传统软件合作伙伴不一样,价值链条完全不同。针对云计算生态链条,我们希望能够将云计算盈利模式讲的更清楚。原来,中国的渠道更多是通过卖硬件赚钱,卖数据库赚钱,但现在通过云计算如何赚钱,需要新的体系规划。我们有计划公布体系规划,其中也包含扶植计划。

云将成为基础设施,你能想象未来阿里云会成为和中石油中石化、国家电网、中移动这样的企业吗?而且更夸张的是,垄断的云公司的最大成本是分布在各地的几个大机房,员工数目不会超过1万人,向全国、全世界十几亿人直接或间接提供信息服务,源源不断的赚钱……

我相信云这一块还有很大的机会,因为信息服务并不是水电,企业用户在IOE之外又更多的选择是好事,但没有人希望自己的信息命脉被阿里一家垄断。在这个领域,有很多中小厂商在奋斗,AVOS,United Stack,UCcloud等等,在互联网技术领域永远不缺乏后来的挑战者,靠某种新的技术,或者是靠发现用户特殊的需求,等等。用种种出乎意料的方式打败原先这个领域的巨头。

你可能感兴趣的:(日志,云计算,sls,Kinesis)