我们先来看一下DB-Engines中关于时序列数据库的排名
这是当前(2016年2月的)排名情况:
下面,我们就按照这个排名的顺序,简单介绍一下这些时序列数据库中的一些。下面要介绍的TSDB以开源的为主,如果是商业或者SaaS服务,也简单介绍一下其特点,让大家能对其他领域的事物也有所了解。
这里有一个例外,就是Pinot并不在这个排名里,但是我们也把它列在了这里。
- | - | 备注 |
---|---|---|
主页 | https://influxdata.com/ | |
编写语言 | Golang | |
License | MIT | |
项目创建时间 | 2013 | |
最新版 | v0.10.1 | 2016/2/18 |
活跃度 | 活跃 | |
文档 | 详细 |
InfluxDB由Golang语言编写,也是由Golang编写的软件中比较著名的一个,在很多Golang的沙龙或者文章中可能都会把InfluxDB当标杆来介绍,这也间接帮助InfluxDB提高了知名度。
InfluxDB的主要特点包括下面这些:
InfluxDB是TSDB中为数不多的进行了用户和角色方面实现的,提供了Cluster Admin、Database Admin和Database User三种角色。
InfluxDB的数据采集系统也支持多种协议和插件:
不过InfluxDB每次变动都较大,尤其是在存储和集群方面,追求平平安过日子,不想瞎折腾的可以考虑下。
注意:
由于InfluxDB开发太活跃了,很可能你在网上搜到的资料都是老的,会害到你,所以你需要以官方文档为主。
一句话总结:欣欣向荣、值得一试。
- | - | 备注 |
---|---|---|
主页 | http://oss.oetiker.ch/rrdtool/index.en.html | |
编写语言 | C语言 | |
License | GNU GPL V2 | or later |
项目创建时间 | 16-Jul-1999 | rrdtool-1.0.0 |
最新版 | rrdtool-1.5.5 | 10-Nov-2015 |
活跃度 | 活跃 | |
文档 | 详细 |
RRDtool全称为Round Robin Database Tool,也就是用于操作RRD的工具,简单明了的软件名。
什么是RRD呢?简单来说它就是一个循环使用的固定大小的数据库文件(其实也不太像典型的数据库)。
大体来说,RRDtool提供的主要工具如下:
这其中,画图功能是最复杂也是最强大的,甚至支持下面这些图形,这是其他TSDB中少见的:
总之,它的画图功能太丰富了。
一句话总结:老牌经典、艺多不压身。
- | - | 备注 |
---|---|---|
主页 | http://graphite.readthedocs.org/en/latest/ | |
编写语言 | Python | |
License | Apache 2.0 | |
项目创建时间 | 2006年 | |
最新版 | 0.9.10 | 2012/5/31 |
活跃度 | 活跃 | |
文档 | 详细 |
Graphite由Orbitz, LLC 的 Chris Davis创立于2006年,它主要有两个功能:
相应的,它的特点为:
Graphite本身不带数据采集功能,但是你可以选择很多第三方插件,比如适用于collectd、Ganglia或Sensu的插件等。同时,Graphite也支持Plaintext、Pickle和AMQP这些数据输入方式。
Graphite主要由三个模块组成:
whisper使用了类似RRDtool的RRD文件格式,它也不像C/S结构的软件一样,没有服务进程,只是作为Python library使用,提供对数据的create/update/fetch操作。
如果你对它的性能比较在意,这里有一份老的数据可供参考。
Google、Etsy、GitHub、豆瓣、Instagram、Evernote和Uber等很多知名公司都是Graphite的用户。有此背景,其可信度又加一层,而且网上的资料也相当的多,值得评估一下。
一句话总结:群众基础好、可以参考。
- | - | 备注 |
---|---|---|
主页 | http://opentsdb.net/ | |
编写语言 | Java | |
License | LGPLv2.1+ GPLv3+ | |
项目创建时间 | 2010 | |
最新版 | 2.2 | |
活跃度 | 活跃 | |
文档 | 详细 |
OpenTSDB是一个分布式、可伸缩的时间序列数据库。它支持豪秒级数据采集所有metrics,支持永久存储(不需要downsampling),和InfluxDB类似,它也是无模式,以tag来实现维度的概念。
比如,这就是它的一个metric例子:
|
OpenTSDB的节点称为TSD(Time Series Daemon (TSD)),它没有主、从之分,消除了单点隐患,非常容易扩展。它主要以HBase作为存储系统,现在也增加了对Cassandra和Bigtable(非云端)。
OpenTSDB以数据存储和查询为主,附带了一个简单地图形界面(依赖Gnuplot),共开发、调试使用。
一句话总结:好用,我们在用。
- | - | 备注 |
---|---|---|
主页 | http://kx.com/ | |
License | 商业 |
所有TSDB中,估计就数这个最酷了,我说的是域名,只有两个字母,猥琐地想一下,域名就值很多钱 :-)。
kdb+
是一个面向列的时序列数据库,以及专门为其设计的查询语言q
(和他们的域名一样简短)。Kdb+混合使用了流、内存和实时分析,速度很快,支持分析10亿级别的记录以及快速访问TB级别的历史数据。
不过这是一个商业产品,但是也提供了免费版本(貌似还限制在32位)。
- | - | 备注 |
---|---|---|
主页 | http://kairosdb.github.io/ | |
编写语言 | Java | |
License | Apache License 2.0 | |
项目创建时间 | 2013 | |
最新版 | 1.1.1 | 2015/12/08 |
活跃度 | 活跃 | |
文档 | 详细 |
KairosDB是一个OpenTSDB的fork,不过是基于Cassandra存储的。由于Cassandra的行比HBase宽,所以KairosDB的Cassandra的默认行大小为3星期,而OpenTSDB的HBase则为1小时。
KairosDB支持通过Telnet、Rest、Graphite等协议写入数据,你也可以通过编写插件自己实现数据写入。
KairosDB也提供了基于Web API的查询接口,支持数据聚合、持过滤和分组等功能。
同时KairosDB提供了一个供开发用的Web UI,图形绘制引擎使用了 Flot。
和OpenTSDB类似,KairosDB 也提供了插件机制,你可以使用插件完成如下工作:
- | - | 备注 |
---|---|---|
主页 | http://druid.io/ | |
编写语言 | Java | |
License | Apache License 2.0 | |
项目创建时间 | 2011 | |
最新版 | Druid 0.9.0-RC2 | 2016/02/23 |
活跃度 | 活跃 | |
文档 | 详细 |
Druid是一个快速、近实时的海量数据OLAP系统,并且是开源的。Druid诞生于Metamarkets,后来一些核心人员创立了IMPLY公司,进行Druid相关的产品开发。
Druid会按时间来进行分区(segment),并且是面向列存储的。它的主要特性如下:
根据去年底druid.io的白皮书,现在生产环境下最大的集群规模如下:
Druid企业用户比较多,比如OneAPM、Netflix和Paypal等。具体可以参考 http://druid.io/druid-powered.html 。
Druid架构比较复杂,因此对部署和运维也有一定的负担,比如需要的机器多、机器配置要高(尤其是内存)。
一句话总结:好用,我们在用。
- | - | 备注 |
---|---|---|
主页 | http://prometheus.io/ | |
编写语言 | Golang | |
License | Apache License 2.0 | |
项目创建时间 | 2012 | |
最新版 | 0.17.0rc2 | 2016-02-05 |
活跃度 | 活跃 | |
文档 | 详细 |
Prometheus是一个开源的服务监控系统和时序列数据库,由社交音乐平台SoundCloud在2012年开发,最近也变得很流行,最新版本为0.17.0rc2。
Prometheus从各种输入源采集metric,进行计算后显示结果,或者根据指定条件出发报警。
和其他监控系统相比,Prometheus的特点包括:
由于Prometheus采用了类似OpenTSDB 和 InfluxDB的key/value维度机制,所以如果你对任一种TSDB有了解的话,学习起来会简单些。
一句话总结:貌似比较火,何不试一试?
- | - | 备注 |
---|---|---|
主页 | https://github.com/linkedin/pinot/wiki | |
编写语言 | Java | |
License | Apache License 2.0 | |
项目创建时间 | 2014/08 | |
最新版 | 0.016 | |
活跃度 | 活跃 | |
文档 | 详细 |
Pinot是一个开源的实时、分布式OLAP数据存储方案。它来自Linkedin,虽然Linkedin最近估价表现很差,但是他们创建的各种软件、中间件实在太多了。这一点我们做软件的都应该向Linkedin表示感谢。
Pinot就像是一个Druid的copy,不过两者的灵感都来源于SenseiDB(Sensei在日语里为老师的意思,写成汉字为“先生”)。
Pinot也像Druid一样,能加载offline数据(Hadoop文件)和实时数据(Kafka)。Pinot从设计上就面向水平扩展。
Pinot主要特点:
Pinot的特点和Druid很像,两者可互为参考。
一句话总结:背靠大树好乘凉。