大数据分析druid(大数据实时统计分析数据存储)

什么是druid

与某连接池同名,但完全是两个东西。Druid(俗名德鲁伊)是一个为在大数据集之上做实时统计分析而设计的开源数据存储。这个系统集合了一个面向列存储的层,一个分布式、shared-nothing(共享)的架构,和一个高级的索引结构,来达成在秒级以内对十亿行级别的表进行任意的探索分析。下文都以德鲁伊代表druid

为什么创建德鲁伊

在最近几年,互联网技术的快速增长已经产生了大量由机器产生的数据。单独来看,这些数据包含很少的有用信息,价值都是很低的。虽然有基础设施可以处理,但是价格极高
随后出现了的hadoop擅长的是存储和获取大规模数据,但是它并不提供任何性能上的保证它能多快获取到数据。而且不能保证存入的数据立即可见
Metamarkets的产品开发在尝试了关系型数据库管理系统和NoSQL架构后。得到一个结论,就是在开源的世界里,并没有可以充分满足我们需求的系统。最后我们创建了Druid

druid支持的查询类型

timeseries类型

基于时间范围查询的类型

topN类型

基于单维度的排名查询

groupby类型

基于多维度的分组查询

具体如何使用详见官方文档
http://druid.io/docs/0.12.1/q...

简单地说就是拼接符合要求的json。通过http请求访问数据库

你可能感兴趣的:(java)