利用Apache Drill查询MongoDB(二)分布式部署

利用Apache Drill查询MongoDB(二)分布式部署

关于Drill是什么、Drill单机部署、Drill mongo插件配置请查看
利用Apache Drill查询MongoDB(一)单机部署

1.Drill分布式部署

测试server:CentOS 6.5 x86_64
先决条件:Oracle JDK,ZooKeeper集群

  • 安装zk集群
    下载解压目前最新版zk:zookeeper-3.4.9.tar.gz
cd zookeeper-3.4.9/
vim conf/zoo.cfg

输入内容如下

tickTime=2000
dataDir=/home/app/zkdata //这里用相对路径可能会报错
clientPort=2181
initLimit=5
syncLimit=2
server.1=172.19.3.132:2888:3888 //2888是zk各节点通信的端口,3888是选举zk leader的端口
server.2=172.19.3.133:2888:3888
server.3=172.19.3.134:2888:3888 

cd到/home/app/zkdata目录下,创建文件myid

vim myid

myid的文件内容只有一个数字,3个zk server分别输入1、2、3。
配置hosts
sudo vim /etc/hosts
输入:

172.19.3.131 drill
172.19.3.132 zk1
172.19.3.133 zk2
172.19.3.134 zk3

现在启动zk
bin/zkServer.sh start
同样的操作,把另两台zk server也启动。
输出日志在zk所在目录的zookeeper.out文件中,可以辅助调试异常。

  • 安装和启动Drill
    下载截止目前最新版Drill:apache-drill-1.8.0.tar.gz
    解压并cd到drill目录,修改配置文件
tar -zxvf apache-drill-1.8.0.tar.gz
cd apache-drill-1.8.0
vim conf/drill-override.conf

配置文件内容

drill.exec: {
  cluster-id: "drillbits1",
  zk.connect: "zk1:2181,zk2:2181,zk3:2181"
}

启动drill
bin/drillbit.sh start
ps:执行后只是提示日志在log/drillbit.out,这个文件是排错利器,可以通过ss命令查看与zk的连接是否建立
ss -ant | grep 2181

2.查询测试

测试的内容与上一篇一样,只是这次使用web console的REST API测试。

  • 查询数据库
    curl -X POST -H "Content-Type: application/json" -d '{"queryType":"SQL", "query": "show database"}' http://172.19.3.131:8047/query.json
    返回结果
{
  "columns" : [ "SCHEMA_NAME" ],
  "rows" : [ {
    "SCHEMA_NAME" : "INFORMATION_SCHEMA"
  }, {
    "SCHEMA_NAME" : "cp.default"
  }, {
    "SCHEMA_NAME" : "dfs.default"
  }, {
    "SCHEMA_NAME" : "dfs.root"
  }, {
    "SCHEMA_NAME" : "dfs.tmp"
  }, {
    "SCHEMA_NAME" : "mongo.car"
  }, {
    "SCHEMA_NAME" : "mongo.local"
  }, {
    "SCHEMA_NAME" : "mongo.test"
  }, {
    "SCHEMA_NAME" : "sys"
  } ]
}
  • 查询mongo.test数据库
    curl -X POST -H "Content-Type: application/json" -d '{"queryType":"SQL", "query": "select * from mongo.test.categories"}' http://172.19.3.131:8047/query.json
    返回结果
{
  "columns" : [ "_id", "parent" ],
  "rows" : [ {
    "parent" : "Databases",
    "_id" : "MongoDB"
  }, {
    "parent" : "Databases",
    "_id" : "dbm"
  }, {
    "parent" : "Programming",
    "_id" : "Databases"
  }, {
    "parent" : "Programming",
    "_id" : "Languages"
  }, {
    "parent" : "Books",
    "_id" : "Programming"
  }, {
    "parent" : null,
    "_id" : "Books"
  } ]
}
  • 查询mongo.car数据库的car集合中2012-2015年的数据
    select * from mongo.car.car where createTime between '2012-1-1 0:0:0' and '2015-12-31 0:0:0'
    涉及到单引号转义,直接用web console来提交请求,如图
    利用Apache Drill查询MongoDB(二)分布式部署_第1张图片

    返回结果
    利用Apache Drill查询MongoDB(二)分布式部署_第2张图片

    原来的数据从2011-2016共6条数据,过滤后只有2012-2015的4条
  • 查询mongo.car数据库,获取福特汽车的油耗和公里数
    select * from mongo.car.car where deviceId in (select deviceId from mongo.car.arch where archive='ford')
    利用Apache Drill查询MongoDB(二)分布式部署_第3张图片

    返回结果
    利用Apache Drill查询MongoDB(二)分布式部署_第4张图片

    最后,也可以使用sqlline通过shell查询
bin/sqlline
!connect jdbc:drill:zk=mongodb_node01,mongodb_node02,mongodb_node03

参考文档
Drill官方文档
Drill官方文档中文翻译
SQL on MongoDB

你可能感兴趣的:(利用Apache Drill查询MongoDB(二)分布式部署)