【Docker】安装Presto连接Hive、mysql、oracle、postgresql、SQL server等7种类型数据库

目录

1、简介

2、下载安装

1)下载镜像

2)下载presto客户端jar文件

3)将hadoop配置拷贝到容器

4)新增hive.properties配置文件

 5)重启容器(在linux命令行下):

3、测试连接

4、其他类型数据库配置连接

1)mysql

2)oracle

3)PostgreSQL


目录

1、简介

2、下载安装

1)下载镜像

2)下载presto客户端jar文件

3)将hadoop配置拷贝到容器

4)新增hive.properties配置文件

 5)重启容器(在linux命令行下):

3、测试连接


1、简介

Presto 是一个开源分布式 SQL 查询引擎,用于针对从千兆字节到 PB 级的各种规模的数据源运行交互式分析查询。Presto 允许查询数据所在的位置,包括 Hive、Cassandra、关系数据库甚至专有数据存储。单个 Presto 查询可以组合来自多个来源的数据,从而允许对整个组织进行分析。

2、下载安装

1)下载镜像

docker pull starburstdata/presto

下载过程:

Last login: Tue Jun 14 10:58:46 on ttys001
zxf@localhost ~ % docker pull starburstdata/presto
Using default tag: latest
latest: Pulling from starburstdata/presto
2d473b07cdd5: Pull complete
54c6b866b90d: Pull complete
9a2bdd16fa83: Pull complete
547ac96cdcb8: Pull complete
f341031b4ad5: Pull complete
ec9d1adc03e7: Pull complete
12b2f706192d: Pull complete
d5e53479b75a: Pull complete
Digest: sha256:8500cab845f47aef2a89be9500350b88b7061e587d272e64ddbc94f0ce2cf8ed
Status: Downloaded newer image for starburstdata/presto:latest
docker.io/starburstdata/presto:latest
zxf@localhost ~ %

2)下载presto客户端jar文件

因为pull下来的镜像是server,是没有presto-cli命令的,所以需要下载presto-cli-0.260.1-executable.jar,然后将下载好的jar包拉入Linux系统中。

下载完成后,run容器:

#端口号为8080,请自行修改,名字为presto

docker run -d -p 8080:8080  --name presto starburstdata/presto

将客户端jar包拷贝到容器中的bin目录下:

docker cp [客户端jar包所在的linux路径] [容器名]:/bin

如:

zxf@localhost Downloads % docker cp /Users/zxf/Downloads/presto-cli-0.260.1-executable.jar presto:/bin

3)将hadoop配置拷贝到容器

进入到hadoop配置文件目录,将core-site.xml和hdfs-site.xml复制到容器中

cd ${HADOOP_HOME}/etc/hadoop

docker cp core-site.xml presto:/usr/lib/presto/etc/

docker cp hdfs-site.xml presto:/usr/lib/presto/etc/

我的不是装本地,远程连接,所以找到

【Docker】安装Presto连接Hive、mysql、oracle、postgresql、SQL server等7种类型数据库_第1张图片

进入容器(以下不标注都是在容器中进行的操作):

#以root用户进入容器,防止没有权限操作文件

docker exec --user=root -it presto /bin/bash

将客户端jar包改名并赋予可执行权限:

cd bin

mv presto-cli-0.260.1-executable.jar presto-cli

chmod a+x presto-cli

4)新增hive.properties配置文件

进入配置文件目录,创建hive配置文件:

cd /usr/lib/presto/etc/catalog

vi hive.properties

hive.properties:

#连接名,固定

connector.name=hive-hadoop2

#hive元数据uri,在hive-site.xml里能够找到,请自行修改ip和端口

hive.metastore.uri=thrift://dsmaster:19083

#hive配置的资源 core-site.xml和hdfs-site.xml,请根据自己集群中的配置文件路径进行修改,中间用逗号隔开

hive.config.resources=/usr/lib/presto/etc/core-site.xml,/usr/lib/presto/etc/hdfs-site.xml

wq保存退出

其中,元数据可以去ambari上看

【Docker】安装Presto连接Hive、mysql、oracle、postgresql、SQL server等7种类型数据库_第2张图片

 5)重启容器(在linux命令行下):

重启前检查下3个文件权限(core-site.xml、hdfs-site.xml和hive.properties

[root@e640f5a2d205 bin]# cd /usr/lib/presto/etc/catalog/
[root@e640f5a2d205 catalog]# ls -l
total 20
-rw-r--r-- 1    501 games 401 Jun 14 07:16 hive.properties
-rw-r--r-- 1 presto root   19 Dec 17  2020 jmx.properties
-rw-r--r-- 1 presto root   22 Dec 17  2020 memory.properties
-rw-r--r-- 1 presto root   45 Dec 17  2020 tpcds.properties
-rw-r--r-- 1 presto root   43 Dec 17  2020 tpch.properties
[root@e640f5a2d205 catalog]# chown presto:root hive.properties
[root@e640f5a2d205 catalog]# ls -l
total 20
-rw-r--r-- 1 presto root 401 Jun 14 07:16 hive.properties
-rw-r--r-- 1 presto root  19 Dec 17  2020 jmx.properties
-rw-r--r-- 1 presto root  22 Dec 17  2020 memory.properties
-rw-r--r-- 1 presto root  45 Dec 17  2020 tpcds.properties
-rw-r--r-- 1 presto root  43 Dec 17  2020 tpch.properties
[root@e640f5a2d205 catalog]# cd ..
[root@e640f5a2d205 etc]# ll
total 36
drwxr-xr-x 1 presto root  4096 Jun 14 07:20 catalog
-rw-r--r-- 1 presto root   178 Dec 17  2020 config.properties
-rw-r--r-- 1    501 games 4655 Jun 14 03:52 core-site.xml
-rw-r--r-- 1    501 games 6941 Jun 14 04:01 hdfs-site.xml
-rw-r--r-- 1 presto root   295 Dec 17  2020 jvm.config
-rw-r--r-- 1 presto root    57 Dec 17  2020 log.properties
-rw-r--r-- 1 presto root    85 Dec 17  2020 node.properties
[root@e640f5a2d205 etc]# chown presto:root *
[root@e640f5a2d205 etc]# ls -l
total 36
drwxr-xr-x 1 presto root 4096 Jun 14 07:20 catalog
-rw-r--r-- 1 presto root  178 Dec 17  2020 config.properties
-rw-r--r-- 1 presto root 4655 Jun 14 03:52 core-site.xml
-rw-r--r-- 1 presto root 6941 Jun 14 04:01 hdfs-site.xml
-rw-r--r-- 1 presto root  295 Dec 17  2020 jvm.config
-rw-r--r-- 1 presto root   57 Dec 17  2020 log.properties
-rw-r--r-- 1 presto root   85 Dec 17  2020 node.properties
docker restart presto

3、测试连接

进入容器:

#以root用户进入容器,防止没有权限操作文件

docker exec --user=root -it presto /bin/bash

#进入bin目录

cd bin

#执行命令行脚本并测试hive连接,连接到hive配置文件,数据库是default

[root@e640f5a2d205 /]# cd bin
[root@e640f5a2d205 bin]# ./presto-cli --server localhost:8080 --catalog hive --schema default
presto:default> show tables;
         Table
-----------------------
 buss
 sdm_info_1
 t_sys
 t_sys_data_permission
 t_user
(5 rows)

Query 20220614_073624_00009_wd2j6, FINISHED, 1 node
Splits: 19 total, 19 done (100.00%)
0:01 [5 rows, 131B] [3 rows/s, 88B/s]

presto:default>

#换test看看
presto:default>exit
[root@e640f5a2d205 bin]# ./presto-cli --server localhost:8080 --catalog hive --schema test
presto:test> show tables;
   Table
------------
 buss
 newtable
 sdm_info_1
(3 rows)

Query 20220614_073524_00006_wd2j6, FINISHED, 1 node
Splits: 19 total, 19 done (100.00%)
0:04 [3 rows, 64B] [0 rows/s, 16B/s]

presto:test>

说明:要是连不上,检查/etc/hosts,有做集群的,要都带上,如:

192.168.1.86 dsmaster
192.168.1.87 dsslave1
192.168.1.88 dsslave2

 hive环境搭建可参考,小编整理的详细安装过程,有问题可以留言,谢谢!

Ambari安装和配置详细步骤_小慌慌的博客-CSDN博客_ambari安装​目录一、准备环境二、修改主机名和hosts文件八、安装ambari九、系统配置十、实例演示一、准备环境1、服务器准备至少3台我这边准备了3台:192.168.1.86(master)192.168.1.87(slave1)192.168.1.88(slave2)2、在(master上):mkdir -p /var/www/html​3、ambari依赖包准备,上传到主节点master的/var/www/html路径下(本次选择的amb..https://blog.csdn.net/whowhowhoisimportant/article/details/120096424?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522165519242616782425118312%2522%252C%2522scm%2522%253A%252220140713.130102334.pc%255Fblog.%2522%257D&request_id=165519242616782425118312&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~blog~first_rank_ecpm_v1~rank_v31_ecpm-1-120096424-null-null.nonecase&utm_term=amb&spm=1018.2226.3001.4450

4、其他类型数据库配置连接

与hive的类似

1)mysql

cd /usr/lib/presto/etc/catalog

vi mysql.properties

#设置MySQL连接名称
connector.name=mysql
#设置MySQL连接地址
connection-url=jdbc:mysql://localhost:3306
#设置MySQL登录用户
connection-user=root
#设置MySQL登录密码
connection-password=123456

启动

[root@e640f5a2d205 /]# cd bin
[root@e640f5a2d205 bin]# ./presto-cli --server localhost:8080 --catalog mysql

2)oracle

cd /usr/lib/presto/etc/catalog

vi oracle.properties

connector.name=oracle
# The correct syntax of the connection-url varies by Oracle version and
# configuration. The following example URL connects to an Oracle SID named
# "orcl".
connection-url=jdbc:oracle:thin:@ip:1521:orl
connection-user=user
connection-password=password

启动

[root@e640f5a2d205 /]# cd bin
[root@e640f5a2d205 bin]# ./presto-cli --server localhost:8080 --catalog oracle

3)PostgreSQL

cd /usr/lib/presto/etc/catalog

vi postgresql.properties

connector.name=postgresql
connection-url=jdbc:postgresql://ip:5432/database
connection-user=user
connection-password=password

启动

[root@e640f5a2d205 /]# cd bin
[root@e640f5a2d205 bin]# ./presto-cli --server localhost:8080 --catalog postgresql

Presto连接支持7种类型数据库:hive、mysql、oracle、postgresql、SQL server、MongoDB、Kudu。仅限于查询、连接。还支持中间件连接(redis、kafka、​​​​​​​​Elasticsearch )

详细可参考官方文档

Presto 0.273.3 官方文档​​​​​​​

你可能感兴趣的:(docker,hive,big,data,hadoop)