presto升级操作文档

1、前言

由于presto基于内存计算,相比较与hive(on spark)有更好的交互查询体验,组织决定使用presto作为主要的交互查询工具,hive作为跑批使用。有个问题就是我们ETL后的数据都是avro格式的数据,当前我们使用的presto(0.185)暂时还不支持avro格式表的查询操作,故需要一次整体升级操作,将presto升级到0.205。

2、流程描述

相较于其他服务的升级,该服务的升级相对比较麻烦一点,主要的思路就是:停掉之前所有节点的presto服务;将新版本分发到各个节点;配置相关环境;启动新版本的presto服务。中间主要用到ansible工具作为分发软件包及相关配置的操作。所以前提条件是需要安装ansible且配置了免登陆。

3、操作步骤

3.1 停掉所有presto服务

这里使用ansible命令:

ansible presto  -m command -a "/opt/soft/presto-server-0.185/bin/launcher stop"

3.2 分发新版本软件包

现将新版本的presto下载到主节点(192.168.49.110)然后使用ansible命令分发到各个节点。

下载然后分发

wget https://repo1.maven.org/maven2/com/facebook/presto/presto-server/0.205/presto-server-0.205.tar.gz  
ansible presto -m copy -a "src=/opt/sot/presto-server-0.205.tar.gz dest=/opt/soft/"

解压软件包

主节点直接解压

tar -zxvf presto-server-0.205.tar.gz

其他节点使用ansible命令解压

ansible presto -m command -a "tar -zxvf /opt/soft/presto-server-0.205.tar.gz -C /opt/soft/"

注意点:这里都是root用户在操作,待会需要修改一下目录权限以及所属者的问题。

3.3 修改相应的配置

3.3.1 修改主节点的配置

将老版本的配置都拷贝过来,修改几个地方即可

#config.properties

coordinator=true
node-scheduler.include-coordinator=false
http-server.http.port=8866
query.max-memory=128GB
query.max-total-memory-per-node=8GB(注意:之前这个参数名为query.max-memory-per-node,由于版本更新官方对这个参数做了调整)
discovery-server.enabled=true
discovery.uri=http://192.168.49.110:8866

exchange.http-client.request-timeout=500s

这里配置一个worker节点的文件作为之后分发的源文件

#worker-config.properties

coordinator=false
http-server.http.port=8866
query.max-memory=128GB
query.max-total-memory-per-node=8GB
discovery.uri=http://192.168.49.110:8866
exchange.http-client.request-timeout=500s

还需要更改一下启动脚本,添加一下java8的环境:

vim bin/launcher
export JAVA_HOME=/opt/soft/java/jdk1.8.0_111
export PATH=$JAVA_HOME/bin:$PATH

3.3.2 接下来就是分发配置了。

替换掉之前的启动脚本launcher

ansible presto -m command -a "rm -rf /opt/soft/presto-server-0.205/bin/launcher"

ansible presto -m copy - a "src=/opt/soft/presto-server-0.205/bin/launcher dest=/opt/soft/presto-server-0.205/bin/"

分发节点配置

ansible presto -m copy -a "src=/opt/soft/presto-server-0.205/etc dest=/opt/soft/presto-server-0.205"

在worker节点需要更改两个地方:1、删掉server节点的配置文件config.properties,然后将worker-config.properties文件重命名为config.properties;2、修改node.properties文件将node.id值改为本节点对应的编号(注意这个值必须唯一,且跟上个版本保持一致)

ansible presto -m command -a "rm -rf /opt/soft/presto-server-0.205/etc/config.properties "

ansible presto -m command -a "mv /opt/soft/presto-server-0.205/etc/worker-config.properties /opt/soft/presto-server-0.205/etc/config.properties"

修改操作就必须在每台worker节点操作了。。。

3.4 上面都配置成功之后,接下来还需要更改目录权限以及所属者了,因为都是以root用户在使用ansible,但是后面我们需要使用dmp用户来启动服务。

ansible presto -m command -a "chown -R dmp:infra /opt/soft/presto-server-0.205"

3.5 最后就是启动服务了,这里最好使用ansible的Playbooks 剧本模式,因为worker节点也需要使用dmp用户来启动,所有需要指定用户,原生的ansible命令暂时还不支持切换用户执行命令的功能。

- hosts: presto    # 运行指定任务的目标主机
  remote_user: dmp    # 在远程主机上执行任务的用户
  tasks:    # 任务列表
  - name: start presto    # 设置任务名称,非必要
    command: opt/soft/presto-server-0.205/bin/launcher start

4、验证升级是否成功

4.1 第一步查看每个节点的presto服务是否都已启动,且都切换到0.205版本。

ansible presto -m command -a "ps -ef | grep presto"

4.2 浏览器访问presto主页,查看版本以及节点数是否一致

presto2.png

5、总结

在此次升级操作过程中,几个重要的关键点:1、配置参数要随着版本的更迭做相应的调整;2、需要熟练掌握ansible,目前还处于初始阶段,肯定还有比我这个更好的方式来实现;3、presto的worker节点的编号必须唯一;4、服务必须都是dmp用户启动的,不然会报出很多权限错误。

这只是我想到的一种方式,总感觉有点繁琐,希望有人能提供更好的方式,大家共同学习!!!

你可能感兴趣的:(presto升级操作文档)