1、前言
由于presto基于内存计算,相比较与hive(on spark)有更好的交互查询体验,组织决定使用presto作为主要的交互查询工具,hive作为跑批使用。有个问题就是我们ETL后的数据都是avro格式的数据,当前我们使用的presto(0.185)暂时还不支持avro格式表的查询操作,故需要一次整体升级操作,将presto升级到0.205。
2、流程描述
相较于其他服务的升级,该服务的升级相对比较麻烦一点,主要的思路就是:停掉之前所有节点的presto服务;将新版本分发到各个节点;配置相关环境;启动新版本的presto服务。中间主要用到ansible工具作为分发软件包及相关配置的操作。所以前提条件是需要安装ansible且配置了免登陆。
3、操作步骤
3.1 停掉所有presto服务
这里使用ansible命令:
ansible presto -m command -a "/opt/soft/presto-server-0.185/bin/launcher stop"
3.2 分发新版本软件包
现将新版本的presto下载到主节点(192.168.49.110)然后使用ansible命令分发到各个节点。
下载然后分发
wget https://repo1.maven.org/maven2/com/facebook/presto/presto-server/0.205/presto-server-0.205.tar.gz
ansible presto -m copy -a "src=/opt/sot/presto-server-0.205.tar.gz dest=/opt/soft/"
解压软件包
主节点直接解压
tar -zxvf presto-server-0.205.tar.gz
其他节点使用ansible命令解压
ansible presto -m command -a "tar -zxvf /opt/soft/presto-server-0.205.tar.gz -C /opt/soft/"
注意点:这里都是root用户在操作,待会需要修改一下目录权限以及所属者的问题。
3.3 修改相应的配置
3.3.1 修改主节点的配置
将老版本的配置都拷贝过来,修改几个地方即可
#config.properties
coordinator=true
node-scheduler.include-coordinator=false
http-server.http.port=8866
query.max-memory=128GB
query.max-total-memory-per-node=8GB(注意:之前这个参数名为query.max-memory-per-node,由于版本更新官方对这个参数做了调整)
discovery-server.enabled=true
discovery.uri=http://192.168.49.110:8866
exchange.http-client.request-timeout=500s
这里配置一个worker节点的文件作为之后分发的源文件
#worker-config.properties
coordinator=false
http-server.http.port=8866
query.max-memory=128GB
query.max-total-memory-per-node=8GB
discovery.uri=http://192.168.49.110:8866
exchange.http-client.request-timeout=500s
还需要更改一下启动脚本,添加一下java8的环境:
vim bin/launcher
export JAVA_HOME=/opt/soft/java/jdk1.8.0_111
export PATH=$JAVA_HOME/bin:$PATH
3.3.2 接下来就是分发配置了。
替换掉之前的启动脚本launcher
ansible presto -m command -a "rm -rf /opt/soft/presto-server-0.205/bin/launcher"
ansible presto -m copy - a "src=/opt/soft/presto-server-0.205/bin/launcher dest=/opt/soft/presto-server-0.205/bin/"
分发节点配置
ansible presto -m copy -a "src=/opt/soft/presto-server-0.205/etc dest=/opt/soft/presto-server-0.205"
在worker节点需要更改两个地方:1、删掉server节点的配置文件config.properties,然后将worker-config.properties文件重命名为config.properties;2、修改node.properties文件将node.id值改为本节点对应的编号(注意这个值必须唯一,且跟上个版本保持一致)
ansible presto -m command -a "rm -rf /opt/soft/presto-server-0.205/etc/config.properties "
ansible presto -m command -a "mv /opt/soft/presto-server-0.205/etc/worker-config.properties /opt/soft/presto-server-0.205/etc/config.properties"
修改操作就必须在每台worker节点操作了。。。
3.4 上面都配置成功之后,接下来还需要更改目录权限以及所属者了,因为都是以root用户在使用ansible,但是后面我们需要使用dmp用户来启动服务。
ansible presto -m command -a "chown -R dmp:infra /opt/soft/presto-server-0.205"
3.5 最后就是启动服务了,这里最好使用ansible的Playbooks 剧本模式,因为worker节点也需要使用dmp用户来启动,所有需要指定用户,原生的ansible命令暂时还不支持切换用户执行命令的功能。
- hosts: presto # 运行指定任务的目标主机
remote_user: dmp # 在远程主机上执行任务的用户
tasks: # 任务列表
- name: start presto # 设置任务名称,非必要
command: opt/soft/presto-server-0.205/bin/launcher start
4、验证升级是否成功
4.1 第一步查看每个节点的presto服务是否都已启动,且都切换到0.205版本。
ansible presto -m command -a "ps -ef | grep presto"
4.2 浏览器访问presto主页,查看版本以及节点数是否一致
5、总结
在此次升级操作过程中,几个重要的关键点:1、配置参数要随着版本的更迭做相应的调整;2、需要熟练掌握ansible,目前还处于初始阶段,肯定还有比我这个更好的方式来实现;3、presto的worker节点的编号必须唯一;4、服务必须都是dmp用户启动的,不然会报出很多权限错误。