CDH集成Kylin

CDH集成Kylin


  • 下载地址:下载CDH5版本Kylin

一、安装启动

1. 上传并解压下载的tar包

tar -zxvf apache-kylin-2.6.4-bin-cdh57.tar.gz -C /opt/cdh-5.15.2
mv apache-kylin-2.6.4-bin-cdh57 kylin-2.6.4

2. 配置环境变量

  • 注意:Spark作为Kylin启动的一项环境检查,无论是否使用Spark作为Kylin的构建引擎,都需要集群安装Spark
sudo vim /etc/profile
#
# SPARK_HOME
export SPARK_HOME=/opt/cdh-5.15.2/cloudera/parcels/SPARK2/lib/spark2
export PATH=$PATH:$SPARK_HOME/sbin
#
# KYLIN_HOME
export KYLIN_HOME=/opt/cdh-5.15.2/kylin-2.6.4
export PATH=$PATH:KYLIN_HOME/bin
#
# 重加载文件生效
source /etc/profile

3. 修改配置文件

vim $KYLIN_HOME/conf/kylin.properties
#
# 修改:
kylin.server.cluster-servers=192.168.1.120:7070
# 增加:
kylin.job.jar=$KYLIN_HOME/lib/kylin-job-2.6.3.jar
kylin.coprocessor.local.jar=$KYLIN_HOME/lib/kylin-coprocessor-2.6.3.jar
kylin.job.yarn.app.rest.check.status.url=http://192.168.1.57:8088/ws/v1/cluster/apps/{job_id}?anonymous=true
  • 配置文件中有详细说明,此处不一一列举

4. 执行环境检查

sudo -u hdfs $KYLIN_HOME/bin/check-env.sh
  • CDH集群会为组件创建独立的用户,此处如使用错误用户会报HDFS权限错误,解决方法即将用户添加到supergroup组中,具体方法在CentOS7离线安装CDH5.15中已写明,此处不再赘述

5. 启动服务

$KYLIN_HOME/bin/kylin.sh start
$KYLIN_HOME/bin/kylin.sh sop
  • 没有restart

二、登录Web页面

  • 地址:http://host:7070/kylin
  • 默认用户
    • 管理:ADMIN / KYLIN
    • 建模:MODELER / MODELER
    • 分析:ANALYST / ANALYST
  • 用户需要在Web页面登陆一次后才能正常使用,自定义用户后续会写

三、其他配置

(一)配置Impala为下压查询引擎

1. 修改kylin.properties

kylin.query.pushdown.runner-class-name=org.apache.kylin.query.adhoc.PushDownRunnerJdbcImpl
kylin.query.pushdown.jdbc.url=jdbc:impala://host:21050/default
kylin.query.pushdown.jdbc.driver=com.cloudera.impala.jdbc41.Driver
# 如未配置用户认证,用户可用任意有hdfs权限的系统用户
kylin.query.pushdown.jdbc.username=hadoop
# kylin.query.pushdown.jdbc.password=
kylin.query.pushdown.jdbc.pool-max-total=150
kylin.query.pushdown.jdbc.pool-max-idle=100
kylin.query.pushdown.jdbc.pool-min-idle=50

2. 上传Impala的JDBC驱动

  • 下载地址:下载Impala的JDBC
  • 解压下载的zip包,上传ImpalaJDBC41.jar到$KYLIN_HOME/lib下,重启Kylin

(二)配置Presto为下压查询引擎

1. 修改kylin.properties

kylin.query.pushdown.runner-class-name=org.apache.kylin.query.adhoc.PushDownRunnerJdbcImpl
kylin.query.pushdown.jdbc.url=jdbc:presto://coordinator-host:port/hive
kylin.query.pushdown.jdbc.driver=com.facebook.presto.jdbc.PrestoDriver
# 如未配置用户认证,用户可用任意有hdfs权限的系统用户
kylin.query.pushdown.jdbc.username=hadoop
# kylin.query.pushdown.jdbc.password=
kylin.query.pushdown.jdbc.pool-max-total=150
kylin.query.pushdown.jdbc.pool-max-idle=100
kylin.query.pushdown.jdbc.pool-min-idle=50

2. 上传Impala的JDBC驱动

  • 下载地址:下载Presto的JDBC
  • 上传presto-jdbc-0.228.jar到$KYLIN_HOME/lib下,重启Kylin

(三)修改压缩算法

  • Kylin默认使用Snappy压缩,可通过配置文件修改为lzo、gzip、lz4、none
  • 修改为lzo压缩
vim conf/kylin.properties
#
kylin.storage.hbase.compression-codec=lzo
  • 需要集群支持LZO压缩,方法在CentOS7离线安装CDH5.15中已写明,此处不再赘述

四、注意事项

(一)HDFS权限报错

  • 解决办法:将Kylin的启动账户添加到supergroup组中,具体操作见CentOS7离线安装CDH5.15

(二)关于下压查询

  1. Impala-2.12不支持date类型,在使用Impala为下压查询引擎时,时间字段不要使用date类型
  2. Presto查询使用的varchar类型与Kylin不兼容,在使用Presto为下压查询引擎时,建议使用string作为字符串类型

你可能感兴趣的:(CDH)