Hadoop_23_oozie与hue整合

oozie与hue整合

  • 停止oozie与hue的进程
  • 修改hue的配置文件
    • 修改hue的配置文件hue.ini
  • 启动hue与oozie的进程
  • oozie使用过程当中可能遇到的问题

停止oozie与hue的进程

通过命令停止oozie与hue的进程,准备修改oozie与hue的配置文件
bin/oozied.sh stop

修改hue的配置文件

修改hue的配置文件hue.ini

[liboozie]
  # The URL where the Oozie service runs on. This is required in order for
  # users to submit jobs. Empty value disables the config check.
  oozie_url=http://node03.hadoop.com:11000/oozie

  # Requires FQDN in oozie_url if enabled
  ## security_enabled=false

  # Location on HDFS where the workflows/coordinator are deployed when submitted.
  remote_deployement_dir=/user/root/oozie_works

修改oozie的配置文件大概在1151行左右的样子

[oozie]
  # Location on local FS where the examples are stored.
  # local_data_dir=/export/servers/oozie-4.1.0-cdh5.14.0/examples/apps

  # Location on local FS where the data for the examples is stored.
  # sample_data_dir=/export/servers/oozie-4.1.0-cdh5.14.0/examples/input-data

  # Location on HDFS where the oozie examples and workflows are stored.
  # Parameters are $TIME and $USER, e.g. /user/$USER/hue/workspaces/workflow-$TIME
  # remote_data_dir=/user/root/oozie_works/examples/apps

  # Maximum of Oozie workflows or coodinators to retrieve in one API call.
  oozie_jobs_count=100

  # Use Cron format for defining the frequency of a Coordinator instead of the old frequency number/unit.
  enable_cron_scheduling=true

  # Flag to enable the saved Editor queries to be dragged and dropped into a workflow.
  enable_document_action=true

  # Flag to enable Oozie backend filtering instead of doing it at the page level in Javascript. Requires Oozie 4.3+.
  enable_oozie_backend_filtering=true

  # Flag to enable the Impala action.
  enable_impala_action=true

[filebrowser]
  # Location on local filesystem where the uploaded archives are temporary stored.
  archive_upload_tempdir=/tmp

  # Show Download Button for HDFS file browser.
  show_download_button=true

  # Show Upload Button for HDFS file browser.
  show_upload_button=true

  # Flag to enable the extraction of a uploaded archive in HDFS.
  enable_extract_uploaded_archive=true

启动hue与oozie的进程

启动hue进程
cd /export/servers/hue-3.9.0-cdh5.14.0
build/env/bin/supervisor
启动oozie进程
cd /export/servers/oozie-4.1.0-cdh5.14.0
bin/oozied.sh start

页面访问hue
http://node03.hadoop.com:8888/

oozie使用过程当中可能遇到的问题

  1. Mysql权限配置
    授权所有主机可以使用root用户操作所有数据库和数据表
    mysql> grant all on . to root@’%’ identified by ‘123456’ with grant option;
    mysql> flush privileges;
    mysql> exit;

  2. workflow.xml配置的时候不要忽略file属性

  3. jps查看进程时,注意有没有bootstrap bootstrao是oozie的进程

  4. 关闭oozie
    如果bin/oozied.sh stop无法关闭,则可以使用kill -9 [pid],之后oozie根目录下的oozie-server/temp/xxx.pid文件一定要删除。

  5. Oozie重新打开时,一定要注意先关闭进程,删除对应文件夹下面的pid文件。(可以参考第4条目)

  6. 配置文件一定要生效
    起始标签和结束标签无对应则不生效,配置文件的属性写错了,那么则执行默认的属性。

  7. libext下边的jar存放于某个文件夹中,导致share/lib创建不成功。

  8. 修改Hadoop配置文件,需要重启集群。一定要记得scp到其他节点。

  9. JobHistoryServer必须开启,集群要重启的。

  10. Mysql配置如果没有生效的话,默认使用derby数据库。

  11. 在本地修改完成的job配置,必须重新上传到HDFS。

  12. 将HDFS中上传的oozie配置文件下载下来查看是否有错误。

  13. Linux用户名和Hadoop的用户名不一致。

14)sharelib找不到,包括重新初始化oozie
如果部署oozie出错,修复执行,初始化oozie:
1、停止oozie(要通过jps检查bootstrap进程是否已经不存在)
2、删除oozie-server/temp/*
3、删除HDFS上的sharelib文件夹
4、删除oozie.sql文件,删除Mysql中删除oozie库,重新创建
5、重新按照顺序执行文档中oozie的安装重新再来一遍

你可能感兴趣的:(Hadoop_23_oozie与hue整合)