oozie定时调度的配置说明第二篇

这一讲相对上一讲会稍微难点

job.properties 文件 和 coordinato.xml 上一讲已经讲过,本次就不再做过多的赘述了

job.properties

# 集群参数
nameNode=hdfs://master:8020
jobTracker=master:8032
queueName=default


# oozie.coord.application.path=${nameNode}/work/coordinator.xml
# start=2016-12-06T16:00Z
# end=2019-07-30T16:00Z
workflowAppUri=${nameNode}/work/workflow1.xml
# workflow文件在hdfs上的目录
oozie.wf.application.path=${workflowAppUri}
# jar包的路径
jarsDir=/home/work/jars_test
hiveSQLDir=/home/work/HiveSql
# jar包所在机器的host
sshHost=master
sshUser=root
# workflow的名称
workflowName=workflow
# subworkflow
workflow2=workflow2.xml
workflow3=workflow3.xml
# impala
impalaIP=192.168.247.3

coordinator.xml


 
   
      ${workflowAppUri}
     
       
          jobTracker
          ${jobTracker}
       

       
          nameNode
          ${nameNode}
       

       
          queueName
          ${queueName}
       

     

   

 


workflow1.xml


   
    work1
">--执行开始的action
       
            ${sshUser}@${sshHost}
       hadoop jar
            ${jarsDir}/work1.jar 
       

        --work1执行成功以后执行work2
       
   

       
            ${sshUser}@${sshHost}
      hadoop jar
            ${jarsDir}/work2.jar
            :oozie:ssh:W=${workflowName}:A=work2:ID=${wf:id()}
       

        work2执行成功以后执行fork_00
       
   


    --fork标签的意思是并行的执行里面的任务
       
       
   



       
            ${sshUser}@${sshHost}
            hadoop jar
            ${jarsDir}/work3.jar
            :oozie:ssh:W=${workflowName}:A=work3:ID=${wf:id()}
       

       
       
   


       
            ${sshUser}@${sshHost}
            hadoop jar
            ${jarsDir}/work4.jar
            :oozie:ssh:W=${workflowName}:A=work4:ID=${wf:id()}
       

       
       
   


--join的意思是 只有在 work3 和work4 也就是fork的程序都执行成功以后再执行以下内容


       
            ${sshUser}@${sshHost}
            hadoop jar
            ${jarsDir}/work5.jar
            :oozie:ssh:W=${workflowName}:A=work5:ID=${wf:id()}
       

       
       
   


workflow2">---可以执行另外一个workflow

${nameNode}/user/${workflow2}


 nameNode
 ${nameNode}


 jobTracker
 ${jobTracker}


 queueName
 ${queueName}


 jarsDir
 ${jarsDir}


 hiveSQLDir
 ${hiveSQLDir}


 sshHost
 ${sshHost}


 sshUser
 ${sshUser}


 workflowName
 ${workflowName}_subworkflow_part2


 subworkflow_part2_xml
 ${subworkflow_part2_xml}


 subworkflow_part3_xml
 ${subworkflow_part3_xml}


 impalaIP
 ${impalaIP}







   
        Java failed, error message[${wf:errorMessage(wf:lastErrorNode())}]
   

   

你可能感兴趣的:(oozie)