JobTracker实现原理(一)

      首先进行JobTacker内部实现原理的解析。  

    JobTrackerMap/Reduce模型中的MAster节点,JobTracker负责作业控制和资源管理。作业控制模块则负责作业的分解和状态监控。

状态监控负责TaskTracker,作业和任务的状态监控。作用为容错和为任务调度提供依据。

资源管理则是通过一定的策略将节点中的资源分配给集群中的任务。由任务调度器TaskScheduler完成。

JobTracker的内部实现结构如下图1-1所示


                                       图1-1

      数据结构Maps:将相关信息封装为各种对象后,保存到Map中。jobstrackerToTaskMap等等。JobTracker的各种操作如监控、更新。即为修改map中的映射关系。

     三层多叉树监控状态:依次从上向下可分为作业监控层、任务监控层和任务执行层。每个作业由一个JobInProgress对象跟踪其整体运行状态和每个任务的运行情况。每个任务有一个TaskInpROGRESSDUIXIANG 描述和跟踪其运行状态。每个任务尝试执行多次直至成功为止。当一个TA运行成功,则TIP会标注其运行成功。当所有的TIP都运行成功,则JIP会标记整个作业运行成功。

   Taskscheduler:任务调度器

   RPC Server:远程调度器


你可能感兴趣的:(hadoop)