Spark Streaming源码解读之JobScheduler内幕实现和深度思考

Spark Streaming中JobScheduler是整个Job的调度中心,会调度ReceiverTracker来接受数据,JobGenerator来生成Job,所以JobScheduler是Spark Streaming中的作业调度总控制中心。


DStream是Spark Streaming中数据处理的单位,DStream是RDD的模板,集合,下图是使用简单的print函数,来说明,逻辑级别的DStream到物理级别的RDD转换,执行的过程图:




JobScheduler重要方法源码跟踪步骤:

Spark Streaming源码解读之JobScheduler内幕实现和深度思考_第1张图片



备注:技术资源来自大数据Spark第一人王家林
QQ:1740415547
新浪微博:http://weibo.com/ilovepains/

你可能感兴趣的:(spark,spark,大数据,Streaming,Streaming,JobScheduler)