lhui798

版本定制第5课：基于案例一节课贯通Spark Streaming流计算框架的运行源码

本期内容：

1、在线动态计算分类最热门商品案例回顾与演示

2、基于案例贯通Spark Streaming的运行源码

第一部分案例：

 
   package com.dt.spark.sparkstreaming 
   
 
   
 
   import com.robinspark.utils.ConnectionPool 
   
 
   import org.apache.spark.SparkConf 
   
 
   import org.apache.spark.sql.Row 
   
 
   import org.apache.spark.sql.hive.HiveContext 
   
 
   import org.apache.spark.sql.types.{IntegerType 
   , StringType 
   , StructField 
   , StructType} 
   
 
   import org.apache.spark.streaming.{Seconds 
   , StreamingContext} 
   
 
   
 
   /**
  
     *  
   使用 
   Spark Streaming+Spark SQL 
   来在线动态计算电商中不同类别中最热门的商品排名，例如手机这个类别下面最热门的三种手机、电视这个类别
  
      
   *  
   下最热门的三种电视，该实例在实际生产环境下具有非常重大的意义；
  
      
   *
  
     *  
   @author  
   DT 
   大数据梦工厂
  
      
   *  
   新浪微博： 
   http://weibo.com/ilovepains/
  
     *
  
     *
  
     *    
   实现技术： 
   Spark Streaming+Spark SQL 
   ，之所以 
   Spark Streaming 
   能够使用 
   ML 
   、 
   sql 
   、 
   graphx 
   等功能是因为有 
   foreachRDD 
   和 
   Transform
  
     *  
   等接口，这些接口中其实是基于 
   RDD 
   进行操作，所以以 
   RDD 
   为基石，就可以直接使用 
   Spark 
   其它所有的功能，就像直接调用 
   API 
   一样简单。
  
      
   *   
   假设说这里的数据的格式： 
   user item category 
   ，例如 
   Rocky Samsung Android
  
     */
  
   object OnlineTheTop3ItemForEachCategory2DB { 
   
    
   def  
   main(args: Array[ 
   String]){ 
   
      
   /**
  
         *  
   第 
   1 
   步：创建 
   Spark 
   的配置对象 
   SparkConf 
   ，设置 
   Spark 
   程序的运行时的配置信息，
  
          
   *  
   例如说通过 
   setMaster 
   来设置程序要链接的 
   Spark 
   集群的 
   Master 
   的 
   URL, 
   如果设置
  
          
   *  
   为 
   local 
   ，则代表 
   Spark 
   程序在本地运行，特别适合于机器配置条件非常差（例如
  
          
   *  
   只有 
   1G 
   的内存）的初学者        
   *
  
         */
  
        
   val conf =  
   new SparkConf()  
   // 
   创建 
   SparkConf 
   对象
  
       conf.setAppName( 
   "OnlineTheTop3ItemForEachCategory2DB")  
   // 
   设置应用程序的名称，在程序运行的监控界面可以看到名称
  
       conf.setMaster( 
   "spark://Master:7077")  
   // 
   此时，程序在 
   Spark 
   集群
  
        
   //conf.setMaster("local[2]")
  
       // 
   设置 
   batchDuration 
   时间间隔来控制 
   Job 
   生成的频率并且创建 
   Spark Streaming 
   执行的入口
  
        
   val ssc =  
   new StreamingContext(conf 
   ,  
   Seconds( 
   5)) 
   
 
   
     ssc.checkpoint( 
   "/root/Documents/SparkApps/checkpoint") 
   
 
   
      
   val userClickLogsDStream = ssc.socketTextStream( 
   "Master" 
   ,  
   9999) 
   
 
   
      
   val formattedUserClickLogsDStream = userClickLogsDStream.map(clickLog => 
   
         (clickLog.split( 
   " ")( 
   2) +  
   "_" + clickLog.split( 
   " ")( 
   1) 
   ,  
   1)) 
   
 
   
 
   //    val categoryUserClickLogsDStream = formattedUserClickLogsDStream.reduceByKeyAndWindow((v1:Int, v2: Int) => v1 + v2,
  
   //      (v1:Int, v2: Int) => v1 - v2, Seconds(60), Seconds(20))
  
   
  
        
   val categoryUserClickLogsDStream = formattedUserClickLogsDStream.reduceByKeyAndWindow(_+_ 
   ,
  
         _-_ 
   ,  
   Seconds( 
   60) 
   ,  
   Seconds( 
   20)) 
   
 
   
     categoryUserClickLogsDStream.foreachRDD { rdd => { 
   
        
   if (rdd.isEmpty()) { 
   
          
   println( 
   "No data inputted!!!") 
   
       }  
   else { 
   
          
   val categoryItemRow = rdd.map(reducedItem => { 
   
            
   val category = reducedItem._1.split( 
   "_")( 
   0) 
   
            
   val item = reducedItem._1.split( 
   "_")( 
   1) 
   
            
   val click_count = reducedItem._2 
   
            
   Row(category 
   , item 
   , click_count) 
   
         }) 
   
 
   
          
   val structType =  
   StructType( 
   Array( 
   
            
   StructField( 
   "category" 
   , StringType 
   ,  
   true) 
   ,
  
              
   StructField( 
   "item" 
   , StringType 
   ,  
   true) 
   ,
  
              
   StructField( 
   "click_count" 
   , IntegerType 
   ,  
   true) 
   
         )) 
   
 
   
          
   val hiveContext =  
   new HiveContext(rdd.context) 
   
          
   val categoryItemDF = hiveContext.createDataFrame(categoryItemRow 
   , structType) 
   
 
   
         categoryItemDF.registerTempTable( 
   "categoryItemTable") 
   
 
   
          
   val reseltDataFram = hiveContext.sql( 
   "SELECT category,item,click_count FROM (SELECT category,item,click_count,row_number()" + 
   
            
   " OVER (PARTITION BY category ORDER BY click_count DESC) rank FROM categoryItemTable) subquery " + 
   
            
   " WHERE rank <= 3") 
   
         reseltDataFram.show() 
   
 
   
          
   val resultRowRDD = reseltDataFram. 
   rdd
  
   
  
           resultRowRDD.foreachPartition { partitionOfRecords => { 
   
 
   
            
   if (partitionOfRecords.isEmpty){ 
   
              
   println( 
   "This RDD is not null but partition is null") 
   
           }  
   else { 
   
              
   // ConnectionPool is a static, lazily initialized pool of connections
  
                
   val connection = ConnectionPool. 
   getConnection() 
   
             partitionOfRecords.foreach(record => { 
   
                
   val sql =  
   "insert into categorytop3(category,item,client_count) values('" + record.getAs( 
   "category") +  
   "','" + 
   
                 record.getAs( 
   "item") +  
   "'," + record.getAs( 
   "click_count") +  
   ")"
  
                  
   val stmt = connection.createStatement() 
   ;
  
                 stmt.executeUpdate(sql) 
   ;
  
   
  
               }) 
   
             ConnectionPool. 
   returnConnection(connection)  
   // return to the pool for future reuse
  
   
  
             } 
   
         } 
   
         } 
   
       } 
   
     } 
   
     } 
   
      
   /**
  
         *  
   在 
   StreamingContext 
   调用 
   start 
   方法的内部其实是会启动 
   JobScheduler 
   的 
   Start 
   方法，进行消息循环，在 
   JobScheduler
  
         *  
   的 
   start 
   内部会构造 
   JobGenerator 
   和 
   ReceiverTacker 
   ，并且调用 
   JobGenerator 
   和 
   ReceiverTacker 
   的 
   start 
   方法：
  
          
   *   1 
   ， 
   JobGenerator 
   启动后会不断的根据 
   batchDuration 
   生成一个个的 
   Job
  
         *   2 
   ， 
   ReceiverTracker 
   启动后首先在 
   Spark Cluster 
   中启动 
   Receiver 
   （其实是在 
   Executor 
   中先启动 
   ReceiverSupervisor 
   ），在 
   Receiver 
   收到
  
          
   *    
   数据后会通过 
   ReceiverSupervisor 
   存储到 
   Executor 
   并且把数据的 
   Metadata 
   信息发送给 
   Driver 
   中的 
   ReceiverTracker 
   ，在 
   ReceiverTracker
  
         *    
   内部会通过 
   ReceivedBlockTracker 
   来管理接受到的元数据信息
  
          
   *  
   每个 
   BatchInterval 
   会产生一个具体的 
   Job 
   ，其实这里的 
   Job 
   不是 
   Spark Core 
   中所指的 
   Job 
   ，它只是基于 
   DStreamGraph 
   而生成的 
   RDD
  
         *  
   的 
   DAG 
   而已，从 
   Java 
   角度讲，相当于 
   Runnable 
   接口实例，此时要想运行 
   Job 
   需要提交给 
   JobScheduler 
   ，在 
   JobScheduler 
   中通过线程池的方式找到一个
  
          
   *  
   单独的线程来提交 
   Job 
   到集群运行（其实是在线程中基于 
   RDD 
   的 
   Action 
   触发真正的作业的运行），为什么使用线程池呢？
  
          
   *   1 
   ，作业不断生成，所以为了提升效率，我们需要线程池；这和在 
   Executor 
   中通过线程池执行 
   Task 
   有异曲同工之妙；
  
          
   *   2 
   ，有可能设置了 
   Job 
   的 
   FAIR 
   公平调度的方式，这个时候也需要多线程的支持；
  
          
   *
  
         */
  
       ssc.start() 
   
     ssc.awaitTermination() 
   
   } 
   
 } 
   
 
  

第二部分源码解析：

1、构建StreamingContext时传递SparkConf参数（或者自己Configuration）在内部创建SparkContext

 
  def this(conf: SparkConf 
  , batchDuration: Duration) = { 
  
  this(StreamingContext. 
  createNewSparkContext(conf) 
  ,  
  null 
  , batchDuration) 
  
 }

2、事实说明SparkStreaming就是SparkCore上的一个应用程序

 
  private[streaming]  
  def  
  createNewSparkContext(conf: SparkConf): SparkContext = { 
  
  new SparkContext(conf) 
  
 }

3、创建Socket输入流

def socketTextStream(

       hostname:  
  String 
  ,
  
      port:  
  Int,
  
      storageLevel: StorageLevel = StorageLevel. 
  MEMORY_AND_DISK_SER_2
  
    ): ReceiverInputDStream[ 
  String] = withNamedScope( 
  "socket text stream") { 
  
   socketStream[ 
  String](hostname 
  , port 
  , SocketReceiver. 
  bytesToLines 
  , storageLevel) 
  
 } 
  
 
 

4、创建SocketInputDStream

 
  def  
  socketStream[ 
  T: ClassTag]( 
  
     hostname:  
  String 
  ,
  
      port:  
  Int,
  
      converter: (InputStream) =>  
  Iterator[ 
  T] 
  ,
  
      storageLevel: StorageLevel 
  
   ): ReceiverInputDStream[ 
  T] = { 
  
    
  new SocketInputDStream[ 
  T]( 
  this 
  , hostname 
  , port 
  , converter 
  , storageLevel) 
  
 } 
  
 
 

5、SocketInputDstream继承ReceiverInputDStream，通过构建Receiver来接收数据

 
  private[streaming] 
  
  class SocketInputDStream[ 
  T: ClassTag]( 
  
     ssc_ : StreamingContext 
  ,
  
      host:  
  String 
  ,
  
      port:  
  Int,
  
      bytesToObjects: InputStream =>  
  Iterator[ 
  T] 
  ,
  
      storageLevel: StorageLevel 
  
   )  
  extends ReceiverInputDStream[ 
  T](ssc_) { 
  
  def  
  getReceiver(): Receiver[ 
  T] = { 
  
  new SocketReceiver(host 
  , port 
  , bytesToObjects 
  , storageLevel) 
  
   } 
  
 }

5.1、ReceiverInputDStream

 
   abstract class ReceiverInputDStream[ 
   T: ClassTag](ssc_ : StreamingContext) 
   
   extends InputDStream[ 
   T](ssc_) {

 
   abstract class InputDStream[ 
   T: ClassTag] (ssc_ : StreamingContext) 
   
   extends DStream[ 
   T](ssc_) {

5.2、DStream

 
   /*
  
   * DStreams internally is characterized by a few basic properties:
  
   *  - A list of other DStreams that the DStream depends on
  
   *  - A time interval at which the DStream generates an RDD
  
   *  - A function that is used to generate an RDD after each time interval
  
   */

1）、依赖于其他DStream

2）、什么时候依据DStream，依赖关系的模板，构成RDD之间的依赖

3）、基于DStream它有一个Function，Function 基于Batch Interval（time Interval）生成RDD，这个和定时器有关系

 
  abstract class DStream[ 
  T: ClassTag] ( 
  
  @transient  
  private[streaming]  
  var ssc: StreamingContext

    )  
   extends Serializable  
   with Logging {

6、SocketReceiver对象在onStart中创建Thread启动run方法调用执行receive接收数据。

      
  def  
  onStart() { 
  
  // Start the thread that receives data over a connection
  
  new Thread( 
  "Socket Receiver") { 
  
       setDaemon( 
  true) 
  
  override def  
  run() { receive() } 
  
     }.start() 
  
   }

7、创建一个Socket connection连接接收数据

      
  /** Create a socket connection and receive data until receiver is stopped */
  
  def  
  receive() { 
  
  var socket: Socket =  
  null
  
      try { 
  
       logInfo( 
  "Connecting to " + host +  
  ":" + port) 
  
       socket =  
  new Socket(host 
  , port) 
  
       logInfo( 
  "Connected to " + host +  
  ":" + port) 
  
  val iterator = bytesToObjects(socket.getInputStream()) 
  
  while(!isStopped && iterator.hasNext) { 
  
         store(iterator.next) 
  
       } 
  
  if (!isStopped()) { 
  
         restart( 
  "Socket data stream had no more data") 
  
       }  
  else { 
  
         logInfo( 
  "Stopped receiving") 
  
       }

8、 总体流程：在StreamingContext调用start方法的内部其实是会启动JobScheduler的Start方法，进行消息循环，在JobScheduler的start内部会构造JobGenerator和ReceiverTacker，并且调用JobGenerator和ReceiverTacker的start方法：

1）、JobGenerator启动后会不断的根据batchDuration生成一个个的Job

2）、ReceiverTracker启动后首先在Spark Cluster中启动Receiver（其实是在Executor中先启动ReceiverSupervisor），

在Receiver收到数据后会通过ReceiverSupervisor存储到Executor并且把数据的Metadata信息发送给Driver中的ReceiverTracker，

在ReceiverTracker 内部会通过ReceivedBlockTracker来管理接受到的元数据信息每个BatchInterval会产生一个具体的Job（这里的Job主要是封装了业务逻辑例如上面实例中的代码），其实这里的Job不是Spark Core中所指的Job，它只是基于DStreamGraph而生成的RDD 的DAG而已，

从Java角度讲，相当于Runnable接口实例，此时要想运行Job需要提交给JobScheduler，在JobScheduler中通过线程池的方式找到一个单独的线程来提交Job到集群运行（其实是在线程中基于RDD的Action触发真正的作业的运行）,

为什么使用线程池呢？

a）、作业不断生成，所以为了提升效率，我们需要线程池；这和在Executor中通过线程池执行Task有异曲同工之妙；

b）、有可能设置了Job的FAIR公平调度的方式，这个时候也需要多线程的支持；

8.1、StreamingContext.start

 
  // Start the streaming scheduler in a new thread, so that thread local properties
  
  // like call sites and job groups can be reset without affecting those of the
  
  // current thread.
 ThreadUtils. 
  runInNewThread( 
  "streaming-start") { 
  
   sparkContext.setCallSite( 
  startSite.get) 
  
   sparkContext.clearJobGroup() 
  
   sparkContext.setLocalProperty(SparkContext. 
  SPARK_JOB_INTERRUPT_ON_CANCEL 
  ,  
  "false") 
  
  scheduler.start() 
  
 }

补充：线程本地存储，线程ThreadLocal每个线程有自己的私有属性，设置线程的私有属性不会影响当前线程或其他线程

9、JobScheduler.start 创建EventLoop消息线程并启动

 
  def  
  start():  
  Unit = synchronized { 
  
  if ( 
  eventLoop !=  
  null)  
  return  
  // scheduler has already been started
  
    logDebug( 
  "Starting JobScheduler") 
  
  eventLoop =  
  new EventLoop[JobSchedulerEvent]( 
  "JobScheduler") { 
  
  override protected def  
  onReceive(event: JobSchedulerEvent):  
  Unit = processEvent(event) 
  
  override protected def  
  onError(e:  
  Throwable):  
  Unit = reportError( 
  "Error in job scheduler" 
  , e) 
  
   } 
  
  eventLoop.start()

9.1、EventLoop中创建Thread线程接收和发送消息，调用JobScheduler中的processEvent方法

 
  private[spark]  
  abstract class EventLoop[ 
  E](name:  
  String)  
  extends Logging { 
  
  private val  
  eventQueue: BlockingQueue[ 
  E] =  
  new LinkedBlockingDeque[ 
  E]() 
  
  private val  
  stopped =  
  new AtomicBoolean( 
  false) 
  
  private val  
  eventThread =  
  new Thread(name) { 
  
     setDaemon( 
  true) 
  
  override def  
  run():  
  Unit = { 
  
  try { 
  
  while (! 
  stopped.get) { 
  
  val event =  
  eventQueue.take() 
  
  try { 
  
             onReceive(event) 
  
           }  
  catch {

9.2、会接受不同的任务，JobScheduler是整个Job的调度器，它本身用了一个线程循环，去监听不同的Job启动、Job完成、Job失败等任务（消息驱动系统）

 
  private def  
  processEvent(event: JobSchedulerEvent) { 
  
  try { 
  
     event  
  match { 
  
  case  
  JobStarted(job 
  , startTime) => handleJobStart(job 
  , startTime) 
  
  case  
  JobCompleted(job 
  , completedTime) => handleJobCompletion(job 
  , completedTime) 
  
  case  
  ErrorReported(m 
  , e) => handleError(m 
  , e) 
  
     } 
  
   }  
  catch {

10、JobScheduler.start

 
  // attach rate controllers of input streams to receive batch completion updates
  
  for { 
  
   inputDStream <- ssc. 
  graph.getInputStreams 
  
   rateController <- inputDStream. 
  rateController
 } ssc.addStreamingListener(rateController)

10.1、多个InputStream

    inputDStream <- ssc. 
   graph.getInputStreams

10.2、RateController控制输入的速度

 
  // Keep track of the freshest rate for this stream using the rateEstimator
  
  protected[streaming]  
  val  
  rateController: Option[RateController] = None

11、JobScheduler.start

 
  listenerBus.start(ssc.sparkContext) 
  
  receiverTracker =  
  new ReceiverTracker(ssc) 
  
  inputInfoTracker =  
  new InputInfoTracker(ssc) 
  
  receiverTracker.start() 
  
  jobGenerator.start()

11.1、StreamingListenerBus

 
  override def  
  onPostEvent(listener: StreamingListener 
  , event: StreamingListenerEvent):  
  Unit = { 
  
   event  
  match { 
  
  case receiverStarted: StreamingListenerReceiverStarted => 
  
       listener.onReceiverStarted(receiverStarted) 
  
  case receiverError: StreamingListenerReceiverError => 
  
       listener.onReceiverError(receiverError) 
  
  case receiverStopped: StreamingListenerReceiverStopped => 
  
       listener.onReceiverStopped(receiverStopped) 
  
  case batchSubmitted: StreamingListenerBatchSubmitted => 
  
       listener.onBatchSubmitted(batchSubmitted) 
  
  case batchStarted: StreamingListenerBatchStarted => 
  
       listener.onBatchStarted(batchStarted) 
  
  case batchCompleted: StreamingListenerBatchCompleted => 
  
       listener.onBatchCompleted(batchCompleted) 
  
  case outputOperationStarted: StreamingListenerOutputOperationStarted => 
  
       listener.onOutputOperationStarted(outputOperationStarted) 
  
  case outputOperationCompleted: StreamingListenerOutputOperationCompleted => 
  
       listener.onOutputOperationCompleted(outputOperationCompleted) 
  
  case _ => 
  
   } 
  
 }

11.2、receiverTracker.start()，ReceiveTracker是通过发Job的方式到集群的Executor上启动Receiver

 
  /** Start the endpoint and receiver execution thread. */
  
  def  
  start():  
  Unit = synchronized { 
  
  if (isTrackerStarted) { 
  
  throw new SparkException( 
  "ReceiverTracker already started") 
  
   } 
  
  if (! 
  receiverInputStreams.isEmpty) { 
  
  endpoint = ssc. 
  env.rpcEnv.setupEndpoint( 
  
  "ReceiverTracker" 
  ,  
  new ReceiverTrackerEndpoint(ssc. 
  env.rpcEnv)) 
  
  if (!skipReceiverLaunch) launchReceivers() 
  
     logInfo( 
  "ReceiverTracker started") 
  
  trackerState =  
  Started
  
    } 
  
 }

11.2.1、创建一个ReceiverTrackerEndpoint消息通信体

 
  override def  
  receive: PartialFunction[Any 
  , Unit] = { 
  
  // Local messages
  
  case  
  StartAllReceivers(receivers) => 
  
  val scheduledLocations =  
  schedulingPolicy.scheduleReceivers(receivers 
  , getExecutors) 
  
  for (receiver <- receivers) { 
  
  val executors = scheduledLocations(receiver.streamId) 
  
       updateReceiverScheduledExecutors(receiver.streamId 
  , executors) 
  
  receiverPreferredLocations(receiver.streamId) = receiver.preferredLocation 
  
       startReceiver(receiver 
  , executors) 
  
     } 
  
  case  
  RestartReceiver(receiver) => 
  
  // Old scheduled executors minus the ones that are not active any more
  
  val oldScheduledExecutors = getStoredScheduledExecutors(receiver.streamId) 
  
  val scheduledLocations =  
  if (oldScheduledExecutors.nonEmpty) { 
  
  // Try global scheduling again
  
          oldScheduledExecutors 
  
       }  
  else { 
  
  val oldReceiverInfo =  
  receiverTrackingInfos(receiver.streamId) 
  
  // Clear "scheduledLocations" to indicate we are going to do local scheduling
  
  val newReceiverInfo = oldReceiverInfo.copy( 
  
           state = ReceiverState. 
  INACTIVE 
  , scheduledLocations = None) 
  
  receiverTrackingInfos(receiver.streamId) = newReceiverInfo 
  
  schedulingPolicy.rescheduleReceiver( 
  
           receiver.streamId 
  ,
  
            receiver.preferredLocation 
  ,
  
  receiverTrackingInfos 
  ,
  
            getExecutors) 
  
       } 
  
  // Assume there is one receiver restarting at one time, so we don't need to update
  
      // receiverTrackingInfos
  
      startReceiver(receiver 
  , scheduledLocations)

11.2.1.1、ReceiverSchedulingPolicy.scheduleReceivers，从下面的代码中可以看出来在那些Executor上启动Receiver,以及怎么具体在Executor上启动Receiver

 
  // Firstly, we need to respect "preferredLocation". So if a receiver has "preferredLocation",
  
  // we need to make sure the "preferredLocation" is in the candidate scheduled executor list.
  
  for (i <-  
  0 until receivers.length) { 
  
  // Note: preferredLocation is host but executors are host_executorId
  
    receivers(i).preferredLocation.foreach { host => 
  
     hostToExecutors.get(host)  
  match { 
  
  case  
  Some(executorsOnHost) => 
  
  // preferredLocation is a known host. Select an executor that has the least receivers in
  
          // this host
  
  val leastScheduledExecutor = 
  
           executorsOnHost.minBy(executor => numReceiversOnExecutor(executor)) 
  
         scheduledLocations(i) += leastScheduledExecutor 
  
         numReceiversOnExecutor(leastScheduledExecutor) = 
  
           numReceiversOnExecutor(leastScheduledExecutor) +  
  1
  
  case None => 
  
  // preferredLocation is an unknown host.
  
          // Note: There are two cases:
  
          // 1. This executor is not up. But it may be up later.
  
          // 2. This executor is dead, or it's not a host in the cluster.
  
          // Currently, simply add host to the scheduled executors.
  
          // Note: host could be `HDFSCacheTaskLocation`, so use `TaskLocation.apply` to handle
  
          // this case
  
          scheduledLocations(i) +=  
  TaskLocation(host) 
  
     } 
  
   } 
  
 }

补充：ReceiverTracker本身不直接监管Receiver，它是Driver级别的可间接地，用ReceiverSupervisor监控那台机器上Executor中的Receiver。

11.2.2、if (!skipReceiverLaunch) launchReceivers()

 
  /**
  
   * Get the receivers from the ReceiverInputDStreams, distributes them to the
  
   * worker nodes as a parallel collection, and runs them.
  
   */
  
  private def  
  launchReceivers():  
  Unit = { 
  
  val receivers =  
  receiverInputStreams.map(nis => { 
  
  val rcvr = nis.getReceiver() 
  
     rcvr.setReceiverId(nis. 
  id) 
  
     rcvr 
  
   }) 
  
   runDummySparkJob() 
  
   logInfo( 
  "Starting " + receivers.length +  
  " receivers") 
  
  endpoint.send( 
  StartAllReceivers(receivers)) 
  
 }

11.2.2.1运行了一个Dummy的作业，确保所有的Slaves正常工作，保证所有的Receiver都在一台机器上

 
  /**
  
   * Run the dummy Spark job to ensure that all slaves have registered. This avoids all the
  
   * receivers to be scheduled on the same node.
  
   *
  
   *  
  TODO Should poll the executor number and wait for executors according to
  
  * "spark.scheduler.minRegisteredResourcesRatio" and
  
   * "spark.scheduler.maxRegisteredResourcesWaitingTime" rather than running a dummy job.
  
   */
  
  private def  
  runDummySparkJob():  
  Unit = { 
  
  if (!ssc.sparkContext.isLocal) { 
  
     ssc.sparkContext.makeRDD( 
  1 to  
  50 
  ,  
  50).map(x => (x 
  ,  
  1)).reduceByKey(_ + _ 
  ,  
  20).collect() 
  
   } 
  
  assert(getExecutors.nonEmpty) 
  
 }

11.2.2.2、 endpoint .send(StartAllReceivers(receivers)

 
  // endpoint is created when generator starts.
  
  // This not being null means the tracker has been started and not stopped
  
  private var  
  endpoint: RpcEndpointRef =  
  null

 
  endpoint = ssc. 
  env.rpcEnv.setupEndpoint( 
  
  "ReceiverTracker" 
  ,  
  new ReceiverTrackerEndpoint(ssc. 
  env.rpcEnv))

ReceiverTrackerEndpoint

 
   override def  
   receive: PartialFunction[Any 
   , Unit] = { 
   
   // Local messages
  
   case  
   StartAllReceivers(receivers) => 
   
   val scheduledLocations =  
   schedulingPolicy.scheduleReceivers(receivers 
   , getExecutors) 
   
   for (receiver <- receivers) { 
   
   val executors = scheduledLocations(receiver.streamId) 
   
       updateReceiverScheduledExecutors(receiver.streamId 
   , executors) 
   
   receiverPreferredLocations(receiver.streamId) = receiver.preferredLocation 
   
       startReceiver(receiver 
   , executors) 
   
     }

startReceiver

 
   // Function to start the receiver on the worker node
  
   val startReceiverFunc:  
   Iterator[Receiver[_]] =>  
   Unit = 
   
   (iterator:  
   Iterator[Receiver[_]]) => { 
   
   if (!iterator.hasNext) { 
   
   throw new SparkException( 
   
   "Could not start receiver as object not found.") 
   
     } 
   
   if (TaskContext. 
   get().attemptNumber() ==  
   0) { 
   
   val receiver = iterator.next() 
   
   assert(iterator.hasNext ==  
   false) 
   
   val supervisor =  
   new ReceiverSupervisorImpl( 
   
         receiver 
   , SparkEnv. 
   get 
   , serializableHadoopConf.value 
   , checkpointDirOption) 
   
       supervisor.start() 
   
       supervisor.awaitTermination() 
   
     }  
   else { 
   
   // It's restarted by TaskScheduler, but we want to reschedule it again. So exit it.
  
       } 
   
   }

逆天的设计啊

       
   // Create the RDD using the scheduledLocations to run the receiver in a Spark job
  
      
   val receiverRDD: RDD[Receiver[_]] = 
   
      
   if (scheduledLocations.isEmpty) { 
   
       ssc. 
   sc.makeRDD( 
   Seq(receiver) 
   ,  
   1) 
   
     }  
   else { 
   
        
   val preferredLocations = scheduledLocations.map(_.toString).distinct 
   
       ssc. 
   sc.makeRDD( 
   Seq(receiver -> preferredLocations)) 
   
     } 
   
   receiverRDD.setName( 
   s"Receiver  
   $receiverId 
   ") 
   
   ssc.sparkContext.setJobDescription( 
   s"Streaming job running receiver  
   $receiverId 
   ") 
   
   ssc.sparkContext.setCallSite( 
   Option(ssc.getStartSite()).getOrElse(Utils. 
   getCallSite())) 
   
 
   
    
   val future = ssc.sparkContext.submitJob[Receiver[_] 
   , Unit, Unit]( 
   
     receiverRDD 
   , startReceiverFunc 
   ,  
   Seq( 
   0) 
   , (_ 
   , _) =>  
   Unit, ()) 
   
    
   // We will keep restarting the receiver job until ReceiverTracker is stopped
  
     future.onComplete { 
   
      
   case  
   Success(_) => 
   
        
   if (!shouldStartReceiver) { 
   
         onReceiverJobFinish(receiverId) 
   
       }  
   else { 
   
         logInfo( 
   s"Restarting Receiver  
   $receiverId 
   ") 
   
         self.send( 
   RestartReceiver(receiver)) 
   
       } 
   
      
   case  
   Failure(e) => 
   
        
   if (!shouldStartReceiver) { 
   
         onReceiverJobFinish(receiverId) 
   
       }  
   else { 
   
         logError( 
   "Receiver has been stopped. Try to restart it." 
   , e) 
   
         logInfo( 
   s"Restarting Receiver  
   $receiverId 
   ") 
   
         self.send( 
   RestartReceiver(receiver)) 
   
       } 
   
   }( 
   submitJobThreadPool) 
   
   logInfo( 
   s"Receiver  
   ${receiver.streamId} 
    started") 
   
 } 
   
 
  

ReceiverSupervisorImpl.startReceiver

 
   /** Start receiver */
  
   def  
   startReceiver():  
   Unit = synchronized { 
   
   try { 
   
   if (onReceiverStart()) { 
   
       logInfo( 
   "Starting receiver") 
   
   receiverState =  
   Started
  
         receiver.onStart() 
   
       logInfo( 
   "Called receiver onStart") 
   
     }  
   else { 
   
   // The driver refused us
  
         stop( 
   "Registered unsuccessfully because Driver refused to start receiver " +  
   streamId 
   , None) 
   
     }

 
   override protected def  
   onReceiverStart():  
   Boolean = { 
   
    
   val msg =  
   RegisterReceiver( 
   
      
   streamId 
   , receiver.getClass.getSimpleName 
   ,  
   host 
   ,  
   executorId 
   ,  
   endpoint) 
   
    
   trackerEndpoint.askWithRetry[ 
   Boolean](msg) 
   
 } 
   
 
  

11.3、JobScheduler.start jobGenerator.start()

 
   /** Start generation of jobs */
  
   def  
   start():  
   Unit = synchronized { 
   
   if ( 
   eventLoop !=  
   null)  
   return  
   // generator has already been started
  
     // Call checkpointWriter here to initialize it before eventLoop uses it to avoid a deadlock.
  
     // See SPARK-10125
  
   checkpointWriter
  
     eventLoop =  
   new EventLoop[JobGeneratorEvent]( 
   "JobGenerator") { 
   
   override protected def  
   onReceive(event: JobGeneratorEvent):  
   Unit = processEvent(event) 
   
   override protected def  
   onError(e:  
   Throwable):  
   Unit = { 
   
       jobScheduler.reportError( 
   "Error in job generator" 
   , e) 
   
     } 
   
   } 
   
   eventLoop.start() 
   
   if ( 
   ssc. 
   isCheckpointPresent) { 
   
     restart() 
   
   }  
   else { 
   
     startFirstTime() 
   
   } 
   
 }

根据时间间隔不断发送消息

 
   /** Processes all events */
  
   private def  
   processEvent(event: JobGeneratorEvent) { 
   
   logDebug( 
   "Got event " + event) 
   
   event  
   match { 
   
   case  
   GenerateJobs(time) => generateJobs(time) 
   
   case  
   ClearMetadata(time) => clearMetadata(time) 
   
   case  
   DoCheckpoint(time 
   , clearCheckpointDataLater) => 
   
       doCheckpoint(time 
   , clearCheckpointDataLater) 
   
   case  
   ClearCheckpointData(time) => clearCheckpointData(time) 
   
   } 
   
 }

 
   /** Generate jobs and perform checkpoint for the given  
   ` 
   time 
   ` 
   .  */
  
   private def  
   generateJobs(time: Time) { 
   
    
   // Set the SparkEnv in this thread, so that job generation code can access the environment
  
     // Example: BlockRDDs are created in this thread, and it needs to access BlockManager
  
     // Update: This is probably redundant after threadlocal stuff in SparkEnv has been removed.
  
     SparkEnv. 
   set( 
   ssc. 
   env) 
   
    
   Try { 
   
     jobScheduler. 
   receiverTracker.allocateBlocksToBatch(time)  
   // allocate received blocks to batch
  
        
   graph.generateJobs(time)  
   // generate jobs using allocated block
  
     }  
   match { 
   
      
   case  
   Success(jobs) => 
   
        
   val streamIdToInputInfos = jobScheduler. 
   inputInfoTracker.getInfo(time) 
   
       jobScheduler.submitJobSet( 
   JobSet(time 
   , jobs 
   , streamIdToInputInfos)) 
   
      
   case  
   Failure(e) => 
   
       jobScheduler.reportError( 
   "Error generating jobs for time " + time 
   , e) 
   
   } 
   
    
   eventLoop.post( 
   DoCheckpoint(time 
   , clearCheckpointDataLater =  
   false)) 
   
 } 
   
 
  

 
   def  
   submitJobSet(jobSet: JobSet) { 
   
   if (jobSet.jobs.isEmpty) { 
   
     logInfo( 
   "No jobs added for time " + jobSet.time) 
   
   }  
   else { 
   
   listenerBus.post( 
   StreamingListenerBatchSubmitted(jobSet.toBatchInfo)) 
   
   jobSets.put(jobSet.time 
   , jobSet) 
   
     jobSet.jobs.foreach(job =>  
   jobExecutor.execute( 
   new JobHandler(job))) 
   
     logInfo( 
   "Added jobs for time " + jobSet.time) 
   
   } 
   
 }

 
   /**
  
    * Executes the given task sometime in the future.  The task
  
    * may execute in a new thread or in an existing pooled thread.
  
    *
  
    * If the task cannot be submitted for execution, either because this
  
    * executor has been shutdown or because its capacity has been reached,
  
    * the task is handled by the current { 
   @code  
   RejectedExecutionHandler}.
  
    *
  
    *  
   @param  
   command  
   the task to execute
  
    *  
   @throws  
   RejectedExecutionException at discretion of
  
    *         { 
   @code  
   RejectedExecutionHandler}, if the task
  
    *         cannot be accepted for execution
  
    *  
   @throws  
   NullPointerException if { 
   @code  
   command} is null
  
    */
  
   public void  
   execute(Runnable command) { 
   
   if (command ==  
   null) 
   
   throw new NullPointerException() 
   ;
  
   /*
  
        * Proceed in 3 steps:
  
        *
  
        * 1. If fewer than corePoolSize threads are running, try to
  
        * start a new thread with the given command as its first
  
        * task.  The call to addWorker atomically checks runState and
  
        * workerCount, and so prevents false alarms that would add
  
        * threads when it shouldn't, by returning false.
  
        *
  
        * 2. If a task can be successfully queued, then we still need
  
        * to double-check whether we should have added a thread
  
        * (because existing ones died since last checking) or that
  
        * the pool shut down since entry into this method. So we
  
        * recheck state and if necessary roll back the enqueuing if
  
        * stopped, or start a new thread if there are none.
  
        *
  
        * 3. If we cannot queue task, then we try to add a new
  
        * thread.  If it fails, we know we are shut down or saturated
  
        * and so reject the task.
  
        */
  
   int c =  
   ctl.get() 
   ;
  
       if ( 
   workerCountOf(c) <  
   corePoolSize) { 
   
   if (addWorker(command 
   , true)) 
   
   return;
  
           c =  
   ctl.get() 
   ;
  
       } 
   
   if ( 
   isRunning(c) &&  
   workQueue.offer(command)) { 
   
   int recheck =  
   ctl.get() 
   ;
  
           if (!  
   isRunning(recheck) && remove(command)) 
   
             reject(command) 
   ;
  
           else if ( 
   workerCountOf(recheck) ==  
   0) 
   
             addWorker( 
   null, false) 
   ;
  
       } 
   
   else if (!addWorker(command 
   , false)) 
   
         reject(command) 
   ;
 }

       
   private class JobHandler(job: Job)  
   extends Runnable  
   with Logging { 
   
      
   import JobScheduler._ 
   
 
   
      
   def  
   run() { 
   
        
   try { 
   
          
   val formattedTime = UIUtils. 
   formatBatchTime( 
   
           job.time.milliseconds 
   , ssc. 
   graph. 
   batchDuration.milliseconds 
   , showYYYYMMSS =  
   false) 
   
          
   val batchUrl =  
   s"/streaming/batch/?id= 
   ${job.time.milliseconds} 
   "
  
            
   val batchLinkText =  
   s"[output operation  
   ${job.outputOpId} 
   , batch time  
   ${formattedTime} 
   ]"
  
   
  
           ssc. 
   sc.setJobDescription( 
   
            
   s"""Streaming job from <a href=" 
   $batchUrl 
   "> 
   $batchLinkText 
   </a>""") 
   
         ssc. 
   sc.setLocalProperty( 
   BATCH_TIME_PROPERTY_KEY 
   , job.time.milliseconds.toString) 
   
         ssc. 
   sc.setLocalProperty( 
   OUTPUT_OP_ID_PROPERTY_KEY 
   , job.outputOpId.toString) 
   
 
   
          
   // We need to assign `eventLoop` to a temp variable. Otherwise, because
  
           // `JobScheduler.stop(false)` may set `eventLoop` to null when this method is running, then
  
           // it's possible that when `post` is called, `eventLoop` happens to null.
  
            
   var _eventLoop =  
   eventLoop
  
            
   if (_eventLoop !=  
   null) { 
   
           _eventLoop.post( 
   JobStarted(job 
   ,  
   clock.getTimeMillis())) 
   
            
   // Disable checks for existing output directories in jobs launched by the streaming
  
             // scheduler, since we may need to write output to an existing directory during checkpoint
  
             // recovery; see SPARK-4835 for more details.
  
             PairRDDFunctions. 
   disableOutputSpecValidation.withValue( 
   true) { 
   
             job.run() 
   
           } 
   
           _eventLoop =  
   eventLoop
  
              
   if (_eventLoop !=  
   null) { 
   
             _eventLoop.post( 
   JobCompleted(job 
   ,  
   clock.getTimeMillis())) 
   
           } 
   
         }  
   else { 
   
            
   // JobScheduler has been stopped.
  
           } 
   
       }  
   finally { 
   
         ssc. 
   sc.setLocalProperty(JobScheduler. 
   BATCH_TIME_PROPERTY_KEY 
   ,  
   null) 
   
         ssc. 
   sc.setLocalProperty(JobScheduler. 
   OUTPUT_OP_ID_PROPERTY_KEY 
   ,  
   null) 
   
       } 
   
     } 
   
   } 
   
 } 
   
 
  

 
   private def  
   processEvent(event: JobSchedulerEvent) { 
   
   try { 
   
     event  
   match { 
   
   case  
   JobStarted(job 
   , startTime) => handleJobStart(job 
   , startTime) 
   
   case  
   JobCompleted(job 
   , completedTime) => handleJobCompletion(job 
   , completedTime) 
   
   case  
   ErrorReported(m 
   , e) => handleError(m 
   , e) 
   
     } 
   
   }  
   catch { 
   
   case e:  
   Throwable => 
   
       reportError( 
   "Error in job scheduler" 
   , e) 
   
   } 
   
 }

 
   private def  
   handleJobStart(job: Job 
   , startTime:  
   Long) { 
   
   val jobSet =  
   jobSets.get(job.time) 
   
   val isFirstJobOfJobSet = !jobSet.hasStarted 
   
   jobSet.handleJobStart(job) 
   
   if (isFirstJobOfJobSet) { 
   
   // "StreamingListenerBatchStarted" should be posted after calling "handleJobStart" to get the
  
       // correct "jobSet.processingStartTime".
  
   listenerBus.post( 
   StreamingListenerBatchStarted(jobSet.toBatchInfo)) 
   
   } 
   
   job.setStartTime(startTime) 
   
   listenerBus.post( 
   StreamingListenerOutputOperationStarted(job.toOutputOperationInfo)) 
   
   logInfo( 
   "Starting job " + job.id +  
   " from job set of time " + jobSet.time) 
   
 }

       
   private class JobHandler(job: Job)  
   extends Runnable  
   with Logging { 
   
      
   import JobScheduler._ 
   
 
   
      
   def  
   run() { 
   
        
   try { 
   
          
   val formattedTime = UIUtils. 
   formatBatchTime( 
   
           job.time.milliseconds 
   , ssc. 
   graph. 
   batchDuration.milliseconds 
   , showYYYYMMSS =  
   false) 
   
          
   val batchUrl =  
   s"/streaming/batch/?id= 
   ${job.time.milliseconds} 
   "
  
            
   val batchLinkText =  
   s"[output operation  
   ${job.outputOpId} 
   , batch time  
   ${formattedTime} 
   ]"
  
   
  
           ssc. 
   sc.setJobDescription( 
   
            
   s"""Streaming job from <a href=" 
   $batchUrl 
   "> 
   $batchLinkText 
   </a>""") 
   
         ssc. 
   sc.setLocalProperty( 
   BATCH_TIME_PROPERTY_KEY 
   , job.time.milliseconds.toString) 
   
         ssc. 
   sc.setLocalProperty( 
   OUTPUT_OP_ID_PROPERTY_KEY 
   , job.outputOpId.toString) 
   
 
   
          
   // We need to assign `eventLoop` to a temp variable. Otherwise, because
  
           // `JobScheduler.stop(false)` may set `eventLoop` to null when this method is running, then
  
           // it's possible that when `post` is called, `eventLoop` happens to null.
  
            
   var _eventLoop =  
   eventLoop
  
            
   if (_eventLoop !=  
   null) { 
   
           _eventLoop.post( 
   JobStarted(job 
   ,  
   clock.getTimeMillis())) 
   
            
   // Disable checks for existing output directories in jobs launched by the streaming
  
             // scheduler, since we may need to write output to an existing directory during checkpoint
  
             // recovery; see SPARK-4835 for more details.
  
             PairRDDFunctions. 
   disableOutputSpecValidation.withValue( 
   true) { 
   
             job.run() 
   
           } 
   
           _eventLoop =  
   eventLoop
  
              
   if (_eventLoop !=  
   null) { 
   
             _eventLoop.post( 
   JobCompleted(job 
   ,  
   clock.getTimeMillis())) 
   
           } 
   
         }  
   else { 
   
            
   // JobScheduler has been stopped.
  
           } 
   
       }  
   finally { 
   
         ssc. 
   sc.setLocalProperty(JobScheduler. 
   BATCH_TIME_PROPERTY_KEY 
   ,  
   null) 
   
         ssc. 
   sc.setLocalProperty(JobScheduler. 
   OUTPUT_OP_ID_PROPERTY_KEY 
   ,  
   null) 
   
       } 
   
     } 
   
   } 
   
 } 
   
 
  

资料来源于：王家林（Spark版本定制班课程）
新浪微博：http://www.weibo.com/ilovepains

你可能感兴趣的:(版本定制第5课：基于案例一节课贯通Spark Streaming流计算框架的运行源码)

斤斤计较的婚姻到底有多难？白心之岂必有为
很多人私聊我会问到在哪个人群当中斤斤计较的人最多？我都会回答他，一般婚姻出现问题的斤斤计较的人士会非常多，以我多年经验，在婚姻落的一塌糊涂的人当中，斤斤计较的人数占比在20～30%以上，也就是说10个婚姻出现问题的斤斤计较的人有2-3个有多不减。在婚姻出问题当中，有大量的心理不平衡的、尖酸刻薄的怨妇。在婚姻中仅斤斤计较有两种类型：第一种是物质上的，另一种是精神上的。在物质与精神上抠门已经严重的影响
情绪觉察日记第37天露露_e800
今天是家庭关系规划师的第二阶最后一天，慧萍老师帮我做了个案，帮我处理了埋在心底好多年的一份恐惧，并给了我深深的力量！这几天出来学习，爸妈过来婆家帮我带小孩，妈妈出于爱帮我收拾东西，并跟我先生和婆婆产生矛盾，妈妈觉得他们没有照顾好我…。今晚回家见到妈妈，我很欣赏她并赞扬她，妈妈说今晚要跟我睡我说好，当我们俩躺在床上准备睡觉的时候，我握着妈妈的手对她说:妈妈这几天辛苦你了，你看你多利害把我们的家收拾得
芦花鞋一四许叶晗
又是在一个寒冷的夏日里，青铜和葵花决定今天一起去卖芦花鞋，奶奶亲手给他们做了一碗热乎乎的粥对他们说:“就靠你们两挣生活费了这碗粥赶紧趁热喝了吧！”于是青铜和葵花喝完了奶奶给她们做的粥，就准备去镇上卖卢花鞋，这回青铜和葵花穿着新的芦花鞋来到了镇上。青铜这回看到了很多人都在卖，用手势表达对葵花说:“这回有好多人在抢我们生意呢！我们必须得吆喝起来。”葵花点了点头。可是谁知他们也大声的叫，卖芦花喽！卖芦花
QQ群采集助手，精准引流必备神器 2401_87347160 其他经验分享
功能概述微信群查找与筛选工具是一款专为微信用户设计的辅助工具，它通过关键词搜索功能，帮助用户快速找到相关的微信群，并提供筛选是否需要验证的群组的功能。主要功能关键词搜索：用户可以输入关键词，工具将自动查找包含该关键词的微信群。筛选功能：工具提供筛选机制，用户可以选择是否只显示需要验证或不需要验证的群组。精准引流：通过上述功能，用户可以更精准地找到目标群组，进行有效的引流操作。3.设备需求该工具可以
关于沟通这件事，项目经理不需要每次都面对面进行流程大师兄
很多项目经理都会遇到这样的问题，项目中由于事情太多，根本没有足够的时间去召开会议，那在这种情况下如何去有效地管理项目中的利益相关者？当然，不建议电子邮件也不需要开会的话，建议可以采取下面几种方式来形成有效的沟通，这几种方式可以帮助你努力的通过各种办法来保持和各方面的联系。项目经理首先要问自己几个问题，项目中哪些利益相关者是必须要进行沟通的？可以列出项目中所有的利益相关者清单，同时也整理出项目中哪些
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
铭刻于星（四十二）随风至
69夜晚，绍敏同学做完功课后，看了眼房外，没听到动静才敢从书包的夹层里拿出那个心形纸团。折痕压得很深，都有些旧了，想来是已经写好很久了。绍敏同学慢慢地、轻轻地捏开折叠处，待到全部拆开后，又反复抚平纸张，然后仔细地一字字默看。只是开头的三个字是第一次看到，让她心漏跳了几拍。“亲爱的绍敏：从四年级的时候，我就喜欢你了，但是我一直不敢说，怕影响你学习。六年级的时候听说有人跟你表白，你接受了，我很难过，但
底层逆袭到底有多难，不甘平凡的你准备好了吗？让吴起给你说说造命者说
底层逆袭到底有多难，不甘平凡的你准备好了吗？让吴起给你说说我叫吴起，生于公元前440年的战国初期，正是群雄并起、天下纷争不断的时候。后人说我是军事家、政治家、改革家，是兵家代表人物。评价我一生历仕鲁、魏、楚三国，通晓兵家、法家、儒家三家思想，在内政军事上都有极高的成就。周安王二十一年（公元前381年），因变法得罪守旧贵族，被人乱箭射死。我出生在卫国一个“家累万金”的富有家庭，从年轻时候起就不甘平凡
2020-01-25 晴岚85
郑海燕坚持分享590天2020.1.24在生活中只存在两个问题。一个问题是：你知道想要达成的目标是什么，但却不知道如何才能达成；另一个问题是：你不知道你的目标是什么。前一个是行动的问题，后一个是结果的问题。通过制定具体的下一步行动，可以解决不知道如何开始行动的问题。而通过去想象结果，对结果做预估，可以解决找不着目标的问题。对于所有吸引我们注意力，想要完成的任务，你可以先想象一下，预期的结果究竟是什
随笔 | 仙一般的灵气海思沧海
仙岛今天，我看了你全部，似乎已经进入你的世界我不知道，这是否是梦幻，还是你仙一般的灵气吸引了我也许每一个人都要有一份属于自己的追求，这样才能够符合人生的梦想，生活才能够充满着阳光与快乐我不知道，我为什么会这样的感叹，是在感叹自己的人生，还是感叹自己一直没有孜孜不倦的追求只感觉虚度了光阴，每天活在自己的梦中，活在一个不真实的世界是在逃避自己，还是在逃避周围的一切有时候我嘲笑自己，嘲笑自己如此的虚无，
想家爆米花机
也许不同于大家对家乡的思念，我对家乡甚至是疯狂的不舍。还未踏出车站就感觉到幸福，我享受这里的夕阳、这里的浓烈柴火味、这里每一口家常菜。我是宅女，我贪恋家的安逸。刚刚踏出大学校门，初出茅庐，无法适应每年只能国庆和春节回家。我焦虑、失眠、无端发脾气，是无法适应工作的节奏，是无法接受我将一步步离开家乡的事实。我不想承认自己胸无大志，选择再次踏上征程。图片发自App
【iOS】MVC设计模式 Magnetic_h ios mvc 设计模式 objective-c 学习 ui
MVC前言如何设计一个程序的结构，这是一门专门的学问，叫做"架构模式"（architecturalpattern），属于编程的方法论。MVC模式就是架构模式的一种。它是Apple官方推荐的App开发架构，也是一般开发者最先遇到、最经典的架构。MVC各层controller层Controller/ViewController/VC（控制器）负责协调Model和View，处理大部分逻辑它将数据从Mod
OC语言多界面传值五大方式 Magnetic_h ios ui 学习 objective-c 开发语言
前言在完成暑假仿写项目时，遇到了许多需要用到多界面传值的地方，这篇博客来总结一下比较常用的五种多界面传值的方式。属性传值属性传值一般用前一个界面向后一个界面传值，简单地说就是通过访问后一个视图控制器的属性来为它赋值，通过这个属性来做到从前一个界面向后一个界面传值。首先在后一个界面中定义属性@interfaceBViewController:UIViewController@propertyNSSt
一百九十四章. 自相矛盾巨木擎天
唉！就这么一夜，林子感觉就像过了很多天似的，先是回了阳间家里，遇到了那么多不可思议的事情儿。特别是小伙伴们，第二次与自己见面时，僵硬的表情和恐怖的气氛，让自己如坐针毡，打从心眼里难受！还有东子，他现在还好吗？有没有被人欺负？护城河里的小鱼小虾们，还都在吗？水不会真的干枯了吧？那对相亲相爱漂亮的太平鸟儿，还好吧！春天了，到了做窝、下蛋、喂养小鸟宝宝的时候了，希望它们都能够平安啊！虽然没有看见家人，也
UI学习——cell的复用和自定义cell Magnetic_h ui 学习
目录cell的复用手动（非注册）自动（注册）自定义cellcell的复用在iOS开发中，单元格复用是一种提高表格（UITableView）和集合视图（UICollectionView）滚动性能的技术。当一个UITableViewCell或UICollectionViewCell首次需要显示时，如果没有可复用的单元格，则视图会创建一个新的单元格。一旦这个单元格滚动出屏幕，它就不会被销毁。相反，它被添
element实现动态路由+面包屑软件技术NINI vue案例 vue.js 前端
el-breadcrumb是ElementUI组件库中的一个面包屑导航组件，它用于显示当前页面的路径，帮助用户快速理解和导航到应用的各个部分。在Vue.js项目中，如果你已经安装了ElementUI，就可以很方便地使用el-breadcrumb组件。以下是一个基本的使用示例：安装ElementUI（如果你还没有安装的话）:你可以通过npm或yarn来安装ElementUI。bash复制代码npmi
10月|愿你的青春不负梦想-读书笔记-01 Tracy的小书斋
本书的作者是俞敏洪，大家都很熟悉他了吧。俞敏洪老师是我行业的领头羊吧，也是我事业上的偶像。本日摘录他书中第一章中的金句：『一个人如果什么目标都没有，就会浑浑噩噩，感觉生命中缺少能量。能给我们能量的，是对未来的期待。第一件事，我始终为了进步而努力。与其追寻全世界的骏马，不如种植丰美的草原，到时骏马自然会来。第二件事，我始终有阶段性的目标。什么东西能给我能量？答案是对未来的期待。』读到这里的时候，我便
C语言宏函数南林yan C语言 c语言
一、什么是宏函数？通过宏定义的函数是宏函数。如下，编译器在预处理阶段会将Add(x,y)替换为((x)*(y))#defineAdd(x,y)((x)*(y))#defineAdd(x,y)((x)*(y))intmain(){inta=10;intb=20;intd=10;intc=Add(a+d,b)*2;cout<
地推话术，如何应对地推过程中家长的拒绝校师学
相信校长们在做地推的时候经常遇到这种情况：市场专员反馈家长不接单，咨询师反馈难以邀约这些家长上门，校区地推疲软，招生难。为什么？仅从地推层面分析，一方面因为家长受到的信息轰炸越来越多，对信息越来越“免疫”；而另一方面地推人员的专业能力和营销话术没有提高，无法应对家长的拒绝，对有意向的家长也不知如何跟进，眼睁睁看着家长走远；对于家长的疑问，更不知道如何有技巧地回答，机会白白流失。由于回答没技巧和专业
谢谢你们，爱你们！鹿游儿
昨天家人去泡温泉，二个孩子也带着去，出发前一晚，匆匆下班，赶回家和孩子一起收拾。饭后，我拿出笔和本子（上次去澳门时做手帐的本子）写下了1\2\3\4\5\6\7\8\9,让后让小壹去思考，带什么出发去旅游呢？她在对应的数字旁边画上了，泳衣、泳圈、肖恩、内衣内裤、tapuy、拖鞋……画完后，就让她自己对着这个本子，将要带的，一一带上，没想到这次带的书还是这本《便便工厂》(晚上姑婆发照片过来，妹妹累得
C语言如何定义宏函数？小九格物 c语言
在C语言中，宏函数是通过预处理器定义的，它在编译之前替换代码中的宏调用。宏函数可以模拟函数的行为，但它们不是真正的函数，因为它们在编译时不会进行类型检查，也不会分配存储空间。宏函数的定义通常使用#define指令，后面跟着宏的名称和参数列表，以及宏展开后的代码。宏函数的定义方式：1.基本宏函数：这是最简单的宏函数形式，它直接定义一个表达式。#defineSQUARE(x)((x)*(x))2.带参
微服务下功能权限与数据权限的设计与实现 nbsaas-boot 微服务 java 架构
在微服务架构下，系统的功能权限和数据权限控制显得尤为重要。随着系统规模的扩大和微服务数量的增加，如何保证不同用户和服务之间的访问权限准确、细粒度地控制，成为设计安全策略的关键。本文将讨论如何在微服务体系中设计和实现功能权限与数据权限控制。1.功能权限与数据权限的定义功能权限：指用户或系统角色对特定功能的访问权限。通常是某个用户角色能否执行某个操作，比如查看订单、创建订单、修改用户资料等。数据权限：
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
小丽成长记（四十三）玲玲54321
小丽发现，即使她好不容易调整好自己的心态下一秒总会有不确定的伤脑筋的事出现，一个接一个的问题，人生就没有停下的时候，小问题不断出现。不过她今天看的书，她接受了人生就是不确定的，厉害的人就是不断创造确定性，在Ta的领域比别人多的确定性就能让自己脱颖而出，显示价值从而获得的比别人多的利益。正是这样的原因，因为从前修炼自己太少，使得她现在在人生道路上打怪起来困难重重，她似乎永远摆脱不了那种无力感，有种习
学点心理知识，呵护孩子健康静候花开_7090
昨天听了华中师范大学教育管理学系副教授张玲老师的《哪里才是学生心理健康的最后庇护所，超越教育与技术的思考》的讲座。今天又重新学习了一遍，收获匪浅。张玲博士也注意到了当今社会上的孩子由于心理问题导致的自残、自杀及伤害他人等恶性事件。她向我们普及了一个重要的命题，她说心理健康的一些基本命题，我们与我们通常的一些教育命题是不同的，她还举了几个例子，让我们明白我们原来以为的健康并非心理学上的健康。比如如果
2021年12月19日，春蕾教育集团团建活动感受——黄晓丹黄错错加油
感受:1.从陌生到熟悉的过程。游戏环节让我们在轻松的氛围中得到了锻炼，也增长了不少知识。2.游戏过程中，我们贡献的是个人力量，展现的是团队的力量。它磨合的往往不止是工作的熟悉，更是观念上契合度的贴近。3.这和工作是一样的道理。在各自的岗位上，每个人摆正自己的位置、各司其职充分发挥才能，并团结一致劲往一处使，才能实现最大的成功。新知:1.团队精神需要不断地创新。过去，人们把创新看作是冒风险，现在人们
Cell Insight | 单细胞测序技术又一新发现，可用于HIV-1和Mtb共感染个体诊断尐尐呅
结核病是艾滋病合并其他疾病中导致患者死亡的主要原因。其中结核病由结核分枝杆菌（Mycobacteriumtuberculosis,Mtb）感染引起，获得性免疫缺陷综合症（艾滋病）由人免疫缺陷病毒（Humanimmunodeficiencyvirustype1,HIV-1）感染引起。国家感染性疾病临床医学研究中心/深圳市第三人民医院张国良团队携手深圳华大生命科学研究院吴靓团队，共同研究得出单细胞测序
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
瑶池防线谜影梦蝶
冥华虽然逃过了影梦的军队，但他是一个忠臣，他选择上报战况。败给影梦后成逃兵，高层亡尔还活着，七重天失守......随便一条，即可处死冥华。冥华自然是知道以仙界高层的习性此信一发自己必死无疑，但他还选择上报实情，因为责任。同样此信送到仙宫后，知道此事的人，大多数人都认定冥华要完了，所以上到仙界高层，下到扫大街的，包括冥华自己，全都准备好迎接冥华之死。如果仙界现在还属于两方之争的话，冥华必死无疑。然而
爬山后遗症璃绛
爬山，攀登，一步一步走向制高点，是一种挑战。成功抵达是一种无法言语的快乐，在山顶吹吹风，看看风景，这是从未有过的体验。然而，爬山一时爽，下山腿打颤，颠簸的路，一路向下走，腿部力量不够，走起来抖到不行，停不下来了！第二天必定腿疼，浑身酸痛，坐立难安！
Js函数返回值 _wy_ js return
一、返回控制与函数结果，语法为：return 表达式;作用: 结束函数执行，返回调用函数，而且把表达式的值作为函数的结果二、返回控制语法为：return;作用: 结束函数执行，返回调用函数，而且把undefined作为函数的结果在大多数情况下,为事件处理函数返回false,可以防止默认的事件行为.例如,默认情况下点击一个<a>元素,页面会跳转到该元素href属性
MySQL 的 char 与 varchar bylijinnan mysql
今天发现，create table 时，MySQL 4.1有时会把 char 自动转换成 varchar 测试举例： CREATE TABLE `varcharLessThan4` ( `lastName` varchar(3) ) ; mysql> desc varcharLessThan4; +----------+---------+------+-
Quartz——TriggerListener和JobListener eksliang TriggerListener JobListener quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208624 一.概述 listener是一个监听器对象，用于监听scheduler中发生的事件，然后执行相应的操作；你可能已经猜到了，TriggerListeners接受与trigger相关的事件，JobListeners接受与jobs相关的事件。二.JobListener监听器 j
oracle层次查询 18289753290 oracle；层次查询；树查询
.oracle层次查询(connect by) oracle的emp表中包含了一列mgr指出谁是雇员的经理，由于经理也是雇员，所以经理的信息也存储在emp表中。这样emp表就是一个自引用表，表中的mgr列是一个自引用列，它指向emp表中的empno列，mgr表示一个员工的管理者， select empno,mgr,ename,sal from e
通过反射把map中的属性赋值到实体类bean对象中酷的飞上天空 javaee 泛型类型转换
使用过struts2后感觉最方便的就是这个框架能自动把表单的参数赋值到action里面的对象中但现在主要使用Spring框架的MVC，虽然也有@ModelAttribute可以使用但是明显感觉不方便。好吧，那就自己再造一个轮子吧。原理都知道，就是利用反射进行字段的赋值，下面贴代码主要类如下： import java.lang.reflect.Field; imp
SAP HANA数据存储：传统硬盘的瓶颈问题蓝儿唯美 HANA
SAPHANA平台有各种各样的应用场景，这也意味着客户的实施方法有许多种选择，关键是如何挑选最适合他们需求的实施方案。在《Implementing SAP HANA》这本书中，介绍了SAP平台在现实场景中的运作原理，并给出了实施建议和成功案例供参考。本系列文章节选自《Implementing SAP HANA》，介绍了行存储和列存储的各自特点，以及SAP HANA的数据存储方式如何提升空间压
Java Socket 多线程实现文件传输随便小屋 java socket
高级操作系统作业，让用Socket实现文件传输，有些代码也是在网上找的，写的不好，如果大家能用就用上。客户端类： package edu.logic.client; import java.io.BufferedInputStream; import java.io.Buffered
java初学者路径 aijuans java
学习Java有没有什么捷径?要想学好Java，首先要知道Java的大致分类。自从Sun推出Java以来，就力图使之无所不包，所以Java发展到现在，按应用来分主要分为三大块：J2SE,J2ME和J2EE,这也就是Sun ONE(Open Net Environment)体系。J2SE就是Java2的标准版，主要用于桌面应用软件的编程；J2ME主要应用于嵌入是系统开发，如手机和PDA的编程；J2EE
APP推广 aoyouzi APP 推广
一，免费篇 1，APP推荐类网站自主推荐最美应用、酷安网、DEMO8、木蚂蚁发现频道等,如果产品独特新颖，还能获取最美应用的评测推荐。PS：推荐简单。只要产品有趣好玩，用户会自主分享传播。例如足迹APP在最美应用推荐一次，几天用户暴增将服务器击垮。 2，各大应用商店首发合作老实盯着排期，多给应用市场官方负责人献殷勤。 3，论坛贴吧推广百度知道，百度贴吧，猫扑论坛，天涯社区，豆瓣（
JSP转发与重定向百合不是茶 jsp servlet Java Web jsp转发
在servlet和jsp中我们经常需要请求,这时就需要用到转发和重定向; 转发包括;forward和include 例子;forwrad转发; 将请求装法给reg.html页面关键代码; req.getRequestDispatcher("reg.html
web.xml之jsp-config bijian1013 java web.xml servlet jsp-config
1.作用：主要用于设定JSP页面的相关配置。 2.常见定义： <jsp-config> <taglib> <taglib-uri>URI(定义TLD文件的URI,JSP页面的tablib命令可以经由此URI获取到TLD文件)</tablib-uri> <taglib-location> TLD文件所在的位置
JSF2.2 ViewScoped Using CDI sunjing CDI JSF 2.2 ViewScoped
JSF 2.0 introduced annotation @ViewScoped; A bean annotated with this scope maintained its state as long as the user stays on the same view(reloads or navigation - no intervening views). One problem w
【分布式数据一致性二】Zookeeper数据读写一致性 bit1129 zookeeper
很多文档说Zookeeper是强一致性保证，事实不然。关于一致性模型请参考http://bit1129.iteye.com/blog/2155336 Zookeeper的数据同步协议 Zookeeper采用称为Quorum Based Protocol的数据同步协议。假如Zookeeper集群有N台Zookeeper服务器(N通常取奇数，3台能够满足数据可靠性同时
Java开发笔记白糖_ java开发
1、Map<key,value>的remove方法只能识别相同类型的key值 Map<Integer,String> map = new HashMap<Integer,String>(); map.put(1,"a"); map.put(2,"b"); map.put(3,"c"
图片黑色阴影 bozch 图片
.event{ padding:0; width:460px; min-width: 460px; border:0px solid #e4e4e4; height: 350px; min-heig
编程之美-饮料供货-动态规划 bylijinnan 动态规划
import java.util.Arrays; import java.util.Random; public class BeverageSupply { /** * 编程之美饮料供货 * 设Opt（V’，i）表示从i到n-1种饮料中，总容量为V’的方案中，满意度之和的最大值。 * 那么递归式就应该是：Opt（V’，i）=max{ k * Hi+Op
ajax大参数（大数据）提交性能分析 chenbowen00 Web Ajax 框架浏览器 prototype
近期在项目中发现如下一个问题项目中有个提交现场事件的功能，该功能主要是在web客户端保存现场数据（主要有截屏，终端日志等信息）然后提交到服务器上方便我们分析定位问题。客户在使用该功能的过程中反应点击提交后反应很慢，大概要等10到20秒的时间浏览器才能操作，期间页面不响应事件。根据客户描述分析了下的代码流程，很简单，主要通过OCX控件截屏，在将前端的日志等文件使用OCX控件打包，在将之转换为
[宇宙与天文]在太空采矿,在太空建造 comsci
我们在太空进行工业活动...但是不太可能把太空工业产品又运回到地面上进行加工,而一般是在哪里开采,就在哪里加工,太空的微重力环境,可能会使我们的工业产品的制造尺度非常巨大.... 地球上制造的最大工业机器是超级油轮和航空母舰,再大些就会遇到困难了,但是在空间船坞中,制造的最大工业机器,可能就没
ORACLE中CONSTRAINT的四对属性 daizj oracle CONSTRAINT
ORACLE中CONSTRAINT的四对属性 summary:在data migrate时,某些表的约束总是困扰着我们,让我们的migratet举步维艰,如何利用约束本身的属性来处理这些问题呢?本文详细介绍了约束的四对属性: Deferrable/not deferrable, Deferred/immediate, enalbe/disable, validate/novalidate,以及如
Gradle入门教程 dengkane gradle
一、寻找gradle的历程一开始的时候，我们只有一个工程，所有要用到的jar包都放到工程目录下面，时间长了，工程越来越大，使用到的jar包也越来越多，难以理解jar之间的依赖关系。再后来我们把旧的工程拆分到不同的工程里，靠ide来管理工程之间的依赖关系，各工程下的jar包依赖是杂乱的。一段时间后，我们发现用ide来管理项程很不方便，比如不方便脱离ide自动构建，于是我们写自己的ant脚本。再后
C语言简单循环示例 dcj3sjt126com c
# include <stdio.h> int main(void) { int i; int count = 0; int sum = 0; float avg; for (i=1; i<=100; i++) { if (i%2==0) { count++; sum += i; } } avg
presentModalViewController 的动画效果 dcj3sjt126com controller
系统自带(四种效果)： presentModalViewController模态的动画效果设置： [cpp] view plain copy UIViewController *detailViewController = [[UIViewController al
java 二分查找 shuizhaosi888 二分查找 java二分查找
需求：在排好顺序的一串数字中，找到数字T 一般解法：从左到右扫描数据，其运行花费线性时间O(N)。然而这个算法并没有用到该表已经排序的事实。 /** * * @param array * 顺序数组 * @param t * 要查找对象 * @return */ public stati
Spring Security（07）——缓存UserDetails 234390216 ehcache 缓存 Spring Security
Spring Security提供了一个实现了可以缓存UserDetails的UserDetailsService实现类，CachingUserDetailsService。该类的构造接收一个用于真正加载UserDetails的UserDetailsService实现类。当需要加载UserDetails时，其首先会从缓存中获取，如果缓存中没
Dozer 深层次复制 jayluns VO maven po
最近在做项目上遇到了一些小问题，因为架构在做设计的时候web前段展示用到了vo层，而在后台进行与数据库层操作的时候用到的是Po层。这样在业务层返回vo到控制层，每一次都需要从po-->转化到vo层，用到BeanUtils.copyProperties(source, target)只能复制简单的属性，因为实体类都配置了hibernate那些关联关系，所以它满足不了现在的需求，但后发现还有个很
CSS规范整理（摘自懒人图库） a409435341 html UI css 浏览器
刚没事闲着在网上瞎逛，找了一篇CSS规范整理，粗略看了一下后还蛮有一定的道理，并自问是否有这样的规范，这也是初入前端开发的人一个很好的规范吧。一、文件规范 1、文件均归档至约定的目录中。具体要求通过豆瓣的CSS规范进行讲解：所有的CSS分为两大类：通用类和业务类。通用的CSS文件，放在如下目录中：基本样式库 /css/core
C++动态链接库创建与使用你不认识的休道人 C++dll
一、创建动态链接库 1.新建工程test中选择”MFC [dll]”dll类型选择第二项"Regular DLL With MFC shared linked"，完成 2.在test.h中添加 extern “C” 返回类型 _declspec(dllexport)函数名(参数列表); 3.在test.cpp中最后写 extern “C” 返回类型 _decls
Android代码混淆之ProGuard rensanning ProGuard
Android应用的Java代码，通过反编译apk文件（dex2jar、apktool）很容易得到源代码，所以在release版本的apk中一定要混淆一下一些关键的Java源码。 ProGuard是一个开源的Java代码混淆器（obfuscation）。ADT r8开始它被默认集成到了Android SDK中。官网： http://proguard.sourceforge.net/
程序员在编程中遇到的奇葩弱智问题 tomcat_oracle jquery 编程 ide
　　现在收集一下：　　排名不分先后，按照发言顺序来的。 1、Jquery插件一个通用函数一直报错，尤其是很明显是存在的函数，很有可能就是你没有引入jquery。。。或者版本不对 2、调试半天没变化：不在同一个文件中调试。这个很可怕，我们很多时候会备份好几个项目，改完发现改错了。有个群友说的好：在汤匙
解决maven-dependency-plugin (goals "copy-dependencies","unpack") is not supported xp9802 dependency
解决办法：在plugins之前添加如下pluginManagement，二者前后顺序如下： [html] view plain copy <build> <pluginManagement