水中舟_luyl

spark-core_15:sparkContext初始化源码分析

这幅图是网友提供的，非常感谢

/**
* Main entry point for Sparkfunctionality. A SparkContext represents the connection to a Spark cluster, andcan be used to create RDDs, accumulators and broadcast variables on thatcluster.
*
* Only one SparkContext may be activeper JVM. You must `stop()` the active SparkContext before creating a new one. This limitation may eventually be removed;see SPARK-2243 for more details.
*
* @param config a Spark Configobject describing the application configuration. Any settings in this configoverrides the default configs as well as system properties.
*
*  SparkContext是spark功能的主入口，代表着集群的联接，可以用它在集群中创建rdds,累加器和广播变量
*  每个jvm只能有一个SparkContext，再创建新的SparkContext之前需要先stop()当前活动的SparkContext，不过这种限制可能会在将来被移除，看SPARK-2243
*  它的构造参数是SparkConf是当前app的配制。这个配置会覆盖默认的配置以及系统属性
*
* SparkContext的初始化步骤：
*    1.创建Spark执行环境SparkEnv;
*    2.创建并且初始化Spark UI;
*    3.hadoop相关配置以及Executor环境变量的设置；
*    4.创建任务调度TaskScheduler;
*    5.创建和启动DAGScheduler;
*    6.TaskScheduler的启动；
*    7.初始化管理器BlockManager（BlockManager是存储体系的主要组件之一）
*    8.启动测量系统MetricsSystem;
*    9.创建和启动Executor分配管理器ExecutorAllocationManager;
*    10.ContextCleaner的启动和创建。
*    11.Spark环境更新
*    12.创建DAGSchedulerSource和BlockManagerSource;
*    13.将SparkContext标记激活
*/
class SparkContext(config: SparkConf) extends Logging withExecutorAllocationClient {

/**The call site where this SparkContext was constructed.spark
    * 这个CallSite是一个case class
    * 在sparkPi例子中，获得的CallSite数据如下：(该方法不单单在SparkContext被调用，在RDD或广播时等地都会被调用，每一次调用结果都是不一样的)
    *  shortForm:最短栈：SparkContext at SparkPi.scala:29
   *   longForm:最长栈：   org.apache.spark.SparkContext.(SparkContext.scala:82)
    *org.apache.spark.examples.SparkPi$.main(SparkPi.scala:29)
    *org.apache.spark.examples.SparkPi.main(SparkPi.scala)   */
private val creationSite: CallSite = Utils.getCallSite()

1、先查看一下Uitls.getCallSite()它的作用就是用于打印执行过程中的堆栈信息.

/**
 * When called inside a class in the spark package, returns the name of the user code class
 * (outside the spark package) that called into Spark, as well as which Spark method they called.
 * This is used, for example, to tell users where in their code each RDD got created.
 * 返回spark调用代码对应类的名称和方法，如选择用户每个RDD的调用过程 过滤掉非用户编写的代码
 * @param skipClass Function that is used to exclude non-user-code classes.
  *
  * 功能描述：获取当前SparkContext的当前调用栈，将栈中最靠近栈底的属于Spark或者Scala核心的类压入callStack的栈顶， 并将此类的方法存入lastSparkMethod;
  * 将栈里最靠近栈顶的用户类放入callStack,将此类的行号存入firstUserline，类名
  * 存入firstUserFile，最终返回的样例类CallSite存储了最短栈和长度默认为20的最长栈的样例类。
  * 在sparkPi例子中，获得的数据如下：(该方法不单单在SparkContext被调用，在RDD或广播时都会被调用，每一次调用结果都是不一样的)
  *   shortForm:最短栈：SparkContext at SparkPi.scala:29
  *   longForm:最长栈：    org.apache.spark.SparkContext.(SparkContext.scala:82)
                  org.apache.spark.examples.SparkPi$.main(SparkPi.scala:29)
                  org.apache.spark.examples.SparkPi.main(SparkPi.scala)
 */
def getCallSite(skipClass: String => Boolean = sparkInternalExclusionFunction): CallSite = {
  //会一直跟踪到spark代码，会将用户调用的Rdd转换等信息都取出;跟踪最后一个(最浅的)连续的Spark方法。

  这可能是一个RDD转换，一个SparkContext函数(例如parallelize)，或者其他导致RDD实例化的东西。

var lastSparkMethod= ""
var firstUserFile= ""
var firstUserLine= 0
var insideSpark= true
var callStack = new ArrayBuffer[String]() :+ ""
// 返回当前正在执行的线程对象的引用。
// getStackTrace()方法返回，StackTraceElement[]栈帧集合，每个元素都是一个栈帧，除了最顶部栈帧，都是一个方法的调用。
// 堆栈顶部的帧表示生成堆栈跟踪的执行点
Thread.currentThread.getStackTrace().foreach {ste: StackTraceElement =>
    // When running under some profilers, the current stacktrace might contain some bogus
    // frames. This is intended to ensurethat we don't crash in these situations by
    // ignoring any frames that we can'texamine.
    // 在某些profiler下运行时，当前堆栈跟踪可能包含一些假frames。
    // 这是为了确保我们在这些情况下不会忽略任何我们不能检查的框架。
    if (ste!= null && ste.getMethodName != null
      && !ste.getMethodName.contains("getStackTrace")) {
      if (insideSpark){
        if (skipClass(ste.getClassName)){ //如果是spark或scala内部类则将spark的方法名给lastSparkMethod
          //如果栈帧的方法名是，则取栈帧的类名.如：org.apache.spark.SparkContext.(SparkContext.scala:82)
          //它的方法名是，表示类的初始化过程
          lastSparkMethod = if (ste.getMethodName== "") {
            // Spark method is a constructor; get its class name
            //得到的类名是SparkContext，在RDD调用时，也会调用这个方法，然后得到的MapPartitionsRDD
            ste.getClassName.substring(ste.getClassName.lastIndexOf('.') + 1)
          } else {
            ste.getMethodName
          }
          //将最后的spark方法的的堆栈信息放ArrayBuffer最上面
          callStack(0) = ste.toString // Put last Spark method on top of the stack trace.
        } else{
          //出spark内部代码时，将第一个用户调用代码的栈帧方法对应的行号，文件名取出，再栈信息加到callStack：ArrayBuffer中
          firstUserLine = ste.getLineNumber
          firstUserFile = ste.getFileName
          callStack += ste.toString
          insideSpark = false //因为先从spark代码开始的，如果调用到用户代码时，就说明出了spark内部代码，则将insideSpark设置成false
        }
      } else {
        //将用户代码的所有堆栈信息都取出来加到callStack：ArrayBuffer中
        callStack += ste.toString
      }
    }
}

===》分析一下带名参数getCallSite(skipClass: String => Boolean= sparkInternalExclusionFunction)

/** Defaultfiltering function for finding call sites using `getCallSite`.
* 过滤掉非用户编写的代码，即将spark、scala自身的代码过滤掉
* */
private def sparkInternalExclusionFunction(className: String): Boolean = {
// A regular expression to match classes of the internalSpark API's
// that we want to skip when findingthe call site of a method.
val SPARK_CORE_CLASS_REGEX=
"""^org\.apache\.spark(\.api\.java)?(\.util)?(\.rdd)?(\.broadcast)?\.[A-Z]""".r
val SPARK_SQL_CLASS_REGEX= """^org\.apache\.spark\.sql.*""".r
val SCALA_CORE_CLASS_PREFIX= "scala"
//使用正则表达式将sparkCore,sql，scala的代码过滤掉
val isSparkClass= SPARK_CORE_CLASS_REGEX.findFirstIn(className).isDefined ||
SPARK_SQL_CLASS_REGEX.findFirstIn(className).isDefined
val isScalaClass= className.startsWith(SCALA_CORE_CLASS_PREFIX)
// If the class is a Spark internal class or a Scalaclass, then exclude.
isSparkClass || isScalaClass
}

===>再回到sparkContext初始化代码：

2，可以看出当前版本默认只能有一个活跃的SparkContext在jvm中，否则多个活跃SparkContext会抛异常

// If true, logwarnings instead of throwing exceptions when multiple SparkContexts are active
// 如果设置为true log日志里将会抛出多个SparkContext处于活动状态的异常
private val allowMultipleContexts: Boolean =
config.getBoolean("spark.driver.allowMultipleContexts", false)

// In order to prevent multipleSparkContexts from being active at the same time, mark this
// context as having started construction.
// NOTE: this must be placed at the beginning of the SparkContext constructor.
// 为了预防多SparkContexts同一时间处于活动状态，如果出现多个活跃的SparkContext则会报错，如果spark.driver.allowMultipleContexts值为true就会有警告日志
// 注：这placed必须要开始的sparkcontextconstructor。
SparkContext.markPartiallyConstructed(this, allowMultipleContexts)
// 得到系统的当前时间
val startTime = System.currentTimeMillis()
//使用Atomic原子类来确保stopped变量原子性
private[spark] val stopped: AtomicBoolean = new AtomicBoolean(false)

3，查看SparkContext主构造器

/**
* Alternative constructor that allowssetting common Spark properties directly
* 替代构造函数，允许直接设置常用的Spark属性
*master对应集群的URL
* @param master Cluster URL toconnect to (e.g. mesos://host:port, spark://host:port, local[4]).
* @param appName A name for yourapplication, to display on the cluster web UI
* @param conf a [[org.apache.spark.SparkConf]] objectspecifying other Spark parameters
*/
def this(master: String, appName: String, conf: SparkConf) =
this(SparkContext.updatedConf(conf, master, appName))

…

/**
* Alternative constructor that allowssetting common Spark properties directly
* 替代构造函数，允许直接设置常用的Spark属性
* @param master Cluster URL toconnect to (e.g. mesos://host:port, spark://host:port, local[4]).
* @param appName A name for yourapplication, to display on the cluster web UI.
*/
private[spark] def this(master: String, appName: String) =
this(master, appName, null, Nil, Map())

===》顺便看一下SparkContext.updatedConf(conf, master, appName)方法

/**
* Creates a modified version of aSparkConf with the parameters that can be passed separately
* to SparkContext, to make it easier towrite SparkContext's constructors. This ignores
* parameters that are passed as thedefault value of null, instead of throwing an exception
* like SparkConf would.
* 通过参数修改sparkConf的内容
*/
private[spark] def updatedConf(
    conf: SparkConf,
    master: String,
    appName: String,
    sparkHome: String= null,
    jars: Seq[String] = Nil, //Nil表示空元素的list()
    environment: Map[String, String] = Map()): SparkConf =
{
val res= conf.clone()
res.setMaster(master)
res.setAppName(appName)
if (sparkHome!= null) {
    res.setSparkHome(sparkHome)
}

//会将上传的jar发送到每个节点，然后存在到SparkConf下面的ConcurrentHashMap中。它的key是spark.jars，value是按jars每个元素按逗号分开的串
  if (jars != null && !jars.isEmpty) {
    res.setJars(jars)
  }
//将由seq每个元素对应的key指定的环境变量值添加到Executor进程。 然后在Executor进来取出来使用
// 如：存在到SparkConf下面的ConcurrentHashMap中key：spark.executorEnv.VAR_NAME（是当前environment的key）,value:当前environment的value
  res.setExecutorEnv(environment.toSeq)
  res
}

4,初始化生成LiveListenerBus

/**Anasynchronous listener bus for Spark events
* a,它和StreamingListenerBus有相同的父类AsynchronousListenerBus ，使用相同的监听器StreamingListener
* b，异步将SparkListenerEvents事件注册到SparkListeners，在调用start（）之前，所有发布的事件仅被缓存。
* 只有在此LiveListenerBus启动后，事件才会实际传播给所有连接的SparkListener。
* 该LiveListenerBus在接收到使用stop（）发布的SparkListenerShutdown事件时停止。
*/
private[spark] val listenerBus= new LiveListenerBus

。。。

// Used to store a URLfor each static file/jar together with the file's local timestamp
//用于将每个静态文件/ jar的URL与文件的本地时间戳一起存储
private[spark] val addedFiles= HashMap[String,Long]()
private[spark] val addedJars = HashMap[String, Long]()

// Keeps track of all persisted RDDs，保持跟踪所有存储的RDD
private[spark] val persistentRdds= new TimeStampedWeakValueHashMap[Int, RDD[_]]

。。。

// Environmentvariables to pass to our executors. 设置环境变化给executor使用
private[spark] val executorEnvs= HashMap[String, String]()

// Set SPARK_USER for user who is runningSparkContext. 返回当前环境的机器名：luyl
val sparkUser = Utils.getCurrentUserName()

5,初始化ThreadLocal及它的子类InheritableThreadLocal

// Thread Localvariable that can be used by users to pass information down the stack
//可以使用ThreadLocal传递的线程的变量
//它和ThreadLocal的区别：
//a,ThreadLocal只有在当前线程中，线程变量值有效，如果是当前线程的子线程，线程值就不一样了。
//b,InheritableThreadLocal可以解决在当前线程的子线程取父线程的值，同时它多了一个childValue方法，
// 这个方法可以从父线程中得到父线程中set或第一次get是初始化initialValue的值，然后可以对这个值进行重写
protected[spark] val localProperties= new InheritableThreadLocal[Properties]{
override protected def childValue(parent:Properties): Properties = {
    // Note: make a clone such that changes in the parentproperties aren't reflected in
    // the those of the children threads,which has confusing semantics (SPARK-10563).
    SerializationUtils.clone(parent).asInstanceOf[Properties]
}
override protected def initialValue(): Properties = new Properties()
}

。。。。。

6，检查SparkConf的必要属性，并对相应属性做解析将相应的值赋给SparkContext成员

try {
//config就是主构造参数传进来的SparkConf,里面没有master或appName会报错
_conf =config.clone()
_conf.validateSettings()

if (!_conf.contains("spark.master")) {
    throw new SparkException("A masterURL must be set in your configuration")
}
if (!_conf.contains("spark.app.name")) {
    throw new SparkException("Anapplication name must be set in your configuration")
}

// System property spark.yarn.app.id must be set if usercode ran by AM on a YARN cluster
// yarn-standalone is deprecated, butstill supported
if ((master== "yarn-cluster" || master == "yarn-standalone") &&
      !_conf.contains("spark.yarn.app.id")) {
    throw new SparkException("Detectedyarn-cluster mode, but isn't running on a cluster. " + "Deployment to YARN is not supported directly by SparkContext. Pleaseuse spark-submit.")
}

if (_conf.getBoolean("spark.logConf", false)) {
    logInfo("Spark configuration:\n"+ _conf.toDebugString)
}

// Set Spark driver host and port system properties
//如果conf中没有host，port属性，会设置host就是本机域名 port是0
_conf.setIfMissing("spark.driver.host", Utils.localHostName())
_conf.setIfMissing("spark.driver.port", "0")
//DRIVER_IDENTIFIER的值就是driver，可见driver也是一个executor
_conf.set("spark.executor.id", SparkContext.DRIVER_IDENTIFIER)
//spark.jars就是SparkSubmit解析val (childArgs, childClasspath,sysProps, childMainClass) = prepareSubmitEnvironment(args)
//在sparkSubmit的606行sysProps.put("spark.jars",jars.mkString(","))，这些默认参数会在sparkConf初始化时加进去
//这边把jars的串，按逗号分隔成一个集合串
_jars = _conf.getOption("spark.jars").map(_.split(",")).map(_.filter(_.size != 0)).toSeq.flatten
//是通过--files传进来的，放在每个executor的工作目录的。也是按逗号分开的
_files = _conf.getOption("spark.files").map(_.split(",")).map(_.filter(_.size != 0))
    .toSeq.flatten

7，将spark的事件日志目录及压缩日志的类提取出来

/**
* 如果spark.eventLog.enabled为true,默认是false，如果设置成true则记录Spark事件的根目录。在这个根目录中，
* Spark为每个应用程序创建一个子目录，并在该目录中记录特定于应用程序的事件。
* 可以设置它成hdfs目录，以便历史记录服务器可以读取历史文件。
* spark.eventLog.dir：默认值是/tmp/spark-events ，即在hdfs中会变成Some(URI(http://192.168.1.150:50070/tmp/spark-events))
* 本地文件：Some(URI(file:///tmp/spark-events))

spark.eventLog.dir、spark.eventLog.enabled，这两个属性在Spark_home/conf/spark-defaults.conf也可以配制
*/
_eventLogDir =
if (isEventLogEnabled){ //isEventLogEnabled : 默认是false,对应spark.eventLog.enabled配制
    val unresolvedDir= conf.get("spark.eventLog.dir", EventLoggingListener.DEFAULT_LOG_DIR)
      .stripSuffix("/") //该方法会把串中后面带有“/”去掉
    //unresolvedDir得到的是如：/tmp/spark-events
    //为用户输入字符串描述的文件返回格式正确的网络URI路径。如：file:/tmp/spark-events
    Some(Utils.resolveURI(unresolvedDir))
} else {
    None
}

/**
* spark.eventLog.compress是否压缩事件日志，默认false
*/
_eventLogCodec = {
val compress= _conf.getBoolean("spark.eventLog.compress", false)
if (compress&& isEventLogEnabled) { //isEventLogEnabled: 默认是false,对应spark.eventLog.enabled
    //默认是Some("snappy").map("snappy"),返回Some("snappy")
    Some(CompressionCodec.getCodecName(_conf)).map(CompressionCodec.getShortName)
} else {
    None
}
}
//给外部block存储的目录，生成一个随机的名称，在这个名称后缀上加上timestamp,得到的是spark-cf14b6b5-baff-44dc-a434-429f251cb505
_conf.set("spark.externalBlockStore.folderName", externalBlockStoreFolderName)

if (master == "yarn-client") System.setProperty("SPARK_YARN_MODE", "true")

//给外部block存储的目录，生成一个随机的名称，在这个名称后缀上加上timestamp,得到的是spark-cf14b6b5-baff-44dc-a434-429f251cb505
_conf.set("spark.externalBlockStore.folderName", externalBlockStoreFolderName)

8，初始化JobProgressLIstener(sparkConf),并加到LiveListenerBus中

// "_jobProgressListener"should be set up before creating SparkEnv because when creating
// "SparkEnv", some messages will be posted to"listenerBus" and we should not miss them.
//创建SparkEnv之前应该设置“jobProgressListener”，因为在创建“SparkEnv”时，一些消息将被发布到“listenerBus”
_jobProgressListener= new JobProgressListener(_conf) //跟踪要在UI中显示的任务级别信息。
listenerBus.addListener(jobProgressListener)

1，初始化SparkEnv(查看：spark-core_16:初始化Driver的SparkEnv)

* SparkEnv的构造步骤如下：
*     1.创建安全管理器SecurityManager
*     2.创建给予AKKa的分布式消息系统ActorSystem; --未来版本会被移除
*     3.创建Map任务输出跟踪器mapOutputTracker;
*     4.实例化ShuffleManager;
*     5.创建块传输服务BlockTransferService;
*     6.创建BlockManagerMaster;
*     7.创建块管理器BlockManager;
*     8.创建广播管理器BroadcastManager;
*     9.创建缓存管理器CacheManager;
*     10.创建HTTP文件服务器HttpFileServer;
*     11.创建测量系统MetricsSystem;
*     12.创建输出提交控制器OutputCommitCoordinator;
*     13.创建SparkEnv;

// Create the Sparkexecution environment (cache, map output tracker, etc)
//SparkContext初始化时，将SparkEnv初始化出来
_env = createSparkEnv(_conf, isLocal, listenerBus)
SparkEnv.set(_env)

// This functionallows components created by SparkEnv to be mocked in unit tests: 可以在单元测试中可以调用这个方法创建SparkEnv
//SparkContext初始化时，将SparkEnv初始化出来
//SparkContext.numDriverCores(master):如果master是local模式会将driver对应节点cpu的线程数取出来，如果是集群模式则返回0
private[spark] def createSparkEnv(
    conf: SparkConf,
    isLocal: Boolean,
    listenerBus: LiveListenerBus): SparkEnv = {
SparkEnv.createDriverEnv(conf, isLocal, listenerBus, SparkContext.numDriverCores(master))
}

9、启动jettyServer,跟踪job相关的信息然后在web展示出来

//实例化出来的SparkEnv，通过SparkEnv.set()，将sparkEnv实例，设置到伴生对象的成员变量中
SparkEnv.set(_env)
//运行一个定时器定期清理原数据，如旧文件或hashTable实例kv，前提是设置spark.cleaner.ttl的值才会定时清理
_metadataCleaner = new MetadataCleaner(MetadataCleanerType.SPARK_CONTEXT, this.cleanup, _conf)
//用于监控Job和Stage进度的低级状态报告API
_statusTracker = new SparkStatusTracker(this)

_progressBar =
if (_conf.getBoolean("spark.ui.showConsoleProgress", true) && !log.isInfoEnabled) {
    Some(new ConsoleProgressBar(this))
} else {
    None
}
//初始化EnvironmentListener,StorageStatusListener，ExecutorsListener,RDDOperationGraphListener，放到LisvListenerBus中，
// 然后将SparkUI初始化出来，即4040对应的页面
_ui =
if (conf.getBoolean("spark.ui.enabled", true)) {
    //_jobProgressListener跟踪要在UI中显示的任务级别信息，startTime就是SparkContext的初始时的系统时间返回SparkUI，它的父类是WebUI，和MasterWebUI是一个级别的
    Some(SparkUI.createLiveUI(this, _conf, listenerBus, _jobProgressListener,
      _env.securityManager, appName, startTime = startTime))
} else {
    // For tests, do not enable the UI
    None
}
// Bind the UI before starting the taskscheduler to communicate
// the bound port to the cluster manager properly
//调用SparkUI的bind()方法，就是启动jetty Server
//在启动任务调度程序之前绑定用户界面，以便将绑定的端口正确地与集群管理器进行通信
_ui.foreach(_.bind())
//返回Hadoop的Configuration()实例
_hadoopConfiguration= SparkHadoopUtil.get.newConfiguration(_conf)

10，将sparkSubmit的--jars和--files发布到HttpBasedFileServer对应的jettyServer的路径下

// Add each JAR giventhrough the constructor.为SparkContext上执行的所有任务添加JAR依赖项。
if (jars != null) {
//每个jar路径是jars集合的元素，会被HttpBasedFileServer对应的jettyServer发布网络上
/*如果传递进来的是/data/path/aa.jar，getScheme得到的是file，jettyServer提供一个文件服务*/
jars.foreach(addJar)
}

if (files != null) {
//是通过--files传进来的，放在每个节点的HttpBasedFileServer对应的jettyServer发布网络上。也是按逗号分开的
//目前只支持hadoop协议的上的数据，并且必须把路径写全，如：写成hdfs://ns1/examples/src/main/resources/people.json
//否则会报错
files.foreach(addFile)
}

//每个执行程序进程使用的内存量,默认是1G，System.getenv是从spark-env.sh中得到的（SPARK_EXECUTOR_MEMORY、SPARK_MEM）,
// 或提交参数时指定：--executor-memory
//默认是取的1024
_executorMemory = _conf.getOption("spark.executor.memory")
.orElse(Option(System.getenv("SPARK_EXECUTOR_MEMORY")))
.orElse(Option(System.getenv("SPARK_MEM"))
.map(warnSparkMem))
.map(Utils.memoryStringToMb)
.getOrElse(1024)

11，每分钟检测一下Executor的心跳

// We need to register"HeartbeatReceiver" before "createTaskScheduler" becauseExecutor will retrieve "HeartbeatReceiver" in the constructor.(SPARK-6640)
//我们需要在“createTaskScheduler”之前注册“HeartbeatReceiver”，因为Executor将在构造函数中检索“HeartbeatReceiver”
//创建一个HeartbeatReceiver 的RpcEndpoint注册到RpcEnv中，每分钟给自己发送ExpireDeadHosts，去检测Executor是否存在心跳，如果当前时间减去最一次心跳时间，大于1分钟，就会用CoarseGrainedSchedulerBackend将Executor杀死
_heartbeatReceiver = env.rpcEnv.setupEndpoint(

HeartbeatReceiver.ENDPOINT_NAME, new HeartbeatReceiver(this))

===》进入HeartbeatReceiver(this),即是一个RepEndPoint也是一个SparkListener监听器

/**
* Lives in the driver to receiveheartbeats from executors..
* driver接收所有executor的心跳，混入SparkListener，说明它是一个监听器
*/
private[spark] class HeartbeatReceiver(sc:SparkContext, clock: Clock)
extends ThreadSafeRpcEndpoint withSparkListener with Logging {
def this(sc: SparkContext) {
    this(sc, new SystemClock)
}
sc.addSparkListener(this)

override val rpcEnv:RpcEnv = sc.env.rpcEnv
private[spark]var scheduler: TaskScheduler = null

// executor ID -> timestamp of when the last heartbeatfrom this executor was received
//executor ID - >接收到来自该执行者的最后一次心跳的时间戳
private val executorLastSeen = new mutable.HashMap[String,Long]

// "spark.network.timeout" uses"seconds", while `spark.storage.blockManagerSlaveTimeoutMs` uses"milliseconds"
//“spark.network.timeout”使用“秒”，而`spark.storage.blockManagerSlaveTimeoutMs`使用“毫秒”
private val slaveTimeoutMs =
    sc.conf.getTimeAsMs("spark.storage.blockManagerSlaveTimeoutMs", "120s")
//executorTimeoutMs是120秒
private val executorTimeoutMs =
    sc.conf.getTimeAsSeconds("spark.network.timeout", s"${slaveTimeoutMs}ms") * 1000

// "spark.network.timeoutInterval" uses"seconds", while
//"spark.storage.blockManagerTimeoutIntervalMs" uses"milliseconds"
private val timeoutIntervalMs =
    sc.conf.getTimeAsMs("spark.storage.blockManagerTimeoutIntervalMs", "60s")
private val checkTimeoutIntervalMs =
    sc.conf.getTimeAsSeconds("spark.network.timeoutInterval", s"${timeoutIntervalMs}ms") * 1000

private var timeoutCheckingTask: ScheduledFuture[_] = null

// "eventLoopThread" is used to run some prettyfast actions. The actions running in it should not
// block the thread for a long time.
//“eventLoopThread”用于运行一些相当快的动作。在其中运行的动作不应该长时间阻塞线程。生成一个单线程的调度池
private val eventLoopThread =
    ThreadUtils.newDaemonSingleThreadScheduledExecutor("heartbeat-receiver-event-loop-thread")

private val killExecutorThread = ThreadUtils.newDaemonSingleThreadExecutor("kill-executor-thread")

override def onStart(): Unit = {
  //每分钟给自己发送ExpireDeadHosts
    timeoutCheckingTask = eventLoopThread.scheduleAtFixedRate(new Runnable {
      override def run(): Unit = Utils.tryLogNonFatalError {
        Option(self).foreach(_.ask[Boolean](ExpireDeadHosts))
      }
    }, 0, checkTimeoutIntervalMs, TimeUnit.MILLISECONDS)
}

===》onStart()方法每分钟执行一下心跳检测：

override def receiveAndReply(context: RpcCallContext): PartialFunction[Any, Unit] = {
// Messages sent and received locally
。。。

case ExpireDeadHosts=>
expireDeadHosts()
context.reply(true)

===》expireDeadHosts会在比对Executor最后一次心跳时间，超过1分钟的，调用ExecutorSchedulerBackEnd清除Executor

private def expireDeadHosts(): Unit= {
logTrace("Checking for hosts with no recent heartbeats inHeartbeatReceiver.")
val now= clock.getTimeMillis() //值就是currentTimeMillis
//executorLastSeen:HashMap[String,Long]必须有Executor注册才会有值,Long值是executor最后一个心跳时间
for ((executorId, lastSeenMs) <- executorLastSeen) {
    //当前时间减去lastSeenMs(executor最后一个心跳时间)大于60s则移除Executor
    if (now- lastSeenMs > executorTimeoutMs) {
      logWarning(s"Removing executor $executorId with no recent heartbeats: " +
        s"${now - lastSeenMs} ms exceeds timeout $executorTimeoutMs ms")
      //scheduler得有消息发到TaskSchedulerIsSet才会有值
      scheduler.executorLost(executorId, SlaveLost("Executorheartbeat " +
        s"timed out after ${now- lastSeenMs} ms"))
        // Asynchronously kill the executor to avoid blocking thecurrent thread
       // 异步杀死executor避免阻塞当前线程
      killExecutorThread.submit(new Runnable {
        override def run(): Unit = Utils.tryLogNonFatalError {
          // Note: we want to get an executor back after expiringthis one,
          // so do not simply call`sc.killExecutor` here (SPARK-8119)
          sc.killAndReplaceExecutor(executorId)
        }
     })
      executorLastSeen.remove(executorId)
    }
}
}

===>再回到SparkContext中

12、创建TaskSchdulerImpl和SparkDeploySchedulerBackend，在createTaskScheduler()。TaskSchdulerImpl.initialize()会被调用，同时将SparkDeploySchedulerBackend，，赋给TaskSchdulerImpl成员上

查看（spark-core_22: SparkDeploySchedulerBackend，TaskSchedulerImpl的初始化源码分析）和

(spark-core_23: TaskSchedulerImpl.start()、SparkDeploySchedulerBackend.start()、CoarseGrainedExecutorBackend.start()、AppClient.start()源码分析)

// Create and startthe scheduler，这个master是在sparkSubmit.Main方法得到：spark://luyl152:7077,luyl153:7077,luyl154:7077
//如果集群管理器是standalone模式：该方法返回（SparkDeploySchedulerBackend，TaskSchedulerImpl）
val (sched, ts)= SparkContext.createTaskScheduler(this, master)
_schedulerBackend = sched //SparkDeploySchedulerBackend
_taskScheduler = ts //TaskSchedulerImpl

（查看spark-core_27:DAGScheduler的初始化源码分析）
_dagScheduler = new DAGScheduler(this) //DAGScheduler初始化时会将自己设置到TaskSchedulerImpl中
_heartbeatReceiver.ask[Boolean](TaskSchedulerIsSet)//向HeartbeatReceiver发出询问，将TaskSchedulerImpl赋给TaskSchedulerIsSet.scheduler成员

// start TaskScheduler after taskScheduler sets DAGScheduler reference inDAGScheduler's constructor

在TaskSchedulerImpl在DAGScheduler的构造函数中设置DAGScheduler引用后启动TaskScheduler
_taskScheduler.start()

13，从sparkDeploySchdulerBackend中取得appId给sparkContext的_applicationId赋值

同时调用BlockManager.initialized()

_applicationId = _taskScheduler.applicationId() //在sparkDeploySchedulerBackend中的AppClient的start()往master注册得到的值: app-20180404172558-0000
//如果集群管理器支持多次尝试，则获取此运行的尝试标识。在客户端模式下运行的应用程序不会有尝试ID。
_applicationAttemptId= taskScheduler.applicationAttemptId()
_conf.set("spark.app.id", _applicationId)
_ui.foreach(_.setAppId(_applicationId))//给sparkUI设置的

查看（spark-core_29：Executor初始化过程env.blockManager.initialize(conf.getAppId)源码分析）driver的blockManager.initialize也是类似的
_env.blockManager.initialize(_applicationId) //Executor在初始化时调用一次，driver在SparkContext初始化也调用

你可能感兴趣的:(spark,core)

【云原生技术】k8s是不是不能处理0.1core的CUP配置，必须配置成100mi？阿寻寻云原生 kubernetes 容器
CPU的资源请求和限制特定的表示方式CPU配置的单位配置要求示例在Kubernetes中，CPU的资源请求和限制确实有特定的表示方式。关于你提到的0.1core和100m这两个值，以下是详细的解释：CPU配置的单位KubernetesCPU单位：Kubernetes使用milliCPU（毫核）作为CPU的计量单位。1核CPU=1000milliCPU(m)。例如，0.1核实际上表示为100m（10
搭建单机伪分布式Hadoop+spark+scala 啥也不会0-0 分布式 hadoop spark
目录一、准备环境包：二、创建centos7虚拟机并配置ip三、链接Xshell并上环境包四、安装JDK1.解压jdk2.设置JAVA环境变量3.执行source使设置生效：4.检查JAVA是否可用。五、免密登陆1.创建ssh秘钥，输入如下命令，生成公私密钥2.将master公钥id_dsa复制到master进行公钥认证，实现本机免密登陆，测试完exit退出六、安装Hadoop软件1.解压hadoo
CDP中的Hive3之Apache Hive3特性对许 #Hive #Spark hive cdp
CDP中的Hive3之ApacheHive3特性1、ApacheHive3特性2、Hive不支持的接口和功能3、HiveonTez简介4、ApacheHive3架构概述CDP中采用的是ApacheHive3版本，相比Hive1/2，该版本在事务和安全性等方面有重大改进，了解这些版本之间的主要差异对于SQL用户至关重要，包括使用ApacheSpark和ApacheImpala的用户1、ApacheH
Hadoop 与 Spark：大数据处理的比较王子良. 大数据经验分享 hadoop spark 大数据
欢迎来到我的博客！非常高兴能在这里与您相遇。在这里，您不仅能获得有趣的技术分享，还能感受到轻松愉快的氛围。无论您是编程新手，还是资深开发者，都能在这里找到属于您的知识宝藏，学习和成长。博客内容包括：Java核心技术与微服务：涵盖Java基础、JVM、并发编程、Redis、Kafka、Spring等，帮助您全面掌握企业级开发技术。大数据技术：涵盖Hadoop（HDFS）、Hive、Spark、Fli
RabbitMQ消息监听异常问题探究风树种子 RabbitMQ RabbitMQ spring Wireshark 异常 requeue
问题场景在使用SpringRabbitMQ做消息监听时，如果监听程序处理异常了，且未对异常进行捕获，会一直重复接收消息，然后一直抛异常。为了更好的描述问题，下面写个简单的例子。通过访问null对象来引发空指针异常，消息监听处理程序代码清单:packageamqp;importorg.springframework.amqp.core.Message;importorg.springframewor
虚拟机VMware Workstation Pro安装集群+hadoop+spark+scala 落枫兮 hadoop spark scala
参考资料：参考视频教程链接：大数据实验虚拟机安装Hadoop和Spark_哔哩哔哩_bilibiliup主：孤独时代的硕硕namenode安装选择镜像、路径、磁盘（最好不要c盘）、内存和处理器编辑名称与位置可点击此处自定义硬盘进行设置。选择语言、时区、软件、位置和网络
大数据手写面试题Scala语言实现大全（持续更新）大模型大数据攻城狮大数据数据结构算法面试题面试宝典
在大数据领域，Scala语言因其强大的函数式编程特性和对并发处理的良好支持而成为了开发者们的热门选择。有些面试官，为了考验面试者的基本功，需要让手写一些面试题，以数据结构和算法类的居多。本文将为您提供一些常见的Scala手写面试题及参考答案，帮助您在面试或工作中更好地运用Scala。目录1.冒泡排序2.二分查找3.快速排序4.归并排序5.手写Spark-WordCount6.手写Spark程序求平
com.mongodb.MongoSocketOpenException: Exception opening socket错误解决方法且听风吟， JAVA mongodb java 数据库
详细错误信息：com.mongodb.MongoSocketOpenException:Exceptionopeningsocketatcom.mongodb.connection.SocketStream.open(SocketStream.java:63)~[mongodb-driver-core-3.4.2.jar:na]atcom.mongodb.connection.InternalSt
帮助应用实现实时语音与文本的相互转换 harmonyos
课程简介本课程是【HarmonyOS主题课：HarmonyOSSDK开放能力】的第10课。本课程专为助力应用实现实时语音与文本相互转换而设。课程将深入讲解CoreSpeechKit这一基础语音服务，详细阐述其语音识别（SpeechRecognizer）能力，使开发者能精准掌握语音转文本的技术要点与应用方式。同时全面剖析文本转语音（TextToSpeech）功能，包括其原理、参数设置及优化策略。通过
Flutter：进步器，数量加减简单使用 sunly_ Flutter flutter
封装组件import'package:ducafe_ui_core/ducafe_ui_core.dart';import'package:flutter/cupertino.dart';import'../index.dart';///数量编辑classQuantityWidgetextendsStatelessWidget{//数量发送改变finalFunction(intquantity)o
解决：com.mongodb.MongoSocketOpenException: Exception opening socket ppo_wu BUG mongodb 数据库 spring boot java
背景springboot项目启动时，报错com.mongodb.MongoSocketOpenException:Exceptionopeningsocketatcom.mongodb.internal.connection.SocketStream.open(SocketStream.java:70)~[mongodb-driver-core-3.11.2.jar:na]atcom.mongod
Blazor-AdminLTE 项目教程诸余煦
Blazor-AdminLTE项目教程blazor-adminlteThisprojectadaptsADMINLTE3sothecomponentscanbeusedfromdotnetcoreBlazor/Server/WebAssembly项目地址:https://gitcode.com/gh_mirrors/bl/blazor-adminlte1.项目的目录结构及介绍Blazor-Admi
探索数据之美：Blazor-ApexCharts——为.NET Core而生的图表神器解雁淞
探索数据之美：Blazor-ApexCharts——为.NETCore而生的图表神器Blazor-ApexChartsAblazorwrapperforApexCharts.js项目地址:https://gitcode.com/gh_mirrors/bl/Blazor-ApexCharts在可视化日益重要的今天，找到一个既高效又灵活的图表库对于开发者来说至关重要。今天，我们要向大家隆重推荐一款专为
dotnet-blazor-crud 项目教程尚舰舸Elsie
dotnet-blazor-crud项目教程dotnet-blazor-crudDemoapplicationbuiltwiththeBlazorclient-sidehostingmodel(WebAssembly)and.NETCoreRESTAPIssecuredbyaJWTservice.项目地址:https://gitcode.com/gh_mirrors/do/dotnet-blazo
使用iFlyTek SparkLLM进行实时聊天应用开发 dagGAIYD 前端 javascript java python
技术背景介绍在当今的AI应用开发中，实时对话模型越来越受到重视。iFlyTek的SparkLLM为开发者提供了强大的聊天模型API，支持灵活的集成和扩展。本文将介绍如何使用SparkLLM搭建一个简单的聊天应用，包括基本的API初始化和调用，以及如何实现流式输出。核心原理解析SparkLLM是一款基于大规模语言模型的对话生成系统。它的核心在于通过自然语言理解和生成，实现人机之间的自然交流。通过使用
hvie SQL优化之where子句过滤模式三生暮雨渡瀟瀟 hive调优 hive
本篇文章来源于《Hive性能调优实现》。在HiveSQL里面经常用到的过滤方法就是使用where子句，例如：explainselect*fromstudent_tb_seqwheres_age=19ands_namelike'%红%'ands_scorein(100,50,22);where子句在执行计划中以filter操作表示，代码如下：STAGEPLANS:Stage:Stage-1MapRe
数据恢复常用方法（三）如何辨别固态硬盘故障类型记忆空间istore 固态硬盘SSD 数据恢复
数据恢复首先需要辨别固态硬盘故障类型，只有先确认故障类型，才能进行下一步动作如下是一种常见的场景，固态硬盘无法识别，接入电源与数据线，电脑的磁盘管理不显示任何信息。第一步：确认硬件状态，电源部分是否正常？主控core电压是否正常？一般主控core电压为（0.9V、1.1V等），其次就是nandflash电压是否正常？nandflash电压有2路，一路是NANDCore电压3.3V（也有的是2.5V
EasyExcel 导出，保留两位小数并显示千分位 Leslie_Lei Excel java excel
实体类属性类型为BigDecimal注解@NumberFormat("#,###.00")试过了不顶用，原因不太清楚值为0.81这种，导出后变为.81所以，换个思路，写个转换器，就是麻烦点转换器BigDecimalConvertimportcn.hutool.core.util.StrUtil;importcom.alibaba.excel.converters.Converter;importc
有了TiDB，是否还需要“散装”大数据组件？狮歌~资深攻城狮 tidb 数据仓库数据分析数据库分布式
有了TiDB，是否还需要“散装”大数据组件？最近和同事们讨论一个问题：在大数据应用日益增多的今天，如果使用了TiDB这样的一体化数据库，还需要使用那些传统的大数据组件（比如Hadoop、Spark等）吗？相信大家在公司或项目中，常常遇到需要处理大量数据的场景，特别是互联网、金融、电商等行业。随着TiDB的兴起，它作为一款分布式关系型数据库，似乎能够解决不少大数据问题。那么，问题来了：如果我们已经选
SecureUtil.aes数据加密工具类 Java知识技术分享 java技术后端 java intellij-idea
数据加密、解密工具类包含map和vo的数据转换importcn.hutool.core.bean.BeanUtil;importcn.hutool.crypto.SecureUtil;importjava.util.HashMap;importjava.util.Map;/***数据解析**/publicclassParamUtils{/***数据解密**@paramparams参数*@param
盘点10个.NetCore实用的开源框架项目 zsw119 .netcore 开源
连续分享.Net开源项目快3个月了，今天我们一起梳理下10个，比较受到大家欢迎的.NetCore开源框架项目。1、FytSoaCms前后端分离CMS系统项目简介这是一个基于.Net3构建的简单、跨平台、模块化建站系统。系统业务简单、代码清晰、层级分明、全新架构便于二次扩展开发。支持多种数据库，可用于OA、ERP、CRM、BI、物流系统等系统。技术架构1、跨平台：这是基于.NetCore开发的系统，
自定义注解格式化处理BigDecimal 都要好好的O java 自定义注解
一、场景描述在开发过程中，如果有实体类的属性中存在BigDecimal的属性，并且需要对其进行校验，例如：限制BigDecimal的小数点位数是两位或者处理精度自动补0。但目前没有注解可以完成这个操作，因此我们可以使用下面的工具类和注解进行处理。二、实现步骤1、自定义类importcom.fasterxml.jackson.core.JsonGenerator;importcom.fasterxm
ASP.NET Core微服务架构：从入门到精通的Ocelot实践 LaotLisp 架构 asp.net 微服务
微服务架构的兴起使得开发人员能够构建高度可伸缩、松耦合的应用程序。在ASP.NETCore中，Ocelot是一个流行的开源库，它提供了一个简单而强大的方式来构建和管理微服务架构。在本文中，我们将深入探讨如何使用Ocelot从基础入门，逐步实现一个完整的微服务架构。步骤1：安装Ocelot首先，我们需要在ASP.NETCore应用程序中安装Ocelot。在VisualStudio中，可以通过NuGe
reactor框架使用时，数据流请求流程 silver9886 java reactor
1.我们在Flux打开时，可以看到publicabstractclassFluximplementsCorePublisher{2.publicinterfaceCorePublisherextendsPublisher{voidsubscribe(CoreSubscribersubscriber);}Publisher的关键时有个subscribe方法。这个方法就是在reactor的subscr
Linux 内核中的 InfiniBand 核心模块：drivers/infiniband/core/device.c 分析 109702008 #linux系统编程网络网络 linux 人工智能
InfiniBand是一种高性能、低延迟的网络互连技术，广泛应用于高性能计算（HPC）、数据中心和云计算等领域。Linux内核中的InfiniBand子系统提供了对InfiniBand设备的支持，而drivers/infiniband/core/device.c文件则是InfiniBand核心模块的重要组成部分。本文将对device.c文件的功能、数据结构、关键函数以及驱动核心入口进行详细分析。一
Spark GraphX原理与代码实例讲解 AI大模型应用之禅 AI大模型与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
SparkGraphX原理与代码实例讲解作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着互联网和大数据技术的迅猛发展，社交网络、推荐系统、生物信息学、图分析等领域对图计算的需求日益增长。传统的图处理技术如GraphLab、Neo4j等，虽然功能强大，但往往存在扩展性差、易用性低、计算效率不足等问题。为了解决这些问题，A
Linux 安装gitlab 絮落锦乡 linux gitlab 运维
1.更新系统确保系统是最新的：sudoyumupdate-y2.安装依赖项安装必需的依赖项：sudoyuminstall-ycurlpolicycoreutils-pythonopenssh-serverGitLab需要一个邮件服务来发送通知。你可以使用现有的邮件服务器，或者在本地配置Postfix：sudoyuminstall-ypostfixsudosystemctlenablepostfix
Linux 使用 GDB 进行调试的常用命令与技巧打工人你好 Linux网络 linux
GDB调试的常用命令与技巧1.GDB常用命令1.1安装GDB1.2启动GDB1.3设置程序的参数1.4设置断点1.5启动程序并运行至断点1.6执行一步1.7打印变量值1.8查看函数调用栈2.GDB调试Core文件2.1生成Core文件2.2使用GDB调试Core文件3.GDB调试正在运行的程序3.1附加到正在运行的进程3.2在进程中设置断点3.3恢复程序执行GDB（GNUDebugger）是一个功
oracle查询结果使用“||”拼接符造成的小数点前的0被抹除的问题肉三 oracle oracle 数据库
很多时候当我们写一条查询语句的时候会使用到“||”拼接符，但是如果拼接的列中有一列在oracle数据库中的类型是NUMBER(10,2)这种时，查询结果可能会跟数据库中的值不一致。例如表user_score：namescoreMark0.5Jorn1.3根据上表写出一下查询语句：selectname||'='||scorefromuser_score;当我们执行这条语句时，结果可能会显示为：Mar
【转】ASP.NET Core 实战：基于 Jwt Token 的权限控制全揭露 GoToDinner core
【转】https://www.cnblogs.com/danvic712/p/10331976.html?tdsourcetag=s_pcqq_aiomsgASP.NETCore实战：基于JwtToken的权限控制全揭露一、前言#在涉及到后端项目的开发中，如何实现对于用户权限的管控是需要我们首先考虑的，在实际开发过程中，我们可能会运用一些已经成熟的解决方案帮助我们实现这一功能，而在Grapefru
Java序列化进阶篇 g21121 java序列化
1.transient 类一旦实现了Serializable 接口即被声明为可序列化，然而某些情况下并不是所有的属性都需要序列化，想要人为的去阻止这些属性被序列化，就需要用到transient 关键字。
escape()、encodeURI()、encodeURIComponent()区别详解 aigo JavaScript Web
原文：http://blog.sina.com.cn/s/blog_4586764e0101khi0.html JavaScript中有三个可以对字符串编码的函数，分别是： escape,encodeURI,encodeURIComponent，相应3个解码函数：,decodeURI,decodeURIComponent 。下面简单介绍一下它们的区别 1 escape()函
ArcgisEngine实现对地图的放大、缩小和平移 Cb123456 添加矢量数据对地图的放大、缩小和平移 Engine
ArcgisEngine实现对地图的放大、缩小和平移: 个人觉得是平移，不过网上的都是漫游，通俗的说就是把一个地图对象从一边拉到另一边而已。就看人说话吧. 具体实现: 一、引入命名空间 using ESRI.ArcGIS.Geometry; using ESRI.ArcGIS.Controls; 二、代码实现.
Java集合框架概述天子之骄 Java集合框架概述
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
旗正4.0页面跳转传值问题何必如此 java jsp
跳转和成功提示 a) 成功字段非空forward 成功字段非空forward，不会弹出成功字段，为jsp转发，页面能超链接传值,传输变量时需要拼接。接拼接方式list.jsp?test="+strweightUnit+"或list.jsp?test="+weightUnit+&qu
全网唯一:移动互联网服务器端开发课程 cocos2d-x小菜 web开发移动开发移动端开发移动互联程序员
移动互联网时代来了！ App市场爆发式增长为Web开发程序员带来新一轮机遇，近两年新增创业者，几乎全部选择了移动互联网项目！传统互联网企业中超过98%的门户网站已经或者正在从单一的网站入口转向PC、手机、Pad、智能电视等多端全平台兼容体系。据统计，AppStore中超过85%的App项目都选择了PHP作为后端程
Log4J通用配置|注意问题笔记 7454103 DAO apache tomcat log4j Web
关于日志的等级那些去百度就知道了！这几天要搭个新框架配置了日志记下来！做个备忘！ #这里定义能显示到的最低级别,若定义到INFO级别,则看不到DEBUG级别的信息了~! log4j.rootLogger=INFO,allLog # DAO层 log记录到dao.log 控制台和总日志文件 log4j.logger.DAO=INFO,dao,C
SQLServer TCP/IP 连接失败问题 ---SQL Server Configuration Manager darkranger sql c windows SQL Server XP
当你安装完之后,连接数据库的时候可能会发现你的TCP/IP 没有启动.. 发现需要启动客户端协议 : TCP/IP 需要打开 SQL Server Configuration Manager... 却发现无法打开 SQL Server Configuration Manager..?? 解决方法: C:\WINDOWS\system32目录搜索framedyn.
[置顶] 做有中国特色的程序员 aijuans 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有些技术书读得可
document.domain 跨域问题 avords document
document.domain用来得到当前网页的域名。比如在地址栏里输入：javascript:alert(document.domain); //www.315ta.com我们也可以给document.domain属性赋值，不过是有限制的，你只能赋成当前的域名或者基础域名。比如：javascript:alert(document.domain = "315ta.com");
关于管理软件的一些思考 houxinyou 管理
工作好多看年了,一直在做管理软件,不知道是我最开始做的时候产生了一些惯性的思维,还是现在接触的管理软件水平有所下降.换过好多年公司,越来越感觉现在的管理软件做的越来越乱. 在我看来,管理软件不论是以前的结构化编程,还是现在的面向对象编程,不管是CS模式,还是BS模式.模块的划分是很重要的.当然,模块的划分有很多种方式.我只是以我自己的划分方式来说一下. 做为管理软件,就像现在讲究MVC这
NoSQL数据库之Redis数据库管理(String类型和hash类型) bijian1013 redis 数据库 NoSQL
一.Redis的数据类型 1.String类型及操作 String是最简单的类型，一个key对应一个value，string类型是二进制安全的。Redis的string可以包含任何数据，比如jpg图片或者序列化的对象。 Set方法：设置key对应的值为string类型的value
Tomcat 一些技巧征客丶 java tomcat dos
以下操作都是在windows 环境下一、Tomcat 启动时配置 JAVA_HOME 在 tomcat 安装目录，bin 文件夹下的 catalina.bat 或 setclasspath.bat 中添加 set JAVA_HOME=JAVA 安装目录 set JRE_HOME=JAVA 安装目录/jre 即可；二、查看Tomcat 版本在 tomcat 安装目
【Spark七十二】Spark的日志配置 bit1129 spark
在测试Spark Streaming时，大量的日志显示到控制台，影响了Spark Streaming程序代码的输出结果的查看(代码中通过println将输出打印到控制台上)，可以通过修改Spark的日志配置的方式，不让Spark Streaming把它的日志显示在console 在Spark的conf目录下，把log4j.properties.template修改为log4j.p
Haskell版冒泡排序 bookjovi 冒泡排序 haskell
面试的时候问的比较多的算法题要么是binary search，要么是冒泡排序，真的不想用写C写冒泡排序了，贴上个Haskell版的，思维简单，代码简单，下次谁要是再要我用C写冒泡排序，直接上个haskell版的，让他自己去理解吧。 sort [] = [] sort [x] = [x] sort (x:x1:xs) | x>x1 = x1:so
java 路径配置文件读取 bro_feng java
这几天做一个项目，关于路径做如下笔记，有需要供参考。取工程内的文件，一般都要用相对路径，这个自然不用多说。在src统计目录建配置文件目录res,在res中放入配置文件。读取文件使用方式： 1. MyTest.class.getResourceAsStream("/res/xx.properties") 2. properties.load(MyTest.
读《研磨设计模式》-代码笔记-简单工厂模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 个人理解：简单工厂模式就是IOC; * 客户端要用到某一对象，本来是由客户创建的，现在改成由工厂创建，客户直接取就好了 */ interface IProduct {
SVN与JIRA的关联 chenyu19891124 SVN
SVN与JIRA的关联一直都没能装成功，今天凝聚心思花了一天时间整合好了。下面是自己整理的步骤：一、搭建好SVN环境，尤其是要把SVN的服务注册成系统服务二、装好JIRA，自己用是jira-4.3.4破解版三、下载SVN与JIRA的插件并解压，然后拷贝插件包下lib包里的三个jar，放到Atlassian\JIRA 4.3.4\atlassian-jira\WEB-INF\lib下，再
JWFDv0.96 最新设计思路 comsci 数据结构算法工作企业应用公告
随着工作流技术的发展，工作流产品的应用范围也不断的在扩展，开始进入了像金融行业(我已经看到国有四大商业银行的工作流产品招标公告了)，实时生产控制和其它比较重要的工程领域，而
vi 保存复制内容格式粘贴 daizj vi 粘贴复制保存原格式不变形
vi是linux中非常好用的文本编辑工具，功能强大无比，但对于复制带有缩进格式的内容时，粘贴的时候内容错位很严重，不会按照复制时的格式排版，vi能不能在粘贴时，按复制进的格式进行粘贴呢？答案是肯定的，vi有一个很强大的命令可以实现此功能。在命令模式输入:set paste，则进入paste模式，这样再进行粘贴时
shell脚本运行时报错误：/bin/bash^M: bad interpreter 的解决办法 dongwei_6688 shell脚本
出现原因：windows上写的脚本，直接拷贝到linux系统上运行由于格式不兼容导致解决办法： 1. 比如文件名为myshell.sh，vim myshell.sh 2. 执行vim中的命令 : set ff?查看文件格式，如果显示fileformat=dos，证明文件格式有问题 3. 执行vim中的命令 :set fileformat=unix 将文件格式改过来就可以了，然后:w
高一上学期难记忆单词 dcj3sjt126com word english
honest 诚实的；正直的 argue 争论 classical 古典的 hammer 锤子 share 分享；共有 sorrow 悲哀；悲痛 adventure 冒险 error 错误；差错 closet 壁橱；储藏室 pronounce 发音；宣告 repeat 重做；重复 majority 大多数；大半 native 本国的，本地的，本国
hibernate查询返回DTO对象，DTO封装了多个pojo对象的属性 frankco POJO hibernate查询 DTO
DTO-数据传输对象；pojo-最纯粹的java对象与数据库中的表一一对应。简单讲：DTO起到业务数据的传递作用，pojo则与持久层数据库打交道。有时候我们需要查询返回DTO对象，因为DTO
Partition List hcx2013 partition
Given a linked list and a value x, partition it such that all nodes less than x come before nodes greater than or equal to x. You should preserve the original relative order of th
Spring MVC测试框架详解——客户端测试 jinnianshilongnian
上一篇《Spring MVC测试框架详解——服务端测试》已经介绍了服务端测试，接下来再看看如果测试Rest客户端，对于客户端测试以前经常使用的方法是启动一个内嵌的jetty/tomcat容器，然后发送真实的请求到相应的控制器；这种方式的缺点就是速度慢；自Spring 3.2开始提供了对RestTemplate的模拟服务器测试方式，也就是说使用RestTemplate测试时无须启动服务器，而是模拟一
关于推荐个人观点 liyonghui160com 推荐系统关于推荐个人观点
回想起来，我也做推荐了3年多了，最近公司做了调整招聘了很多算法工程师，以为需要多么高大上的算法才能搭建起来的，从实践中走过来，我只想说【不是这样的】第一次接触推荐系统是在四年前入职的时候，那时候，机器学习和大数据都是没有的概念，什么大数据处理开源软件根本不存在，我们用多台计算机web程序记录用户行为，用.net的w
不间断旋转的动画 pangyulei 动画
CABasicAnimation* rotationAnimation; rotationAnimation = [CABasicAnimation animationWithKeyPath:@"transform.rotation.z"]; rotationAnimation.toValue = [NSNumber numberWithFloat: M
自定义annotation sha1064616837 java enum annotation reflect
对象有的属性在页面上可编辑，有的属性在页面只可读，以前都是我们在页面上写死的，时间一久有时候会混乱，此处通过自定义annotation在类属性中定义。越来越发现Java的Annotation真心很强大，可以帮我们省去很多代码，让代码看上去简洁。下面这个例子主要用到了 1.自定义annotation：@interface，以及几个配合着自定义注解使用的几个注解 2.简单的反射 3.枚举
Spring 源码 up2pu spring
1.Spring源代码 https://github.com/SpringSource/spring-framework/branches/3.2.x 注：兼容svn检出 2.运行脚本 import-into-eclipse.bat 注：需要设置JAVA_HOME为jdk 1.7 build.gradle compileJava { sourceCompatibilit
利用word分词来计算文本相似度 yangshangchuan word word分词文本相似度余弦相似度简单共有词
word分词提供了多种文本相似度计算方式：方式一：余弦相似度，通过计算两个向量的夹角余弦值来评估他们的相似度实现类：org.apdplat.word.analysis.CosineTextSimilarity 用法如下： String text1 = "我爱购物"; String text2 = "我爱读书"; String text3 =