u014393917

Spark中的Scheduler

scheduler分成两个类型，一个是TaskScheduler与其实现，一个是DAGScheduler。

TaskScheduler:主要负责各stage中传入的task的执行与调度。

DAGScheduler:主要负责对JOB中的各种依赖进行解析，根据RDD的依赖生成stage并通知TaskScheduler执行。

实例生成

TaskScheduler实例生成：

scheduler实例生成，我目前主要是针对onyarn的spark进行的相关分析，

在appmaster启动后，通过调用startUserClass()启动线程来调用用户定义的spark分析程序。

传入的第一个参数为appmastername(master),可传入的如:yarn-cluster等。

在用户定义的spark分析程序中，生成SparkContext实例。

通过SparkContext.createTaskScheduler函数。如果是yarn-cluster,生成YarnClusterScheduler实例。

此部分生成的scheduler为TaskScheduler实例。

defthis(sc:SparkContext) = this(sc,newConfiguration())

同时YarnClusterSchduler实现TaskSchedulerImpl。

defthis(sc:SparkContext) = this(sc,sc.conf.getInt("spark.task.maxFailures",4))

生成TaskScheduler中的SchedulerBackend属性引用，yarn-cluster为CoarseGrainedSchedulerBackend

valbackend =newCoarseGrainedSchedulerBackend(scheduler,sc.env.actorSystem)

scheduler.initialize(backend)

DAGScheduler实例生成：

classDAGScheduler(

taskSched: TaskScheduler,

mapOutputTracker:MapOutputTrackerMaster,

blockManagerMaster:BlockManagerMaster,

env: SparkEnv)

extendsLogging {

defthis(taskSched:TaskScheduler){

this(taskSched,SparkEnv.get.mapOutputTracker.asInstanceOf[MapOutputTrackerMaster],

SparkEnv.get.blockManager.master,SparkEnv.get)

}

taskSched.setDAGScheduler(this)

scheduler调度过程分析

1.rdd执行action操作，如saveAsHadoopFile

2.调用SparkContext.runJob

3.调用DAGScheduler.runJob-->此函数调用submitJob,并等job执行完成。

Waiter.awaitResult()中通过_jobFinished检查job运行是否完成，如果完成，此传为true,否则为false.

_jobFinished的值通过resultHandler函数，每调用一次finishedTasks的值加一，

如果finishedTasks的个数等于totalTasks的个数时，表示完成。或者出现exception.

defrunJob[T, U: ClassTag](

rdd: RDD[T],

func: (TaskContext, Iterator[T])=> U,

partitions: Seq[Int],

callSite: String,

allowLocal: Boolean,

resultHandler: (Int, U) =>Unit,

properties: Properties = null)

{

valwaiter =submitJob(rdd, func, partitions, callSite, allowLocal, resultHandler,properties)

waiter.awaitResult()match{

caseJobSucceeded => {}

caseJobFailed(exception:Exception, _) =>

logInfo("Failedto run " + callSite)

throwexception

}

4.调用DAGScheduler.submitJob函数，

部分代码：生成JobWaiter实例，并传入此实例，发送消息，调用JobSubmitted事件。并返回waiter实例。

JobWaiter是JobListener的实现。

valwaiter =newJobWaiter(this,jobId,partitions.size, resultHandler)

eventProcessActor! JobSubmitted(

jobId,rdd, func2,partitions.toArray, allowLocal, callSite, waiter,properties)

waiter

5.处理DAGScheduler的JobSubmitted事件消息，通过processEvent处理消息接收的事件。

defreceive = {

caseevent:DAGSchedulerEvent =>

logTrace("Gotevent of type " +event.getClass.getName)

if(!processEvent(event)){

submitWaitingStages()

} else{

resubmissionTask.cancel()

context.stop(self)

}

}))

6.processEvent函数中处理JobSubmitted事件部分代码：

caseJobSubmitted(jobId,rdd, func,partitions,allowLocal,callSite,listener,properties)=>

varfinalStage:Stage = null

try{

生成stage实例，stage的id通过nextStageId的值加一得到，task的个数就是partitions的分区个数，

根据job对应的rdd,得到如果parentrdd是shuffle的rdd时生成ShuffleMapStage，通过getParentStages函数，

此处去拿到parentrdd时，如果currentrdd的parentrdd不是shuffle,递归调用parentrdd,

如果parendrdd中没有shuffle的rdd,不生成新的stage,否则有多少个，生成多少个。此处是处理DAG类的依赖

finalStage= newStage(rdd,partitions.size,None, jobId,Some(callSite))

} catch{

casee:Exception =>

logWarning("Creatingnew stage failed due to exception - job: "+ jobId, e)

listener.jobFailed(e)

returnfalse

}

生成ActiveJob实例。设置numFinished的值为0，表示job中有0个完成的task.

设置所有task个数的arrayfinished.并把所有元素的值设置为false.把JobWaiter当listener传入ActiveJob.

valjob = newActiveJob(jobId,finalStage,func,partitions,callSite,listener,properties)

对已经cache过的TaskLocation进行清理。

clearCacheLocs()

logInfo("Gotjob " + job.jobId+ " ("+ callSite+ ") with "+ partitions.length+

"output partitions (allowLocal=" +allowLocal+ ")")

logInfo("Finalstage: " + finalStage+ " ("+ finalStage.name+ ")")

logInfo("Parentsof final stage: " +finalStage.parents)

logInfo("Missingparents: " +getMissingParentStages(finalStage))

如果runJob时传入的allowLocal的值为true,同时没有需要shuffle的rdd，同时partitions的长度为1，

也就是task只有一个，直接在local运行此job..通过runLocallyWithinThread生成一个线程来执行。

if(allowLocal&& finalStage.parents.size== 0 &&partitions.length== 1) {

//Compute very short actions like first() or take() with no parentstages locally.

listenerBus.post(SparkListenerJobStart(job,Array(), properties))

通过ActiveJob中的func函数来执行job的运行，此函数在rdd的action调用时生成定义，

如saveAsHadoopFile(saveAsHadoopDataset)中的定义的内部func,writeToFile函数。

完成函数执行后，调用上面提到的生成的JobWaiter.taskSucceeded函数。

runLocally(job)

} else{

否则有多个partition也就是有多个task,或者有shuffle的情况，

idToActiveJob(jobId)= job

activeJobs+= job

resultStageToJob(finalStage)= job

listenerBus.post(SparkListenerJobStart(job,jobIdToStageIds(jobId).toArray,properties))

调用DAGScheduler.submitStage函数。

submitStage(finalStage)

}

7.DAGScheduler.submitStage函数：递归函数调用，

如果stage包含parentstage(shuffle的情况)把stage设置为waiting状态，等待parentstage执行完成才进行执行。

privatedefsubmitStage(stage: Stage) {

valjobId =activeJobForStage(stage)

if(jobId.isDefined){

logDebug("submitStage("+ stage + ")")

如果RDD的Dependency的RDD还没有执行完成，等待Dependency执行完成后当前的RDD才能进行执行操作。

if(!waiting(stage)&& !running(stage)&& !failed(stage)){

根据stage中rdd的Dependency，检查是否需要生成新的stage,如果是ShuffleDependency，会生成新的ShuffleMapStage

此处去拿到parentrdd时，如果currentrdd的parentrdd不是shuffle,递归调用parentrdd,

如果parendrdd中没有shuffle的rdd,不生成新的stage,否则有多少个，生成多少个。此处是处理DAG类的依赖

valmissing =getMissingParentStages(stage).sortBy(_.id)

logDebug("missing:" + missing)

如果没有RDD中的shuffle的Dependency,也就是RDD之间都是NarrowDependency的Dependency

表示所有的Dependency都在map端本地执行。

if(missing ==Nil) {

logInfo("Submitting" + stage + "(" + stage.rdd+ "), which has no missingparents")

submitMissingTasks(stage,jobId.get)

running+= stage

} else{

如果RDD有Dependency,先执行parentrdd的stage操作。此处是递归函数调用

for(parent <-missing) {

submitStage(parent)

}

waiting+= stage

}

}else{

abortStage(stage, "Noactive job for stage " + stage.id)

}

8.DAGScheduler.submitMissingTask的执行流程：

privatedefsubmitMissingTasks(stage: Stage, jobId: Int) {

logDebug("submitMissingTasks("+ stage + ")")

//Get our pending tasks and remember them in our pendingTasks entry

valmyPending =pendingTasks.getOrElseUpdate(stage,newHashSet)

myPending.clear()

vartasks =ArrayBuffer[Task[_]]()

如果stage是shuffle的rdd,迭代stage下的的所有partition,根据partition与对应的TaskLocation

生成ShuffleMapTask.添加到task列表中。

if(stage.isShuffleMap){

for(p <- 0until stage.numPartitionsifstage.outputLocs(p)== Nil) {

vallocs =getPreferredLocs(stage.rdd,p)

tasks+= newShuffleMapTask(stage.id,stage.rdd,stage.shuffleDep.get,p, locs)

}

}else{

否则表示stage是非shuffle的rdd,此是是执行完成后直接返回结果的stage,生成ResultTask实例。

由于是ResultTask，因此需要传入定义的func,也就是如何处理结果返回

//This is a final stage; figure out its job's missing partitions

valjob =resultStageToJob(stage)

for(id <- 0until job.numPartitionsif!job.finished(id)){

valpartition =job.partitions(id)

vallocs =getPreferredLocs(stage.rdd,partition)

tasks+= newResultTask(stage.id,stage.rdd,job.func,partition,locs, id)

}

valproperties= if(idToActiveJob.contains(jobId)){

idToActiveJob(stage.jobId).properties

}else{

//thisstage will be assigned to "default" pool

null

}

//must be run listener before possible NotSerializableException

//should be "StageSubmitted" first and then "JobEnded"

listenerBus.post(SparkListenerStageSubmitted(stageToInfos(stage),properties))

if(tasks.size> 0) {

//Preemptively serialize a task to make sure it can be serialized. Weare catching this

//exception here because it would be fairly hard to catch thenon-serializableexception

//down the road, where we have several different implementations forlocal scheduler and

//cluster schedulers.

try{

SparkEnv.get.closureSerializer.newInstance().serialize(tasks.head)

} catch{

casee:NotSerializableException =>

abortStage(stage, "Tasknot serializable: " + e.toString)

running-= stage

return

}

logInfo("Submitting" + tasks.size+ " missing tasks from "+ stage + " ("+ stage.rdd+ ")")

myPending++= tasks

logDebug("Newpending tasks: " + myPending)

生成TaskSet实例，把stage中要执行的Task列表传入，同时把stage对应的ActiveJob也传入。

通过TaskScheduler的实现，调用submitTasks函数，YarnClusterScheduler(TaskSchedulerImpl)

taskSched.submitTasks(

newTaskSet(tasks.toArray,stage.id,stage.newAttemptId(), stage.jobId,properties))

stageToInfos(stage).submissionTime= Some(System.currentTimeMillis())

}else{

logDebug("Stage" + stage + "is actually done; %b %d %d".format(

stage.isAvailable,stage.numAvailableOutputs,stage.numPartitions))

running-= stage

}

9.TaskSchedulerImpl.submitTasks函数流程分析：

通过传入的TaskSet,得到要执行的tasks列表，并生成TaskSetmanager实例，

同时把实例添加到的schedulableBuilder(FIFOSchedulableBuilder/FairSchedulableBuilder)队列中。

关于TaskSetManager实例可参见后面的分析。

overridedefsubmitTasks(taskSet: TaskSet) {

valtasks =taskSet.tasks

logInfo("Addingtask set " + taskSet.id+ " with "+ tasks.length+ " tasks")

this.synchronized{

valmanager =newTaskSetManager(this,taskSet, maxTaskFailures)

activeTaskSets(taskSet.id)= manager

schedulableBuilder.addTaskSetManager(manager,manager.taskSet.properties)

taskSetTaskIds(taskSet.id)= newHashSet[Long]()

定期检查task的执行消息是否被生成执行。如果task被分配执行，关闭此线程。否则一直给出提示.

if(!isLocal && !hasReceivedTask){

starvationTimer.scheduleAtFixedRate(newTimerTask() {

overridedefrun() {

if(!hasLaunchedTask){

logWarning("Initialjob has not accepted any resources; "+

"checkyour cluster UI to ensure that workers are registered "+

"andhave sufficient memory")

} else{

this.cancel()

}

}, STARVATION_TIMEOUT,STARVATION_TIMEOUT)

}

hasReceivedTask= true

}

通过SchedulerBackend的实现CoarseGrainedSchedulerBackend.reviceOffers发起执行处理操作。

backend.reviveOffers()

}

9.1TaskSetManager的实例生成:

private[spark]classTaskSetManager(

sched: TaskSchedulerImpl,

valtaskSet:TaskSet,

valmaxTaskFailures:Int,

clock: Clock = SystemClock)

extendsSchedulablewithLogging

...........................

for(i <- (0until numTasks).reverse){

addPendingTask(i)

}

关于addPendingTask的定义：此睦传入的readding的值为false.

privatedefaddPendingTask(index: Int, readding: Boolean = false){

//Utility method that adds `index` to a list only if readding=falseor it's not already there

内部定义的addTo方法。

defaddTo(list:ArrayBuffer[Int]) {

if(!readding || !list.contains(index)) {

list += index

}

varhadAliveLocations= false

迭代所有的要执行的task,并通过task的TaskLocation检查执行的节点级别。添加到相应的pendingTask容器中

for(loc <-tasks(index).preferredLocations){

for(execId <-loc.executorId){

检查TaskSchedulerImpl.activeExecutorIds的活动的worker的executor是否存在，

如果是第一个执行的RDD时，此时activeExecutorIds容器的的值为空，当第一个RDD中有TASK在此executor中执行过后，

会把executor的id添加到activeExecutorIds容器中。

第一个RDD的stage执行时，此部分不执行，但第二个stage执行时，可最大可能的保证task在PROCESS_LOCAL的执行。

if(sched.isExecutorAlive(execId)){

addTo(pendingTasksForExecutor.getOrElseUpdate(execId,newArrayBuffer))

hadAliveLocations= true

}

if(sched.hasExecutorsAliveOnHost(loc.host)){

如果在TaskSchedulerImpl的executorsByHost容器中包含此host,在pendingTasksForHost中添加对应的task.

TaskSchedulerImpl.executorsByHost容器的值在每一个worker注册时

通过向CoarseGrainedSchedulerBackend.DriverActor发送RegisterExecutor事件消息。

通过makeOffers()-->TaskSchedulerImpl.resourceOffers把host添加到executorsByHost容器中。

addTo(pendingTasksForHost.getOrElseUpdate(loc.host,newArrayBuffer))

通过调用YarnClusterScheduler.getRackForHost得到host对应的rack,

并在rack的pending容器中添加对应的task个数和。

for(rack <-sched.getRackForHost(loc.host)){

addTo(pendingTasksForRack.getOrElseUpdate(rack,newArrayBuffer))

}

hadAliveLocations= true

}

如果上面两种情况都没有添加到容器中pendingTasksWithNoPrefs。

if(!hadAliveLocations){

//Even though the task might've had preferred locations, all of thosehosts or executors

//are dead; put it in the no-prefslist so we can schedule it elsewhere right away.

addTo(pendingTasksWithNoPrefs)

}

在TaskSetManager实例生成是，把所有task的个数都添加到allPendingTasks容器中

if(!readding) {

allPendingTasks+= index // No point scanning thiswhole list to find the old task there

}

.............................

得到可选择的LocalityLevel级别。

valmyLocalityLevels= computeValidLocalityLevels()

vallocalityWaits= myLocalityLevels.map(getLocalityWait)// Time to wait at each level

以下代码是computeValidLocalityLevels的定义，主要根据各种locality中pending的容器中是否有值。

生成当前stage中的task执行可选择的Locality级别。

privatedefcomputeValidLocalityLevels(): Array[TaskLocality.TaskLocality] = {

importTaskLocality.{PROCESS_LOCAL,NODE_LOCAL,RACK_LOCAL,ANY}

vallevels =newArrayBuffer[TaskLocality.TaskLocality]

if(!pendingTasksForExecutor.isEmpty&& getLocalityWait(PROCESS_LOCAL)!= 0) {

levels+= PROCESS_LOCAL

}

if(!pendingTasksForHost.isEmpty&& getLocalityWait(NODE_LOCAL)!= 0) {

levels+= NODE_LOCAL

}

if(!pendingTasksForRack.isEmpty&& getLocalityWait(RACK_LOCAL)!= 0) {

levels+= RACK_LOCAL

}

levels+= ANY

logDebug("Validlocality levels for " + taskSet+ ": "+ levels.mkString(","))

levels.toArray

}

以下代码是getLocalityWait的定义代码：此函数主要是定义每一个Task在此Locality级别中执行的等待时间。

也就是scheduler调度在传入的Locality级别时所花的时间是否超过指定的等待时间，

如果超过表示需要放大Locality的查找级别。

privatedefgetLocalityWait(level: TaskLocality.TaskLocality): Long = {

valdefaultWait= conf.get("spark.locality.wait","3000")

level match{

caseTaskLocality.PROCESS_LOCAL=>

conf.get("spark.locality.wait.process",defaultWait).toLong

caseTaskLocality.NODE_LOCAL=>

conf.get("spark.locality.wait.node",defaultWait).toLong

caseTaskLocality.RACK_LOCAL=>

conf.get("spark.locality.wait.rack",defaultWait).toLong

caseTaskLocality.ANY=>

}

10.SchedulerBackend.reviveOffers()的调度处理流程：

SchedulerBackend的实现为CoarseGrainedSchedulerBackend。

overridedefreviveOffers() {

driverActor! ReviveOffers

}

以上代码发CoarseGrainedSchedulerBackend内部的DriverActor发送消息，处理ReviveOffers事件。

caseReviveOffers =>

makeOffers()

................

defmakeOffers() {

见下面的launchTasks与resourceOffers函数

launchTasks(scheduler.resourceOffers(

executorHost.toArray.map{case(id, host)=> newWorkerOffer(id,host,freeCores(id))}))

}

调用TaskSchedulerImpl.resourceOffers并传入注册的worker中executorid与host的kvarray.

defresourceOffers(offers: Seq[WorkerOffer]): Seq[Seq[TaskDescription]] =synchronized {

SparkEnv.set(sc.env)

//Mark each slave as alive and remember its hostname

for(o <-offers) {

executorIdToHost(o.executorId)= o.host

此部分主要是在worker注册时executorsByHost中还不存在时会执行，

if(!executorsByHost.contains(o.host)){

executorsByHost(o.host)= newHashSet[String]()

executorGained(o.executorId,o.host)

}

offers表示有多少个注册的worker的executor,根据每一个worker中可能的cpucore个数生成可执行的task个数。

//Build a list of tasks to assign to each worker

valtasks =offers.map(o => newArrayBuffer[TaskDescription](o.cores))

可分配的cpu个数,由此处可以看出每一个任务分配时最好按每个worker能分配的最大cpucore个数来分配。

valavailableCpus= offers.map(o => o.cores).toArray

得到队列中的所有的TaskSetManager列表。

valsortedTaskSets= rootPool.getSortedTaskSetQueue()

for(taskSet <-sortedTaskSets){

logDebug("parentName:%s, name: %s, runningTasks: %s".format(

taskSet.parent.name,taskSet.name,taskSet.runningTasks))

}

计算task的Locality级别，launchedTask=false表示需要放大Locality的级别。

//Take each TaskSet in our scheduling order, and then offer it eachnode in increasing order

//of locality levels so that it gets a chance to launch local tasks onall of them.

varlaunchedTask= false

计算task的Locality,此处是一个for的迭代调用，先从taskset列表中拿出一个tasetset,

子迭代是从PROCESS_LOCAL开始迭代locality的级别。

for(taskSet <-sortedTaskSets;maxLocality<- TaskLocality.values) {

do{

launchedTask= false

迭代调用每一个worker的值，从每一个worker中在taskset中选择task的执行级别，生成TaskDescription

for(i <- 0until offers.size) {

得到迭代出的worker的executorid与host

valexecId =offers(i).executorId

valhost =offers(i).host

通过TaskSetManager.resourceOffer选择一个执行级别,通过此函数选择Locality级别时，

不能超过传入的maxLocality,每次生成一个task,

for(task <-taskSet.resourceOffer(execId,host,availableCpus(i),maxLocality)){

每次生成一个task,把生成的task添加到上面的tasks列表中。

tasks(i)+= task

valtid =task.taskId

taskIdToTaskSetId(tid)= taskSet.taskSet.id

taskSetTaskIds(taskSet.taskSet.id)+= tid

taskIdToExecutorId(tid)= execId

设置当前executorid设置到activeExecutorIds列表中，当有多个依赖的stage执行时，

第二个stage在submitTasks时，生成TaskSetManager时，会根据的activeExecutorIds值，

在pendingTasksForExecutor中生成等执行的PROCESS_LOCAL的pendingtasks.

activeExecutorIds+= execId

把executor对应的host记录到executorsByHost容器中。

executorsByHost(host)+= execId

当前worker中可用的cpucore的值需要减去一，这样能充分保证一个cpucore执行一个task

availableCpus(i) -= 1

这个值用来检查是否在当前的Locality级别中接着执行其它的task的分配，

如果这个值为true,不放大maxLocality的级别，从下一个worker中接着分配剩余的task

launchedTask= true

}

} while(launchedTask)

}

if(tasks.size> 0) {

设置hasLaunchedTask的值为true,表示task的执行分配完成，在上面提到过的检查线程中对线程执行停止操作。

hasLaunchedTask= true

}

returntasks

}

10.1TaskSetManager.resourceOffer流程分析

defresourceOffer(

execId: String,

host:String,

availableCpus: Int,

maxLocality:TaskLocality.TaskLocality)

:Option[TaskDescription] =

{

如果完成的task个数小于要生成的总task个数，同时当前cpu可用的core个数和大于或等于一个配置的，默认1

if(tasksSuccessful< numTasks&& availableCpus >= CPUS_PER_TASK){

valcurTime =clock.getTime()

通过现在执行task分配的时间减去上一次并从currentLocalityIndex的下标开始，

取出locality对应的task分配等待时间，如果时间超过了此配置，把下标值加一，

找到下一个locality的配置时间,按这方式找，直到找到ANY的值，具体可见下面的此方法说明

varallowedLocality= getAllowedLocalityLevel(curTime)

如果通过的locality的级别超过了传入的最大locality级别，把级别设置为传入的最大级别

if(allowedLocality> maxLocality) {

allowedLocality= maxLocality // We're not allowed tosearch for farther-away tasks

}

findTask主要是从对应的pending的列表中根据对应的Locality拿到对应的task的下标，在TaskSet.tasks中的下标。

findTask(execId, host,allowedLocality)match{

caseSome((index,taskLocality))=> {

//Found a task; do some bookkeeping and return a task description

valtask =tasks(index)

valtaskId =sched.newTaskId()

//Figure out whether this should count as a preferred launch

logInfo("Startingtask %s:%d as TID %s on executor %s: %s (%s)".format(

taskSet.id,index,taskId,execId, host, taskLocality))

//Do various bookkeeping

copiesRunning(index) += 1

valinfo = newTaskInfo(taskId,index,curTime,execId, host, taskLocality)

taskInfos(taskId)= info

taskAttempts(index)= info ::taskAttempts(index)

把分配此task的locality级别拿到对应的下标，并重新设置下标的值。

//Update our locality level for delay scheduling

currentLocalityIndex= getLocalityIndex(taskLocality)

把这次的task的分配时间设置成最后一次分配时间。

lastLaunchTime= curTime

//Serialize and return the task

valstartTime =clock.getTime()

//We rely on the DAGScheduler to catch non-serializableclosures and RDDs, so in here

//we assume the task can be serialized without exceptions.

valserializedTask= Task.serializeWithDependencies(

task,sched.sc.addedFiles,sched.sc.addedJars,ser)

valtimeTaken =clock.getTime() - startTime

addRunningTask(taskId)

logInfo("Serializedtask %s:%d as %d bytes in %d ms".format(

taskSet.id,index,serializedTask.limit,timeTaken))

valtaskName ="task %s:%d".format(taskSet.id,index)

如果是第一次执行，通过DAGScheduler.taskStarted发送BeginEvent事件。

if(taskAttempts(index).size== 1)

taskStarted(task,info)

returnSome(newTaskDescription(taskId,execId, taskName,index,serializedTask))

}

case_ =>

}

None

}

根据超时时间配置，如果这次分配task的时间减去上次task分配的时间超过了locality分配等待的配置时间，

把locality的级别向上移动一级，并重新比对时间，拿到不超时的locality级别或ANY的级别。

privatedefgetAllowedLocalityLevel(curTime: Long): TaskLocality.TaskLocality = {

while(curTime - lastLaunchTime>= localityWaits(currentLocalityIndex)&&

currentLocalityIndex< myLocalityLevels.length- 1)

{

下标值加一，也就是把当前的Locality的级别向上放大一级。

//Jump to the next locality level, and remove our waiting time for thecurrent one since

//we don't want to count it again on the next one

lastLaunchTime+= localityWaits(currentLocalityIndex)

currentLocalityIndex+= 1

}

myLocalityLevels(currentLocalityIndex)

}

DAGScheduler中处理BeginEvent事件：

caseBeginEvent(task,taskInfo)=>

for(

job<- idToActiveJob.get(task.stageId);

stage<- stageIdToStage.get(task.stageId);

stageInfo<- stageToInfos.get(stage)

) {

if(taskInfo.serializedSize> TASK_SIZE_TO_WARN* 1024 &&

!stageInfo.emittedTaskSizeWarning){

stageInfo.emittedTaskSizeWarning= true

logWarning(("Stage%d (%s) contains a task of very large "+

"size(%d KB). The maximum recommended task size is %d KB.").format(

task.stageId,stageInfo.name,taskInfo.serializedSize/ 1024,TASK_SIZE_TO_WARN))

}

listenerBus.post(SparkListenerTaskStart(task,taskInfo))

11.CoarseGrainedSchedulerBackend.launchTasks流程

执行task的执行，发送LaunchTask事件处理消息

deflaunchTasks(tasks: Seq[Seq[TaskDescription]]) {

for(task <-tasks.flatten) {

freeCores(task.executorId) -= 1

根据worker注册时的actor,向此actor发送LaunchTask事件。

executorActor(task.executorId)! LaunchTask(task)

}

12.启动task,由于是onyarn的模式，worker的actor在CoarseGrainedExecutorBackend.

处理代码如下：

caseLaunchTask(taskDesc)=>

logInfo("Gotassigned task " + taskDesc.taskId)

if(executor== null){

logError("ReceivedLaunchTask command but executor was null")

System.exit(1)

} else{

executor.launchTask(this,taskDesc.taskId,taskDesc.serializedTask)

}

.............................

通过Executor启动task的执行。

其它actor的消息处理与task的具体执行与shuffle后面分析，这里先不做细的说明。

吐槽一把scala,这玩意编写代码是方便，但看起来有点麻烦呀。

你可能感兴趣的:(spark,源代码,分布式)

鸿蒙系统用什么开发应用？ 109702008 编程 harmonyos 华为人工智能
鸿蒙系统（HarmonyOS）是华为技术有限公司开发的一款分布式操作系统，旨在实现跨设备的无缝协同和高效运行。在应用开发方面，鸿蒙系统提供了多种编程语言的支持，以满足不同开发者的需求。以下是一些常用的鸿蒙系统应用开发语言：Java：Java是一种广泛使用的编程语言，特别在移动应用开发领域。鸿蒙系统支持Java开发，这使得安卓开发者可以快速上手。Java拥有优秀的跨平台能力和丰富的API库，涵盖了网
raft4j:练手之作 youyouiknow tech-review 后端分布式
raft4j是一个我的基于RAFT一致性算法的高性能Java实现，其核心功能围绕分布式系统中的一致性协议展开。整体架构raft4j的架构设计清晰，核心模块围绕RAFT协议的三个部分展开：Leader选举确保在任何时间只有一个有效的Leader承担写入请求。日志复制保证日志在所有节点上的一致性。日志应用和状态机将日志应用到状态机，提供最终一致的系统状态。raft4j通过高度模块化的设计，将这些功能封
Hadoop分布式文件系统-HDFS架构 Fancs2024 hadoop hadoop hdfs
一、HDFS的简介HDFS全称HadoopDistributedFileSystem，是分布式文件管理系统。主要是为了解决大数据如何存储的问题，跟一般文件系统不同的是，它可以通过扩展服务器结点来扩充存储量，可以用低成本的硬件构建出支持高吞吐量的文件系统。二、HDFS的特点高容错性：一个HDFS集群会包含非常多的结点，HDFS将文件分块存储，并且会保存多个副本到不同的机器节点上以保证数据的安全，而且
GitHub的主要用途及核心功能王景程 github git
------>在给手机成功root之后，我也经常光临GitHub，在上面挖掘好玩的模块还有，并根据其源代码进行学习。那GitHub是什么网站呢？它又有什么功能？GitHub是什么？GitHub是一个基于Git的版本控制和代码托管平台，也是全球最受欢迎的开发者协作工具之一。它最初于2008年上线，目前已被微软收购。GitHub的核心功能是帮助开发者存储和管理代码，同时支持多人协作开发、版本控制以及项
Linux系统中安装Git（详细教程） wujiada001 云服务部署 linux git
在Linux系统中安装Git，可以通过多种方式来实现，主要包括使用包管理器安装和从源代码编译安装。以下是详细的安装步骤：一、使用包管理器安装（不建议该方式）大多数Linux发行版都提供了包管理器，如Debian/Ubuntu的apt、CentOS/RHEL的yum/dnf等，通过这些包管理器可以方便地安装Git。1.Debian/Ubuntu及其衍生版打开终端，执行以下命令：sudoaptupda
MongoDB的聚合&MongoDB的索引小强同志 MongoDb mongodb nosql 数据库
一、mongoDB的聚合操作知识点：pipeline聚合mapRedurce聚合pipeline与mapRedurce比较pipeline速度快，但只能运行在单机上，适合数据量小的实时聚合操作。mapRedurce可以运行在分布式节点，适适大数量并且复杂的聚合分析操作pipeline聚合pipeline聚合其特性是运行速度快，只能运行在单机上，并且对资源的使用有一定限制如下：单个的聚合操作耗费的内
Lisp语言：循环控制 YdvCss lisp 开发语言
Lisp是一种功能强大的编程语言，具有灵活的控制结构和丰富的语法。在Lisp中，我们可以使用循环控制结构来迭代执行一系列操作。本文将介绍Lisp中的循环控制结构以及它们的使用方法，并提供相应的源代码示例。在Lisp中，常用的循环控制结构有三种：do、dotimes和dolist。这些结构各有特点，适用于不同的循环场景。下面我们将逐个介绍它们的用法。do循环do循环是Lisp中最通用的循环控制结构，
Spring Cloud Alibaba 及其组件的作用、适用场景与与 Eureka 的区别小白的一叶扁舟 Java开发 eureka 云原生 springcloud alibaba 中间件 java
前言：随着微服务架构在现代应用中的普及，如何高效构建、管理和运维分布式系统成为开发者的核心关注点。SpringCloudAlibaba是在SpringCloud基础上集成Alibaba开源技术的一站式解决方案。它提供丰富的组件，旨在简化分布式系统的开发与运维，特别适合需要高可用性和复杂功能的企业级应用。本文将详细介绍SpringCloudAlibaba的核心组件及其适用场景，比较其与传统服务注册发
Redis从0到1详解（SpringBoot）小白的一叶扁舟面试题 redis spring boot 数据库 spring cloud java 后端中间件
前言在现代应用中，Redis扮演着重要的角色，作为高性能的缓存和消息队列，它能够大大提高系统的响应速度和吞吐量。在SpringBoot项目中使用Redis，不仅能通过简单的配置连接Redis服务，还能利用Redis提供的各种高效算法，如LRU（最近最少使用）和LFU（最不常用）来实现智能的数据管理。此外，分布式锁也可以通过Redis提供的功能来实现，保证多线程或多服务之间的数据一致性。本文将介绍如
分布式系统架构：分布式缓存工业甲酰苯胺架构分布式缓存
分布式缓存也是面试常见的问题，通常面试官会问为什么要用缓存，以及用的Redis是哪种模式，用的过程中遇到哪些问题这些1.AP还是CPRedis集群就是典型的AP式，它具有高性能、高可用等特点，但它却并不保证强一致性。而能够保证强一致性的ZooKeeper、Doozerd、Etcd等框架，吞吐量比不过Redis，通常不会用作“缓存框架”，而是作为通知、协调、队列、分布式锁等使用2.透明多级缓存TMC
TiDB 对 Hadoop 的影响：大数据时代的新选择狮歌~资深攻城狮 tidb 数据仓库数据分析数据库分布式
TiDB对Hadoop的影响：大数据时代的新选择随着大数据时代的到来，各种处理和存储海量数据的技术应运而生。Hadoop和TiDB都是这个时代的代表性技术，但它们的设计初衷、使用场景和应用方式却有所不同。那么，TiDB作为一个分布式数据库，它对传统的Hadoop生态系统产生了哪些影响呢？今天，我们就来聊聊这个话题。Hadoop简介：大数据的“老牌劲旅”首先，我们需要了解一下Hadoop的背景。Ha
Kafka 入门与应用实战：吞吐量优化与与 RabbitMQ、RocketMQ 的对比小白的一叶扁舟 Java开发 kafka rabbitmq rocketmq spring boot java
前言在现代微服务架构和分布式系统中，消息队列作为解耦组件，承担着重要的职责。它不仅提供了异步处理的能力，还能确保系统的高可用性、容错性和扩展性。常见的消息队列包括Kafka、RabbitMQ和RocketMQ，其中Kafka因其高吞吐量、分布式特性和可靠性成为大规模数据流处理的首选。本篇文章将深入介绍Kafka的基本概念、执行流程、吞吐量优化策略、生命周期，重点对比Kafka与RabbitMQ和R
赶紧收藏！2024 年最常见 20道分布式、微服务面试题（八）学长爱编程分布式微服务程序员面试分布式微服务架构面试后端跳槽中间件
上一篇地址：赶紧收藏！2024年最常见20道分布式、微服务面试题（七）-CSDN博客十五、什么是负载均衡，它在微服务架构中如何工作？负载均衡是一种在计算机网络中分配工作负载（如网络流量、请求处理等）到多个计算资源（如服务器、数据库、存储设备等）的策略。其主要目的是优化资源的利用、提高吞吐量、增强系统可用性和容错性，以及避免任何单一资源的过载。负载均衡的关键概念：前端（Client-Side）负载均
使用iFlyTek SparkLLM进行实时聊天应用开发 dagGAIYD 前端 javascript java python
技术背景介绍在当今的AI应用开发中，实时对话模型越来越受到重视。iFlyTek的SparkLLM为开发者提供了强大的聊天模型API，支持灵活的集成和扩展。本文将介绍如何使用SparkLLM搭建一个简单的聊天应用，包括基本的API初始化和调用，以及如何实现流式输出。核心原理解析SparkLLM是一款基于大规模语言模型的对话生成系统。它的核心在于通过自然语言理解和生成，实现人机之间的自然交流。通过使用
Java 大视界 -- Java 与大数据分布式机器学习平台搭建（58）青云交大数据新视界 Java 大视界大数据分布式机器学习 Apache Spark Hadoop Apache Flink 平台搭建架构设计
亲爱的朋友们，热烈欢迎你们来到青云交的博客！能与你们在此邂逅，我满心欢喜，深感无比荣幸。在这个瞬息万变的时代，我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客，正是这样一个温暖美好的所在。在这里，你们不仅能够收获既富有趣味又极为实用的内容知识，还可以毫无拘束地畅所欲言，尽情分享自己独特的见解。我真诚地期待着你们的到来，愿我们能在这片小小的天地里共同成长，共同进步。一、欢迎加入【福利社群
如何防止DDOS攻击与CC攻击？？? 来杯咖啡 Linux ddos 安全服务器 linux
防止DDOS（分布式拒绝服务）和CC（网络层阻断）攻击需要综合采取多种措施，包括以下几个方面：1.增加带宽和资源：通过增加网络带宽和服务器资源，可以扩大系统的吞吐能力，从而能够承受更大规模的攻击流量。2.使用防火墙和入侵检测系统（IDS）：配置防火墙来过滤和限制恶意流量的访问，同时使用IDS来检测并阻止潜在的攻击行为。3.负载均衡和流量分流：使用负载均衡器将流量分散到多个服务器上，分担压力并防止单
Zookeeper（22）Zookeeper的Leader、Follower和Observer角色分别是什么？辞暮尔尔-烟火年年微服务 zookeeper 分布式云原生
Zookeeper是一个分布式协调服务，采用了Leader-Follower架构来保证数据的一致性和高可用性。集群中的每个节点都有一个特定的角色：Leader、Follower和Observer。以下是对这些角色的详细介绍和代码示例。Leader、Follower和Observer角色Leader：职责：Leader是Zookeeper集群中的核心节点，负责处理所有写请求和协调事务的提交。Lead
MySQL、HBase 和 Elasticsearch：特点与区别详解一休哥助手 mysql hbase elasticsearch
引言随着大数据和分布式计算的快速发展，数据库系统已从传统的关系型数据库（RDBMS）扩展到多种新型数据存储技术，包括NoSQL数据库和搜索引擎等。MySQL、HBase和Elasticsearch是其中三种非常常见的数据存储系统，它们在各自的领域都有着重要的应用。MySQL作为传统的关系型数据库，HBase则是一个分布式、可扩展的NoSQL数据库，而Elasticsearch则是一个分布式的搜索引
HarmonyOS-面试整理大众筹码 harmonyos 面试华为
目录为什么选择HarmonyOS/优点/特点鸿蒙系统的权限有哪些授权方式区别：说一说鸿蒙系统的安全机制说一说鸿蒙系统的微内核与安卓的内核区别鸿蒙操作系统的微内核架构有哪些优势分布式能力在鸿蒙系统中如何实现请解释一下鸿蒙系统中的分布式软总线技术如何在鸿蒙操作系统中进行多设备协同开发？鸿蒙操作系统如何保障系统的安全性？请描述一下鸿蒙操作系统的用户界面开发框架鸿蒙操作系统支持哪些编程语言请解释一下鸿蒙操
爬取NBA球员信息并可视化小白入门 Serendipity_Carl 爬虫数分爬虫基础 python 爬虫数据可视化 pycharm 数据分析
网址:虎扑体育-NBA球员得分数据排行第1页步骤:分析页面确定URL地址模拟浏览器向服务器发送请求数据解析提取想要的数据保存数据爬虫所需要的模块requests(发送HTTP请求)parsel(解析HTML内容)pandas(数据保存模块)第一步分析页面--确定是静态页面还是动态页面右击点击查看网页源代码在新窗口中搜索(Ctrl+F)我们所需要的数据通过分析可得此网站为静态页面URL地址为浏览器栏
OceanBase 分布式数据库【信创/国产化】- OceanBase 2024 开发者大会简简单单OnlineZuozuo m2 Java 领域 m4 杂项数据库领域 OceanBase 数据库国产化分布式
本心、输入输出、结果文章目录OceanBase分布式数据库【信创/国产化】-OceanBase2024开发者大会前言OceanBase数据更新架构携程CTO杨传辉蚂蚁研究院院长陈文光首席科学家阳振坤OceanBase分布式数据库【信创/国产化】-OceanBase2024开发者大会编辑|简简单单Onlinezuozuo地址|https://blog.csdn.net/qq_15071263个人简介
Autosar CP RTE:一个例子简要介绍工作原理老猿讲编程 Autosar初探 autosar 汽车 c++
以下是一个示例，展示如何通过AUTOSAR的RTE机制利用配置（ARXML文件）来实现软件组件集成，包含对应的C++源代码以及模拟自动生成的RTE框架代码的示例。请注意，实际的AUTOSAR项目会复杂得多，这里只是一个简化且示意性的案例帮助你理解其基本流程。文章目录一、RTE例子1.示例场景2.ARXML配置文件（示例简化内容，实际更复杂）3.C++源代码温度传感器组件实现（`Temperatur
深入MapReduce——引入黄雪超大数据基础 #深入MapReduce mapreduce 大数据 hadoop
引入前面我们已经深入了HDFS的设计与实现，对于分布式系统也有了不错的理解。但HDFS仅仅解决了海量数据存储和读写的问题。但要想让数据产生价值，一定是需要从数据中挖掘出价值才行，这就需要我们拥有海量数据的计算处理能力。下面我们还是老样子，来数据一下要实现海量计算处理能力，有些什么核心痛点大数据计算核心痛点量级大在稍微大一点的互联网企业，需要计算处理的数据量都开始以PB计了。而传统的计算处理模型中，
Git分布式版本控制系统之SSH协议访问饶子文 git 分布式
目录前言：我来公司上班day1正文：Git的SSH协议访问步骤一.安装Git软件二.SSH密钥生成三.添加SSH公钥到远端仓库四.配置Git使用SSH协议来连接远程仓库五.使用Git命令进行测试结尾：前言：我来公司上班day1回顾我的毕业季，那是一段充斥着投递简历和准备面试的青葱岁月。都说23年学计算机，如同49年入国军。但已经投入过多的沉没成本的在计算机上的我也别无选择，在历经浪潮般的简历投递和
Spring Boot 集成 RabbitMQ 一叶飘零_sweeeet MQ Springboot 果酱紫 java-rabbitmq spring boot rabbitmq
在现代分布式系统中，消息队列扮演着至关重要的角色。它能够实现系统间的异步通信、解耦组件以及提高系统的可扩展性和可靠性。RabbitMQ作为一款广泛使用的开源消息中间件，具有强大的功能和灵活的配置。而SpringBoot则是一种流行的Java开发框架，能够快速构建应用程序。本文将详细介绍如何在SpringBoot项目中集成RabbitMQ，包括安装和配置RabbitMQ、在SpringBoot中使用
高效消息传递架构：基于 RabbitMQ 与 C# 实现分布式系统的异步通信与解耦威哥说编程开发语言后端 rabbitmq
在现代分布式系统中，消息队列作为一种核心的通信机制，广泛应用于系统间的异步通信、解耦以及负载均衡等场景。特别是对于需要处理高吞吐量、低延迟和高度可扩展的应用，采用成熟的消息队列中间件如RabbitMQ，可以显著提高系统的可靠性、灵活性和可维护性。与C#结合使用时，开发者可以充分利用其强大的类型系统、丰富的库支持和异步编程能力，构建高效、响应快速的分布式系统架构。本文将深入探讨如何利用RabbitM
Python操作MongoDB看这一篇就够了 Python3.7 Python进阶 python
MongoDB是由C++语言编写的非关系型数据库，是一个基于分布式文件存储的开源数据库系统，其内容存储形式类似JSON对象，它的字段值可以包含其他文档、数组及文档数组，非常灵活。在这一节中，我们就来看看Python3下MongoDB的存储操作。1.准备工作在开始之前，请确保已经安装好了MongoDB并启动了其服务，并且安装好了Python的PyMongo库。2.连接MongoDB连接MongoDB
分布式因果推断在美团履约平台的探索与实践思维导图-java架构用心去追梦 java 架构开发语言
为了创建一个关于“分布式因果推断在美团履约平台的探索与实践”的思维导图，并且专注于Java架构下的实现，我们可以将这个主题分解为几个关键领域。这包括：项目背景、因果推断的基本概念、数据收集与预处理、分布式系统设计、算法选择与实现、性能优化策略、以及效果评估与迭代。以下是这个主题的思维导图结构建议：思维导图结构1.项目背景美团履约平台简介平台业务流程（如外卖配送、闪购等）履约效率的重要性分布式因果推
如何在 PyTorch 分布式训练中使用 TORCH_DISTRIBUTED_DEBUG=INFO 进行调试 weixin_48705841 pytorch 分布式人工智能
如何在PyTorch分布式训练中使用TORCH_DISTRIBUTED_DEBUG=INFO进行调试在使用PyTorch进行分布式训练时，调试分布式训练过程中的问题可能非常棘手。尤其是在多卡、多节点的训练环境中，常常会遇到通信延迟、同步错误等问题。为了帮助调试这些问题，PyTorch提供了一个非常有用的环境变量TORCH_DISTRIBUTED_DEBUG，通过设置它，你可以在控制台输出更多的调试
OpenCompass评测大模型辣条少年人工智能
OpenCompass简介上海人工智能实验室科学家团队于2024.01.30正式发布了大模型开源开放评测体系“司南”(OpenCompass2.0)，用于为大语言模型、多模态模型等提供一站式评测服务。OpenCompass平台广泛支持超过100种HuggingFace和API模型，融合了100多个数据集，包含约40万个问题，用以从八个维度评估模型。其高效的分布式评估系统能够快速且全面地评估十亿级规
ztree设置禁用节点 3213213333332132 JavaScript ztree json setDisabledNode Ajax
ztree设置禁用节点的时候注意，当使用ajax后台请求数据,必须要设置为同步获取数据，否者会获取不到节点对象，导致设置禁用没有效果。 $(function(){ showTree(); setDisabledNode(); });
JVM patch by Taobao bookjovi java HotSpot
在网上无意中看到淘宝提交的hotspot patch，共四个，有意思，记录一下。 7050685：jsdbproc64.sh has a typo in the package name 7058036：FieldsAllocationStyle=2 does not work in 32-bit VM 7060619：C1 should respect inline and
将session存储到数据库中 dcj3sjt126com sql PHP session
CREATE TABLE sessions ( id CHAR(32) NOT NULL, data TEXT, last_accessed TIMESTAMP NOT NULL, PRIMARY KEY (id) ); <?php /** * Created by PhpStorm. * User: michaeldu * Date
Vector 171815164 vector
public Vector<CartProduct> delCart(Vector<CartProduct> cart, String id) { for (int i = 0; i < cart.size(); i++) { if (cart.get(i).getId().equals(id)) { cart.remove(i);
各连接池配置参数比较 g21121 连接池
排版真心费劲，大家凑合看下吧，见谅~ Druid DBCP C3P0 Proxool 数据库用户名称 Username Username User 数据库密码 Password Password Password 驱动名
[简单]mybatis insert语句添加动态字段 53873039oycg mybatis
mysql数据库,id自增,配置如下： <insert id="saveTestTb" useGeneratedKeys="true" keyProperty="id" parameterType=&
struts2拦截器配置云端月影 struts2拦截器
struts2拦截器interceptor的三种配置方法方法1. 普通配置法 <struts> <package name="struts2" extends="struts-default"> &
IE中页面不居中，火狐谷歌等正常 aijuans IE中页面不居中
问题是首页在火狐、谷歌、所有IE中正常显示，列表页的页面在火狐谷歌中正常，在IE6、7、8中都不中，觉得可能那个地方设置的让IE系列都不认识，仔细查看后发现，列表页中没写HTML模板部分没有添加DTD定义，就是<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3
String,int,Integer,char 几个类型常见转换 antonyup_2006 html sql .net
如何将字串 String 转换成整数 int? int i = Integer.valueOf(my_str).intValue(); int i=Integer.parseInt(str); 如何将字串 String 转换成Integer ? Integer integer=Integer.valueOf(str); 如何将整数 int 转换成字串 String ? 1.
PL/SQL的游标类型百合不是茶显示游标(静态游标)隐式游标游标的更新和删除 %rowtype ref游标(动态游标)
游标是oracle中的一个结果集,用于存放查询的结果; PL/SQL中游标的声明; 1,声明游标 2,打开游标(默认是关闭的); 3,提取数据 4,关闭游标注意的要点:游标必须声明在declare中,使用open打开游标,fetch取游标中的数据,close关闭游标隐式游标:主要是对DML数据的操作隐
JUnit4中@AfterClass @BeforeClass @after @before的区别对比 bijian1013 JUnit4 单元测试
一.基础知识 JUnit4使用Java5中的注解（annotation），以下是JUnit4常用的几个annotation： @Before：初始化方法对于每一个测试方法都要执行一次（注意与BeforeClass区别，后者是对于所有方法执行一次）@After：释放资源对于每一个测试方法都要执行一次（注意与AfterClass区别，后者是对于所有方法执行一次
精通Oracle10编程SQL(12)开发包 bijian1013 oracle 数据库 plsql
/* *开发包 *包用于逻辑组合相关的PL/SQL类型（例如TABLE类型和RECORD类型）、PL/SQL项（例如游标和游标变量）和PL/SQL子程序（例如过程和函数） */ --包用于逻辑组合相关的PL/SQL类型、项和子程序，它由包规范和包体两部分组成 --建立包规范：包规范实际是包与应用程序之间的接口，它用于定义包的公用组件，包括常量、变量、游标、过程和函数等 --在包规
【EhCache二】ehcache.xml配置详解 bit1129 ehcache.xml
在ehcache官网上找了多次，终于找到ehcache.xml配置元素和属性的含义说明文档了，这个文档包含在ehcache.xml的注释中！ ehcache.xml ： http://ehcache.org/ehcache.xml ehcache.xsd ： http://ehcache.org/ehcache.xsd ehcache配置文件的根元素是ehcahe ehcac
java.lang.ClassNotFoundException: org.springframework.web.context.ContextLoaderL 白糖_ java eclipse spring tomcat Web
今天学习spring+cxf的时候遇到一个问题：在web.xml中配置了spring的上下文监听器： <listener> <listener-class>org.springframework.web.context.ContextLoaderListener</listener-class> </listener> 随后启动
angular.element boyitech AngularJS AngularJS API angular.element
angular.element 描述: 包裹着一部分DOM element或者是HTML字符串，把它作为一个jQuery元素来处理。（类似于jQuery的选择器啦）如果jQuery被引入了，则angular.element就可以看作是jQuery选择器，选择的对象可以使用jQuery的函数；如果jQuery不可用，angular.e
java-给定两个已排序序列，找出共同的元素。 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class CommonItemInTwoSortedArray { /** * 题目：给定两个已排序序列，找出共同的元素。 * 1.定义两个指针分别指向序列的开始。 * 如果指向的两个元素
sftp 异常，有遇到的吗？求解 Chen.H java jcraft auth jsch jschexception
com.jcraft.jsch.JSchException: Auth cancel at com.jcraft.jsch.Session.connect(Session.java:460) at com.jcraft.jsch.Session.connect(Session.java:154) at cn.vivame.util.ftp.SftpServerAccess.connec
[生物智能与人工智能]神经元中的电化学结构代表什么? comsci 人工智能
我这里做一个大胆的猜想,生物神经网络中的神经元中包含着一些化学和类似电路的结构,这些结构通常用来扮演类似我们在拓扑分析系统中的节点嵌入方程一样,使得我们的神经网络产生智能判断的能力,而这些嵌入到节点中的方程同时也扮演着"经验"的角色.... 我们可以尝试一下...在某些神经
通过LAC和CID获取经纬度信息 dai_lm lac cid
方法1：用浏览器打开http://www.minigps.net/cellsearch.html，然后输入lac和cid信息(mcc和mnc可以填0)，如果数据正确就可以获得相应的经纬度方法2：发送HTTP请求到http://www.open-electronics.org/celltrack/cell.php?hex=0&lac=<lac>&cid=&
JAVA的困难分析 datamachine java
前段时间转了一篇SQL的文章（http://datamachine.iteye.com/blog/1971896），文章不复杂，但思想深刻，就顺便思考了一下java的不足，当砖头丢出来，希望引点和田玉。 -----------------------------------------------------------------------------------------
小学5年级英语单词背诵第二课 dcj3sjt126com english word
money 钱 paper 纸 speak 讲，说 tell 告诉 remember 记得，想起 knock 敲，击，打 question 问题 number 数字，号码 learn 学会，学习 street 街道 carry 搬运，携带 send 发送，邮寄，发射 must 必须 light 灯，光线，轻的 front
linux下面没有tree命令 dcj3sjt126com linux
centos p安装 yum -y install tree mac os安装 brew install tree 首先来看tree的用法 tree 中文解释：tree 功能说明：以树状图列出目录的内容。语　　法：tree [-aACdDfFgilnNpqstux][-I <范本样式>][-P <范本样式
Map迭代方式，Map迭代，Map循环蕃薯耀 Map循环 Map迭代 Map迭代方式
Map迭代方式，Map迭代，Map循环 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年
Spring Cache注解+Redis hanqunfeng spring
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redis</artifactId>
Guava中针对集合的 filter和过滤功能 jackyrong filter
在guava库中，自带了过滤器(filter)的功能，可以用来对collection 进行过滤，先看例子： @Test public void whenFilterWithIterables_thenFiltered() { List<String> names = Lists.newArrayList("John"
学习编程那点事 lampcy 编程 android PHP html5
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
架构师之流处理---------bytebuffer的mark,limit和flip nannan408 ByteBuffer
1.前言。如题，limit其实就是可以读取的字节长度的意思，flip是清空的意思，mark是标记的意思。 2.例子. 例子代码: String str = "helloWorld"; ByteBuffer buff = ByteBuffer.wrap(str.getBytes()); Sy
org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1, column 1 Everyday都不同 $转义 el表达式
最近在做Highcharts的过程中，在写js时，出现了以下异常：严重: Servlet.service() for servlet jsp threw exception org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1,
用Java实现发送邮件到163 tntxia java实现
/* 在java版经常看到有人问如何用javamail发送邮件？如何接收邮件？如何访问多个文件夹等。问题零散，而历史的回复早已经淹没在问题的海洋之中。本人之前所做过一个java项目，其中包含有WebMail功能，当初为用java实现而对javamail摸索了一段时间，总算有点收获。看到论坛中的经常有此方面的问题，因此把我的一些经验帖出来，希望对大家有些帮助。此篇仅介绍用
探索实体类存在的真正意义 java小叶檀 POJO
一. 实体类简述实体类其实就是俗称的POJO,这种类一般不实现特殊框架下的接口，在程序中仅作为数据容器用来持久化存储数据用的 POJO（Plain Old Java Objects）简单的Java对象它的一般格式就是 public class A{ private String id; public Str