qq836869520

Delta Lake源码分析

Delta Lake源码分析
- Delta Lake元数据
- snapshot生成
- 日志提交
- 冲突检测（并发控制）
- delete
- update
- merge

Delta Lake源码分析

Delta Lake元数据

delta lake 包含Protocol、Metadata、FileAction(AddFile、RemoveFile)、CommitInfo和SetTransaction这几种元数据action。

Protocol：这是delta lake自身的版本管理，一般只出现在第一次的commit日志里（之后版本升级应该也会有）；
Metadata：存储delta表的schema信息，第一次commit和每次修改schema时出现，以最后一次出现的为准；
FileAction：文件的相关操作，delta lake的文件操作只有添加文件和删除文件；
CommitInfo：保存关于本次更改的原始信息，如修改时间，操作类型，读取的数据版本等；
SetTransaction：设置application的提交版本，一般用于流式计算的一致性控制（exactlyOnce）。

//初始的commit log会包含protocol和metaData的信息
{"commitInfo":{"timestamp":1576480709055,"operation":"WRITE","operationParameters":{"mode":"ErrorIfExists","partitionBy":"[]"},"isBlindAppend":true}}
{"protocol":{"minReaderVersion":1,"minWriterVersion":2}}
{"metaData":{"id":"fe0948b9-8253-4942-9e28-3a89321a004d","format":{"provider":"parquet","options":{}},"schemaString":"{\"type\":\"struct\",\"fields\":[{\"name\":\"azkaban_tag\",\"type\":\"string\",\"nullable\":true,\"metadata\":{}},{\"name\":\"project_name\",\"type\":\"string\",\"nullable\":true,\"metadata\":{}},{\"name\":\"flow_name\",\"type\":\"string\",\"nullable\":true,\"metadata\":{}},{\"name\":\"job_name\",\"type\":\"string\",\"nullable\":true,\"metadata\":{}},{\"name\":\"application_name\",\"type\":\"string\",\"nullable\":true,\"metadata\":{}},{\"name\":\"queue_name\",\"type\":\"string\",\"nullable\":true,\"metadata\":{}},{\"name\":\"master_name\",\"type\":\"string\",\"nullable\":true,\"metadata\":{}}]}","partitionColumns":[],"configuration":{},"createdTime":1576480707164}}
{"add":{"path":"part-00000-dc1d1431-1e4b-4337-b111-6a447bad15fc-c000.snappy.parquet","partitionValues":{},"size":1443338,"modificationTime":1576480711000,"dataChange":true}}

//之后的commit log会记录下当前操作的信息
{"commitInfo":{"timestamp":1576481270646,"operation":"DELETE","operationParameters":{"predicate":"[\"(`master_name` = 'mob_analyse')\"]"},"readVersion":0,"isBlindAppend":false}}
{"remove":{"path":"part-00000-dc1d1431-1e4b-4337-b111-6a447bad15fc-c000.snappy.parquet","deletionTimestamp":1576481270643,"dataChange":true}}
{"add":{"path":"part-00000-d6431884-390d-4837-865c-f6e52f0e2cf5-c000.snappy.parquet","partitionValues":{},"size":1430267,"modificationTime":1576481273000,"dataChange":true}}

snapshot生成

当存在checkpoint文件时，DeltaLog类的currentSnapshot会根据checkpoint和之后的json日志来计算快照。

通过loadMetadataFromFile()方法读取_last_checkpoint文件获得最新的checkpoint路径；
通过LogStore.listFrom()方法获得checkpoint之后版本的delta log文件；
使用verifyDeltaVersions方法验证delta log的文件是否是连续的（日志版本必须是连续的，每个commit log都需要被计算）；
解析并聚合checkpoint和delta log为Seq[DeltaLogFileIndex]，然后new Snapshot()；
Snapshot里的stateReconstruction会使用InMemoryLogReplay来计算日志中的各种action，获得最终的状态信息。

当没有checkpoint文件时，通过DeltaLog类的update方法来计算快照。

当不存在_last_checkpoint文件时，new一个版本号为-1的Snapshot；
检测到currentSnapshot的版本为-1，调用update方法，实际工作的是updateInternal方法，它会把当前的快照更新到最新版本；
updateInternal会遍历出版本号小于等于 max（当前版本，0）的checkpoint文件和delta log，并通过new Snapshot将这些更新添加到当前快照中。

@volatile private var currentSnapshot: Snapshot = lastCheckpoint.map { c =>
    val checkpointFiles = c.parts
      .map(p => checkpointFileWithParts(logPath, c.version, p))     //目前版本没用到parts，疑似商业版功能
      .getOrElse(Seq(checkpointFileSingular(logPath, c.version)))   //返回最新checkpoint文件路径
    val deltas = store.listFrom(deltaFile(logPath, c.version + 1))  //返回checkpoint之后版本的json文件
      .filter(f => isDeltaFile(f.getPath))
      .toArray
    val deltaVersions = deltas.map(f => deltaVersion(f.getPath))
    verifyDeltaVersions(deltaVersions)  //验证版本日志是否连续
    val newVersion = deltaVersions.lastOption.getOrElse(c.version)
    logInfo(s"Loading version $newVersion starting from checkpoint ${c.version}")
    try {
      val deltaIndex = DeltaLogFileIndex(DeltaLog.COMMIT_FILE_FORMAT, deltas)
      val checkpointIndex = DeltaLogFileIndex(DeltaLog.CHECKPOINT_FILE_FORMAT, fs, checkpointFiles)
      val snapshot = new Snapshot(  //创建快照
        logPath,
        newVersion,
        None,
        checkpointIndex :: deltaIndex :: Nil,
        minFileRetentionTimestamp,
        this,
        // we don't want to make an additional RPC here to get commit timestamps when "deltas" is
        // empty. The next "update" call will take care of that if there are delta files.
        deltas.lastOption.map(_.getModificationTime).getOrElse(-1L))

      validateChecksum(snapshot)    //通过crc文件校验版本，但是目前delta版本并没有生成crc文件，后续会更新或者又是商业版的坑？
      lastUpdateTimestamp = clock.getTimeMillis()
      snapshot
    } catch {
      case e: FileNotFoundException
          if Option(e.getMessage).exists(_.contains("parquet does not exist")) =>
        recordDeltaEvent(this, "delta.checkpoint.error.partial")
        throw DeltaErrors.missingPartFilesException(c, e)
      case e: AnalysisException if Option(e.getMessage).exists(_.contains("Path does not exist")) =>
        recordDeltaEvent(this, "delta.checkpoint.error.partial")
        throw DeltaErrors.missingPartFilesException(c, e)
    }
  }.getOrElse {
    new Snapshot(logPath, -1, None, Nil, minFileRetentionTimestamp, this, -1L)  //没有checkpoint文件时，从头开始读delta log计算
  }

  // Reconstruct the state by applying deltas in order to the checkpoint.
  // We partition by path as it is likely the bulk of the data is add/remove.
  // Non-path based actions will be collocated to a single partition.
  private val stateReconstruction = {
    val implicits = spark.implicits
    import implicits._

    val numPartitions = spark.sessionState.conf.getConf(DeltaSQLConf.DELTA_SNAPSHOT_PARTITIONS)

    val checkpointData = previousSnapshot.getOrElse(emptyActions)
    val deltaData = load(files)
    val allActions = checkpointData.union(deltaData)
    val time = minFileRetentionTimestamp
    val hadoopConf = new SerializableConfiguration(spark.sessionState.newHadoopConf())
    val logPath = path.toUri // for serializability

    allActions.as[SingleAction]
      .mapPartitions { actions =>
        val hdpConf = hadoopConf.value
        actions.flatMap {
          _.unwrap match {
            case add: AddFile => Some(add.copy(path = canonicalizePath(add.path, hdpConf)).wrap)
            case rm: RemoveFile => Some(rm.copy(path = canonicalizePath(rm.path, hdpConf)).wrap)
            case other if other == null => None
            case other => Some(other.wrap)
          }
        }
      }
      .withColumn("file", assertLogBelongsToTable(logPath)(input_file_name()))
      .repartition(numPartitions, coalesce($"add.path", $"remove.path"))
      .sortWithinPartitions("file")
      .as[SingleAction]
      .mapPartitions { iter =>
        val state = new InMemoryLogReplay(time)
        state.append(0, iter.map(_.unwrap))
        state.checkpoint.map(_.wrap)
      }
  }

日志提交

日志的提交是在OptimisticTransactionImpl的commit()中实现的。

调用prepareCommit方法做各种检查，如字段是否重复、是否第一次提交等；
判断本次commit的隔离等级,目前只检查是否修改了数据，若修改了数据则使用Serializable级别，否则用SnapshotIsolation，因为不修改数据的情况下，它可以提供和Serializable一样的保证，且能在之后的冲突检测中更容易通过（writeIsolation还没有使用，后期会更新吧）；
使用doCommit方法提交action日志，doCommit使用deltaLog.lockInterruptibly来实现乐观锁，如果该version+1的log文件已存在，则提交失败；
doCommit失败后会调用checkAndRetry进行重试，遍历读version后的所有commit log，进行冲突检测，检测通过后再次提交doCommit；
完成doCommit后，postCommit方法会检查是否满足checkpointInterval，如果满足条件则调用deltaLog.checkpoint()方法生成新的checkpoint文件，并更新_last_checkpoint文件。

  /**
   * Modifies the state of the log by adding a new commit that is based on a read at
   * the given `lastVersion`.  In the case of a conflict with a concurrent writer this
   * method will throw an exception.
   *
   * @param actions     Set of actions to commit
   * @param op          Details of operation that is performing this transactional commit
   */
  @throws(classOf[ConcurrentModificationException])
  def commit(actions: Seq[Action], op: DeltaOperations.Operation): Long = recordDeltaOperation(
      deltaLog,
      "delta.commit") {
    val version = try {
      // Try to commit at the next version.
      var finalActions = prepareCommit(actions, op) //各种检查

      // Find the isolation level to use for this commit
      val noDataChanged = actions.collect { case f: FileAction => f.dataChange }.forall(_ == false)
      val isolationLevelToUse = if (noDataChanged) {  //0.5版本新特性，很简单的隔离等级判定，writeIsolation还没有使用，等后续更新吧
        // If no data has changed (i.e. its is only being rearranged), then SnapshotIsolation
        // provides Serializable guarantee. Hence, allow reduced conflict detection by using
        // SnapshotIsolation of what the table isolation level is.
        SnapshotIsolation
      } else {
        Serializable
      }

      val isBlindAppend = { //判断是否不读取delta数据且所有的文件操作都是AddFile
        val dependsOnFiles = readPredicates.nonEmpty || readFiles.nonEmpty
        val onlyAddFiles =
          finalActions.collect { case f: FileAction => f }.forall(_.isInstanceOf[AddFile])
        onlyAddFiles && !dependsOnFiles
      }

      if (spark.sessionState.conf.getConf(DeltaSQLConf.DELTA_COMMIT_INFO_ENABLED)) {    //默认会将commitInfo记录到commit log里
        commitInfo = CommitInfo(
          clock.getTimeMillis(),
          op.name,
          op.jsonEncodedValues,
          Map.empty,
          Some(readVersion).filter(_ >= 0),
          None,
          Some(isBlindAppend))
        finalActions = commitInfo +: finalActions
      }

      // Register post-commit hooks if any  
      lazy val hasFileActions = finalActions.collect { case f: FileAction => f }.nonEmpty
      if (DeltaConfigs.SYMLINK_FORMAT_MANIFEST_ENABLED.fromMetaData(metadata) && hasFileActions) {
        registerPostCommitHook(GenerateSymlinkManifest) //生成manifest支持Presto和Athena
      }

      val commitVersion = doCommit(snapshot.version + 1, finalActions, 0, isolationLevelToUse)  //提交action日志
      logInfo(s"Committed delta #$commitVersion to ${deltaLog.logPath}")
      postCommit(commitVersion, finalActions) //检测是否合并checkpoint
      commitVersion
    } catch {
      case e: DeltaConcurrentModificationException =>
        recordDeltaEvent(deltaLog, "delta.commit.conflict." + e.conflictType)
        throw e
      case NonFatal(e) =>
        recordDeltaEvent(
          deltaLog, "delta.commit.failure", data = Map("exception" -> Utils.exceptionString(e)))
        throw e
    }

    runPostCommitHooks(version, actions)  //0.5版本新特性，用来支持Presto和Amazon Athena

    version
  }

冲突检测（并发控制）

如果后续commit升级了protocol版本，则不通过；
如果后续commit更改了metadata，则不通过；
如果后续commit更改了文件:
1. 在0.5之前的版本，只要读了delta表的文件，且后续其他commit log有FileAction操作，就不能通过检测（除非是完全不依赖delta表，单纯的灌数据才行，怪不得并发低）；
2. 0.5版本增加了Serializable,WriteSerializable,SnapshotIsolation三个隔离等级；（以下仅考虑源码的具体实现，根据isolationLevels里的文档注释，它们应该具有更多的功能，尤其是WriteSerializable级别，目前的代码并没有使用，推测应该会在后续版本进行更新，或者在商业版里才有）
  1. Serializable最严格的，要求绝对的串行化，设置了这个级别，只要出现并发冲突，且后续commit log存在AddFile操作，就会报错；
  2. WriteSerializable允许其他commit isBlindAppend时通过冲突检测（即后续的commit仅AddFile，不RemoveFile），此种情况下最终结果和串行的结果可能不同；
  3. SnapshotIsolation最宽松，基本都可以通过这部分的冲突检测，但是可能无法通过其他模块的检测。
如果后续commit删除了本次读取的文件，则不通过；
如果后续commit和本次commit删除了同一个文件，则不通过；
如果幂等的事务发生了冲突（SetTransaction部分有相同的appId），则不通过。

（具体代码在OptimisticTransaction.scala的checkAndRetry方法里，有兴趣的可以看一下）

delete

调用DeltaTable里的delete方法可以删除满足指定条件的数据。

DeltaTableOperations的executeDelete将任务解析成DeleteCommand，然后run；
DeleteCommand.run会检查目标delta表是否为appendOnly，若是，则禁止更新和删除数据，否则performDelete；
在performDelete方法中，首先解析给定的删除数据的条件，划分为只使用元数据就能计算的谓词和其它谓词两类；（具体实现是检查谓词是否仅包含分区列和条件是否涉及子查询表达式）
使用OptimisticTransaction里的filterFiles方法找出需要删除的文件列表，
1. 如果只有上述第一种情况，则不需要扫描文件数据，直接删除文件就行，删除调用的是removeWithTimestamp方法，返回RemoveFile action；
2. 如果包含上述第二种情况，则需要扫描文件数据，找出文件列表中不需要被删除的数据，使用TransactionalWrite.writeFiles方法写到新的文件中，此时deleteActions包括AddFile和RemoveFile。
最后用commit方法提交deleteActions，并使用recordDeltaEvent记录本次删除操作的详细信息。
（文件并没有被物理删除）

  private def performDelete(
      sparkSession: SparkSession, deltaLog: DeltaLog, txn: OptimisticTransaction) = {
    import sparkSession.implicits._

    var numTouchedFiles: Long = 0
    var numRewrittenFiles: Long = 0
    var scanTimeMs: Long = 0
    var rewriteTimeMs: Long = 0

    val startTime = System.nanoTime()
    val numFilesTotal = deltaLog.snapshot.numOfFiles

    val deleteActions: Seq[Action] = condition match {
      case None =>  //没有限定条件，需删除整张表，此时遍历所有文件，然后删除就行
        // Case 1: Delete the whole table if the condition is true
        val allFiles = txn.filterFiles(Nil)

        numTouchedFiles = allFiles.size
        scanTimeMs = (System.nanoTime() - startTime) / 1000 / 1000

        val operationTimestamp = System.currentTimeMillis()
        allFiles.map(_.removeWithTimestamp(operationTimestamp)) //逻辑删除数据文件
      case Some(cond) =>  //有条件就需要区分不同情况了
        val (metadataPredicates, otherPredicates) =
          DeltaTableUtils.splitMetadataAndDataPredicates(   //将条件解析成能用元数据定位的和其他
            cond, txn.metadata.partitionColumns, sparkSession)

        if (otherPredicates.isEmpty) {  //第一种情况，只使用元数据就能定位所有数据
          // Case 2: The condition can be evaluated using metadata only.
          //         Delete a set of files without the need of scanning any data files.
          val operationTimestamp = System.currentTimeMillis()
          val candidateFiles = txn.filterFiles(metadataPredicates)  //返回涉及到的文件

          scanTimeMs = (System.nanoTime() - startTime) / 1000 / 1000
          numTouchedFiles = candidateFiles.size

          candidateFiles.map(_.removeWithTimestamp(operationTimestamp)) //删除
        } else {  //第二种情况，需要把文件中不需要删除的数据重写一份
          // Case 3: Delete the rows based on the condition.
          val candidateFiles = txn.filterFiles(metadataPredicates ++ otherPredicates)

          numTouchedFiles = candidateFiles.size
          val nameToAddFileMap = generateCandidateFileMap(deltaLog.dataPath, candidateFiles)    //生成重写后的文件名和对应的AddFile action

          val fileIndex = new TahoeBatchFileIndex(
            sparkSession, "delete", candidateFiles, deltaLog, tahoeFileIndex.path, txn.snapshot)
          // Keep everything from the resolved target except a new TahoeFileIndex
          // that only involves the affected files instead of all files.
          val newTarget = DeltaTableUtils.replaceFileIndex(target, fileIndex)   //替换文件索引，更新LogicalPlan
          val data = Dataset.ofRows(sparkSession, newTarget)
          val filesToRewrite =
            withStatusCode("DELTA", s"Finding files to rewrite for DELETE operation") {
              if (numTouchedFiles == 0) {
                Array.empty[String]
              } else {
                data.filter(new Column(cond)).select(new Column(InputFileName())).distinct()
                  .as[String].collect()
              }
            }

          scanTimeMs = (System.nanoTime() - startTime) / 1000 / 1000
          if (filesToRewrite.isEmpty) {
            // Case 3.1: no row matches and no delete will be triggered
            Nil
          } else {
            // Case 3.2: some files need an update to remove the deleted files
            // Do the second pass and just read the affected files
            val baseRelation = buildBaseRelation(
              sparkSession, txn, "delete", tahoeFileIndex.path, filesToRewrite, nameToAddFileMap)
            // Keep everything from the resolved target except a new TahoeFileIndex
            // that only involves the affected files instead of all files.
            val newTarget = DeltaTableUtils.replaceFileIndex(target, baseRelation.location)

            val targetDF = Dataset.ofRows(sparkSession, newTarget)
            val filterCond = Not(EqualNullSafe(cond, Literal(true, BooleanType)))
            val updatedDF = targetDF.filter(new Column(filterCond))

            val rewrittenFiles = withStatusCode(
              "DELTA", s"Rewriting ${filesToRewrite.size} files for DELETE operation") {
              txn.writeFiles(updatedDF)  //写文件
            }

            numRewrittenFiles = rewrittenFiles.size
            rewriteTimeMs = (System.nanoTime() - startTime) / 1000 / 1000 - scanTimeMs

            val operationTimestamp = System.currentTimeMillis()
            removeFilesFromPaths(deltaLog, nameToAddFileMap, filesToRewrite, operationTimestamp) ++ //删文件
              rewrittenFiles  //写文件
          }
        }
    }
    if (deleteActions.nonEmpty) {
      txn.commit(deleteActions, DeltaOperations.Delete(condition.map(_.sql).toSeq)) //提交commit日志
    }

    recordDeltaEvent(   //记录本次操作的详细信息
      deltaLog,
      "delta.dml.delete.stats",
      data = DeleteMetric(
        condition = condition.map(_.sql).getOrElse("true"),
        numFilesTotal,
        numTouchedFiles,
        numRewrittenFiles,
        scanTimeMs,
        rewriteTimeMs)
    )
  }

update

调用DeltaTable里的update()方法可以更新满足指定条件的数据。（和delete有些相似）

DeltaTableOperations的executeUpdate将任务解析成UpdateCommand，然后run；
UpdateCommand.run检查目标delta表是否为appendOnly，若是，则禁止更新和删除数据，否则performUpdate；
解析给定条件，划分为只使用元数据就能计算的谓词和其它谓词两类；
使用OptimisticTransaction里的filterFiles方法找出需要删除的文件列表，
1. 如果只有上述第一种情况，removeWithTimestamp直接删除文件，然后调用rewriteFiles方法，使用buildUpdatedColumns更新受影响的列，最后writeFiles；
2. 如果包含上述第二种情况，扫描数据，找出需要更新的数据，（逻辑）删除原文件，更新受影响的数据，然后rewriteFiles。
最后用commit方法提交deleteActions，并使用recordDeltaEvent记录本次删除操作的详细信息。

(关键代码详见UpdateCommand.scala的performUpdate方法，和delete相似)

merge

DeltaTable里merge直接调用DeltaMergeBuilder方法，后续的whenMatched和whenNotMatched都是向mergeBuilder里面添加从句，最后使用execute()启动执行；

whenMatched时可以执行update操作。

update调用addUpdateClause方法，它使用MergeIntoClause.toActions将解析后的列名和update的表达式转化为MergeAction，MergeIntoUpdateClause将它与whenMatched的条件结合，通过withClause()添加到mergeBuilder里；

updateAll也是同样的流程，只是MergeIntoClause.toActions(Nil, Nil)参数为空(类似于update set * )，后续execute时resolveClause方法会予以解析。

private def addUpdateClause(set: Map[String, Column]): DeltaMergeBuilder = {
    if (set.isEmpty && matchCondition.isEmpty) {
      // Nothing to update = no need to add an update clause
      mergeBuilder
    } else {
      val setActions = set.toSeq
      val updateActions = MergeIntoClause.toActions(  //转化为MergeAction
        colNames = setActions.map(x => UnresolvedAttribute.quotedString(x._1)),
        exprs = setActions.map(x => x._2.expr),
        isEmptySeqEqualToStar = false)
      val updateClause = MergeIntoUpdateClause(matchCondition.map(_.expr), updateActions) //和条件一起打包
      mergeBuilder.withClause(updateClause)   //加到mergeBuilder里
    }
}

whenMatched时可以执行delete操作，直接用MergeIntoDeleteClause封装一下matchCondition，然后withClause添加进mergeBuilder；

  /** Delete a matched row from the table */
  def delete(): DeltaMergeBuilder = {
    val deleteClause = MergeIntoDeleteClause(matchCondition.map(_.expr))
    mergeBuilder.withClause(deleteClause)
  }

whenNotMatched时可以执行insert操作，流程类似update，MergeIntoClause.toActions转化，MergeIntoInsertClause封装，然后添加到mergeBuilder里；

  private def addInsertClause(setValues: Map[String, Column]): DeltaMergeBuilder = {
    val values = setValues.toSeq
    val insertActions = MergeIntoClause.toActions(
      colNames = values.map(x => UnresolvedAttribute.quotedString(x._1)),
      exprs = values.map(x => x._2.expr),
      isEmptySeqEqualToStar = false)
    val insertClause = MergeIntoInsertClause(notMatchCondition.map(_.expr), insertActions)
    mergeBuilder.withClause(insertClause)
  }

调用execute来执行。
1. 使用MergeInto.resolveReferences解析mergeClause。首先会检查merge的语法规则；
  1. 一个merge中至少存在一个whenClauses；
  2. 如果存在两个whenMatched，则第一个必须有条件；
  3. whenMatched最多有两个；
  4. update、delete和insert都只能出现一次。
2. 具体的解析工作是由resolveClause和resolveOrFail来完成的（resolveOrFail提供了一个递归的调用）。
3. 使用PreprocessTableMerge进行预处理，将MergeIntoInsertClause（notMatch）和MergeIntoMatchedClause（match：MergeIntoUpdateClause和MergeIntoDeleteClause都继承自它）封装成MergeIntoCommand；
4. 调用MergeIntoCommand.run。
  1. 如果只有whenNotMatched，则只需要insert数据，调用writeInsertsOnlyWhenNoMatchedClauses方法，此时只需要left anti join 找到需要插入的数据，然后写就行了，相关方法是OptimisticTransaction.filterFiles和TransactionalWrite.writeFiles；
  2. 如果包含whenMatched，
    1. 调用findTouchedFiles找到所有需要更改的文件（用withColumn把列编号和文件名加到数据上，然后inner join找到match的数据）；
    2. 然后调用writeAllChanges方法处理需要改变的数据，具体流程是对sourceDF（merge的目标df）和targetDF（上一步找出来的delta文件DF）做full join，然后使用JoinedRowProcessor.processPartition处理相应的逻辑，最后writeFiles写数据，然后remove找出的delta文件。
    3. 提交commit，然后recordDeltaEvent记录本次的MergeStats。

   def execute(): Unit = {
       val sparkSession = targetTable.toDF.sparkSession
       val resolvedMergeInto =
         MergeInto.resolveReferences(mergePlan)(tryResolveReferences(sparkSession) _)   //解析
       if (!resolvedMergeInto.resolved) {
         throw DeltaErrors.analysisException("Failed to resolve\n", plan = Some(resolvedMergeInto))
       }
       // Preprocess the actions and verify
       val mergeIntoCommand = PreprocessTableMerge(sparkSession.sessionState.conf)(resolvedMergeInto)   //封装
       sparkSession.sessionState.analyzer.checkAnalysis(mergeIntoCommand)   //检查LogicalPlan
       mergeIntoCommand.run(sparkSession)   //执行
     }

vscode 文件追踪_vscode源码分析【三】程序的启动逻辑，性能问题的追踪 weixin_39809793 vscode 文件追踪
启动追踪代码文件：src\main.js如果指定了特定的启动参数：tracevscode会在启动之初，执行下面的代码：constcontentTracing=require('electron').contentTracing;consttraceOptions={categoryFilter:args['trace-category-filter']||'*',traceOptions:args
DBC差异比较工具DBCCompare_原理介绍（四） 99乘法口诀万物皆可变 C#CANSelf 测试工具 c#
DBC比对工具UI图片DBC比对工具：功能详解与源码分析在现代汽车开发和诊断过程中，DBC（DatabaseContainer）文件扮演着至关重要的角色。它们详细描述了CAN（ControllerAreaNetwork）网络中各消息和信号的详细信息。然而，随着项目的推进和迭代，DBC文件也会随之发生变化。为了确保新旧DBC文件的一致性，并找出其中的差异，DBC比对工具应运而生。本文将详细介绍一款D
Python潮流周刊#1：如何系统地自学Python？亭台六七座 Qt/C++成长之路 python 开发语言 qt c#c++
文章&教程1、编程语言的错误处理模式文章讨论了编程中处理错误的四种常见方法：返回错误代码（C、Go）、异常（Java、C＃、Python、C++）、回调函数（JavaScript）和Result对象（Haskell、Rust、Kotlin）。对每种方法进行了分析，介绍了它们的优缺点以及使用时需要注意的地方。2、深入理解Python虚拟机：描述器实现原理与源码分析文章介绍了描述器的实现原理，分析了C
你了解B+树吗？它有哪些使用场景呢？心丑姑娘算法 java
MySQLInnoDB索引（B+树）详解及源码分析MySQLInnoDB使用B+树（B+Tree）作为其主要的索引结构，用于主键索引（聚簇索引）和辅助索引（二级索引）。B+树相比AVL树、红黑树等数据结构，更适合数据库的大规模数据存储和磁盘存取优化。一、B+树的基本概念1.什么是B+树？B+树是一种平衡树，它具有以下特点：多路平衡搜索树：不是二叉树，而是多路（m阶），每个节点可以有m个子节点。数据
从头开始读skynet源码（1）main入口干了什么 BanFS skynet 1024程序员节后端
使用skynet一年半了。源码也断断续续读了不少，也看了几篇skynet的源码分析。他们都说的很好。但是觉得分析只是给你一个理解代码的观点，但是没个人的理解方式是不一样的，我也写一写我自己的理解。下面进入正题。首先，还是要有一个观念，skynet是干嘛的，云风前辈的Skynet设计综述，wiki什么的都是要读的。然后进入正题。从我学习开始，我理解的一个C/C++程序都是从main函数开始运行的，s
木马免杀学习方案浩策信息收集学习网络安全安全系统安全 web安全安全架构网络攻击模型
目录️1.Web页面源码分析用于信息收集的技术点技术点与技术栈2.敏感文件读取的信息收集分析前后分析️细化步骤与网络安全分析3.信息收集的前后关联与技术栈前后关联分析技术栈总结4.全局总结⚔️5.攻击技术链攻击链可视化️1.Web页面源码分析用于信息收集的技术点Web页面源码分析是红队渗透测试的初始步骤，通过检查HTML、JavaScript、CSS和其他资源，识别潜在漏洞、暴露的敏感信息、文件路
【MPC】模型预测控制笔记 (6)：不确定模型的鲁棒MPC 车队老哥记录生活模型预测控制 MPC 笔记算法
目录前言不确定模型稳定性分析MATLAB实例1-忽略微小得模型参数误差MATLAB实例2-忽略模型中的非线性项附录1附录2前言致谢【模型预测控制（2022春）lecture4-2RobustMPC】不确定模型假设系统的真实模型为：xk+1=Axk+B(uk+δ1(xk,uk))+δ2(xk)(1)x_{k+1}=Ax_k+B(u_k+\delta_1(x_k,u_k))+\delta_2(x_k)
1. ntfs源码分析 ntfs文件系统中mft的b+树 greshem 源码分析
一直好奇ntfs文件系统的mft是如何使用b+树的,今天开始好好把ntfs使用b+树的流程整理出来,涉及到的代码为ntfs-3gntfsprogs的代码在个人的下载里面有.废话不说开始分析.G:_xfile_all_xfile_2020_05\linux_src_chm_2010\ntfs-3g-20070920-BETA.chm1.MFT的数据结构ntfscat/dev/sda6\$MFTmft
Netty4.0源码分析之PoolThreadCache zhifeng687 NIO &Netty
在JEMalloc分配算法文中，将PoolThreadCache类比为同城仓库，可以就近提取中小型货物。本文将详细介绍PoolThreadCache的细节和实现，在Netty中，其内部结构可见下图：PoolThreadCache这里，新引入一个数据类型MemoryRegionCache，其内部是一个ByteBuf队列。每个节点是一个ByteBuf的说法并不准确，切确的说，是不再使用的ByteBuf
Android-Volley源码分析 grumoon android源码阅读 Volley 网络请求 Android Http
更多开源项目分析请点击Android优秀开源项目实现原理解析1.功能介绍Volley是Google推出的Android异步网络调用框架和图片加载框架。在GoogleI/O2013大会上发布。名字由来：aburstoremissionofmanythingsoralargeamountatonce发布演讲时候的配图从名字由来和配图中无数急促的火箭可以看出Volley的特点：特别适合数据量小，通信频繁
Spring Cloud Stream 深度解析 AI天才研究院 Python实战自然语言处理人工智能语言模型编程实践开发语言架构设计
文章目录1.简介2.概念及术语什么是SpringCloudStream？SpringCloudStream的基本概念架构设计图SpringCloudStream的架构模式3.运行流程4.配置及参数依赖管理配置文件spring.cloud.streamlogging5.源码分析spring-cloud-stream-core模块MessageChannel和SubscribableChannel接口
linux内核-写时复制之实验+源码分析
实验相信大家都听过大名鼎鼎的copyonwrite技术，并且学习过原理。但是可能对于代码中具体的发生场景，脑海中可能没有实体的映射。下面使用1个例子说明copyonwrite的发生时间。有这么一个程序：#include#include#include#include//打印当前进程的内存占用（常驻集大小）voidprint_memory_usage(constchar*stage){FILE*fi
TensorFlow Serving学习笔记2: 模型服务 Jay Kay tfserving tensorflow 学习
本文深入剖析TensorFlowServing的核心架构与实现机制，结合源码分析揭示其如何实现高可用、动态更新的生产级模型服务。一、TensorFlowServing核心架构1.1分层架构设计TensorFlowServing采用模块化分层设计，各组件职责分明：组件职责源码位置Servables可服务对象（如模型），基础服务单元core/servable.hLoaders管理模型加载/卸载生命周期
Kafka消费者客户端源码深度解析：从架构到核心流程 Edingbrugh.南空 kafka kafka 架构
在Kafka生态系统中，消费者客户端作为数据消费的入口，其设计与实现直接影响数据处理的效率和可靠性。本文将深入Kafka消费者客户端源码，通过核心组件解析、流程拆解与源码分析，揭示其高性能消费背后的技术奥秘，并辅以架构图与流程图增强理解。一、消费者客户端整体架构Kafka消费者客户端采用分层架构设计，各组件职责明确且协同工作，核心组件包括：KafkaConsumer：消费者入口，封装消费逻辑与AP
Dubbo源码分析：用了很多年Dubbo，觉得自己挺厉害？程序员秋天 dubbo dubbo
Dubbo作为由阿里巴巴开发的高性能开源框架，用于构建分布式服务体系，以其简洁、灵活和可扩展的特性广受欢迎。要全面理解Dubbo的内部运行机制，并充分发挥其潜力，深入研究其源代码是至关重要的。本文将对Dubbo源码进行全面分析，重点解析其关键组件、设计模式和架构概念，带您领略Dubbo的魅力。1.Dubbo架构Dubbo采用分层架构，推崇松耦合和模块化设计。Dubbo核心由应用层、框架层和协议层组
Dubbo核心源码分析（二）爱吃biangbiang面 Dubbo 微服务开发 dubbo
1.2.3源码分析上一章简单演示了DubboSPI的使用方法，首先通过ExtensionLoader的getExtensionLoader方法获取一个ExtensionLoader实例，然后再通过ExtensionLoader的getExtension方法获取拓展类对象。下面我们从ExtensionLoader的getExtension方法作为入口，对拓展类对象的获取过程进行详细的分析。publi
红黑树精通指南：面试、实战与源码分析张彦峰ZYF 数据结构算法 b树
目录一、对红黑树的理解（一）基本理解（二）红黑树与AVL树的比较二、在实际框架中的应用分析三、开始深入红黑树（一）红黑树的基本概念和性质1、红黑树的基本定义2、红黑性质的五个要点引理证明：一颗有n个内部结点的红黑树的高度至多为2lg(n+1)（二）对旋转的基本理解1、左旋（LeftRotation）2、右旋（RightRotation）3、代码展示（三）插入操作基本理解1、以图形方式进行初步理解情
uboot:源码分析-启动第一阶段-lowlevel_init li星野嵌入式 linux 嵌入式硬件
lowlevel_init找到lowlevel_init函数真正的地方，是在uboot/board/samsumg/x210/lowlevel_init.S中。检查复位状态(1)复杂CPU允许多种复位情况。譬如直接冷上电、热启动、睡眠(低功耗)状态下的唤醒等，这些情况都属于复位。所以我们在复位代码中要去检测复位状态，来判断到底是哪种情况。(2)判断哪种复位的意义在于：冷上电时DDR是需要初始化才能
SpringBoot run 启动源码分析未来AI编程 springboot springCloud
Springboot加载从main方法开始SpringApplication.run(Application.class,args);publicstaticConfigurableApplicationContextrun(ClassprimarySource,String...args){returnrun(newClass[]{primarySource},args);}publicstat
【AAOS】【源码分析】CarFramework IT_码农 Android Automative AAOS CarFramework
整体描述与传统的AOSPStack相比，CarFramework主要有以下区别：特定用于Car的应用程序可以使用汽车API来访问Car服务提供的功能。Car服务通过CarServiceHelperService()与系统服务器通信，以访问Android的核心功能。CarServiceHelperService的主要目的是启动汽车服务。但是，当没有指定的API与系统服务器通信时，将使用CarServ
【AAOS】【源码分析】用户管理（二）-- 整体架构
整体介绍Android多用户功能作为AndroidAutomotive的重要组成部分，为不同驾驶员和乘客提供了一个更加定制化、隐私保护的使用环境。Android多用户的存在，它可以让多个用户使用同一台设备，同时保持彼此的数据、应用和设置分隔开来。各用户类型的权限能力SystemAdminSecondaryGuest可交互界面❌✅✅✅（临时）可切换为前台❌✅✅✅可添加/删除用户❌✅❌❌可设置系统偏好
雷电模拟器安装 KitsuneMagisk (原 Magisk-delta) dilvx android
在2025年，Magiskdelta这个分支的安装可能有极强的时效性，因为仓库的重要维护者弃坑/没时间精力，最佳实践随时会变前情提要Magisk(也被称为“面具”)是一款针对安卓设备的开源自定义工具套件，它能在不直接修改系统文件的情况下获取Root权限，并通过模块系统对设备进行各种自定义修改。此外，Magisk还具备隐藏自身（MagiskHide）的功能，使得用户在获取Root权限的同时也能正常使
基于STM32设计的掌上游戏机(运行NES游戏模拟器)详细开发过程 DS小龙哥智能家居与物联网项目实战 STM32单片机开发基础 stm32 游戏机游戏
目录一、环境与硬件介绍关键问题回答二、游戏运行效果(超级玛丽示例)2.1超级玛丽运行截图2.2仅仅使用独立按键操作游戏效果2.32.8寸屏运行效果-ZET6最小系统板2.42.8寸屏运行效果-正点原子战舰开发板三、NES游戏的运行原理四、什么是NES?五、工程源码分析:以精简版本(1)为例5.2主函数代码5.3加载NES游戏:LoadNes函数介绍5.3NES游戏主循环代码六、工程源码分析:以完整
以太坊（15）交易流程解析 xiliangMa 区块链以太坊交易
以太坊源码分析-交易机理先说一点区块链转账的基本概念和流程用户输入转账的地址和转入的地址和转出的金额系统通过转出的地址的私钥对转账信息进行签名（用于证明这笔交易确实有本人进行）系统对交易信息进行验证把这笔交易入到本地的txpool中（就是缓存交易池）把交易信息广播给其它节点源码分析正对于上面的流程对以太坊(golang)的源码进行必要的分析面程序员对自己的区块链进行必要的改动先来看Geth如何转账
Mybatis执行流程源码分析有答案直接发给我深入Mybatis mybatis java 代理模式
前言大家好，请看下面一段代码，是Mybatis的简单使用案例：publicstaticvoidgenerateFromXML()throwsIOException{Stringresource="mybatis-config.xml";InputStreaminputStream=Resources.getResourceAsStream(resource);SqlSessionFactorysq
FreeRTOS源码分析:heap 想当钓鱼佬 FreeRTOS stm32
FreeRTOS堆内存管理机制分析FreeRTOS提供5种堆内存管理方案（heap_1.c至heap_5.c），每种方案针对不同应用场景设计，源码位于FreeRTOS/Source/portable/MemMang目录。标准C库malloc()和free()函数分配堆空间有以下缺点：它们在嵌入式系统上并不总是可用。它们占用了宝贵的代码空间。它们不是线程安全的。它们不是确定性的（执行函数所需时间将因
前端框架实战经验深度解析：美团#房源选房项目＞＞＞Vue.js开发与跨端部署的那些事 small_wh1te_coder 前端性能优化 vue 前端 javascript vscode es6
跟着codewh全套教程看源码、怼项目也有两个月了，吸取前人经验、敲了几个项目之后也小有收获：1.遇事不决：源码开怼！从js高级到jquery到各中框架，碰到底层知识、实现中的小bug不懂、调试难题.....诸多此类类似于ast生成/编译过程/lexicalEnvironment分析等底层原理性难点，直接找技术手册或找到源码分析！程序员只有刨根问底才能获得最大程度的上的进化！2.觉得记不住？多敲多
后端领域必备：Spring MVC 核心原理深度剖析后端开发笔记 spring mvc java ai
后端领域必备：SpringMVC核心原理深度剖析关键词：SpringMVC、DispatcherServlet、HandlerMapping、ViewResolver、MVC架构、依赖注入、AOP摘要：本文将深入剖析SpringMVC框架的核心原理，从架构设计到实现细节，全面解析DispatcherServlet的工作机制、请求处理流程、视图解析等关键组件。通过源码分析、流程图解和实战案例，帮助开
高通SD驱动适配：QRB5165源码深入解析
高通QRB5165SD驱动适配的细节：深入分析平台驱动源码目录高通QRB5165SD驱动适配的细节：深入分析平台驱动源码一、前言二、整体架构概览三、设备树配置（DTS）关键属性说明：四、驱动源码分析1.platform_driver定义2.probe函数核心逻辑3.控制器操作集`sdhci_msm_ops`五、调试技巧与常见问题1.查看SD卡识别日志2.无法识别卡的原因排查：六、寄存器层级理解（可
Lua 源码分析之闭包Closure Kelvin7_Feng lua 一步一步嚼懂Lua源码 lua Closure 闭包源码
闭包是Lua语言编程一个重要而又常用的概念。它主要作用是在函数离开作用域后还可以访问外部的临时变量，这些变量称为upvalue。闭包分为两种，分别CClosure和LClosure。它们都被封装到一个Closure结构体里，CClosure和LClosure都有一个ClosureHeader的结构体。结构体ClosureHeader的字段作用：1.isC:区分是哪一种闭包类型。0是LClosure
jQuery 跨域访问的三种方式 No 'Access-Control-Allow-Origin' header is present on the reque qiaolevip 每天进步一点点学习永无止境跨域众观千象
XMLHttpRequest cannot load http://v.xxx.com. No 'Access-Control-Allow-Origin' header is present on the requested resource. Origin 'http://localhost:63342' is therefore not allowed access. test.html:1
mysql 分区查询优化 annan211 java 分区优化 mysql
分区查询优化引入分区可以给查询带来一定的优势，但同时也会引入一些bug. 分区最大的优点就是优化器可以根据分区函数来过滤掉一些分区，通过分区过滤可以让查询扫描更少的数据。所以，对于访问分区表来说，很重要的一点是要在where 条件中带入分区，让优化器过滤掉无需访问的分区。可以通过查看explain执行计划，是否携带 partitions
MYSQL存储过程中使用游标 chicony Mysql存储过程
DELIMITER $$ DROP PROCEDURE IF EXISTS getUserInfo $$ CREATE PROCEDURE getUserInfo(in date_day datetime)-- -- 实例-- 存储过程名为：getUserInfo-- 参数为：date_day日期格式:2008-03-08-- BEGINdecla
mysql 和 sqlite 区别 Array_06 sqlite
转载： http://www.cnblogs.com/ygm900/p/3460663.html mysql 和 sqlite 区别 SQLITE是单机数据库。功能简约，小型化，追求最大磁盘效率 MYSQL是完善的服务器数据库。功能全面，综合化，追求最大并发效率 MYSQL、Sybase、Oracle等这些都是试用于服务器数据量大功能多需要安装，例如网站访问量比较大的。而sq
pinyin4j使用 oloz pinyin4j
首先需要pinyin4j的jar包支持；jar包已上传至附件内方法一:把汉字转换为拼音；例如：编程转换后则为biancheng /** * 将汉字转换为全拼 * @param src 你的需要转换的汉字 * @param isUPPERCASE 是否转换为大写的拼音； true:转换为大写；fal
微博发送私信随意而生微博
在前面文章中说了如和获取登陆时候所需要的cookie，现在只要拿到最后登陆所需要的cookie，然后抓包分析一下微博私信发送界面 http://weibo.com/message/history?uid=****&name=**** 可以发现其发送提交的Post请求和其中的数据，让后用程序模拟发送POST请求中的数据，带着cookie发送到私信的接入口，就可以实现发私信的功能了。
jsp 香水浓 jsp
JSP初始化容器载入JSP文件后，它会在为请求提供任何服务前调用jspInit()方法。如果您需要执行自定义的JSP初始化任务，复写jspInit()方法就行了 JSP执行这一阶段描述了JSP生命周期中一切与请求相关的交互行为，直到被销毁。当JSP网页完成初始化后
在 Windows 上安装 SVN Subversion 服务端 AdyZhang SVN
在 Windows 上安装 SVN Subversion 服务端2009-09-16高宏伟哈尔滨市道里区通达街291号最佳阅读效果请访问原地址：http://blog.donews.com/dukejoe/archive/2009/09/16/1560917.aspx 现在的Subversion已经足够稳定，而且已经进入了它的黄金时段。我们看到大量的项目都在使
android开发中如何使用 alertDialog从listView中删除数据？ aijuans android
我现在使用listView展示了很多的配置信息，我现在想在点击其中一条的时候填出 alertDialog,点击确认后就删除该条数据，（ ArrayAdapter ，ArrayList，listView 全部删除），我知道在下面的onItemLongClick 方法中参数 arg2 是选中的序号，但是我不知道如何继续处理下去 1 2 3
jdk-6u26-linux-x64.bin 安装 baalwolf linux
1.上传安装文件(jdk-6u26-linux-x64.bin) 2.修改权限 [root@localhost ~]# ls -l /usr/local/jdk-6u26-linux-x64.bin 3.执行安装文件 [root@localhost ~]# cd /usr/local [root@localhost local]# ./jdk-6u26-linux-x64.bin&nbs
MongoDB经典面试题集锦 BigBird2012 mongodb
1.什么是NoSQL数据库？NoSQL和RDBMS有什么区别？在哪些情况下使用和不使用NoSQL数据库？ NoSQL是非关系型数据库，NoSQL = Not Only SQL。关系型数据库采用的结构化的数据，NoSQL采用的是键值对的方式存储数据。在处理非结构化/半结构化的大数据时；在水平方向上进行扩展时；随时应对动态增加的数据项时可以优先考虑使用NoSQL数据库。在考虑数据库的成熟
JavaScript异步编程Promise模式的6个特性 bijian1013 JavaScript Promise
Promise是一个非常有价值的构造器，能够帮助你避免使用镶套匿名方法，而使用更具有可读性的方式组装异步代码。这里我们将介绍6个最简单的特性。在我们开始正式介绍之前，我们想看看Javascript Promise的样子： var p = new Promise(function(r
[Zookeeper学习笔记之八]Zookeeper源代码分析之Zookeeper.ZKWatchManager bit1129 zookeeper
ClientWatchManager接口 //接口的唯一方法materialize用于确定那些Watcher需要被通知 //确定Watcher需要三方面的因素1.事件状态 2.事件类型 3.znode的path public interface ClientWatchManager { /** * Return a set of watchers that should
【Scala十五】Scala核心九：隐式转换之二 bit1129 scala
隐式转换存在的必要性，在Java Swing中，按钮点击事件的处理，转换为Scala的的写法如下： val button = new JButton button.addActionListener( new ActionListener { def actionPerformed(event: ActionEvent) {
Android JSON数据的解析与封装小Demo ronin47
转自：http://www.open-open.com/lib/view/open1420529336406.html package com.example.jsondemo; import org.json.JSONArray; import org.json.JSONException; import org.json.JSONObject; impor
[设计]字体创意设计方法谈 brotherlamp UI ui自学 ui视频 ui教程 ui资料
从古至今，文字在我们的生活中是必不可少的事物，我们不能想象没有文字的世界将会是怎样。在平面设计中，UI设计师在文字上所花的心思和功夫最多，因为文字能直观地表达UI设计师所的意念。在文字上的创造设计，直接反映出平面作品的主题。如设计一幅戴尔笔记本电脑的广告海报，假设海报上没有出现“戴尔”两个文字，即使放上所有戴尔笔记本电脑的图片都不能让人们得知这些电脑是什么品牌。只要写上“戴尔笔
单调队列-用一个长度为k的窗在整数数列上移动，求窗里面所包含的数的最大值 bylijinnan java 算法面试题
import java.util.LinkedList; /* 单调队列滑动窗口单调队列是这样的一个队列：队列里面的元素是有序的，是递增或者递减题目：给定一个长度为N的整数数列a(i),i=0,1,...,N-1和窗长度k. 要求：f(i) = max{a(i-k+1),a(i-k+2),..., a(i)},i = 0,1,...,N-1 问题的另一种描述就
struts2处理一个form多个submit chiangfai struts2
web应用中，为完成不同工作，一个jsp的form标签可能有多个submit。如下代码： <s:form action="submit" method="post" namespace="/my"> <s:textfield name="msg" label="叙述：">
shell查找上个月，陷阱及野路子 chenchao051 shell
date -d "-1 month" +%F 以上这段代码，假如在2012/10/31执行，结果并不会出现你预计的9月份，而是会出现八月份，原因是10月份有31天，9月份30天，所以-1 month在10月份看来要减去31天，所以直接到了8月31日这天，这不靠谱。野路子解决：假设当天日期大于15号
mysql导出数据中文乱码问题 daizj mysql 中文乱码导数据
解决mysql导入导出数据乱码问题方法：１、进入mysql，通过如下命令查看数据库编码方式： mysql> show variables like 'character_set_%'; +--------------------------+----------------------------------------+ | Variable_name&nbs
SAE部署Smarty出现：Uncaught exception 'SmartyException' with message 'unable to write dcj3sjt126com PHP smarty sae
对于SAE出现的问题：Uncaught exception 'SmartyException' with message 'unable to write file...。官方给出了详细的FAQ：http://sae.sina.com.cn/?m=faqs&catId=11#show_213 解决方案为： 01 $path
《教父》系列台词 dcj3sjt126com
Your love is also your weak point. 你的所爱同时也是你的弱点。 If anything in this life is certain, if history has taught us anything, it is that you can kill anyone. 不顾家的人永远不可能成为一个真正的男人。 &
mongodb安装与使用 dyy_gusi mongo
一.MongoDB安装和启动,widndows和linux基本相同 1.下载数据库, linux:mongodb-linux-x86_64-ubuntu1404-3.0.3.tgz 2.解压文件,并且放置到合适的位置 tar -vxf mongodb-linux-x86_64-ubun
Git排除目录 geeksun git
在Git的版本控制中，可能有些文件是不需要加入控制的，那我们在提交代码时就需要忽略这些文件，下面讲讲应该怎么给Git配置一些忽略规则。有三种方法可以忽略掉这些文件，这三种方法都能达到目的，只不过适用情景不一样。 1. 针对单一工程排除文件这种方式会让这个工程的所有修改者在克隆代码的同时，也能克隆到过滤规则，而不用自己再写一份，这就能保证所有修改者应用的都是同一
Ubuntu 创建开机自启动脚本的方法 hongtoushizi ubuntu
转载自： http://rongjih.blog.163.com/blog/static/33574461201111504843245/ Ubuntu 创建开机自启动脚本的步骤如下： 1) 将你的启动脚本复制到 /etc/init.d目录下以下假设你的脚本文件名为 test。 2) 设置脚本文件的权限 $ sudo chmod 755
第八章流量复制/AB测试/协程 jinnianshilongnian nginx lua coroutine
流量复制在实际开发中经常涉及到项目的升级，而该升级不能简单的上线就完事了，需要验证该升级是否兼容老的上线，因此可能需要并行运行两个项目一段时间进行数据比对和校验，待没问题后再进行上线。这其实就需要进行流量复制，把流量复制到其他服务器上，一种方式是使用如tcpcopy引流；另外我们还可以使用nginx的HttpLuaModule模块中的ngx.location.capture_multi进行并发
电商系统商品表设计 lkl
DROP TABLE IF EXISTS `category`; -- 类目表 /*!40101 SET @saved_cs_client = @@character_set_client */; /*!40101 SET character_set_client = utf8 */; CREATE TABLE `category` ( `id` int(11) NOT NUL
修改phpMyAdmin导入SQL文件的大小限制 pda158 sql mysql
　用phpMyAdmin导入mysql数据库时，我的10M的数据库不能导入，提示mysql数据库最大只能导入2M。　　 phpMyAdmin数据库导入出错：　　You probably tried to upload too large file. Please refer to documentation for ways to workaround this limit.
Tomcat性能调优方案 Sobfist apache jvm tomcat 应用服务器
一、操作系统调优对于操作系统优化来说，是尽可能的增大可使用的内存容量、提高CPU的频率，保证文件系统的读写速率等。经过压力测试验证，在并发连接很多的情况下，CPU的处理能力越强，系统运行速度越快。。【适用场景】任何项目。二、Java虚拟机调优应该选择SUN的JVM，在满足项目需要的前提下，尽量选用版本较高的JVM，一般来说高版本产品在速度和效率上比低版本会有改进。 J
SQLServer学习笔记 vipbooks 数据结构 xml
1、create database school 创建数据库school 2、drop database school 删除数据库school 3、use school 连接到school数据库，使其成为当前数据库 4、create table class(classID int primary key identity not null) 创建一个名为class的表，其有一

Delta Lake源码分析

Delta Lake源码分析

Delta Lake元数据

snapshot生成

日志提交

冲突检测（并发控制）

delete

update

merge

你可能感兴趣的:(Delta Lake源码分析)