DataFlow范式

Delta Lake 事务日志实现的源码剖析

笔者在之前的文章《实战深入理解 Delta Lake 事务日志》中带大家把 Delta Lake 的事务日志大致操作了一遍，并进行了具体的分析。

有了之前的基础，笔者将在本篇文章中继续和大家一起深入研究 Delta Lake 事务日志的源码实现，学习 Delta Lake 开源项目的工程经验。

环境信息

Delta Lake Github：

https://github.com/delta-io/delta

笔者选取的版本为最新发布版本 v0.4.0，源码下载地址为：

https://github.com/delta-io/delta/releases/tag/v0.4.0

看一下 Delta Lake 项目的目录结构：

大部分代码实现都在 org.apache.spark.sql.delta 包下面。代码整体层次还是很清晰的，Scala 编程语言实现。

Delta Lake 事务日志源码分析

读者最好先大体看一下代码结构，点点看。

有没有发现什么？有的读者，可能发现了什么，不知道从哪里入手。

但是要不了多久，聪明的读者会发现 DeltaLog 这个类，打开看看。

org.apache.spark.sql.delta.DeltaLog


     
     
     
     
      
      
      
      /**
      
      
      
       * Used to query the current state of the log as well as modify it by adding
      
      
      
       * new atomic collections of actions.
      
      
      
       *
      
      
      
       * Internally, this class implements an optimistic concurrency control
      
      
      
       * algorithm to handle multiple readers or writers. Any single read
      
      
      
       * is guaranteed to see a consistent snapshot of the table.
      
      
      
       */

DeltaLog 类的注释中有一句话很重要：

Internally, this class implements an optimistic concurrency control algorithm to handle multiple readers or writers. Any single read is guaranteed to see a consistent snapshot of the table.

大致意思为：

在内部，DeltaLog 类实现了一个乐观并发控制算法来处理并发读取或写入操作。任何一次读操作都保证看到表的一致性快照。

为了更方便的分析，我们直接看一下事务开始的代码：


     
     
     
     
      
      
      
       /* ------------------ *
      
      
      
       | Delta Management |
      
      
      
       * ------------------ */
      
      
      
      
      
      
      
       /**
      
      
      
       * Returns a new [[OptimisticTransaction]] that can be used to read the current state of the
      
      
      
       * log and then commit updates. The reads and updates will be checked for logical conflicts
      
      
      
       * with any concurrent writes to the log.
      
      
      
       *
      
      
      
       * Note that all reads in a transaction must go through the returned transaction object, and not
      
      
      
       * directly to the [[DeltaLog]] otherwise they will not be checked for conflicts.
      
      
      
       */
      
      
      
       def startTransaction(): OptimisticTransaction = {
      
      
      
       update()
      
      
      
       new OptimisticTransaction(this)
      
      
      
       }

其实这里注释说的不是很清楚，不着急，我们接着分析。但是这里出现的 OptimisticTransaction 类是事务日志的关键类，对于事务日志的持久化都需要通过这个类，这也正是上面所提到的乐观事务，下面我们将具体分析该类。

OptimisticTransaction 类，直接看名字的意思很明确，乐观事务。该类维护了一个 case class，即 CommitStats。CommitStats 记录了一个成功的事务提交的 metrics，如下：


     
     
     
     
      
      
      
      case class CommitStats(
      
      
      
       /** The version read by the txn when it starts. */
      
      
      
       startVersion: Long,
      
      
      
       /** The version committed by the txn. */
      
      
      
       commitVersion: Long,
      
      
      
       /** The version read by the txn right after it commits. It usually equals to commitVersion,
      
      
      
       * but can be larger than commitVersion when there are concurrent commits. */
      
      
      
       readVersion: Long,
      
      
      
       txnDurationMs: Long,
      
      
      
       commitDurationMs: Long,
      
      
      
       numAdd: Int,
      
      
      
       numRemove: Int,
      
      
      
       bytesNew: Long,
      
      
      
       /** The number of files in the table as of version `readVersion`. */
      
      
      
       numFilesTotal: Long,
      
      
      
       /** The table size in bytes as of version `readVersion`. */
      
      
      
       sizeInBytesTotal: Long,
      
      
      
       /** The protocol as of version `readVersion`. */
      
      
      
       protocol: Protocol,
      
      
      
       info: CommitInfo,
      
      
      
       newMetadata: Option[Metadata],
      
      
      
       numAbsolutePathsInAdd: Int,
      
      
      
       numDistinctPartitionsInAdd: Int,
      
      
      
       isolationLevel: String)

OptimisticTransaction 类定义如下实现内容，包含一些笔者额外标记的注释，具体分析请继续看后文：


     
     
     
     
      
      
      
      ...
      
      
      
      trait OptimisticTransactionImpl extends TransactionalWrite {
      
      
      
       ...
      
      
      
       // commit 方法，参数见后文说明
      
      
      
       @throws(classOf[ConcurrentModificationException])
      
      
      
       def commit(actions: Seq[Action], op: DeltaOperations.Operation): Long = recordDeltaOperation(
      
      
      
       deltaLog,
      
      
      
       "delta.commit") {
      
      
      
       val version = try {
      
      
      
       // 事务日志提交前的准备工作
      
      
      
       // Try to commit at the next version.
      
      
      
       var finalActions = prepareCommit(actions, op)
      
      
      
       // 如果本次更新要删除之前文件，则 isBlindAppend 为 false，否则为 true
      
      
      
       val isBlindAppend = {
      
      
      
       val onlyAddFiles =
      
      
      
       finalActions.collect { case f: FileAction => f }.forall(_.isInstanceOf[AddFile])
      
      
      
       onlyAddFiles && !dependsOnFiles
      
      
      
       }
      
      
      
       // 如果 commitInfo.enabled 参数设置为 true，则需要把 commitInfo 记录到事务日志里面
      
      
      
       if (spark.sessionState.conf.getConf(DeltaSQLConf.DELTA_COMMIT_INFO_ENABLED)) {
      
      
      
       commitInfo = CommitInfo(
      
      
      
       clock.getTimeMillis(),
      
      
      
       op.name,
      
      
      
       op.jsonEncodedValues,
      
      
      
       Map.empty,
      
      
      
       Some(readVersion).filter(_ >= 0),
      
      
      
       None,
      
      
      
       Some(isBlindAppend))
      
      
      
       finalActions = commitInfo +: finalActions
      
      
      
       }
      
      
      
       // 开始写事务日志，如果检测到任何冲突，会尝试解决逻辑冲突并使用新版本提交
      
      
      
       val commitVersion = doCommit(snapshot.version + 1, finalActions, 0)
      
      
      
       logInfo(s"Committed delta #$commitVersion to ${deltaLog.logPath}")
      
      
      
       // 对事务日志执行 checkpoint 操作
      
      
      
       postCommit(commitVersion, finalActions)
      
      
      
       commitVersion
      
      
      
       } catch {
      
      
      
       case e: DeltaConcurrentModificationException =>
      
      
      
       recordDeltaEvent(deltaLog, "delta.commit.conflict." + e.conflictType)
      
      
      
       throw e
      
      
      
       case NonFatal(e) =>
      
      
      
       recordDeltaEvent(
      
      
      
       deltaLog, "delta.commit.failure", data = Map("exception" -> Utils.exceptionString(e)))
      
      
      
       throw e
      
      
      
       }
      
      
      
       version
      
      
      
       }
      
      
      
       ...

为了方便分析和以后查看，我贴了该 commit 方法的全部实现，请读者忍受一下。这个方法非常重要，包含大部分事务日志实现的代码。

commit 方法的参数

commit 方法定义：


     
     
     
     
      
      
      
      def commit(actions: Seq[Action], op: DeltaOperations.Operation): Long = recordDeltaOperation {
      
      
      
      ...
      
      
      
      }

actions: Seq[Action]
记录事务记录（SetTransaction）
表更新操作产生的新文件（AddFile）
删除文件（RemoveFile）
元数据（metaData）
更新操作首次初始化protocol（Protocol）
提交信息（CommitInfo）
op: DeltaOperations.Operation
Delta 操作类型，包括Write、StreamingUpdate、Delete、Truncate、Update等一系列操作类型，具体请查看 DeltaOperations.scala 。

commit 方法的三部曲

整体看完 commit 方法后，主要分为三部分内容：

1. prepareCommit
2. doCommit
3. postCommit

1. prepareCommit 方法


     
     
     
     
      
      
      
       protected def prepareCommit(
      
      
      
       actions: Seq[Action],
      
      
      
       op: DeltaOperations.Operation): Seq[Action] = {
      
      
      
       // 事务是否已经提交，增加断言
      
      
      
       assert(!committed, "Transaction already committed.")
      
      
      
      
      
      
      
       // 1. 如果更新了表的 Metadata 信息，那么需要将其写入到事务日志里面
      
      
      
       // If the metadata has changed, add that to the set of actions
      
      
      
       var finalActions = newMetadata.toSeq ++ actions
      
      
      
       val metadataChanges = finalActions.collect { case m: Metadata => m }
      
      
      
       assert(
      
      
      
       metadataChanges.length <= 1,
      
      
      
       "Cannot change the metadata more than once in a transaction.")
      
      
      
       metadataChanges.foreach(m => verifyNewMetadata(m))
      
      
      
      
      
      
      
       // 2. 首次提交事务日志，那么会确保 _delta_log 目录要存在，然后检查 finalActions 里面是否有 Protocol，没有的话需要初始化 protocol 版本
      
      
      
       if (snapshot.version == -1) {
      
      
      
       deltaLog.ensureLogDirectoryExist()
      
      
      
       if (!finalActions.exists(_.isInstanceOf[Protocol])) {
      
      
      
       finalActions = Protocol() +: finalActions
      
      
      
       }
      
      
      
       }
      
      
      
      
      
      
      
       finalActions = finalActions.map {
      
      
      
       // 3. 当第一次提交，并且有 Metadata，那么会将 Delta Lake 的全局配置信息加入到 Metadata 里面
      
      
      
       case m: Metadata if snapshot.version == -1 =>
      
      
      
       val updatedConf = DeltaConfigs.mergeGlobalConfigs(
      
      
      
       spark.sessionState.conf, m.configuration, Protocol())
      
      
      
       m.copy(configuration = updatedConf)
      
      
      
       case other => other
      
      
      
       }
      
      
      
      
      
      
      
       deltaLog.protocolWrite(
      
      
      
       snapshot.protocol,
      
      
      
       logUpgradeMessage = !actions.headOption.exists(_.isInstanceOf[Protocol]))
      
      
      
      
      
      
      
       // 4. 在检查是否需要删除文件时，我们要确保这不是一个 appendOnly 表。
      
      
      
       val removes = actions.collect { case r: RemoveFile => r }
      
      
      
       if (removes.exists(_.dataChange)) deltaLog.assertRemovable()
      
      
      
      
      
      
      
       finalActions
      
      
      
       }

prepareCommit 里面的重要操作，根据代码的注释标记了1、2、3和4，具体为：

1. 由于 Delta Lake 表允许对已经存在的表模式进行修改，比如添加新列或者覆盖原有表的模式等，需要将新的 Metadata 写入到事务日志里面。Metadata 里面存储了表的 schema、分区列、表的配置、表的创建时间等信息，如下：


     
     
     
     
      
      
      
      case class Metadata(
      
      
      
       id: String = java.util.UUID.randomUUID().toString,
      
      
      
       name: String = null,
      
      
      
       description: String = null,
      
      
      
       format: Format = Format(),
      
      
      
       schemaString: String = null,
      
      
      
       partitionColumns: Seq[String] = Nil,
      
      
      
       configuration: Map[String, String] = Map.empty,
      
      
      
       @JsonDeserialize(contentAs = classOf[java.lang.Long])
      
      
      
       createdTime: Option[Long] = Some(System.currentTimeMillis())

2. 如果是首次提交事务日志，那么先检查表的 _delta_log 目录是否存在，不存在则创建。然后检查是否设置了 protocol 的版本，如果没有设置，则使用默认的协议版本，默认的协议版本中 Action.readerVersion = 1，Action.writerVersion = 2。
3. 如果是第一次提交，并且存在 Metadata ，那么会将 Delta Lake 的配置信息加入到 Metadata 里面。Delta Lake 表的配置信息主要是在 org.apache.spark.sql.delta.sources.DeltaSQLConf 类里面定义的，比如可以在创建 Delta Lake 表的时候指定多久做一次 Checkpoint。
4. 可以通过 spark.databricks.delta.properties.defaults.appendOnly 参数将表设置为仅允许追加，所以如果当 actions 里面存在 RemoveFile，那么我们需要判断表是否允许删除。

prepareCommit 方法的返回值为 finalActions，这些信息就是需要写入到事务日志里面的数据。


     
     
     
     
      
      
      
      var finalActions = prepareCommit(actions, op)
      
      
      
      
      
      
      
      val isBlindAppend = {
      
      
      
       val onlyAddFiles =
      
      
      
       finalActions.collect { case f: FileAction => f }.forall(_.isInstanceOf[AddFile])
      
      
      
       onlyAddFiles && !dependsOnFiles
      
      
      
      }

紧接着会判断这次事务变更是否需要删除之前的文件，如果是，那么 isBlindAppend 为 false，否则为 true。


     
     
     
     
      
      
      
      if (spark.sessionState.conf.getConf(DeltaSQLConf.DELTA_COMMIT_INFO_ENABLED)) {
      
      
      
       commitInfo = CommitInfo(
      
      
      
       clock.getTimeMillis(),
      
      
      
       op.name,
      
      
      
       op.jsonEncodedValues,
      
      
      
       Map.empty,
      
      
      
       Some(readVersion).filter(_ >= 0),
      
      
      
       None,
      
      
      
       Some(isBlindAppend))
      
      
      
       finalActions = commitInfo +: finalActions
      
      
      
      }

当 commitInfo.enabled 参数设置为 true（默认值），那么还需要将 commitInfo 写入到事务日志文件里面。CommitInfo 里面包含了操作时间、操作的类型（Write、Update等）等重要信息。

接下来开始调用 doCommit 方法。

2. doCommit 方法

doCommit 方法传入两个参数：


     
     
     
     
      
      
      
      val commitVersion = doCommit(snapshot.version + 1, finalActions, 0)

doCommit 方法的第一个参数传递是 snapshot.version + 1。snapshot.version 其实就是事务日志中最新的版本，我们再来查看一下 Delta Lake 表的目录信息：

如果snapshot.version 的值为1，那么这次 doCommit 的更新版本为 2。

doCommit 方法具体内容如下：


     
     
     
     
      
      
      
       private def doCommit(
      
      
      
       attemptVersion: Long,
      
      
      
       actions: Seq[Action],
      
      
      
       attemptNumber: Int): Long = deltaLog.lockInterruptibly {
      
      
      
       try {
      
      
      
       logDebug(s"Attempting to commit version $attemptVersion with ${actions.size} actions")
      
      
      
       // 1. 正式写事务日志的操作
      
      
      
       deltaLog.store.write(
      
      
      
       deltaFile(deltaLog.logPath, attemptVersion),
      
      
      
       actions.map(_.json).toIterator)
      
      
      
       val commitTime = System.nanoTime()
      
      
      
       // 2. 由于发生了数据更新，所以更新内存中事务日志的最新快照，并做相关判断
      
      
      
       val postCommitSnapshot = deltaLog.update()
      
      
      
       if (postCommitSnapshot.version < attemptVersion) {
      
      
      
       throw new IllegalStateException(
      
      
      
       s"The committed version is $attemptVersion " +
      
      
      
       s"but the current version is ${postCommitSnapshot.version}.")
      
      
      
       }
      
      
      
      
      
      
      
       // 3. 发送一些统计信息
      
      
      
       var numAbsolutePaths = 0
      
      
      
       var pathHolder: Path = null
      
      
      
       val distinctPartitions = new mutable.HashSet[Map[String, String]]
      
      
      
       val adds = actions.collect {
      
      
      
       case a: AddFile =>
      
      
      
       pathHolder = new Path(new URI(a.path))
      
      
      
       if (pathHolder.isAbsolute) numAbsolutePaths += 1
      
      
      
       distinctPartitions += a.partitionValues
      
      
      
       a
      
      
      
       }
      
      
      
       val stats = CommitStats(
      
      
      
       startVersion = snapshot.version,
      
      
      
       commitVersion = attemptVersion,
      
      
      
       readVersion = postCommitSnapshot.version,
      
      
      
       txnDurationMs = NANOSECONDS.toMillis(commitTime - txnStartNano),
      
      
      
       commitDurationMs = NANOSECONDS.toMillis(commitTime - commitStartNano),
      
      
      
       numAdd = adds.size,
      
      
      
       numRemove = actions.collect { case r: RemoveFile => r }.size,
      
      
      
       bytesNew = adds.filter(_.dataChange).map(_.size).sum,
      
      
      
       numFilesTotal = postCommitSnapshot.numOfFiles,
      
      
      
       sizeInBytesTotal = postCommitSnapshot.sizeInBytes,
      
      
      
       protocol = postCommitSnapshot.protocol,
      
      
      
       info = Option(commitInfo).map(_.copy(readVersion = None, isolationLevel = None)).orNull,
      
      
      
       newMetadata = newMetadata,
      
      
      
       numAbsolutePaths,
      
      
      
       numDistinctPartitionsInAdd = distinctPartitions.size,
      
      
      
       isolationLevel = null)
      
      
      
       recordDeltaEvent(deltaLog, "delta.commit.stats", data = stats)
      
      
      
      
      
      
      
       attemptVersion
      
      
      
       } catch {
      
      
      
       case e: java.nio.file.FileAlreadyExistsException =>
      
      
      
       checkAndRetry(attemptVersion, actions, attemptNumber)
      
      
      
       }
      
      
      
       }

根据注释标记的数字顺序介绍：

1. 正式写事务日志的操作，其中 store 是通过 spark.delta.logStore.class 参数指定的，目前支持 HDFS、S3、Local 等存储介质，默认是 HDFS。具体的写事务操作的过程，接下来介绍。
2. 持久化事务日志之后，更新内存中的事务日志最新的快照，然后做相关的合法性校验。
3. 发送一些统计信息。

我们针对 deltaLog 写事务日志操作专门进行解说：


     
     
     
     
      
      
      
      deltaLog.store.write(
      
      
      
       deltaFile(deltaLog.logPath, attemptVersion),
      
      
      
       actions.map(_.json).toIterator
      
      
      
      )

write 方法传入两个参数：

HDFS路径，deltaFile 方法返回值


     
     
     
     
      
      
      
      /** Returns the path for a given delta file. */
      
      
      
      def deltaFile(path: Path, version: Long): Path = new Path(path, f"$version%020d.json")

actions，doCommit 方法传入的参数 finalActions

write 方法的实现支持好几种存储，比如HDFS、S3、Azure等，这里以大数据平台常用的 HDFS 分布式存储系统来分析。

HDFSLogStore 类实现 LogStore 接口，查看 write 方法的实现：


     
     
     
     
      
      
      
       def write(path: Path, actions: Iterator[String], overwrite: Boolean = false): Unit = {
      
      
      
       val isLocalFs = path.getFileSystem(getActiveHadoopConf).isInstanceOf[RawLocalFileSystem]
      
      
      
       if (isLocalFs) {
      
      
      
       synchronized {
      
      
      
       writeInternal(path, actions, overwrite)
      
      
      
       }
      
      
      
       } else {
      
      
      
       writeInternal(path, actions, overwrite)
      
      
      
       }
      
      
      
       }

其实 write 调用的核心方法为 writeInternal，如下：


     
     
     
     
      
      
      
       private def writeInternal(path: Path, actions: Iterator[String], overwrite: Boolean): Unit = {
      
      
      
       // 1. 获取 HDFS 的 FileContext 用于后面写事务日志
      
      
      
       val fc = getFileContext(path)
      
      
      
      
      
      
      
       // 2. 如果需要写的事务日志已经存在那么就需要抛出异常，后面再重试
      
      
      
       if (!overwrite && fc.util.exists(path)) {
      
      
      
       // This is needed for the tests to throw error with local file system
      
      
      
       throw new FileAlreadyExistsException(path.toString)
      
      
      
       }
      
      
      
      
      
      
      
       // 3. 事务日志先写到临时文件
      
      
      
       val tempPath = createTempPath(path)
      
      
      
       var streamClosed = false // This flag is to avoid double close
      
      
      
       var renameDone = false // This flag is to save the delete operation in most of cases.
      
      
      
       val stream = fc.create(
      
      
      
       tempPath, EnumSet.of(CREATE), CreateOpts.checksumParam(ChecksumOpt.createDisabled()))
      
      
      
      
      
      
      
       try {
      
      
      
       // 4. 将本次修改产生的 actions 写入到临时事务日志里
      
      
      
       actions.map(_ + "\n").map(_.getBytes(UTF_8)).foreach(stream.write)
      
      
      
       stream.close()
      
      
      
       streamClosed = true
      
      
      
       try {
      
      
      
       val renameOpt = if (overwrite) Options.Rename.OVERWRITE else Options.Rename.NONE
      
      
      
       // 5. 将临时的事务日志移到正式的事务日志里面，如果移动失败则抛出异常，后面再重试
      
      
      
       fc.rename(tempPath, path, renameOpt)
      
      
      
       renameDone = true
      
      
      
       // TODO: this is a workaround of HADOOP-16255 - remove this when HADOOP-16255 is resolved
      
      
      
       tryRemoveCrcFile(fc, tempPath)
      
      
      
       } catch {
      
      
      
       case e: org.apache.hadoop.fs.FileAlreadyExistsException =>
      
      
      
       throw new FileAlreadyExistsException(path.toString)
      
      
      
       }
      
      
      
       } finally {
      
      
      
       if (!streamClosed) {
      
      
      
       stream.close()
      
      
      
       }
      
      
      
       // 删除临时事务日志
      
      
      
       if (!renameDone) {
      
      
      
       fc.delete(tempPath, false)
      
      
      
       }
      
      
      
       }
      
      
      
       }

writeInternal 方法的实现过程，就是对 HDFS 进行写文件操作，结合上面数字标记的顺序，具体说明如下：

获取 HDFS 的 FileContext 用于写事务日志

如果需要写的事务日志已经存在，那么就需要抛出异常，然后再重试

写事务日志的时候是先写到表 _delta_lake 目录下的临时文件里面

将本次更新操作的事务记录写到临时文件里

写完事务日志之后，需要将临时事务日志最后移动动正式的日志文件里面。这里需要注意，在写事务日志文件的过程中同样存在多个用户修改表，拿 00000000000000000004.json 这个文件举例，很可能已经被别的修改占用了，这时候也需要抛出 FileAlreadyExistsException 异常，以便后面重试

到此，Delta Lake 的事务日志写操作就完成了。这里需要注意的是，doCommit 有可能会失败，抛出 FileAlreadyExistsException 异常。Delta Lake 在实现 doCommit 方法时捕获了这个异常，并在异常捕获里面调用 checkAndRetry(attemptVersion, actions, attemptNumber) 方法进行重试操作：


     
     
     
     
      
      
      
      } catch {
      
      
      
       case e: java.nio.file.FileAlreadyExistsException =>
      
      
      
       checkAndRetry(attemptVersion, actions, attemptNumber)
      
      
      
      }

checkAndRetry 方法非常简单，这里就不细说了，只是需要注意，重试的版本是刚刚更新内存中事务日志快照的版本加上1：


     
     
     
     
      
      
      
      // 因为上次更新事务日志发生冲突，所以需要再一次读取磁盘中持久化的事务日志，并更新内存中事务日志快照
      
      
      
      deltaLog.update()
      
      
      
      // 重试的版本是刚刚更新内存中事务日志快照的 version + 1
      
      
      
      val nextAttempt = deltaLog.snapshot.version + 1

checkAndRetry 方法只有在事务日志写冲突的时候才会出现，主要目的是重写当前的事务日志。

当事务日志成功持久化到磁盘之后，最后再执行 postCommit 操作。

3. postCommit 方法


     
     
     
     
      
      
      
       protected def postCommit(commitVersion: Long, commitActions: Seq[Action]): Unit = {
      
      
      
       committed = true
      
      
      
       if (commitVersion != 0 && commitVersion % deltaLog.checkpointInterval == 0) {
      
      
      
       try {
      
      
      
       deltaLog.checkpoint()
      
      
      
       } catch {
      
      
      
       case e: IllegalStateException =>
      
      
      
       logWarning("Failed to checkpoint table state.", e)
      
      
      
       }
      
      
      
       }
      
      
      
       }

postCommit 的实现相对来说是最简单的，功能就是判断需不需要对事务日志做一次 checkpoint 操作。deltaLog.checkpointInterval 的值是通过 spark.databricks.delta.properties.defaults.checkpointInterval 参数设置的，默认每写10次事务日志做一次 checkpoint。

checkpoint 的其实就是将内存中事务日志的最新快照持久化到磁盘里面，如下：

/delta/mydelta.db/user_info/_delta_log/00000000000000000010.checkpoint.parquet 文件就是对事务日志进行 checkpoint 的文件，里面汇总了 00000000000000000000.json - 00000000000000000010.json 之间的所有事务操作记录。那么下一次如果再构建事务日志的快照时，只需要从 00000000000000000010.checkpoint.parquet 文件以及往后更新的文件开始构造，而无需再读取 00000000000000000000.json 到 00000000000000000010.json 之间的事务操作。

另外，我们还可以从 HDFS 路径看出，checkpoint 之后还会生成一个 _last_checkpoint 文件，里面记录了最后一次 checkpoint 的版本，checkpoint 文件里面的 Action 条数，如下：


     
     
     
     
      
      
      
      {"version":10,"size":13}

到此，笔者已经带大家完成了对 Delta Lake 事务日志的源码实现的研究，希望大家对 Delta Lake 的认识更深一层。

你可能感兴趣的:(Delta Lake 事务日志实现的源码剖析)

斤斤计较的婚姻到底有多难？白心之岂必有为
很多人私聊我会问到在哪个人群当中斤斤计较的人最多？我都会回答他，一般婚姻出现问题的斤斤计较的人士会非常多，以我多年经验，在婚姻落的一塌糊涂的人当中，斤斤计较的人数占比在20～30%以上，也就是说10个婚姻出现问题的斤斤计较的人有2-3个有多不减。在婚姻出问题当中，有大量的心理不平衡的、尖酸刻薄的怨妇。在婚姻中仅斤斤计较有两种类型：第一种是物质上的，另一种是精神上的。在物质与精神上抠门已经严重的影响
情绪觉察日记第37天露露_e800
今天是家庭关系规划师的第二阶最后一天，慧萍老师帮我做了个案，帮我处理了埋在心底好多年的一份恐惧，并给了我深深的力量！这几天出来学习，爸妈过来婆家帮我带小孩，妈妈出于爱帮我收拾东西，并跟我先生和婆婆产生矛盾，妈妈觉得他们没有照顾好我…。今晚回家见到妈妈，我很欣赏她并赞扬她，妈妈说今晚要跟我睡我说好，当我们俩躺在床上准备睡觉的时候，我握着妈妈的手对她说:妈妈这几天辛苦你了，你看你多利害把我们的家收拾得
芦花鞋一四许叶晗
又是在一个寒冷的夏日里，青铜和葵花决定今天一起去卖芦花鞋，奶奶亲手给他们做了一碗热乎乎的粥对他们说:“就靠你们两挣生活费了这碗粥赶紧趁热喝了吧！”于是青铜和葵花喝完了奶奶给她们做的粥，就准备去镇上卖卢花鞋，这回青铜和葵花穿着新的芦花鞋来到了镇上。青铜这回看到了很多人都在卖，用手势表达对葵花说:“这回有好多人在抢我们生意呢！我们必须得吆喝起来。”葵花点了点头。可是谁知他们也大声的叫，卖芦花喽！卖芦花
QQ群采集助手，精准引流必备神器 2401_87347160 其他经验分享
功能概述微信群查找与筛选工具是一款专为微信用户设计的辅助工具，它通过关键词搜索功能，帮助用户快速找到相关的微信群，并提供筛选是否需要验证的群组的功能。主要功能关键词搜索：用户可以输入关键词，工具将自动查找包含该关键词的微信群。筛选功能：工具提供筛选机制，用户可以选择是否只显示需要验证或不需要验证的群组。精准引流：通过上述功能，用户可以更精准地找到目标群组，进行有效的引流操作。3.设备需求该工具可以
关于沟通这件事，项目经理不需要每次都面对面进行流程大师兄
很多项目经理都会遇到这样的问题，项目中由于事情太多，根本没有足够的时间去召开会议，那在这种情况下如何去有效地管理项目中的利益相关者？当然，不建议电子邮件也不需要开会的话，建议可以采取下面几种方式来形成有效的沟通，这几种方式可以帮助你努力的通过各种办法来保持和各方面的联系。项目经理首先要问自己几个问题，项目中哪些利益相关者是必须要进行沟通的？可以列出项目中所有的利益相关者清单，同时也整理出项目中哪些
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
铭刻于星（四十二）随风至
69夜晚，绍敏同学做完功课后，看了眼房外，没听到动静才敢从书包的夹层里拿出那个心形纸团。折痕压得很深，都有些旧了，想来是已经写好很久了。绍敏同学慢慢地、轻轻地捏开折叠处，待到全部拆开后，又反复抚平纸张，然后仔细地一字字默看。只是开头的三个字是第一次看到，让她心漏跳了几拍。“亲爱的绍敏：从四年级的时候，我就喜欢你了，但是我一直不敢说，怕影响你学习。六年级的时候听说有人跟你表白，你接受了，我很难过，但
底层逆袭到底有多难，不甘平凡的你准备好了吗？让吴起给你说说造命者说
底层逆袭到底有多难，不甘平凡的你准备好了吗？让吴起给你说说我叫吴起，生于公元前440年的战国初期，正是群雄并起、天下纷争不断的时候。后人说我是军事家、政治家、改革家，是兵家代表人物。评价我一生历仕鲁、魏、楚三国，通晓兵家、法家、儒家三家思想，在内政军事上都有极高的成就。周安王二十一年（公元前381年），因变法得罪守旧贵族，被人乱箭射死。我出生在卫国一个“家累万金”的富有家庭，从年轻时候起就不甘平凡
2020-01-25 晴岚85
郑海燕坚持分享590天2020.1.24在生活中只存在两个问题。一个问题是：你知道想要达成的目标是什么，但却不知道如何才能达成；另一个问题是：你不知道你的目标是什么。前一个是行动的问题，后一个是结果的问题。通过制定具体的下一步行动，可以解决不知道如何开始行动的问题。而通过去想象结果，对结果做预估，可以解决找不着目标的问题。对于所有吸引我们注意力，想要完成的任务，你可以先想象一下，预期的结果究竟是什
随笔 | 仙一般的灵气海思沧海
仙岛今天，我看了你全部，似乎已经进入你的世界我不知道，这是否是梦幻，还是你仙一般的灵气吸引了我也许每一个人都要有一份属于自己的追求，这样才能够符合人生的梦想，生活才能够充满着阳光与快乐我不知道，我为什么会这样的感叹，是在感叹自己的人生，还是感叹自己一直没有孜孜不倦的追求只感觉虚度了光阴，每天活在自己的梦中，活在一个不真实的世界是在逃避自己，还是在逃避周围的一切有时候我嘲笑自己，嘲笑自己如此的虚无，
想家爆米花机
也许不同于大家对家乡的思念，我对家乡甚至是疯狂的不舍。还未踏出车站就感觉到幸福，我享受这里的夕阳、这里的浓烈柴火味、这里每一口家常菜。我是宅女，我贪恋家的安逸。刚刚踏出大学校门，初出茅庐，无法适应每年只能国庆和春节回家。我焦虑、失眠、无端发脾气，是无法适应工作的节奏，是无法接受我将一步步离开家乡的事实。我不想承认自己胸无大志，选择再次踏上征程。图片发自App
【iOS】MVC设计模式 Magnetic_h ios mvc 设计模式 objective-c 学习 ui
MVC前言如何设计一个程序的结构，这是一门专门的学问，叫做"架构模式"（architecturalpattern），属于编程的方法论。MVC模式就是架构模式的一种。它是Apple官方推荐的App开发架构，也是一般开发者最先遇到、最经典的架构。MVC各层controller层Controller/ViewController/VC（控制器）负责协调Model和View，处理大部分逻辑它将数据从Mod
OC语言多界面传值五大方式 Magnetic_h ios ui 学习 objective-c 开发语言
前言在完成暑假仿写项目时，遇到了许多需要用到多界面传值的地方，这篇博客来总结一下比较常用的五种多界面传值的方式。属性传值属性传值一般用前一个界面向后一个界面传值，简单地说就是通过访问后一个视图控制器的属性来为它赋值，通过这个属性来做到从前一个界面向后一个界面传值。首先在后一个界面中定义属性@interfaceBViewController:UIViewController@propertyNSSt
一百九十四章. 自相矛盾巨木擎天
唉！就这么一夜，林子感觉就像过了很多天似的，先是回了阳间家里，遇到了那么多不可思议的事情儿。特别是小伙伴们，第二次与自己见面时，僵硬的表情和恐怖的气氛，让自己如坐针毡，打从心眼里难受！还有东子，他现在还好吗？有没有被人欺负？护城河里的小鱼小虾们，还都在吗？水不会真的干枯了吧？那对相亲相爱漂亮的太平鸟儿，还好吧！春天了，到了做窝、下蛋、喂养小鸟宝宝的时候了，希望它们都能够平安啊！虽然没有看见家人，也
UI学习——cell的复用和自定义cell Magnetic_h ui 学习
目录cell的复用手动（非注册）自动（注册）自定义cellcell的复用在iOS开发中，单元格复用是一种提高表格（UITableView）和集合视图（UICollectionView）滚动性能的技术。当一个UITableViewCell或UICollectionViewCell首次需要显示时，如果没有可复用的单元格，则视图会创建一个新的单元格。一旦这个单元格滚动出屏幕，它就不会被销毁。相反，它被添
element实现动态路由+面包屑软件技术NINI vue案例 vue.js 前端
el-breadcrumb是ElementUI组件库中的一个面包屑导航组件，它用于显示当前页面的路径，帮助用户快速理解和导航到应用的各个部分。在Vue.js项目中，如果你已经安装了ElementUI，就可以很方便地使用el-breadcrumb组件。以下是一个基本的使用示例：安装ElementUI（如果你还没有安装的话）:你可以通过npm或yarn来安装ElementUI。bash复制代码npmi
10月|愿你的青春不负梦想-读书笔记-01 Tracy的小书斋
本书的作者是俞敏洪，大家都很熟悉他了吧。俞敏洪老师是我行业的领头羊吧，也是我事业上的偶像。本日摘录他书中第一章中的金句：『一个人如果什么目标都没有，就会浑浑噩噩，感觉生命中缺少能量。能给我们能量的，是对未来的期待。第一件事，我始终为了进步而努力。与其追寻全世界的骏马，不如种植丰美的草原，到时骏马自然会来。第二件事，我始终有阶段性的目标。什么东西能给我能量？答案是对未来的期待。』读到这里的时候，我便
C语言宏函数南林yan C语言 c语言
一、什么是宏函数？通过宏定义的函数是宏函数。如下，编译器在预处理阶段会将Add(x,y)替换为((x)*(y))#defineAdd(x,y)((x)*(y))#defineAdd(x,y)((x)*(y))intmain(){inta=10;intb=20;intd=10;intc=Add(a+d,b)*2;cout<
地推话术，如何应对地推过程中家长的拒绝校师学
相信校长们在做地推的时候经常遇到这种情况：市场专员反馈家长不接单，咨询师反馈难以邀约这些家长上门，校区地推疲软，招生难。为什么？仅从地推层面分析，一方面因为家长受到的信息轰炸越来越多，对信息越来越“免疫”；而另一方面地推人员的专业能力和营销话术没有提高，无法应对家长的拒绝，对有意向的家长也不知如何跟进，眼睁睁看着家长走远；对于家长的疑问，更不知道如何有技巧地回答，机会白白流失。由于回答没技巧和专业
谢谢你们，爱你们！鹿游儿
昨天家人去泡温泉，二个孩子也带着去，出发前一晚，匆匆下班，赶回家和孩子一起收拾。饭后，我拿出笔和本子（上次去澳门时做手帐的本子）写下了1\2\3\4\5\6\7\8\9,让后让小壹去思考，带什么出发去旅游呢？她在对应的数字旁边画上了，泳衣、泳圈、肖恩、内衣内裤、tapuy、拖鞋……画完后，就让她自己对着这个本子，将要带的，一一带上，没想到这次带的书还是这本《便便工厂》(晚上姑婆发照片过来，妹妹累得
C语言如何定义宏函数？小九格物 c语言
在C语言中，宏函数是通过预处理器定义的，它在编译之前替换代码中的宏调用。宏函数可以模拟函数的行为，但它们不是真正的函数，因为它们在编译时不会进行类型检查，也不会分配存储空间。宏函数的定义通常使用#define指令，后面跟着宏的名称和参数列表，以及宏展开后的代码。宏函数的定义方式：1.基本宏函数：这是最简单的宏函数形式，它直接定义一个表达式。#defineSQUARE(x)((x)*(x))2.带参
微服务下功能权限与数据权限的设计与实现 nbsaas-boot 微服务 java 架构
在微服务架构下，系统的功能权限和数据权限控制显得尤为重要。随着系统规模的扩大和微服务数量的增加，如何保证不同用户和服务之间的访问权限准确、细粒度地控制，成为设计安全策略的关键。本文将讨论如何在微服务体系中设计和实现功能权限与数据权限控制。1.功能权限与数据权限的定义功能权限：指用户或系统角色对特定功能的访问权限。通常是某个用户角色能否执行某个操作，比如查看订单、创建订单、修改用户资料等。数据权限：
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
小丽成长记（四十三）玲玲54321
小丽发现，即使她好不容易调整好自己的心态下一秒总会有不确定的伤脑筋的事出现，一个接一个的问题，人生就没有停下的时候，小问题不断出现。不过她今天看的书，她接受了人生就是不确定的，厉害的人就是不断创造确定性，在Ta的领域比别人多的确定性就能让自己脱颖而出，显示价值从而获得的比别人多的利益。正是这样的原因，因为从前修炼自己太少，使得她现在在人生道路上打怪起来困难重重，她似乎永远摆脱不了那种无力感，有种习
学点心理知识，呵护孩子健康静候花开_7090
昨天听了华中师范大学教育管理学系副教授张玲老师的《哪里才是学生心理健康的最后庇护所，超越教育与技术的思考》的讲座。今天又重新学习了一遍，收获匪浅。张玲博士也注意到了当今社会上的孩子由于心理问题导致的自残、自杀及伤害他人等恶性事件。她向我们普及了一个重要的命题，她说心理健康的一些基本命题，我们与我们通常的一些教育命题是不同的，她还举了几个例子，让我们明白我们原来以为的健康并非心理学上的健康。比如如果
2021年12月19日，春蕾教育集团团建活动感受——黄晓丹黄错错加油
感受:1.从陌生到熟悉的过程。游戏环节让我们在轻松的氛围中得到了锻炼，也增长了不少知识。2.游戏过程中，我们贡献的是个人力量，展现的是团队的力量。它磨合的往往不止是工作的熟悉，更是观念上契合度的贴近。3.这和工作是一样的道理。在各自的岗位上，每个人摆正自己的位置、各司其职充分发挥才能，并团结一致劲往一处使，才能实现最大的成功。新知:1.团队精神需要不断地创新。过去，人们把创新看作是冒风险，现在人们
Cell Insight | 单细胞测序技术又一新发现，可用于HIV-1和Mtb共感染个体诊断尐尐呅
结核病是艾滋病合并其他疾病中导致患者死亡的主要原因。其中结核病由结核分枝杆菌（Mycobacteriumtuberculosis,Mtb）感染引起，获得性免疫缺陷综合症（艾滋病）由人免疫缺陷病毒（Humanimmunodeficiencyvirustype1,HIV-1）感染引起。国家感染性疾病临床医学研究中心/深圳市第三人民医院张国良团队携手深圳华大生命科学研究院吴靓团队，共同研究得出单细胞测序
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
瑶池防线谜影梦蝶
冥华虽然逃过了影梦的军队，但他是一个忠臣，他选择上报战况。败给影梦后成逃兵，高层亡尔还活着，七重天失守......随便一条，即可处死冥华。冥华自然是知道以仙界高层的习性此信一发自己必死无疑，但他还选择上报实情，因为责任。同样此信送到仙宫后，知道此事的人，大多数人都认定冥华要完了，所以上到仙界高层，下到扫大街的，包括冥华自己，全都准备好迎接冥华之死。如果仙界现在还属于两方之争的话，冥华必死无疑。然而
爬山后遗症璃绛
爬山，攀登，一步一步走向制高点，是一种挑战。成功抵达是一种无法言语的快乐，在山顶吹吹风，看看风景，这是从未有过的体验。然而，爬山一时爽，下山腿打颤，颠簸的路，一路向下走，腿部力量不够，走起来抖到不行，停不下来了！第二天必定腿疼，浑身酸痛，坐立难安！
log4j对象改变日志级别 3213213333332132 java log4j level log4j对象名称日志级别
log4j对象改变日志级别可批量的改变所有级别，或是根据条件改变日志级别。 log4j配置文件： log4j.rootLogger=ERROR,FILE,CONSOLE,EXECPTION #log4j.appender.FILE=org.apache.log4j.RollingFileAppender log4j.appender.FILE=org.apache.l
elk+redis 搭建nginx日志分析平台 ronin47 elasticsearch kibana logstash
elk+redis 搭建nginx日志分析平台 logstash,elasticsearch,kibana 怎么进行nginx的日志分析呢？首先，架构方面，nginx是有日志文件的，它的每个请求的状态等都有日志文件进行记录。其次，需要有个队列，redis的l
Yii2设置时区 dcj3sjt126com PHP timezone yii2
时区这东西，在开发的时候，你说重要吧，也还好，毕竟没它也能正常运行，你说不重要吧，那就纠结了。特别是linux系统，都TMD差上几小时，你能不痛苦吗？win还好一点。有一些常规方法，是大家目前都在采用的1、php.ini中的设置，这个就不谈了，2、程序中公用文件里设置，date_default_timezone_set一下时区3、或者。。。自己写时间处理函数，在遇到时间的时候，用这个函数处理（比较
js实现前台动态添加文本框，后台获取文本框内容 171815164 文本框
<%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://w
持续集成工具 g21121 持续集成
持续集成是什么？我们为什么需要持续集成？持续集成带来的好处是什么？什么样的项目需要持续集成？... 持续集成(Continuous integration ,简称CI)，所谓集成可以理解为将互相依赖的工程或模块合并成一个能单独运行
数据结构哈希表(hash)总结永夜-极光数据结构
1.什么是hash 来源于百度百科: Hash，一般翻译做“散列”，也有直接音译为“哈希”的，就是把任意长度的输入，通过散列算法，变换成固定长度的输出，该输出就是散列值。这种转换是一种压缩映射，也就是，散列值的空间通常远小于输入的空间，不同的输入可能会散列成相同的输出，所以不可能从散列值来唯一的确定输入值。简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。
乱七八糟程序员是怎么炼成的
eclipse中的jvm字节码查看插件地址： http://andrei.gmxhome.de/eclipse/ 安装该地址的outline 插件后重启，打开window下的view下的bytecode视图 http://andrei.gmxhome.de/eclipse/ jvm博客： http://yunshen0909.iteye.com/blog/2
职场人伤害了“上司” 怎样弥补 aijuans 职场
由于工作中的失误，或者平时不注意自己的言行“伤害”、“得罪”了自己的上司，怎么办呢？　　在职业生涯中这种问题尽量不要发生。下面提供了一些解决问题的建议：　　一、利用一些轻松的场合表示对他的尊重　　即使是开明的上司也很注重自己的权威，都希望得到下属的尊重，所以当你与上司冲突后，最好让不愉快成为过去，你不妨在一些轻松的场合，比如会餐、联谊活动等，向上司问个好，敬下酒，表示你对对方的尊重，
深入浅出url编码 antonyup_2006 应用服务器浏览器 servlet weblogic IE
出处：http://blog.csdn.net/yzhz 杨争 http://blog.csdn.net/yzhz/archive/2007/07/03/1676796.aspx 一、问题：编码问题是JAVA初学者在web开发过程中经常会遇到问题，网上也有大量相关的
建表后创建表的约束关系和增加表的字段百合不是茶标的约束关系增加表的字段
下面所有的操作都是在表建立后操作的,主要目的就是熟悉sql的约束,约束语句的万能公式 1,增加字段(student表中增加姓名字段) alter table 增加字段的表名 add 增加的字段名增加字段的数据类型 alter table student add name varchar2(10); &nb
Uploadify 3.2 参数属性、事件、方法函数详解 bijian1013 JavaScript uploadify
一.属性属性名称默认值说明 auto true 设置为true当选择文件后就直接上传了，为false需要点击上传按钮才上传。 buttonClass ” 按钮样式 buttonCursor ‘hand’ 鼠标指针悬停在按钮上的样子 buttonImage null 浏览按钮的图片的路
精通Oracle10编程SQL(16)使用LOB对象 bijian1013 oracle 数据库 plsql
/* *使用LOB对象 */ --LOB(Large Object)是专门用于处理大对象的一种数据类型，其所存放的数据长度可以达到4G字节 --CLOB/NCLOB用于存储大批量字符数据，BLOB用于存储大批量二进制数据，而BFILE则存储着指向OS文件的指针 /* *综合实例 */ --建立表空间 --#指定区尺寸为128k,如不指定，区尺寸默认为64k CR
【Resin一】Resin服务器部署web应用 bit1129 resin
工作中，在Resin服务器上部署web应用，通常有如下三种方式：配置多个web-app 配置多个http id 为每个应用配置一个propeties、xml以及sh脚本文件配置多个web-app 在resin.xml中,可以为一个host配置多个web-app <cluster id="app&q
red5简介及基础知识白糖_ 基础
简介 Red5的主要功能和Macromedia公司的FMS类似，提供基于Flash的流媒体服务的一款基于Java的开源流媒体服务器。它由Java语言编写，使用RTMP作为流媒体传输协议，这与FMS完全兼容。它具有流化FLV、MP3文件，实时录制客户端流为FLV文件，共享对象，实时视频播放、Remoting等功能。用Red5替换FMS后,客户端不用更改可正
angular.fromJson boyitech AngularJS AngularJS 官方API AngularJS API
angular.fromJson 描述: 把Json字符串转为对象使用方法: angular.fromJson(json); 参数详解: Param Type Details json string JSON 字符串返回值: 对象, 数组, 字符串或者是一个数字示例: <!DOCTYPE HTML> <h
java-颠倒一个句子中的词的顺序。比如： I am a student颠倒后变成：student a am I bylijinnan java
public class ReverseWords { /** * 题目：颠倒一个句子中的词的顺序。比如： I am a student颠倒后变成：student a am I.词以空格分隔。 * 要求： * 1.实现速度最快,移动最少 * 2.不能使用String的方法如split,indexOf等等。 * 解答：两次翻转。 */ publ
web实时通讯 Chen.H Web 浏览器 socket 脚本
关于web实时通讯，做一些监控软件。由web服务器组件从消息服务器订阅实时数据，并建立消息服务器到所述web服务器之间的连接，web浏览器利用从所述web服务器下载到web页面的客户端代理与web服务器组件之间的socket连接，建立web浏览器与web服务器之间的持久连接；利用所述客户端代理与web浏览器页面之间的信息交互实现页面本地更新，建立一条从消息服务器到web浏览器页面之间的消息通路
[基因与生物]远古生物的基因可以嫁接到现代生物基因组中吗? comsci 生物
大家仅仅把我说的事情当作一个IT行业的笑话来听吧..没有其它更多的意思如果我们把大自然看成是一位伟大的程序员,专门为地球上的生态系统编制基因代码,并创造出各种不同的生物来,那么6500万年前的程序员开发的代码,是否兼容现代派的程序员的代码和架构呢?
oracle 外部表 daizj oracle 外部表 external tables
oracle外部表是只允许只读访问，不能进行DML操作，不能创建索引，可以对外部表进行的查询，连接，排序，创建视图和创建同义词操作。 you can select, join, or sort external table data. You can also create views and synonyms for external tables. Ho
aop相关的概念及配置 daysinsun AOP
切面(Aspect): 通常在目标方法执行前后需要执行的方法（如事务、日志、权限），这些方法我们封装到一个类里面，这个类就叫切面。连接点（joinpoint） spring里面的连接点指需要切入的方法，通常这个joinpoint可以作为一个参数传入到切面的方法里面（非常有用的一个东西）。通知（Advice）通知就是切面里面方法的具体实现，分为前置、后置、最终、异常环
初一上学期难记忆单词背诵第二课 dcj3sjt126com english word
middle 中间的，中级的 well 喔，那么；好吧 phone 电话，电话机 policeman 警察 ask 问 take 拿到；带到 address 地址 glad 高兴的，乐意的 why 为什么 China 中国 family 家庭 grandmother (外)祖母 grandfather (外)祖父 wife 妻子 husband 丈夫 da
Linux日志分析常用命令 dcj3sjt126com linux log
1.查看文件内容 cat -n 显示行号 2.分页显示 more Enter 显示下一行空格显示下一页 F 显示下一屏 B 显示上一屏 less /get 查询"get"字符串并高亮显示 3.显示文件尾 tail -f 不退出持续显示 -n 显示文件最后n行 4.显示头文件 head -n 显示文件开始n行 5.内容排序 sort -n 按照
JSONP 原理分析 fantasy2005 JavaScript jsonp jsonp 跨域
转自 http://www.nowamagic.net/librarys/veda/detail/224 JavaScript是一种在Web开发中经常使用的前端动态脚本技术。在JavaScript中，有一个很重要的安全性限制，被称为“Same-Origin Policy”（同源策略）。这一策略对于JavaScript代码能够访问的页面内容做了很重要的限制，即JavaScript只能访问与包含它的
使用connect by进行级联查询 234390216 oracle 查询父子 Connect by 级联
使用connect by进行级联查询 connect by可以用于级联查询，常用于对具有树状结构的记录查询某一节点的所有子孙节点或所有祖辈节点。来看一个示例，现假设我们拥有一个菜单表t_menu，其中只有三个字段：
一个不错的能将HTML表格导出为excel,pdf等的jquery插件 jackyrong jquery插件
发现一个老外写的不错的jquery插件，可以实现将HTML 表格导出为excel,pdf等格式，地址在： https://github.com/kayalshri/ 下面看个例子，实现导出表格到excel,pdf <html> <head> <title>Export html table to excel an
UI设计中我们为什么需要设计动效 lampcy UI UI设计
关于Unity3D中的Shader的知识首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，
如何禁止页面缓存 nannan408 html jsp cache
禁止页面使用缓存~ ------------------------------------------------ jsp:页面no cache： response.setHeader("Pragma","No-cache"); response.setHeader("Cache-Control","no-cach
以代码的方式管理quartz定时任务的暂停、重启、删除、添加等 Everyday都不同定时任务管理 spring-quartz
【前言】在项目的管理功能中，对定时任务的管理有时会很常见。因为我们不能指望只在配置文件中配置好定时任务就行了，因为如果要控制定时任务的 “暂停” 呢？暂停之后又要在某个时间点 “重启” 该定时任务呢？或者说直接 “删除” 该定时任务呢？要改变某定时任务的触发时间呢？ “添加” 一个定时任务对于系统的使用者而言，是不太现实的，因为一个定时任务的处理逻辑他是不
EXT实例 tntxia ext
（1）增加一个按钮 JSP: <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); Stri
数学学习在计算机研究领域的作用和重要性 xjnine Math
最近一直有师弟师妹和朋友问我数学和研究的关系，研一要去学什么数学课。毕竟在清华，衡量一个研究生最重要的指标之一就是paper,而没有数学，是肯定上不了世界顶级的期刊和会议的，这在计算机学界尤其重要！你会发现，不论哪个领域有价值的东西，都一定离不开数学！在这样一个信息时代，当google已经让世界没有秘密的时候，一种卓越的数学思维，绝对可以成为你的核心竞争力. 无奈本人实在见地