迷途小码

HDFS append原理与代码分析(Hadoop 2.0)

在append出现之前，一个file被close之后就是immutable的了，close之前是不能被read的。而在append出现之后，一个未close的file的last block对于read来说也是visible的，那么逻辑就复杂多了。

Apache社区的jira里有对HDFS append设计的详细文档（https://issues.apache.org/jira/secure/attachment/12445209/appendDesign3.pdf）。对于概念和逻辑在那个文档里讲的更详细些，那个文档更像是类似于bible或者C++ primer，可以当字典来查。这篇文章重点解释的是append的执行流程和前后逻辑，可能更容易读懂。

1，概念block和replica

首先区分两个概念：block和replica。在NN中我们叫block，在DN中我们叫replica。

在append问世之前，replica在DN中就两种状态：temporary和finalized。Replica被创建和写入时为temporary状态，当client发送完所有的byte请求DN关闭这个replica时，转化为finalized。 DN restart会删除处于temporary状态的replica。

在append问世之后，逻辑就复杂多了，状态也多了。首先明确block和replica的状态：（如何区分block和replica：在NN中叫block，在每个DN上叫replica）

NN中的block有下面4种状态：

static public enum BlockUCState {
    COMPLETE,
    UNDER_CONSTRUCTION,
    UNDER_RECOVERY,
    COMMITTED;
  }

注意NN中的block的状态是在内存中的，不会持久化到硬盘上。当NN重启后上次未关闭文件的last block将变成under construction，其余的为Complete。

1） complete:block的length和gs不再发生变化，并且NN已经收到至少有一个DN报告有finalized状态的replica（DN上的replica状态发生变化会通过RPC blockReceivedAndDeleted向NN报告）。一个complete的block会保存finalized的replica的locations在NN的内存中。只有当文件的所有的block都是complete的，该文件才能被close。

2） under_construction: 文件被create或者append时，正在被写入的block就处于under_construction状态。该状态的length和gs都不是finalized的，但是处在该状态的block对于read来说是visible的（具体多少byte是visible的，是通过client向DN询问得知的，这个在DFSInputStream的构造函数中会发起RPC调用获得，其实是某个DN所ACK的大小，该block其他replica所received的byte都大于任何DN ACK的大小，所以这个长度在任何replica上都是能够达到的）。

3） under_recovery：如果一个file的last block处于under_construction状态的时候，client异常退出，lease超过softLimit过期，那么该block就需要走下面要说的Lease recovery和Block recovery流程释放lease关闭file。那么正在走Lease recovery和Block recovery流程的block就处于under_recovery状态。

4） committed: client端在写文件的时候，每次请求新的block（addBlock RPC请求）或者close文件时，都会顺带把previous block进行commit操作（previous block从under_construction状态转化成committed状态）。这个时候Client已经把所有的该block的byte都发送给了DN组成的pipeline，已经收到ACK请求。但是NN还没有收到任何一个DN说有finalized replica。

DN中replica有下面5种状态：

1） Finalized(类FinalizedReplica表示)

2） RBW(类ReplicaBeingWritten表示，继承自ReplicaInPipeline)：刚刚被create或者append的replica，处在write的pipeline中，正在被写入。但是byte还是visible to read的。

3） RUR(类ReplicaUnderRecovery表示)：Lease过期之后发生Lease和Block recovery时replica所处的状态。

4） RWR(类ReplicaWaitingToBeRecovered表示)：如果一个DN挂掉并且重启之后，所有RBW的replica将会转换为RWR。RWR的replica不会出现在pipeline中，结果就是等着Lease recovery恢复。

5） Temporary(类ReplicaInPipeline表示)：DN之间传输replica（例如cluster rebalance）时，正在传输的就是处在Temporary。和RBW不同的是，它对read不是visible的，DN如果重启直接删除处于Temporary状态的replica。

NN中block的blockId,numBytes和GS会持久化到硬盘，但是block状态不会持久化到磁盘；然而DN中replica的状态会持久化到磁盘。所以NN如果发生restart，那么只有最后一个block会被加载成under construction，其他的都是complete；但是DN重启会加载已经持久化到磁盘的replica的状态。

有关block和replica的状态转换过程可以参考https://issues.apache.org/jira/secure/attachment/12445209/appendDesign3.pdf的9.1和9.2，那里讲的很详细。

2，write/append代码流程

对于Append一个文件，这个文件可能处于的状态就有很多种可能了：

1）上次关闭的时候是正常关闭，那么就是调用了DFSOutputStream.close()->FSNamesystem.completeFile()->commitOrCompleteLastBlock()并且finalizeINodeFileUnderConstruction()，那么NN中file的状态就是INode而不是INodeUnderConstruction，同时last block也一定被commit或者complete。如果是这样的文件，我们append的时候就省心了。

2）上次关闭的时候是非正常关闭（例如client异常退出等），那么就没有调用close及一系列的后续操作。那么NN中File元数据就处于INodeUnderConstruction状态，last block也没有被commit，而且绑在这个file身上的锁(Lease)也没有被释放。

注解：HDFS中的Lease相当于写锁，HDFS只给write加锁，也就是在client发送create()或者append()请求时，NN给这个file加锁，就是lease。然后client负责定期renew lease，而在NN端Lease monitor线程检测lease是否过期。而Lease expire有两个过期时间：softLimit（60s）和hardLimit（1hour）。NN的Lease monitor只会删除超过hardLimit的Lease，而超过softLimit的Lease虽然也已经过期，但是不删除，是通过下次append或者显式调用recoverLease RPC的时候检查是否超过softLimit来处理的。

在append（或者显式调用recoverLease）的时候，上次正常关闭的file，对应的lease一定不存在了；上次未正常关闭的file，对应的lease如果超过了softLimit，那么就要进行Lease recovery操作。

未正常关闭的file，NN端Lease超过softLimit而过期，那么可能再次打开这个file的client是原来的client，也可能是新的client。这个file上次未正常关闭，last block对应的三个replica也可能处在不同的状态，需要先Block recovery多个replica的信息达成一致状态才能进行append。说白了就是在append一个file的时候，如果检查出现了lease超过softLimit过期，那么就需要先给上次异常操作擦屁股，使其达到正常close状态，这个过程就是Lease recovery和Block recovery.

先回忆下HDFS的write流程所涉及到的RPC。Client先create一个文件，然后addBlock分配块及其存放的DN，建立pipeline，然后write数据。 HDFS的append操作类似：client先向NN发送append RPC，然后是addBlock，然后建立pipeline，然后write。

Client调用DistributedFilesystem.append()接口，然后向NN发送append RPC。

Append在NN的处理逻辑会走到FSNamesystem.startFileInternal()，跟create()走到一块去了，但是在内部处理逻辑上就有分支了。

对所有的append请求都执行这句：

recoverLeaseInternal(myFile,src,holder,clientMachine,false);

recoverLeaseInternal()这个函数是用来Lease recovery的，这个函数内部逻辑只处理那些处于under construction状态的file。因为如果file已经construction完毕（处于INode状态），那么上次关闭一定是走了准确的关闭流程（上述流程1），这样的不需要Lease recovery。

3，Lease recovery:

用一句最简单的话形容Lease recovery就是：上次没有正常关闭一个write的file，没有正常释放lease，last block的多个replica可能处于不同的状态（大小和generationStamp），现在需要由NN和DN配合来完成正常关闭file的流程，Lease recovery的最终结果和上次正常关闭是一样的。

private void recoverLeaseInternal(INode fileInode,
      String src, String holder, String clientMachine,boolean force)
      throwsIOException

这个函数执行recover lease操作：首先获取对应file的INodeFileUnderConstruction（此时该file一定处于under construction状态）；然后检查该file对应的lease是否一致，是否该Lease原来的holder又继续renew lease了；然后就看如果lease超过了softLimit就调用internalReleaseLease（）函数进行下一步操作。

boolean internalReleaseLease(Lease lease, String src,
      String recoveryLeaseHolder)throws AlreadyBeingCreatedException,
      IOException, UnresolvedLinkException {
    LOG.info("Recovering lease="+ lease + ", src="+ src);
    assert!isInSafeMode();
    asserthasWriteLock();
    INodeFile iFile = dir.getFileINode(src);
    if(iFile == null) {
      finalString message = "DIR* NameSystem.internalReleaseLease: "
        +"attempt to release a create lock on "
        + src +" file does not exist.";
      NameNode.stateChangeLog.warn(message);
      thrownew IOException(message);
    }
    if(!iFile.isUnderConstruction()) {
      finalString message = "DIR* NameSystem.internalReleaseLease: "
        +"attempt to release a create lock on "
        + src +" but file is already closed.";
      NameNode.stateChangeLog.warn(message);
      thrownew IOException(message);
    }
 
    INodeFileUnderConstruction pendingFile = (INodeFileUnderConstruction) iFile;
    intnrBlocks = pendingFile.numBlocks();
    BlockInfo[] blocks = pendingFile.getBlocks();
 
    intnrCompleteBlocks;
    BlockInfo curBlock =null;
    //首先检查NN保存的该file的block信息，看是否有block的状态不是complete
    for(nrCompleteBlocks =0; nrCompleteBlocks < nrBlocks; nrCompleteBlocks++) {
      curBlock = blocks[nrCompleteBlocks];
      if(!curBlock.isComplete())
        break;
      assertblockManager.checkMinReplication(curBlock) :
              "A COMPLETE block is not minimally replicated in "+ src;
    }
 
    // If there are no incomplete blocks associated with this file,
    // then reap lease immediately and close the file.
    if(nrCompleteBlocks == nrBlocks) {
      //所有block都是complete的：释放lease，file由INodeUnderConstruction变成INode，然后close file
      finalizeINodeFileUnderConstruction(src, pendingFile);
      NameNode.stateChangeLog.warn("BLOCK*"
        +" internalReleaseLease: All existing blocks are COMPLETE,"
        +" lease removed, file closed.");
      returntrue;  // closed!
    }
 
    // Only the last and the penultimate blocks may be in non COMPLETE state.
    // If the penultimate block is not COMPLETE, then it must be COMMITTED.
    // 执行到这说明有block不是complete的，所以得先修复block，再finalize & close file。
    if(nrCompleteBlocks < nrBlocks -2 ||
       nrCompleteBlocks == nrBlocks -2 &&
         curBlock !=null &&
         curBlock.getBlockUCState() != BlockUCState.COMMITTED) {
      finalString message = "DIR* NameSystem.internalReleaseLease: "
        +"attempt to release a create lock on "
        + src +" but file is already closed.";
      NameNode.stateChangeLog.warn(message);
      thrownew IOException(message);
    }
 
    // The last block is not COMPLETE, and
    // that the penultimate block if exists is either COMPLETE or COMMITTED
    finalBlockInfo lastBlock = pendingFile.getLastBlock();
    BlockUCState lastBlockState = lastBlock.getBlockUCState();
    BlockInfo penultimateBlock = pendingFile.getPenultimateBlock();
    booleanpenultimateBlockMinReplication;
    BlockUCState penultimateBlockState;
    if(penultimateBlock == null) {
      penultimateBlockState = BlockUCState.COMPLETE;
      // If penultimate block doesn't exist then its minReplication is met
      penultimateBlockMinReplication =true;
    }else {
      penultimateBlockState = BlockUCState.COMMITTED;
      penultimateBlockMinReplication =
        blockManager.checkMinReplication(penultimateBlock);
    }
    assertpenultimateBlockState == BlockUCState.COMPLETE ||
           penultimateBlockState == BlockUCState.COMMITTED :
           "Unexpected state of penultimate block in "+ src;
 
    switch(lastBlockState) {
    caseCOMPLETE:
      assertfalse : "Already checked that the last block is incomplete";
      break;
    caseCOMMITTED:
      // Close file if committed blocks are minimally replicated
      if(penultimateBlockMinReplication &&
          blockManager.checkMinReplication(lastBlock)) {
        finalizeINodeFileUnderConstruction(src, pendingFile);
        NameNode.stateChangeLog.warn("BLOCK*"
          +" internalReleaseLease: Committed blocks are minimally replicated,"
          +" lease removed, file closed.");
        returntrue;  // closed!
      }
      // Cannot close file right now, since some blocks
      // are not yet minimally replicated.
      // This may potentially cause infinite loop in lease recovery
      // if there are no valid replicas on data-nodes.
      String message ="DIR* NameSystem.internalReleaseLease: " +
          "Failed to release lease for file "+ src +
          ". Committed blocks are waiting to be minimally replicated."+
          " Try again later.";
      NameNode.stateChangeLog.warn(message);
      thrownew AlreadyBeingCreatedException(message);
    caseUNDER_CONSTRUCTION:
    caseUNDER_RECOVERY:
      finalBlockInfoUnderConstruction uc = (BlockInfoUnderConstruction)lastBlock;
      // setup the last block locations from the blockManager if not known
      if(uc.getNumExpectedLocations() == 0) {
        uc.setExpectedLocations(blockManager.getNodes(lastBlock));
      }
      // start recovery of the last block for this file
      //为这个Block生成新的GS，这个GS是在recovery过程中非常重要的变量。
      longblockRecoveryId = nextGenerationStamp();
      //重新分配lease的持有者。
      //如果是client explicit调用recoverLease RPC，那么新的lease持有者为    NAMENODE_LEASE_HOLDER，由NN作为代理持有该Lease。
      //如果是client通过调用append间接调用lease recovery，那么新的lease持有者为调用请求的client。
      lease = reassignLease(lease, src, recoveryLeaseHolder, pendingFile);
      //初始化Block recovery，首先从拥有replica的DN中选择一个primary DN作为代理发起这个过程。（具体过程在下面详细描述）
      uc.initializeBlockRecovery(blockRecoveryId);
      leaseManager.renewLease(lease);
      // Cannot close file right now, since the last block requires recovery.
      // This may potentially cause infinite loop in lease recovery
      // if there are no valid replicas on data-nodes.
      NameNode.stateChangeLog.warn(
                "DIR* NameSystem.internalReleaseLease: "+
                "File "+ src + " has not been closed."+
               " Lease recovery is in progress. "+
                "RecoveryId = "+ blockRecoveryId + " for block "+ lastBlock);
      break;
    }
    returnfalse;
  }

4，Block recovery:

这里要用到NN和DN之间的heartbeat机制。DN每隔3s向NN发送心跳包，NN收到心跳包，除了更新该DN信息，刷新lastUpdate外，还要给DN发送一些任务：lease recovery; block replication; block invalidation; update balancer bandwith。这些功能在DatanodeManager.handleHeartbeat()这个函数中完成。

以Lease recovery为例，在每个DatanodeDescriptor中有如下数据结构存放需要recover的block:

private BlockQueue recoverBlocks =
                                newBlockQueue();

NN端初始化block recovery的时候选定primary DN，就会把这个Block加入primary DN对应的这个queue里面。然后在NN处理来自primary DN的heartbeat RPC请求时，检查该DN对应的这个queue里面是不是有需要recover的block，然后组成recover block命令发送给对应的DN。

这个命令发送到primary DN之后怎么处理的呢？DN有两个组件负责处理RPC请求：BPServiceActor负责处理与NN的 RPC对话；而client与DN，DN与其他DN之间的RPC对话在DataNode主线程内部处理的。

DN在BPServiceActor.run()方法内部循环执行：connectToNNAndHandshake()和offerService()向NN发送心跳，并接收来自NN的response。然后看NN发送给DN的response里面有啥内容？这里我们主要讨论Block recovery命令。DN调用DataNode.recoverBlocks()，这个函数启动一个单独的线程去做Block recovery，这个线程执行DataNode.recoverBlock()函数。

（下面这个函数只会在primary DN上执行）

private void recoverBlock(RecoveringBlock rBlock) throws IOException {
    ExtendedBlock block = rBlock.getBlock();
    String blookPoolId = block.getBlockPoolId();
    DatanodeID[] datanodeids = rBlock.getLocations();
    List syncList =new ArrayList(datanodeids.length);
    interrorCount = 0;
 
    //遍历该Block所有的replica所在的DN
    for(DatanodeID id : datanodeids) {
      try{
        BPOfferService bpos = blockPoolManager.get(blookPoolId);
        DatanodeRegistration bpReg = bpos.bpRegistration;
        InterDatanodeProtocol datanode = bpReg.equals(id)?
            this: DataNode.createInterDataNodeProtocolProxy(id, getConf(),
                dnConf.socketTimeout, dnConf.connectToDnViaHostname);
        //分别向包含replica的DN发送initReplicaRecovery RPC命令，让包含replica的每台DN都去执行自己的initReplicaRecovery过程。这就跟DN底层的数据存储相关了，所以会调用到FsDatasetImpl.initReplicaRecovery()函数。这个函数的执行过程在下面。
        ReplicaRecoveryInfo info = callInitReplicaRecovery(datanode, rBlock);
        //下面就是判断来自其他DN报告的replica信息是否有效，如果一个replica的GS比这个block的要老，那显然这个replica不是有效的。
        if(info != null &&
            info.getGenerationStamp() >= block.getGenerationStamp() &&
            info.getNumBytes() >0) {
          //把有效的replica加入待同步的数组中。同步过程就是大家来商量一个一致的对外的长度。
          syncList.add(newBlockRecord(id, datanode, info));
        }
      }catch (RecoveryInProgressException ripE) {
        //任何DN抛出RecoveryInProgressException，primary DN将中止Recovery
        InterDatanodeProtocol.LOG.warn(
            "Recovery for replica "+ block + " on data-node "+ id
            +" is already in progress. Recovery id = "
            + rBlock.getNewGenerationStamp() +" is aborted.", ripE);
        return;
      }catch (IOException e) {
        ++errorCount;
        InterDatanodeProtocol.LOG.warn(
            "Failed to obtain replica info for block (="+ block
            +") from datanode (=" + id + ")", e);
      }
    }
 
    if(errorCount == datanodeids.length) {
      //所有的DN都抛出异常，当然也得终止了。
      thrownew IOException("All datanodes failed: block="+ block
          +", datanodeids=" + Arrays.asList(datanodeids));
    }
    //商量把这些replica弄到一致的状态，长度等。
    syncBlock(rBlock, syncList);
  }

上面说到，primary DN发送initReplicaRecovery RPC命令给包含replica的其他DN，然后其他DN上就开始执行Replica Recovery并把结果作为RPC response返回给primary DN。包含replica的每台DN都会执行这个函数：

static ReplicaRecoveryInfo initReplicaRecovery(String bpid,
      ReplicaMap map, Block block, long recoveryId) throws IOException

1）停止写：如果一个replica处于写状态（RBW），并且有对应的写线程，那么interrupted这个写线程并且等待结束。然后检查磁盘上的block文件(bytesOnDisk)和BR是否一致，检查crc文件是否有效。关闭block文件和crc文件。这样client写和block recovery就不能并发执行了。

2）如果该replica已经处于RUR状态，就是说该replica可能已经开始了recovery。那么就要检查开始的recovery和这次recovery是否是同一次。判断的标准就是那个NN发送给primary DN后扩散给每个具备replica的DN的recoveryId，也就是该block新的GS。如果这次的Id比该replica中的recoveryId要老，抛出RecoveryInProgressException异常。否则将处于RUR状态的replica的RecoveryID记为新的Id。

3）如果没有正在运行的Recovery，那么将replica改为RUR，设置它的RecoveryId为新的Id。任何从primary DN到其他DN的交互都用这个RecoveryId标识。对于并发的blockRecovery，新的Recovery永远kill老的Recovery，两个Recovery绝不能交叉执行。

如果没有发生异常的情况下，每台DN执行上述流程后给primary DN发送response（用InitReplicaRecoveryResponseProto标识）。

Primary DN收到来自其他DN发送过来的response之后怎么处理呢，又回到了DataNode.recoverBlock()函数里。（请看上面代码里的注释）

下面看看DataNode.syncBlock()这个函数怎么把状态和大小各异的replica同步成一致状态的。

道理其实很简单，就是先找到所有replica中具有的最好的状态。什么是更好的状态呢？排名从更好到更坏依次是：Finalized, RBW, RWR, RUR, Temporary。其实也就是说明了replica的持久化程度。如果所有replica中最好的状态是Finalized，那么就以这个Finalized的为准，其他和这个replica不一致的replica都被exclude在外；如果最好的状态是RBW或者RWR，那么就选择所有replica中最短的那个作为所有replica的recovery之后的长度。

void syncBlock(RecoveringBlock rBlock,
                         List syncList)throws IOException {
    ExtendedBlock block = rBlock.getBlock();
    finalString bpid = block.getBlockPoolId();
    DatanodeProtocolClientSideTranslatorPB nn =
      getActiveNamenodeForBP(block.getBlockPoolId());
    if(nn == null) {
      thrownew IOException(
          "Unable to synchronize block "+ rBlock + ", since this DN "
          +" has not acknowledged any NN as active.");
    }
 
    longrecoveryId = rBlock.getNewGenerationStamp();
    if(LOG.isDebugEnabled()) {
      LOG.debug("block="+ block + ", (length="+ block.getNumBytes()
          +"), syncList=" + syncList);
    }
 
    // syncList.isEmpty() means that all data-nodes do not have the block
    // or their replicas have 0 length.
    // The block can be deleted.
    if(syncList.isEmpty()) {
      nn.commitBlockSynchronization(block, recoveryId,0,
          true,true, DatanodeID.EMPTY_ARRAY,null);
      return;
    }
 
    // Calculate the best available replica state.
    ReplicaState bestState = ReplicaState.RWR;
    longfinalizedLength = -1;
    for(BlockRecord r : syncList) {
      assertr.rInfo.getNumBytes() > 0: "zero length replica";
      ReplicaState rState = r.rInfo.getOriginalReplicaState();
      if(rState.getValue() < bestState.getValue())
        bestState = rState;
      if(rState == ReplicaState.FINALIZED) {
        if(finalizedLength >0 && finalizedLength != r.rInfo.getNumBytes())
          thrownew IOException("Inconsistent size of finalized replicas. "+
              "Replica "+ r.rInfo + " expected size: "+ finalizedLength);
        finalizedLength = r.rInfo.getNumBytes();
      }
    }
 
    // Calculate list of nodes that will participate in the recovery
    // and the new block size
    List participatingList =new ArrayList();
    finalExtendedBlock newBlock = newExtendedBlock(bpid, block.getBlockId(),
        -1, recoveryId);
    switch(bestState) {
    caseFINALIZED:
      assertfinalizedLength > 0: "finalizedLength is not positive";
      for(BlockRecord r : syncList) {
        ReplicaState rState = r.rInfo.getOriginalReplicaState();
        if(rState == ReplicaState.FINALIZED ||
           rState == ReplicaState.RBW &&
                      r.rInfo.getNumBytes() == finalizedLength)
          participatingList.add(r);
      }
      newBlock.setNumBytes(finalizedLength);
      break;
    caseRBW:
    caseRWR:
      longminLength = Long.MAX_VALUE;
      for(BlockRecord r : syncList) {
        ReplicaState rState = r.rInfo.getOriginalReplicaState();
        if(rState == bestState) {
          minLength = Math.min(minLength, r.rInfo.getNumBytes());
          participatingList.add(r);
        }
      }
      newBlock.setNumBytes(minLength);
      break;
    caseRUR:
    caseTEMPORARY:
      assertfalse : "bad replica state: "+ bestState;
    }
 
    List failedList =new ArrayList();
    finalList successList = newArrayList();
    for(BlockRecord r : participatingList) {
      try{
        //通过InterDatanodeProtocol RPC向其他DN发送RPC更新replica的长度和GS。这个RPC是在block recovery中专用的。各个DN分别update长度和GS，然后把replica变成Finalized。
        r.updateReplicaUnderRecovery(bpid, recoveryId, newBlock.getNumBytes());
        successList.add(r);
      }catch (IOException e) {
        InterDatanodeProtocol.LOG.warn("Failed to updateBlock (newblock="
            + newBlock +", datanode=" + r.id +")", e);
        failedList.add(r.id);
      }
    }
 
    // If any of the data-nodes failed, the recovery fails, because
    // we never know the actual state of the replica on failed data-nodes.
    // The recovery should be started over.
    if(!failedList.isEmpty()) {
      StringBuilder b =new StringBuilder();
      for(DatanodeID id : failedList) {
        b.append("\n  "+ id);
      }
      thrownew IOException("Cannot recover "+ block + ", the following "
          + failedList.size() +" data-nodes failed {" + b + "\n}");
    }
 
    // Notify the name-node about successfully recovered replicas.
    finalDatanodeID[] datanodes = newDatanodeID[successList.size()];
    finalString[] storages = newString[datanodes.length];
    for(inti = 0; i < datanodes.length; i++) {
      finalBlockRecord r = successList.get(i);
      datanodes[i] = r.id;
      storages[i] = r.storageID;
    }
    //向NN发送RPC表明block recovery顺利完成，NN完成元数据持久化工作，commitOrCompleteBlock，然后close file。
    nn.commitBlockSynchronization(block,
        newBlock.getGenerationStamp(), newBlock.getNumBytes(),true, false,
        datanodes, storages);
  }

执行完Lease recovery和Block recovery之后，一个unclose的file被close掉了，这个文件恢复成正常close的状态了。那么这个时候执行append操作就和一个正常close的file没有区别了。然后就是通过addBlock获取replica所在DN，建立pipeline，向DN write数据，这个过程可以参考上一篇博客(HDFS write流程与代码分析)。

从这个流程中再一次深刻体会到一个系统级软件，60%以上的代码是在解决异常情况。一个unclose给我们后续的处理带来这么大的代码量。。。

参考文献：

https://issues.apache.org/jira/secure/attachment/12445209/appendDesign3.pdf

http://blog.csdn.net/chenpingbupt/article/details/7972589

你可能感兴趣的:(hadoop开发)

大数据基础知识-Hadoop、HBase、Hive一篇搞定原来是猪猪呀 hadoop 大数据分布式
HadoopHadoop是一个由Apache基金会所开发的分布式系统基础架构，其核心设计包括分布式文件系统（HDFS）和MapReduce编程模型；Hadoop是一个开源的分布式计算框架，旨在帮助用户在不了解分布式底层细节的情况下，开发分布式程序。它通过利用集群的力量，提供高速运算和存储能力，特别适合处理超大数据集的应用程序。Hadoop生态圈Hadoop生态圈是一个由多个基于Hadoop开发的相
Python实战，Hadoop开发环境，如何分析处理大数据好知识传播者 Python实例开发实战大数据 python hadoop 分析处理大数据
注意：本文的下载教程，与以下文章的思路有相同点，也有不同点，最终目标只是让读者从多维度去熟练掌握本知识点。下载教程：Python项目开发实战_大数据分析处理_编程案例解析实例详解课程教程.pdf在数据驱动的时代，大数据处理与分析已成为各行各业不可或缺的一部分。Python作为一种高效、易学的编程语言，凭借其丰富的数据科学库和强大的数据处理能力，在大数据处理领域发挥着重要作用。同时，Hadoop作为
大数据开发教程——构建Hadoop开发环境比屋大数据大数据架构师源码零基础教程 hadoop big data mapreduce
什么是Hadoop？Hadoop是由Apache基金会开发和维护的一个开源的分布式计算和存储框架。Hadoop为庞大的计算机集群提供可靠的、可伸缩的应用层计算和存储支持，它允许使用简单的编程模型跨计算机群集分布式处理大型数据集，并且支持在单台计算机到几千台计算机之间进行扩展。Hadoop使用Java开发，所以可以在多种不同硬件平台的计算机上部署和使用。其核心部件包括分布式文件系统(HadoopDF
大数据从入门到实战-hadoop开发环境搭建是草莓熊吖 hadoop java 大数据
配置JavaJDK1.下载JDK前往Oracle的官网下载JDK：JavaDownloads|Oracle我们可以先下载到本地，然后从Windows中将文件传入到虚拟机中。也可以复制链接地址，在Linux系统中下载，不过复制链接地址不能直接下载，因为Oracle做了限制，地址后缀需要加上它随机生成的随机码，才能下载到资源所以我们可以点击下载，然后暂停，最后在下载管理中复制链接地址就可以在Linux
hive:创建自定义python UDF -柚子皮- Database hive python udf
由于Hadoop框架是用Java编写的，大多数Hadoop开发人员自然更喜欢用Java编写UDF。然而，Apache也使非Java开发人员能够轻松地使用Hadoop，这是通过使用HadoopStreaming接口完成的!Java-UDFvs.Python-UDFJava实现UDF，需要引用包含HiveAPI的外部jar包，而Python无需引起其他外部包；Java实现UDF后，需要打包后才可被Hi
从零到一：Hadoop开发者的成长之路乌龙饼干 hadoop 大数据分布式
从零到一：Hadoop开发者的成长之路随着大数据时代的来临，Hadoop作为处理大规模数据的开源框架，已成为企业和开发者关注的焦点。那么，如何从零开始，逐步成长为一名优秀的Hadoop开发者呢？本文将为您揭示这一成长之路，并通过示例代码加以说明。一、初识Hadoop首先，作为一名Hadoop开发者，您需要了解Hadoop的基本概念、架构和组件。Hadoop是一个分布式系统基础架构，它允许用户在不了
大数据开发学习资料汇总比屋大数据大数据架构师源码零基础教程大数据 linux 运维
目录大数据系列HadoopHadoop权威指南Hadoop权威指南修订Hadoop实战Hadoop实战_2Hadoop源码分析大数据处理系统：Hadoop源代码情景分析Hadoop开发者入门专刊Hadoop技术内幕：深入解析MapReduce架构设计与实现原理Hadoop技术内幕：深入解析YARN架构设计与实现原理HadoopYARN权威指南Hadoop奶妈级基础入门视频课：Linux嵌入式Lin
Hadoop开发环境搭建柔雾 hadoop 大数据分布式
文章目录第1关：配置开发环境-JavaJDK的配置第2关：配置开发环境-Hadoop安装与伪分布式集群搭建hadoop-env.sh配置yarn-env.sh配置core-site.xml配置hdfs-site.xml文件配置mapred-site.xml文件配置yarn-site.xml配置第二关整体代码如下：第1关：配置开发环境-JavaJDK的配置mkdir/appcd/optlltar-z
Hadoop开发环境搭建紫苓
0、修改hostname1)修改/etc/hosts:192.168.184.130luozheng.bigdata2)修改/etc/hostnameluozheng.bigdata3)添加或是修改/etc/sysconfig/network#CreatedbyanacondaNETWORKING=yesHOSTNAME=luozheng.bigdata重启查看是否修改OKimage.png4)修
云计算实验1 基于Hadoop的云计算平台配置和map-reduce编程案例 MrNeoJeep #云计算 hadoop 云计算大数据
一、实验目的本实验考察学生Hadoop平台下的环境配置、分布式文件存储操作和管理以及基于Hadoop的分布式编程的设计与实现。二、实验环境Linux的虚拟机环境、线上操作视频和实验指导手册三、实验任务完成Hadoop开发环境安装、熟悉基本功能和编程方法。四、实验步骤请按照线上操作视频和实验知道手册，完成以下实验内容：实验1-1Hadoop安装部署(1)登录虚拟机(2)主机配置：主机名、网络和免密登
基于Hadoop开发的大数据实战项目——电商日志分享系统搞程序的菇凉 big data 大数据 database hadoop 数据库
项目介绍大数据电商日志平台项目以某电商网站真实的业务数据架构为基础，将数据从收集到使用通过前端应用程序，后端程序，数据分析，平台部署等多方位的闭环的业务实现。形成了一套符合教学体系的电商日志分析项目。bf_dataapi项目的主要目标有两个：第一个就是我们需要提供一个提供json数据的RestAPI；另外一个目标就是提供一个展示结果的demo页面。bf_dataapi使用spring+mybati
Windows下搭建hadoop 搭建本地hadoop开发环境生活的探路者
一、下载所需文件1.JDK下载地址：点击打开链接2.Hadoop下载地址：点击打开链接3.Windows下安装Hadoop工具下载地址:点击打开链接密码：yk9u二、jdk安装1.不会看这里点击打开链接三、Hadoop环境配置1.下载Hadoop，并解压到你的本地目录，我下载的是hadoop-2.5.2版本，解压在D:\hadoop\hadoop-2.5.2。四、配置Hadoop的环境变量1.计算
大数据开发学习Hadoop路线图（详细篇） qq_43713878 大数据大数据分析 Linux spark 数据挖掘 Hadoop 大数据开发大数据学习大数据大数据学习 Hadoop Linux 大数据开发
Hadoop发展到今天家族产品已经非常丰富，能够满足不同场景的大数据处理需求。作为目前主流的大数据处理技术，市场上很多公司的大数据业务都是基于Hadoop开展，而且对很多场景已经具有非常成熟的解决方案。作为开发人员掌握Hadoop及其生态内框架的开发技术，就是进入大数据领域的必经之路。下面详细介绍一下，学习Hadoop开发技术的路线图。Hadoop本身是用java开发的，所以对java的支持性非常
Hadoop(6) HDFS Alaskyed 大数据 #Hadoop 大数据 hadoop hdfs
Hadoop(6)HDFS文章目录Hadoop(6)HDFSHDFSHDFS介绍HDFS的定义HDFS的优缺点HDFS的应用场景HDFS的组成配置Hadoop开发环境HDFS的Shell命令HDFS操作HDFS上传操作HDFS下载操作HDFS的API操作开发软件中开发环境的搭建API测试HDFS上传和下载的流程客户端上传文件到HDFS流程(写流程)从HDFS下载文件的流程(读流程)元数据元数据介绍
基于ECLIPSE的HADOOP开发-----HDFS API学习 wly603 云计算 Hadoop eclipse hadoop api
详细见本人另一个博客，http://www.cnblogs.com/wly603/archive/2012/04/19/2457297.html谢谢
Hadoop开发环境搭建之Eclipse配置周五见大数据实践学习
0主要参考教程1、厦门大学数据库实验室2、JeffreyZhou的博客园整个hadoop是基于Java开发的，所以要对hadoop进行一些稍微底层一点的开发，还是得编写java程序。那就必然少不了eclipse这一开发工具了。1安装Eclipse1.1在Ubuntu中安装Eclipse，可从Ubuntu的软件中心直接搜索安装，在桌面左侧任务栏，点击“UbuntuSoftware”。1.2直接在右上
头歌Hadoop 开发环境搭建及HDFS初体验（第2关：配置开发环境 - Hadoop安装与伪分布式集群搭建）学不好python的小猫 hadoop hdfs 大数据 jdk
第1关：配置开发环境-JavaJDK的配置第2关：配置开发环境-Hadoop安装与伪分布式集群搭建第3关：HDFS系统初体验注：1头歌《Hadoop开发环境搭建及HDFS初体验》三关在一个实验环境下，需要三关从前往后按顺序评测，跳关或者实验环境结束后重新打开不能单独评测通过2复制粘贴请用右键粘贴，CTRL+C/V不管用哦~第1关：配置开发环境-JavaJDK的配置：解压：mkdir/appcd/o
Hadoop学习（一） MAC OS下安装Hadoop开发环境禅大师
在MACOS下安装和配置Hadoop开发环境相当简单。先去下载最新稳定版本的Hadoop的文件包，下载地址为：http://mirror.bjtu.edu.cn/apache/hadoop/common/hadoop-1.0.3/hadoop-1.0.3-bin.tar.gz下载后解压复制到/Users路径下。在/Users/hadoop-1.0.3/conf路径下修改以下四个文件：core-si
MapReduce序列化 Manfestain
序列化就是把内存中的对象转换成字节序列以便于存储到磁盘（持久化）和网络传输。反序列化就是将字节序列或者是持久化的数据转换成内存中的对象。内存中的对象只能本地进程使用，断掉后就消失了，也不能被发送到网络上的另一台机器，序列化可以将内存中的对象发送到远程机器。由于Java本身的序列化框架（Serializable）太重，序列化的对象包含了很多额外信息，不便于在网络中高效传输，Hadoop开发了自己的序
windows下搭建hadoop 搭建本地hadoop开发环境 Mark_ZQ 大数据大数据
一、下载所需文件1.JDK下载地址：https://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html2.Hadoop下载地址:https://pan.baidu.com/s/1fGclfAivPWVukRPDRfMUzA3.Windows下安装Hadoop工具下载地址:https://pan.b
Hadoop期末总复习赫嘉益华 hadoop 大数据 hdfs
目录第一章概述待续…第2章HDFS【问题1】分布式文件系统有很多，为何Hadoop要单独再开发一个HDFS？答：Hadoop开发了自己的分布式文件系统（HDFS）主要是为了满足其大数据处理框架的需求。下面是一些原因解释为何Hadoop选择单独开发HDFS：适应大数据处理：Hadoop旨在处理大规模数据集，传统的文件系统无法有效地处理这样的数据规模。HDFS是专门为大数据处理而设计的，它采用分布式存
linux系统下进行Hadoop开发环境配置(软件准备，防火墙，NTP服务器，环境变量，SSH免密，静态网卡） Matrix70 Hadoop hadoop 大数据分布式
VMware虚拟机新建虚拟机自动跳转到图形界面问题解决给一个小家伙装机时，我需要转到命令行界面进行操作，而它总是显示UI界面而不是命令行，我还以为是下载的VM版本不对，上网搜了搜，自己操作了一下，在新建完虚拟后登录，然后同时ctrl+alt+F5就能切换到命令行操作界面，卡了好一会，我这个脑子啊。参考链接：虚拟机怎么从图形界面转到命令行（去掉桌面）_vmware怎么进入命令行_虾仁猪心185的博客
Hadoop基础——MapReduce YuannaY 大数据组件 hadoop mapreduce 大数据
1.Hadoop序列化和反序列化及自定义bean对象实现序列化？1)序列化和反序列化的含义序列化是将内存中的对象转换为字节序列，以便持久化和网络传输。反序列化就是将字节序列或者是持久化数据转换成内存中的对象。Java的序列化是一个重量级序列化框架（Serializable），一个对象被序列化后，会附带很多额外的信息，不便于在网络中高效传输，所以hadoop开发了一套序列化机制（Writable）2
基于docker的Hadoop集群下实现最小生成树的mapreduce程序奋羊羊学习笔记技术分享 hadoop mapreduce 大数据 java 算法
01.技术背景在本文中，将为读者详细介绍如下内容：如何部署基于docker的hadoop开发环境mapreduce的基本开发流程与基本知识java开发的一些基本知识最小生成树算法相关的知识。文章中假定您已经具有如下知识背景：了解并掌握docker的相关操作开发过程中Linux相关的知识java的基本知识算法相关的基本知识，如图、树等基本概念在环境搭建与开发过程中，需要用到的资源如下：Hadoop安
Hadoop开发--MapReduce编程--示例(十) 无剑_君
一、手机号分类中国移动公司想要查看北京用户的打电话情况，手机信号来自附近的基站，要查看北京用户的信息得从全国所有的基站获取信息并一一筛选，假如我们不把用户按省市进行分别存放的话，每次我们想查看某个省市的信息时便需要从全国所有的基站信息中去一一查询，这样做，无疑效率是非常低的。假如我们把数据都分省市进行存放了，以后我们再想查看北京市的打电话信息便非常方便了，直接到存放北京市打电话信息的文件中查找
linux下java的环境配置 Sk1y 杂记 java linux
linux下java的环境配置文章目录linux下java的环境配置1.删除原有的java环境2.去官网下载相应的Java环境3.在Linux上进行解压4.修改~/.bashrc参考链接之前在大数据配置hadoop开发环境的时候，进行了相关的配置，所以还有印象，接下来对虚拟机ubuntu进行java的环境配置1.删除原有的java环境2.去官网下载相应的Java环境我用的是java8的环境，比较经
intellij idea使用maven构建hadoop开发环境 yc_yz
pom.xmlUTF-81.81.82.6.5org.apache.hadoophadoop-common${hadoop.version}org.apache.hadoophadoop-hdfs${hadoop.version}org.apache.hadoophadoop-mapreduce-client-core${hadoop.version}org.apache.hadoophadoop
Hadoop开发--IDEA(三) 无剑_君
一、插件安装源码地址https://github.com/fangyuzhong2016/HadoopIntellijPlugin代码下载gitclonehttps://github.com/fangyuzhong2016/HadoopIntellijPlugin.git注意：从Github上下载的源码需要经过编译才能使用编译①、目前Intellijpluginforhadoop的源码使用mave
hadoop开发应用 hello高world
hadoop开发应用一、文件上传创建input文件夹#hadoopfs-mkdir/input上传文件到input文件夹下#hadoopfs-putdat0102.dat/input/二、查询指定字符串出现次数1.编写代码如果忘记了，可以查看：$HADOOP_HOME/share/doc/hadoop/hadoop-mapreduce-client/hadoop-mapreduce-client-
Hadoop开发环境搭建普通网友 java java 后端
之前稍微了解了一下大数据方面的知识，在搭建环境的时候我很惆怅的，因为那时候没有弄好，刚好这几天有时间，于是把以前没有弄好的又来配置了一下，没想到居然成功了，这个过程走了很多的弯路，查阅了网上大量资料，终于直接也来整理一下了。hadoop是分为3种安装模式的，单机模式，伪分布模式和完全分布模式。众所周知，完全分布模式是企业真实开发用的，会需要多台电脑，这里没有条件，所以不讲解这个方面。伪分布模式就是
Spring中@Value注解，需要注意的地方无量 spring bean @Value xml
Spring 3以后,支持@Value注解的方式获取properties文件中的配置值，简化了读取配置文件的复杂操作 1、在applicationContext.xml文件(或引用文件中)中配置properties文件 <bean id="appProperty" class="org.springframework.beans.fac
mongoDB 分片开窍的石头 mongodb
mongoDB的分片。要mongos查询数据时候先查询configsvr看数据在那台shard上，configsvr上边放的是metar信息，指的是那条数据在那个片上。由此可以看出mongo在做分片的时候咱们至少要有一个configsvr,和两个以上的shard（片）信息。第一步启动两台以上的mongo服务 &nb
OVER(PARTITION BY)函数用法 0624chenhong oracle
这篇写得很好，引自 http://www.cnblogs.com/lanzi/archive/2010/10/26/1861338.html OVER(PARTITION BY)函数用法 2010年10月26日 OVER(PARTITION BY)函数介绍开窗函数 &nb
Android开发中，ADB server didn't ACK 解决方法一炮送你回车库 Android开发
首先通知：凡是安装360、豌豆荚、腾讯管家的全部卸载，然后再尝试。一直没搞明白这个问题咋出现的，但今天看到一个方法，搞定了！原来是豌豆荚占用了 5037 端口导致。参见原文章：一个豌豆荚引发的血案——关于ADB server didn't ACK的问题简单来讲，首先将Windows任务进程中的豌豆荚干掉，如果还是不行，再继续按下列步骤排查。 &nb
canvas中的像素绘制问题换个号韩国红果果 JavaScript canvas
pixl的绘制，1.如果绘制点正处于相邻像素交叉线，绘制x像素的线宽，则从交叉线分别向前向后绘制x/2个像素，如果x/2是整数，则刚好填满x个像素，如果是小数，则先把整数格填满，再去绘制剩下的小数部分，绘制时，是将小数部分的颜色用来除以一个像素的宽度，颜色会变淡。所以要用整数坐标来画的话（即绘制点正处于相邻像素交叉线时），线宽必须是2的整数倍。否则会出现不饱满的像素。 2.如果绘制点为一个像素的
编码乱码问题灵静志远 java jvm jsp 编码
1、JVM中单个字符占用的字节长度跟编码方式有关，而默认编码方式又跟平台是一一对应的或说平台决定了默认字符编码方式；2、对于单个字符：ISO-8859-1单字节编码，GBK双字节编码，UTF-8三字节编码；因此中文平台(中文平台默认字符集编码GBK)下一个中文字符占2个字节，而英文平台(英文平台默认字符集编码Cp1252(类似于ISO-8859-1))。 3、getBytes()、getByte
java 求几个月后的日期 darkranger calendar getinstance
Date plandate = planDate.toDate(); SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd"); Calendar cal = Calendar.getInstance(); cal.setTime(plandate); // 取得三个月后时间 cal.add(Calendar.M
数据库设计的三大范式（通俗易懂） aijuans 数据库复习
关系数据库中的关系必须满足一定的要求。满足不同程度要求的为不同范式。数据库的设计范式是数据库设计所需要满足的规范。只有理解数据库的设计范式，才能设计出高效率、优雅的数据库，否则可能会设计出错误的数据库. 目前，主要有六种范式：第一范式、第二范式、第三范式、BC范式、第四范式和第五范式。满足最低要求的叫第一范式，简称1NF。在第一范式基础上进一步满足一些要求的为第二范式，简称2NF。其余依此类推。
想学工作流怎么入手 atongyeye jbpm
工作流在工作中变得越来越重要，很多朋友想学工作流却不知如何入手。很多朋友习惯性的这看一点，那了解一点，既不系统，也容易半途而废。好比学武功，最好的办法是有一本武功秘籍。研究明白，则犹如打通任督二脉。系统学习工作流，很重要的一本书《JBPM工作流开发指南》。本人苦苦学习两个月，基本上可以解决大部分流程问题。整理一下学习思路，有兴趣的朋友可以参考下。 1 首先要
Context和SQLiteOpenHelper创建数据库百合不是茶 android Context创建数据库
一直以为安卓数据库的创建就是使用SQLiteOpenHelper创建,但是最近在android的一本书上看到了Context也可以创建数据库,下面我们一起分析这两种方式创建数据库的方式和区别,重点在SQLiteOpenHelper 一:SQLiteOpenHelper创建数据库: 1,SQLi
浅谈group by和distinct bijian1013 oracle 数据库 group by distinct
group by和distinct只了去重意义一样，但是group by应用范围更广泛些，如分组汇总或者从聚合函数里筛选数据等。譬如：统计每id数并且只显示数大于3 select id ,count(id) from ta
vi opertion 征客丶 mac opration vi
进入 command mode （命令行模式）按 esc 键再按 shift + 冒号注：以下命令中带 $ 【在命令行模式下进行】，不带 $ 【在非命令行模式下进行】一、文件操作 1.1、强制退出不保存 $ q! 1.2、保存 $ w 1.3、保存并退出 $ wq 1.4、刷新或重新加载已打开的文件 $ e 二、光标移动 2.1、跳到指定行数字
【Spark十四】深入Spark RDD第三部分RDD基本API bit1129 spark
对于K/V类型的RDD,如下操作是什么含义？ val rdd = sc.parallelize(List(("A",3),("C",6),("A",1),("B",5)) rdd.reduceByKey(_+_).collect reduceByKey在这里的操作，是把
java类加载机制 BlueSkator java 虚拟机
java类加载机制 1.java类加载器的树状结构引导类加载器 ^ | 扩展类加载器 ^ | 系统类加载器 java使用代理模式来完成类加载，java的类加载器也有类似于继承的关系，引导类是最顶层的加载器，它是所有类的根加载器，它负责加载java核心库。当一个类加载器接到装载类到虚拟机的请求时，通常会代理给父类加载器，若已经是根加载器了，就自己完成加载。虚拟机区分一个Cla
动态添加文本框 BreakingBad 文本框
<script> var num=1; function AddInput() { var str=""; str+="<input
读《研磨设计模式》-代码笔记-单例模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ public class Singleton { } /* * 懒汉模式。注意，getInstance如果在多线程环境中调用，需要加上synchronized，否则存在线程不安全问题 */ class LazySingleton
iOS应用打包发布常见问题 chenhbc ios iOS发布 iOS上传 iOS打包
这个月公司安排我一个人做iOS客户端开发，由于急着用，我先发布一个版本，由于第一次发布iOS应用，期间出了不少问题，记录于此。 1、使用Application Loader 发布时报错：Communication error.please use diagnostic mode to check connectivity.you need to have outbound acc
工作流复杂拓扑结构处理新思路 comsci 设计模式工作算法企业应用 OO
我们走的设计路线和国外的产品不太一样，不一样在哪里呢？国外的流程的设计思路是通过事先定义一整套规则(类似XPDL)来约束和控制流程图的复杂度(我对国外的产品了解不够多，仅仅是在有限的了解程度上面提出这样的看法)，从而避免在流程引擎中处理这些复杂的图的问题，而我们却没有通过事先定义这样的复杂的规则来约束和降低用户自定义流程图的灵活性，这样一来，在引擎和流程流转控制这一个层面就会遇到很
oracle 11g新特性Flashback data archive daizj oracle
1. 什么是flashback data archive Flashback data archive是oracle 11g中引入的一个新特性。Flashback archive是一个新的数据库对象，用于存储一个或多表的历史数据。Flashback archive是一个逻辑对象，概念上类似于表空间。实际上flashback archive可以看作是存储一个或多个表的所有事务变化的逻辑空间。
多叉树:2-3-4树 dieslrae 树
平衡树多叉树,每个节点最多有4个子节点和3个数据项,2,3,4的含义是指一个节点可能含有的子节点的个数,效率比红黑树稍差.一般不允许出现重复关键字值.2-3-4树有以下特征: 1、有一个数据项的节点总是有2个子节点(称为2-节点) 2、有两个数据项的节点总是有3个子节点(称为3-节
C语言学习七动态分配 malloc的使用 dcj3sjt126com c language malloc
/* 2013年3月15日15:16:24 malloc 就memory(内存) allocate(分配)的缩写本程序没有实际含义，只是理解使用 */ # include <stdio.h> # include <malloc.h> int main(void) { int i = 5; //分配了4个字节静态分配 int * p
Objective-C编码规范[译] dcj3sjt126com 代码规范
原文链接 : The official raywenderlich.com Objective-C style guide 原文作者 : raywenderlich.com Team 译文出自 : raywenderlich.com Objective-C编码规范译者 : Sam Lau
0.性能优化-目录 frank1234 性能优化
从今天开始笔者陆续发表一些性能测试相关的文章，主要是对自己前段时间学习的总结，由于水平有限，性能测试领域很深，本人理解的也比较浅，欢迎各位大咖批评指正。主要内容包括：一、性能测试指标吞吐量、TPS、响应时间、负载、可扩展性、PV、思考时间 http://frank1234.iteye.com/blog/2180305 二、性能测试策略生产环境相同基准测试预热等 htt
Java父类取得子类传递的泛型参数Class类型 happyqing java 泛型父类子类 Class
import java.lang.reflect.ParameterizedType; import java.lang.reflect.Type; import org.junit.Test; abstract class BaseDao<T> { public void getType() { //Class<E> clazz =
跟我学SpringMVC目录汇总贴、PDF下载、源码下载 jinnianshilongnian springMVC
----广告-------------------------------------------------------------- 网站核心商详页开发掌握Java技术，掌握并发/异步工具使用，熟悉spring、ibatis框架；掌握数据库技术，表设计和索引优化，分库分表/读写分离；了解缓存技术，熟练使用如Redis/Memcached等主流技术；了解Ngin
the HTTP rewrite module requires the PCRE library 流浪鱼 rewrite
./configure: error: the HTTP rewrite module requires the PCRE library. 模块依赖性Nginx需要依赖下面3个包 1. gzip 模块需要 zlib 库 ( 下载: http://www.zlib.net/ ) 2. rewrite 模块需要 pcre 库 ( 下载: http://www.pcre.org/ ) 3. s
第12章 Ajax（中） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Optimize query with Query Stripping in Web Intelligence blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Optimize+query+with+Query+Stripping+in+Web+Intelligence and a very straightfoward video http://www.sdn.sap.com/irj/scn/events?rid=/library/uuid/40ec3a0c-936
Java开发者写SQL时常犯的10个错误 tomcat_oracle java sql
1、不用PreparedStatements 　　有意思的是，在JDBC出现了许多年后的今天，这个错误依然出现在博客、论坛和邮件列表中，即便要记住和理解它是一件很简单的事。开发者不使用PreparedStatements的原因可能有如下几个：　　他们对PreparedStatements不了解　　他们认为使用PreparedStatements太慢了　　他们认为写Prepar
世纪互联与结盟有感阿尔萨斯
10月10日，世纪互联与（Foxcon）签约成立合资公司，有感。全球电子制造业巨头（全球500强企业）与世纪互联共同看好IDC、云计算等业务在中国的增长空间，双方迅速果断出手，在资本层面上达成合作，此举体现了全球电子制造业巨头对世纪互联IDC业务的欣赏与信任，另一方面反映出世纪互联目前良好的运营状况与广阔的发展前景。众所周知，精于电子产品制造（世界第一），对于世纪互联而言，能够与结盟