loser与你

HDFS集群的Namenode对数据块和数据节点的管理

- HDFS集群的Namenode对数据块和数据节点的管理
数据块管理
- 1.数据块
- 2.数据块副本
- 3.数据块的增、删、改、查
- 4.块汇报
数据节点管理
- 1.数据节点描述符
- 2.数据节点存储描述符
- 3.数据节点管理
- - (1)DatanodeManger
  - (2)添加和撤销Datanode
  - (3)Datanode的启动
  - (4)Datanode的心跳

Namenode维护着HDFS两个最重要的关系，第一关系是文件系统目录树，第二关系便是数据块和数据节点的关系了。
数据块和数据节点的对应关系，就是指定数据块的副本保存在哪些数据节点上的信息。这个信息是在Datanode启动时，由Datanode上报给Namenode的。Namenode收到后再去更新内存中的数据，以维护数据块和数据节点的对应关系。

数据块管理

1.数据块

Namenode中的数据块信息叫作数据块，Datanode中保存的数据块叫作副本。
INodeFile.blocks字段记录了一个HDFS文件拥有的所有数据块，也正是通过这个字段HDFS第一关系与第二关系发生了关联。
INodeFile.blocks字段是一个BlockInfo类型的数组，而BlockInfo是Block的子类，HDFS使用Block类来抽象Namenode中的数据块。

1.Block类
Block类用来唯一标识Namenode中的数据块，实现了Writable接口，可以序列化。还实现了Comparable接口，按照blockid大小排序。
Block类定义了三个字段：

private long blockId; //唯一标识这个Block对象
private long numBytes; //数据块大小
private long generationStamp; //数据块时间戳

2.BlockInfo类
继承自Block类，添加了两个字段：

private BlockCollection bc; //保存该数据块属于哪一个HDFS文件
private Object[] triplets; //保存该数据块的副本存储在哪些数据节点上。

其中，triplets[3 * i]保存的是这个数据块副本的第i个Datanode的DatanodeStorageInfo对象(描述Datanode上存储的对象)，而triplets[3 * i+1]为同一个Datanode存储上保存的前一个数据块对应的BlockInfo对象，triplets[3 * i+2]为同一个Datanode存储上保存的后一个数据块对应的BlockInfo对象。像一个双向链表，这样可以节省内存，也可以更方便地找一个Datanode上存的所有BlockInfo对象。

3.BlockInfoUnderConstruction类
继承自BlockInfo类。HDFS在加载fsimage时，如果当前加载的文件处于正在构建状态，则将该INodeFile的最后一个数据块设置为BlockInfoUnderConstruction，表面最后一个数据块正在构建中，而其他的数据块均为正常的BlockInfo。

4.BlocksMap类
BlocksMap类管理着Namenode上数据块的元数据，包括当前数据块属于哪个HDFS文件，以及当前数据块保存在哪些Datanode上。Namenode通过BlocksMap维护数据块副本与数据节点之间的对应关系。
当Datanode启动时，会对Datanode的本地磁盘进行扫描，并将当前Datanode上保存的数据块信息汇报到Namenode。Namenode收到Datanode的汇报信息后，会建立数据块与保存这个数据块的数据节点的对应关系，并将这个信息保存在BlocksMap中。因而获取某个数据块对应的HDFS文件，获取数据块保存在哪些数据节点上，都需要通过BlocksMap对象。
BlocksMap的实现是通过一个GSet对象维护了Block->BlockInfo的映射关系。GSet是Hadoop自己实现的一个有映射功能的集合。维护Block->BlockInfo的映射关系是因为BlockInfo保存数据节点的信息都是在Datanode启动时上报的，而Namenode启动时内存中保存的关于数据块的信息只有Block类中维护的那么多，随着Datanode不断上报数据块信息，将BlockInfo信息通过BlocksMap的映射去更新到Namenode对应的Block中。

5.Block类的状态
Namenode中的数据块有四种状态：

static public enum BlockUCState {
	COMPLETE,				//完成状态，数据块的长度和时间戳不再发生变化
	UNDER_CONSTRUCTION,		//构建状态，数据块正在被写入
	UNDER_RECOVERY,			//恢复状态，数据块正在进行租约恢复和数据块恢复
	COMMITTED;				//提交状态，表明客户端已经把该数据块的所有数据都发送到了Datanode组成的数据流管道中，且已经收到了ACK响应
}

2.数据块副本

HDFS没有使用枚举类给出数据块副本的状态，而是通过BlockManager中的数据结构、不同的数据块副本类以及副本所在Datanode的状态来记录数据块副本的状态。

1.BlockManager数据结构
Namenode使用BlockManager类来管理和维护所有与数据块相关的操作。BlockManager中用于保存不同状态数据块副本的数据结构如下：

//损坏的数据块副本集合
final CorruptReplicasMap corruptReplicas = new CorruptReplicasMap();

//等待删除的数据块副本集合
private final InvalidateBlocks invalidateBlocks;

//推迟操作的数据块副本集合
private final Set<Block> postponedMisreplicatedBlocks = Sets.newHashSet();

//多余的数据块副本集合
public final Map<String, LightWeightLinkedSet<Block>> excessReplicateMap =
	new TreeMap<String, LightWeightLinkedSet<Block>>();

//等待复制的数据块副本集合
public final UnderReplicatedBlocks neededReplications = new UnderReplicatedBlocks();

//已经生成复制请求的数据块副本
final PendingReplicationBlocks pendingReplications;

上面的数据结构可以看出，很多集合都是hadoop重新定义的。

(1)CorruptRelicasMap类
用于保存损坏的数据块副本集合，其保存的是损坏的数据块副本与保存这个副本的DataNode的对应关系（Block->Datanode的映射关系），同时还保存了这个副本损坏的原因。其底层使用一个TreeMap作为存储的数据结构。

(2)InvalidateBlocks类
用于保存等待删除的数据块副本集合。它使用TreeMap保存了Datanode到该Datanode上所有等待删除的副本集合的映射。使用LightWeightHashSet对象保存一个Datanode上所有等待删除的副本集合，而LightWeightHashSet是Hadoop定义的占用较少内存的HashSet的实现。

(3)UnderReplicatedBlocks类
用于保存所有等待复制的数据块副本集合。它维护了一个优先级队列priorityQueues，而priorityQueues是一个有着5个子队列的列表，每个子队列对应一个优先级。

优先级0：保存需要立刻备份的数据块，该数据块只有一个拷贝，或其拷贝挂了
优先级1：保存副本数极低的数据块，实际副本数与期望副本数的比例小于1:3时，加入该队列
优先级2：保存正处于备份中，但副本数还没达到优先级1队列中比例的数据块
优先级3：数据块副本数量足够，但副本的分布不是很好
优先级4：保存已经损坏的数据块，也就是该数据块对应的所有副本都损坏了

BlockManager会调用chooseUnderReplicatedBlocks()方法从UnderReplicatedBlocks对象中取出blocksToProcess个待复制的数据块，然后选择一个源数据节点和若各目标数据节点生成复制请求。chooseUnderReplicatedBlocks()方法代码如下：

public synchronized List<List<Block>> chooseUnderReplicatedBlocks(int blocksToProcess) {
	//初始化返回值列表，保存从每个优先级队列中取出的数据块
	List<List<Block>> blocksToReplicate = new ArrayList<List<Block>>(LEVEL);
	for(int i = 0; i < LEVEL; i++) {
		blocksToReplicate.add(new ArrayList<Block>());
	}
	
	//UnderReplicatedBlocks没有保存任何复制数据块
	if(size == 0) {
		return blocksToReplicate;
	}
	int blockCount = 0;
	//遍历UnderReplicatedBlocks中的所有优先级队列
	for(int priority = 0; priority < LEVEL; priority++) {
		//当前优先级队列保存的待复制数据块的迭代器
		BlockIterator neededReplicationsIterator = iterator(priority);
		//获取当前优先级队列的读取偏移值
		Integer replIndex = priorityToReplIdx.get(priority);
		
		//从priorityToReplIdx字段记录的读取游标开始读取数据
		for(int i = 0; i < replIndex && neededReplicationsIterator.hasNext(); i++) {
			neededReplicationsIterator.next();
		}
		//获取从当前队列中读取的副本数量
		blocksToProcess = Math.min(blocksToProcess, size());
		
		//如果读取了足够数量，则退出循环
		if(blockCount == blocksToProcess) {
			break;
		}

		//读取副本，并将副本保存到blocksToReplicate返回值列表中
		while(blockCount < blocksToProcess && neededReplicationsIterator.hasNext()) {
			Block block = neededReplicationsIterator.next();
			blocksToReplicate.get(priority).add(block);
			replIndex++;
			blockCount++;
		}	

		if(!neededReplicationsIterator.hasNext() && neededReplicationsIterator.getPriority() == LEVEL - 1) {
			//将所有优先级队列的读取偏移量重置为0，因为最近没有新添加的待复制副本
			for(int i = 0; i < LEVEL; i++){
				priorityToReplIdx.put(i, 0);
			}
			break;
		}
	
		//更新当前队列的读取游标
		priorityToReplIdx.put(priority, replIndex);
	}
	//返回所有待复制数据块
	return blocksToReplicate;
}

(4)PendingReplicationBlocks类
用于存放已经生成复制请求的数据块副本。将已经生成复制请求的数据块副本放入该类缓存，如果出现复制失败的情况，则将该数据块副本重新加入UnderReplicatedBlocks类。
PendingReplicationBlocks类保存了数据块到数据块的复制信息的映射关系Block->PendingBlockInfo，而PendingBlockInfo对象中保存了最近一次复制操作的时间戳，以及正在对当前数据块进行复制操作的数据节点。
数据块副本复制操作执行成功后，Datanode会通知BlockManager对象。BlockManager将这个新添加的副本信息加入内存中。由于副本已经成功地写入数据节点了，所以BlockManager从pendingReplications队列中删除该数据节点上的复制请求。
如果复制操作没有成功，则复制请求会一直保存在pendingReplications字段中，直到复制请求过期。

(5)postponedMisreplicatedBlocks队列
当Namenode发生错误并进行了Active与Standby切换时，Namenode中保存的多余副本不能直接被删除，需要先放入postponedMisreplicatedBlocks队列队列中，直到整个数据块的所有副本所在的Datanode都进行了块汇报。

2.数据块副本状态
数据块副本状态图如下所示：

3.复制和删除操作
computeDatanodeWork()方法执行复制操作和删除操作。代码如下：

int computeDatanodeWork() {
	//处于安全模式下不可以进行复制以及删除操作
	if(namesystem.isInSafeMode()) {
		return 0;
	}
	//获取集群中所有有效的Datanode的数量
	final int numlive = heartbeatManager.getLiveDatanodeCount();
	//计算出进行复制操作的数据块数量
	final int blocksToProcess = numlive * this.blocksReplWorkMultiplier;
	//计算出进行删除操作的Datanode数量
	final int nodesToProcess = (int)Math.ceil(numlive * this.blocksInvalidateWorkPct);
	//计算出需要进行备份的副本
	int workFound = this.computeReplicationWork(blocksToProcess);
	...
	//计算出需要进行删除的副本
	workFound += this.computeInvalidateWork(nodesToProcess);
	return workFound;
}

复制操作
复制操作由computeReplicationWork()方法执行，复制步骤为：
1.先从needReplications队列中选出blocksToProcess个需要复制的数据块
2.然后为这些数据块选择源节点source以及目标节点target
3.接下来为数据块生成名字节点指令，通过该指令向Datanode发送复制指令，复制指令通过下一次心跳带回到源节点source
4.Datanode收到心跳带回的复制指令之后，会执行数据块的复制操作，完成数据块的复制操作之后，Datanode会通过增量块汇报接口通知Namenode数据块已经成功复制了。

删除操作
删除操作由computeInvalidateWork()方法执行，删除步骤为：
1.先从invalidateBlocks队列中选出nodesToProcess个Datanode
2.然后在每个Datanode上选择blockInvalidateLimit个副本删除
3.接下来为待删除的副本生成删除指令，通过Datanode的心跳响应将删除指令带回Datanode节点
4.Datanode收到心跳带回的删除指令之后，会执行删除操作，完成数据块的删除操作之后，Datanode会通过增量块汇报接口通知Namenode数据块已经成功删除了。

3.数据块的增、删、改、查

1.添加数据块
当客户端向HDFS写入新文件时，如果写满了一个数据块，客户端会调用addBlock()方法向Namenode申请一个新的数据块。
这个请求到达Namenode后会由getAdditionalBlock()方法响应。getAdditionalBlock()方法首先会检查文件系统状态，然后为新添加的数据块选择存放副本的Datanode，最后构造Block对象并调用addBlock()方法将Block对象加入文件对应的INode对象中。
addBlock()方法会首先构造Block对应的BlockInfo对象，然后调用addBlockCollection()方法将这个BlockInfo对象加入blocksMap字段中存储，最后addBlock()方法会将BlockInfo对象添加到INodeFile对象的blocks字段中保存。

2.添加副本
当Datanode上写入了一个新的数据块副本或完成了一次数据块副本复制操作后，会向Namenode汇报该Datanode上添加了一个新的数据块副本。向Namenode中添加一个洗的副本后，会引起副本对应数据块状态的改变。在添加副本过程中会调用到addStroedBlock()方法。具体流程如下：

1.addStoredBlock()方法首先确认当前副本是否属于Namenode内存中的一个HDFS文件，如果不属于则直接返回。
2.然后会调用addBlock()方法在数据块与数据节点存储的映射中添加当前数据节点存储的信息，也就是在BlockInfo的triplets[]数组中添加当前DatanodeStroageInfo的信息。并在当前数据节点存储对象上添加这个数据块的信息，也就是在DatanodeStorageInfo的blockList链表中添加当前副本对应的BlockInfo对象。
3.如果新添加的副本对应数据块的状态为COMMITTED，addStoredBlock()方法会调用completeBlock()方法将Namenode中保存的当前数据块的状态由构建状态转换为正常状态。
4.addStoredBlock()方法会调用isNeedReplication()判断当前数据块的副本数量是否满足期望，也就是用户配置的副本系数。如果已经满足了期望，则该数据块没有必要进行复制操作，从neededReplications队列中删除了这个数据块；如果不满足期望，则调用updateNeededReplications()判断数据块需要复制的次数，然后更新neededReplications队列。
5.addStoredBlock()方法还会判断数据块当前的副本数量是否已经超出了期望，如果超出了则存在多余副本，将其放入excessReplicateMap队列中。
6.添加了新的副本之后，如果该数据块的有效副本数量已经超过了期望，addStoredBlock()方法会调用invalidateCorruptReplicas()将该数据块所有的损坏副本从Datanode上删除，也从blocksMap字段删除。

3.删除数据块
当客户端删除一个HDFS文件时，客户端会调用ClientProtocol.delete()删除HDFS文件或目录，并删除文件拥有的所有数据块，以及这个数据块在Datanode上的所有副本。这个请求会由deleteInternal()方法中响应。具体流程如下：

1.deleteInternal()方法首先会调用FSDirectory.delete()方法将文件对应的INode对象从文件系统目录树中删除，然后将这个INode下保存的所有数据块收集到collectedBlocks集合中。然后会调用removeBlocks()方法删除collectedBlocks集合中收集的所有数据块。
2.removeBlocks()方法会遍历collectedBlocks中的所有数据块，然后调用removeBlock()方法将该数据块从Naemnode中完全删除，包括blocksMap、postponedMisreplicatedBlocksCount、pendingReplications、neededReplications、corruptReplicas等队列中保存的该数据块的信息，及其副本信息。
3.之后removeBlocks()会调用addToInvalidates()方法将该数据块的所有副本从Datanode上删除。
4.addToInvalied()方法会遍历所有保存这个数据块副本的数据节点，然后将这个数据节点保存的副本加入invalidateBlocks队列中，然后对该队列执行后续删除操作即可。

4.删除副本
在HDFS文件被删除、副本数量过多、副本损坏这三种情况下会删除副本，数据块副本删除情况如下：

5.数据块的复制
数据块复制操作是HDFS保证数据块冗余存储的一个重要特性，也体现了HDFS故障检测和自动恢复的特性。
Namenode会在客户端完成了一个文件的写操作、更改副本系数、块汇报这三种情况下降一个数据块副本加入neededReplications队列以执行数据块副本复制流程。流程如下图：

4.块汇报

Namenode中数据块与数据节点的对应关系不持久化到fsimage文件中，而是由Datanode定期块汇报到Naemnode，然后由Namenode重建内存中数据块与数据节点的对应关系。
Datanode启动后，会与Namenode握手、注册以及向Namenode发送第一次全量块汇报，全量块汇报中包含了Datanode上存储的所有副本信息。之后Datanode以默认6小时的间隔向Namenode发送全量块汇报，同时以100 * 300(默认)秒间隔向Namenode发送增量块汇报，增量块汇报中包含了Datanode最近新添加的以及删除的副本信息。
可以看出，块汇报共有三种类型。第一次的全量块汇报、周期性的全量块汇报、周期性的增量块汇报。

1.第一次的全量块汇报
为了提高HDFS的启动速度，Namenode对于启动时发送的第一次全量块汇报，不会计算哪些元数据需要删除，不会计算无效副本，会将这些处理都推迟到后面的全量块汇报处理。
块汇报到达Namenode之后，Namenode判断是否该数据节点的第一次块汇报，如果是则调用processFirstReport()方法处理，该方法效率很高。其执行步骤如下：

1.首先processFirstReport()方法会调用addStoredBlockImmediate()方法将块汇报中所有有效的副本加入Namenode内存中
2.之后processFirstReport()方法会调用markBlockAsCorrupt()方法处理无效副本。
3.如果是在HDFS HA架构中，Datanode的心跳信息、全量块汇报以及增量块汇报会同时发送到Standby Namenode以及Active Namenode。Standby Namenode处理全量块汇报时，可能出现命名空间还未与Active Namenode同步的情况，此时需要将待处理副本暂时缓存起来，等到Standby Namenode完全加载editlog并更新命名空间后再处理。

第一步的addStoredBlockImmediate()方法是addStoredBlock()的快速版本。其并不考虑underReplication、overReplication、pendingReplications、corruptReplicas等队列的更新操作，也不用记录日志，而是直接在内存中添加这个副本的信息。
addStoredBlockImmediate()方法是通过调用addBlock()方法将数据块副本的信息加入Namenode内存中的。addBlock()方法首先会更新副本对应的BlockInfo对象的triplets[]数组，将当前数据块存储对应的DatanodeStorageInfo对象加入triplets[]数组中，然后将副本对应的BlockInfo添加到DatanodeStorageInfo的blockList队列中。

2.周期性的全量块汇报
对于周期性的全量块汇报，Namenode调用processReport()方法处理。该方法会调用reportDiff()方法，将块汇报中的副本u当前Namenode内存中记录的副本状态做对比，然后产生5个操作队列：
1.toAdd队列：如果上报副本与Namenode内存中记录的数据块有相同的时间戳以及长度，就将上报副本添加到toAdd队列中。对于toAdd队列中的元素，将执行添加副本的操作。
2.toRemove队列：如果副本在Namenode内存中的DatanodeStorageInfo对象上存在，但是块汇报时并没有上报该副本，就将副本添加到toRemove队列中。对于toRemove队列中的元素，将执行删除副本的操作。
3.toInvalidate队列：如果BlockManager的blocksMap字段中没有保存上报副本的信息，就将上报副本添加到toInvalidate队列中。对于toInvalidate队列中的元素，将其加入invalidateBlocks队列，然后触发Datanode节点删除该副本。
4.toCorrupt队列：如果上报副本的时间戳或文件长度不正常，就将上报副本添加到toCorrupt队列中。对于toCorrupt队列中的元素，执行删除损坏副本的操作。
5.toUC队列：如果上报副本对应的数据块处于构建状态，则构造一个ReplicateUnderConstruction对象，然后将该对象添加到reolicas队列中。

3.增量块汇报
Datanode调用blockReceivedAndDeleted()方法将短时间内接收到的副本或者删除的副本增量汇报给Namenode，Namenode收到了增量汇报后，会调用processIncrementalBlockReport()方法处理。
该方法会遍历增量汇报中的所有数据块，如果是新添加的数据块，则调用addBlock()方法处理添加请求。如果是删除的数据块，则调用removeStorageBlock()修改数据块与存储这个数据块的数据节点存储的对应关系。如果是接收中的副本，则调用processAndHandleRreportedBlock()方法处理。
对于增量汇报中新添加的副本，可能是客户端通过输入流管道写入了一个副本，也有可能是Namenode发起的复制操作。addBlock()方法会更改DatanodeDescriptor上的blockScheduled计数，然后从pendingReplications中移除这个数据节点上该数据块的复制请求，最后调用processAndHandleReportedBlock()处理副本为提交状态的数据块副本。

数据节点管理

数据节点就是Datanode，Namenode对于数据块与Datanode的映射关系需要在Datanode上报后动态构建。NameNode中有很大一部分逻辑是与Datanode相关的，因此对Datanode的管理是很重要的。

1.数据节点描述符

数据节点描述符DatanodeDescriptor是Namenode中对Datanode的抽象，继承自DatanodeInfo类。
1.DatanodeId
DatanodeId用于唯一标识一个Datanode，Datanode通过以及storageId进行标识的。
2.DatanodeInfo
扩展自DatanodeId，它携带了一些比较简单的Datanode信息，代码如下：

private long capacity;		//容量
private long dfsUsed;		//使用的空间
private long remaining;		//剩余空间
private long blockPoolUsed;		//数据块池使用量
private long cacheCapacity;		//缓存容量
private long cacheUsed;		//缓存使用量
private long lastUpdate;		//上次更新时间
private int xceiverCount;		//xceiver数量
private String location = NetworkTopology.DEFAULT_RACK;		//地址
private String softwareVersion;		//软件版本
protected AdminStates adminState;	//标识当前Datanode可能处于的状态

3.DatanodeDescriptor
DatanodeDescriptor是Namenode中用于描述一个Datanode信息的类，继承自DdatanodeInfo类，这个类只用在Namenode侧，对于Client是不可见的。
DatanodeDescriptor定义了很多字段，比较重要的有：
1.状态相关：isAlive记录当前Datanode是否有效；decommissioningStatus记录撤销操作时节点的状态；currApproxBlocksScheduled用于估计Ddatanode的负载。
2.指令相关：badnwidth记均衡器带宽；replicateBlocks保存要被复制的数据块以及复制操作的目标Datanode；recoverBlocks保存所有参与恢复过程的Datanode；invalidateBlocks保存要进行删除操作的副本。
3.缓存相关：pendingCached保存所有已经在当前Datanode上等待缓存的数据块；cached保存当前Datanode上已经缓存的数据块；pendingUncached中保存等待取消缓存的数据块。

2.数据节点存储描述符

DatanodeStorageInfo类描述Datanode上的一个存储，一个Datanode可以定义多个存储来保存数据块，且存储可以异构。
在HDFS2.6版本之前，Namenode内存中维护的第二关系是数据块与保存数据块副本的数据节点的对应关系，即Block与DatanodeDescriptor的对应关系。而在HDFS2.6版本中，为支持Datanode的异构存储，Namenode中维护的第二关系变成了数据块与保存数据块副本的数据节点存储的对应关系，即Block与DatanodeStorageInfo的对应关系，汇报的单位也有Datanode变成了DatanodeStorageInfo。
DatanodeStorageInfo中比较重要的字段有下面这些：
1.blockList：用来记录当前存储上保存的数据块副本链表的头节点。当Namenode成功接收一个数据块副本后，Namenode会调用addBlock()在该DatanodeStorageInfo的blockList中添加这个副本对应的BlockInfo对象。
2.heartbeatedSinceFailover：心跳，当Namenode出现失败时被置为false
3.blockContentsStale：标识是否是stale状态的存储，当一个存储时stale状态时，其上所有的副本都是stale状态的，stale状态数据块的所有副本是不可以执行删除操作的。当出现Active与Standby切换时，Namenode会将所有Datanode存储的heartbeatedSinceFailover以及blockContentsStale字段设置为false和true。然后扫描内存中的所有数据块，如果当前数据块有副本为stale状态，就将这个数据块放入postponedMisereplicatedBlocks队列中，直到所有stale状态的Datanode存储进行了块汇报。
4.storage元信息：dn字段是当前存储所在Datanode对应的DatanodeDescriptor对象；storageId是该存储在集群内唯一的标识符；storageType用于描述当前存储时什么类型

当Datanode向Namenode汇报该Datanode存储上接收了一个新的数据块副本时，BlockManager会调用addBlock()方法在Namenode的第二关系中添加这个副本与保存副本的Datanode存储的对应关系。流程如下：
1.addBlock()方法首先调用addStorage()将这个DatanodeStorageInfo对象添加到数据块所属的Datanodes存储列表中，也就是数据块对应的BlockInfo对象的triplets[]数组中。
2.addStorage()方法在triplets[]数组中找到插入当前DatanodeStorageInfo的位置，并插入。
3.然后调用listInsert()将数据块插入到Datanode存储管理的数据块链表中，也就是将BlockInfo对象加入Datanode存储对应的DatanodeStorageInfo对象的blockList链表中。
4.listInsert()方法将当前数据块对应的BlockInfo对象添加到Datanode存储管理的数据块链表中，插入的方法是直接插入在链表的头节点blockList之前，并用新添加数据块的BlockInfo对象替代原有的blockList作为数据块链表的头节点。

3.数据节点管理

(1)DatanodeManger

DatanodeManager类中记录了在Namenode上注册的Datanode，及这些Datanode在网络中的拓扑结构等信息。其定义的字段比较重要的有：
1.datanodeMap：维护StorageId->DatanodeDescriptor的映射关系
2.host2DataMap：维护host->DatanodeDescriptor的映射关系
3.networktopology：维护整个网络的拓扑结构

(2)添加和撤销Datanode

HDFS的一个重要特征就是具有弹性，当HDFS需要增加容量时，可以动态地向集群中添加新的Datanode。当HDFS需要减小规模时，可以动态地撤销已经存在的Datanode。
HDFS提供了dfs.hosts文件（又称include文件）以及dfs.hosts.exclude文件管理接入到HDFS的Datanode。include文件制定了可以连接到Namenode的Datanode列表，exclude文件指定了不能连接到Namenode的Datanode列表。
HDFS管理员将一个Datanode添加到集群中时，需要在include文件中添加一条该Datanode的记录，然后调用"dfsadmin -refreshNodes"命令刷新名字节点信息，最后才能启动 Datanode。同理，撤销节点通过exclude文件，管理员将要撤销的节点信息添加到exclude文件中，也是调用"dfsadmin -refreshNodes"命令，Namenode就会开始撤销节点操作。被撤销节点上的数据块会被复制到集群中的气体Datanode上，在这个过程中Datanode处于“正在撤销状态”，数据复制完成后Datanode状态会转变为“已撤销”，这时就可以关闭Datanode了。
执行"dfsadmin -refreshNodes"命令最终是由refreshNodes()方法响应。refreshNodes()方法首先调用refreshHostsReader()方法将include文件与exclude文件加载到hostFileManager对象中，之后调用refreshDatanodes()方法刷新所有的数据节点。
refreshDatanodes()方法会遍历datanodeMap字段中保存的所有DatanodeDescriptor对象。对于不可以连接到Namenode的Datanode，设置isAllowed字段为false，表示该Datanode不可以接入HDFS集群。对于exclude文件中的节点，需要进行撤销操作，调用startDecommission()开始撤销操作。
startDecommission()方法首先将当前Datanode对应的adminState设置为正在撤销状态，之后调用checkDecommissionState()检查撤销操作是否完成。如果完成则将adminState设置为已经撤销的状态。checkDecommissionState()方法会判断当前节点上保存的所有数据块是否满足副本系数，不满足则将数据块加入neededReplications进行复制操作。

(3)Datanode的启动

Datanode启动时，需要与Namenode进行握手、注册和数据块上报三个操作。
1.握手操作
由DatanodeProtocol的versionRequest()方法实现，它直接返回命名空间的信息。

2.注册
由DatanodeProtocol的registerDatanode()方法实现。Datanode会为注册的Datanode分配唯一的storageId作为标识。Datenode的注册情况有三种：
(1)该Datanode没有注册过
(2)该Datanode注册过，但这次注册使用了新的storageId，表明该数据节点的存储空间已经被清理过，原来的数据块副本都被删除了
(3)该Datanode注册过，这次是重复注册

第一种情况下，将该新注册的Datanode添加到datanodeMap以及host2DatanodeMap中，然后更新网络拓扑，检查节点是否撤销。
第二种情况下，要清理Namenode中这个Datanode的信息，然后再当作一个新的Datanode按第一种情况处理。
第三种情况下，此时只需要刷新注册的信息更新Namenode内存中保存的Datanode原有信息。

3.数据块上报
由DatanodeProtocol的processReport()方法实现。就是一次块汇报，要区分是不是第一次块汇报。

(4)Datanode的心跳

Datanode会以默认3秒的间隔向Namenode发送心跳。心跳信息包括：Datanode的注册信息、Datanode的存储信息、缓存信息、当前Datanode写文件的连接数、读写数据使用的线程数等信息。
Namenode收到心跳后，会返回一个心跳响应。心跳响应中包含一个DatanodeCommand的数组，同来携带Namenode对Datanode的指令，如数据块副本的复制、删除、缓存等指令。
Namenode还会周期性检测所有Datanode上报心跳的情况，对于长时间没有上报心跳的Datanode，则任务该Datanode出现故障不能正常工作，会删除该数据节点。
对Datanode发来的心跳请求处理分心跳新处理和心跳检测检查两部分。

1.心跳信息处理
Datanode发送的心跳信息由handleHeartbeat()方法处理。其处理步骤如下：
1.对发送心跳的数据节点进行检查。检查该数据节点是否能连接到Namenode，如果不能则抛出异常；检查该节点是否在Namenode上注册过，如果没有注册，则发出指令让Datanode重新发起注册请求。
2.Namenode从Datanode的心跳中取出负载信息，调用updateHeartbeat()方法更新整个集群的负载信息，同时也更新了节点的心跳事件。
3.Namenode为Datanode生成名字节点指令，如果当前名字节点还处于安全模式中，则返回空指令，否则依次生成数据块恢复指令、数据块复制指令、数据块删除指令、缓存相关指令、balancer带宽指令。最后将指令返回给Datanode。

2.心跳检查
HeartbeatManager类会定期调用heartbeatCheck()方法检查所有数据节点是否更新了心跳并执行了清理操作，间隔默认是5分钟。
在heartbeatCheck()方法中，如果发现Datanode在timeout的时间内还未上报心跳，则认为Datanode发生故障。对于故障的Datanode，将其从Namenode中删除这个数据节点的信息，以及这个数据节点保存的所有数据块副本信息。
同时，heartbeatCheck()方法会查找一个故障的Datanode存储，对于故障的Datanode存储，会删除故障Datanode存储上的所有数据块副本信息。

你可能感兴趣的:(Hadoop,hadoop,big,data,hdfs)

MySQL数据库中DDL 、DML 、DQL 、DCL 分别是什么超爱西西鸭 MySQL数据库数据库 mysql sql 运维
目录：一、DDL语句二、DML语句三、DQL语句四、DCL语句在MySQL数据库中，DDL、DML、DQL、DCL分别代表不同的语言类别，用于执行不同的数据库操作。一、DDL语句DDL（DataDefinitionLanguage）语句：数据定义语言，主要是进行定义/改变表的结构、数据类型、表之间的链接等操作。如创建、修改或删除表、视图、索引等。常用的语句关键字CREATE、DROP、ALTER、
ngx_http_escape_location_name 若云止水 nginx
定义在src\http\ngx_http.cstaticngx_int_tngx_http_escape_location_name(ngx_conf_t*cf,ngx_http_core_loc_conf_t*clcf){u_char*p;size_tlen;uintptr_tescape;escape=2*ngx_escape_uri(NULL,clcf->name.data,clcf->na
当细致剪裁遇上大语言模型：从数据匹配到卓越性能的奇幻之旅步子哥 AGI通用人工智能语言模型人工智能自然语言处理
在浩如烟海的人工智能技术中，构建和调教大语言模型（LLMs）的过程就像是一场精心策划的奇幻冒险。本文带您走进一个鲜为人知的领域——如何利用“量身定制”的数据，让模型在知识的海洋中游刃有余。我们将透过一篇最新的研究《TheBestInstruction-TuningDataareThoseThatFit》，探索如何通过选择与目标模型分布高度契合的数据来优化监督式微调（SFT）的效果，以及这一方法如何
MySQL 奇幻之旅：从基础探秘到高级应用魔法进阶的华夫饼进大厂 mysql 数据库
MySQL奇幻之旅：从基础探秘到高级应用魔法在数据库的神秘世界里，MySQL宛如一座蕴藏无尽宝藏的城堡，我怀揣着探索的热情与求知的渴望，踏上了这趟扣人心弦的学习征程。一、MySQL基础：城堡基石的雕琢（一）数据库与表的操作：构建数据的栖息之所数据库创建与管理：绘制数据城堡的蓝图：犹如精心绘制城堡的设计图，我熟练掌握了使用CREATEDATABASE语句创建数据库的魔法咒语，像CREATEDATAB
ngx_http_subrange_module 使用指南汤璞亚Heath
ngx_http_subrange_module使用指南ngx_http_subrange_moduleSplitonebigHTTP/Rangerequesttomultiplesubrangerequesets项目地址:https://gitcode.com/gh_mirrors/ng/ngx_http_subrange_module项目介绍ngx_http_subrange_module是一
原生微信小程序基础语法--快速总结一蓑烟雨，一任平生其他 apache 小程序微信小程序
没错换工作了他们小程序竟然用的原生qaq总结复习一波数据操作数据初始值Page({data:{milktea:[{_id:1,name:'生打椰'},{_id:2,name:'生打椰'},{_id:3,name:'生打椰'},]},}列表渲染在wx:for中，item默认来接收数组项，index默认来接收数组下标；可以通过wx:for-item和wx:for-index来修改默认的item和ind
数据权限访问控制（Apache Sentry） deepdata_cn 权限管理 apache sentry
ApacheSentry最初由Cloudera公司内部开发，针对Hadoop系统中的数据（主要是HDFS、Hive的数据）进行细粒度控制，对HDFS、Hive以及Impala有着良好的支持性。2013年Sentry成为Apache的孵化项目，为Hadoop集群元数据和数据存储提供集中、细粒度的访问控制。其架构包括DataEngine、Plugin、Policymetadata等部分，Plugin负
Mongodb配置分片服务器 czw0723 mongodb 数据库服务器
mongodb的sharding集群由以下3个服务组成：ShardsServer:每个shard由一个或多个mongod进程组成，用于存储数据ConfigServer:用于存储集群的Metadata信息，包括每个Shard的信息和chunks信息RouteServer:用于提供路由服务，由Client连接，使整个Cluster看起来像单个DB服务器另外，Chunks是指MongoDB中一段连续的数
python 利用pandas实现从CSV导出并格式化后写入.jsonl文件风_流沙 python工具备忘录 python pandas 开发语言
你可以使用pandas库来读取CSV文件，然后通过一些格式化操作将数据转换为JSONL格式并写入文件。JSONL（JSONLines）格式是一种每行一个JSON对象的文件格式。下面是一个示例，演示了如何使用pandas读取CSV文件，处理数据并将其导出到JSONL文件中：示例代码：importpandasaspdimportjson#读取CSV文件df=pd.read_csv('data.csv'
spring +kotlin 配置redis 和redis的常用方法 LCY133 spring后端 spring java 后端
在SpringBoot+Kotlin项目中，可以同时使用RedissonClient（提供分布式对象和高级功能）和RedisTemplate（SpringDataRedis的标准操作）。以下是完整配置和用法示例：1.添加依赖在build.gradle.kts中引入依赖：dependencies{//SpringDataRedisimplementation("org.springframework
《Operating System Concepts》阅读笔记：p408-p448 codists 读书笔记操作系统
《OperatingSystemConcepts》学习第34天，p408-p448总结，总计41页。一、技术总结2.page-replacementalgorithmInmemorymanagement,thealgorithmthatchooseswhichvictimframeofphysicalmemorywillbereplacedbyaneedednewframeofdata.(1)FI
【操作系统概念】【恐龙书】笔记六——第六章进程同步我岂是非人哉计算机操作系统
Chapter6:ProcessSynchronization问题的提出：彼此合作的进程之间可以用共享逻辑地址空间的方式来实现，共享逻辑地址空间，也就是共享代码区和数据区，会导致数据不一致，所以介绍一些避免数据不一致的机制。6.1BackgroundConcurrentaccesstoshareddatamayresultindatainconsistencyMaintainingdatacons
hbase表无法删除，命令行卡住问题处理 spring208208 大数据组件线上问题分析 hbase 数据库大数据
问题现象hbase表无法删除，命令行卡住1.activemaster日志出现超时WARNorg.apache.hadoop.hbase.master.procedure.TruncateTableProcedure:Retriableerrortryingtotruncatetable=xxxstate=TRUNCATE_TABLE_PRE_OPERATIONorg.apache.hadoop.h
springCloud集成tdengine(原生和mapper方式) 其一张小娟 spring cloud tdengine mybatis
第一种mapper方式，原生方式在主页看第二章一、添加pom文件com.zaxxerHikariCPcom.taosdata.jdbctaos-jdbcdriver3.5.3二、在nacos中配置好数据库连接spring:datasource:url:jdbc:TAOS://localhost:6030/testusername:rootpassword:yourPassWorddriver-cl
springCloud集成tdengine(原生和mapper方式) 其二原生篇张小娟 spring cloud tdengine spring
mapper篇请看另一篇文章一、引入pom文件com.taosdata.jdbctaos-jdbcdriver3.5.3二、在nacos中填写数据库各种value值tdengine:datasource:location:yourLocationusername:rootpassword:yourPassword三、编写TDengineUtil文件下方util文件里面，包含创建database的方
使用Docker部署RabbitMQ 九思x docker rabbitmq 容器
第一步：安装RabbitMQ#1.拉取镜像dockerpullrabbitmq:3.12.0-management#2.启动容器（开放端口+数据持久化）dockerrun-d\--name=share_rabbitmq\-p5672:5672\#AMQP协议端口-p15672:15672\#管理界面端口-v/opt/rabbitmq/data:/var/lib/rabbitmq\#数据持久化目录r
Appdata\Local Roaming LocalLow文件夹 ynchyong 系统运维 local Roaming LocalLow
自Vista及Win7开始，微软更改了原有的应用程序存储目录结构，（XP是ApplicationData）C\用户\用户名\Appdata,并分为Roaming,Local,及LocalLow三个文件夹.更改原因如下:优化登录速度根据使用安全级别分别访问不同文件夹Windows使用Local及LocalLow文件夹存放非漫游的应用程序数据（类似注册表Local_machine）及一些空间占用大无法
20190626_二次开发BarTender打印机_C#代码_一边读取TID_一边打印_打印机POSTEK weixin_30784141 c/c++数据库
demo代码如下:privatevoidbtnPrint_Click(objectsender,EventArgse){if(this.btnPrint.Text=="停止打印"){SetBtnPrintUIEnable();return;}//禁用界面上的相关按钮SetBtnPrintUIDisable();vardt=newDataTable();newTask(()=>{///开始的打印//
CI/CD(三) 安装nfs并指定k8s默认storageClass qq_41369135 kubernetes ci/cd docker nfs storageClass
一、NFS服务端安装（主节点10.60.0.20）1.安装NFS服务端sudoaptupdatesudoaptinstall-ynfs-kernel-server2.创建共享目录并配置权限sudomkdir-p/data/k8ssudochownnobody:nogroup/data/k8s#允许匿名访问sudochmod777/data/k8s3.配置NFS导出规则编辑/etc/exports文
学习Video.js 前端熊猫 Video Player 学习
查阅官方文档，学习video.js相关属性、回调与方法：播放器选项设置①标准的video标签属性②data-setup属性传递JSON③创建播放器实例以第二个参数配置videojs('my-player',{controls:true,autoplay:false,preload:'auto'});//修改选项varplayer=videojs('my-player');player.option
SAP-ABAP：SAP BW模块架构与实战应用详解爱喝水的鱼丶 ABAP开发之必须知道的 VIP详情查看专栏 SAP-ABAP开发基础详解开发语言 SAP ABAP ERP 开发运维
SAPBW模块架构与实战应用详解—##一、核心架构分层设计###1.数据仓库层（DataWarehousingLayer）|组件|功能说明|典型对象||-------------------|--------------------------------------------------------------------------|-----------------------------
SAP-ABAP：ABAP内存和SAP内存详细对比爱喝水的鱼丶 VIP详情查看专栏 SAP-ABAP开发基础详解 ABAP开发之必须知道的 SAP 运维 ABAP ERP
在SAPABAP中，内存数据（MemoryData）是一种临时存储机制，允许在同一会话或程序之间共享数据。内存数据存储在ABAP内存（ABAPMemory）或SAP内存（SAPMemory）中，具体取决于数据的生命周期和共享范围。以下是关于如何在SAP中保存和使用内存数据的详细说明：—##1.ABAP内存vsSAP内存###ABAP内存-作用范围:仅在当前内部会话（InternalSession）
一些工程实践中的tips litvm 经验分享经验分享
1，简单方法实现四舍五入实际项目中，经常会出现需要四舍五入的地方，比如采集温度temp，如果直接把float类型保存为小数点后1位。它会直接舍后面多余的位数，这样可能偏差会比较大。我们可以通过+0.5来实现四舍五入。比如：floattemp=30.6;//假设我们是扩大10倍保存//直接保存uint16_tmodbus_data.temp=temp*10;//结果就是30//+0.5uint16_
微服务即时通讯系统的实现（客户端）----（2） Smile丶凉轩项目微服务架构云原生
目录1.将protobuf引入项目当中2.前后端交互接口定义2.1核心PB类2.2HTTP接口定义2.3websocket接口定义3.核心数据结构和PB之间的转换4.设计数据中心DataCenter类5.网络通信5.1定义NetClient类5.2引入HTTP5.3引入websocket6.小结7.搭建测试服务器7.1创建项目7.2服务器引入http7.3服务器引入websocket7.4服务器引
数据结构-----队列磨十三数据结构算法 linux
顺序队列（Queue）一、队列核心概念1.基本特性先进先出（FIFO）：最早入队的元素最先出队操作限制：队尾（Rear）：唯一允许插入的位置队头（Front）：唯一允许删除的位置2.顺序队列结构typedefintDATATYPE;typedefstructqueue{DATATYPE*ptr;//存储空间基地址inttlen;//队列总容量inthead;//队头索引inttail;//队尾索引
Cesium实践（1）—— Hello World 迦南giser WebGIS #Cesium webgis cesium
文章目录前言Cesium是什么Cesium核心类ViewerSceneEntityDataSourceCollection创建第一个Cesium应用工程搭建Cesium版helloworld总结前言工作大半年来主要的技术栈是mapbox-gl和threejs，但是作为一名GIS专业毕业生，一直对Cesium充满兴趣。Cesium不仅保持了threejs的三维绘制能力，而且内置大量渲染地理数据的AP
uni-app的滚动加载 uni-load-more组件使用 weixin_42885875
手机端的滚动加载其实就是PC端的分页，触底之后页数加一调用接口，将返回的数据连接在原来的数据后面，就大致完成了。使用组件https://ext.dcloud.net.cn/plugin?id=29exportdefault{data(){return{ifBottomRefresh:false,loadmore:'more',contentText:{"contentdown":"加载更多数据",
access读取EXCEL文件,并根据动态生成表，完成报表的导入 MES先生 ACCESS VBA access
OptionCompareDatabasePublicsheetidAsString'报表IDPublictempAsString'获取年月时分秒PublictmpIAsInteger'对应EXCEL行PublictmpJAsInteger'对应EXCEL列PublicXlsAppAsObjectPublicXlsWorkbookAsObjectPublicXlsWorkSheetAsObject
Uni-App 双栏联动滚动组件开发详解 (电梯导航) FFF-X uni-app
本文基于提供的代码实现一个左右联动的滚动组件，以下是详细的代码解析与实现原理说明：{{item}}{{section.title}}{{para}}exportdefault{//组件参数定义props:{leftData:{//左侧导航数据type:Array,default:()=>['章节1','章节2','章节3','章节4','章节5','章节6'],},rightData:{//右侧内
spark explain如何使用 fzip Spark spark 执行计划
在Spark中，explain是分析SQL或DataFrame执行计划的核心工具，通过不同模式可展示查询优化和执行的详细信息，默认情况下，这个语句只提供关于物理计划的信息。以下是具体使用方法及不同模式的作用：1.explain的基本语法在Spark3.0及以上版本，explain支持多种模式参数，通过mode指定输出格式：#DataFrame调用方式df.explain(mode="simple"
书其实只有三类西蜀石兰类
一个人一辈子其实只读三种书，知识类、技能类、修心类。知识类的书可以让我们活得更明白。类似十万个为什么这种书籍，我一直不太乐意去读，因为单纯的知识是没法做事的，就像知道地球转速是多少一样（我肯定不知道），这种所谓的知识，除非用到，普通人掌握了完全是一种负担，维基百科能找到的东西，为什么去记忆？知识类的书，每个方面都涉及些，让自己显得不那么没文化，仅此而已。社会认为的学识渊博，肯定不是站在
《TCP/IP 详解，卷1：协议》学习笔记、吐槽及其他 bylijinnan tcp
《TCP/IP 详解，卷1：协议》是经典，但不适合初学者。它更像是一本字典，适合学过网络的人温习和查阅一些记不清的概念。这本书，我看的版本是机械工业出版社、范建华等译的。这本书在我看来，翻译得一般，甚至有明显的错误。如果英文熟练，看原版更好： http://pcvr.nl/tcpip/ 下面是我的一些笔记，包括我看书时有疑问的地方，也有对该书的吐槽，有不对的地方请指正： 1.
Linux—— 静态IP跟动态IP设置 eksliang linux IP
一.在终端输入 vi /etc/sysconfig/network-scripts/ifcfg-eth0 静态ip模板如下： DEVICE="eth0" #网卡名称 BOOTPROTO="static" #静态IP（必须） HWADDR="00:0C:29:B5:65:CA" #网卡mac地址 IPV6INIT=&q
Informatica update strategy transformation 18289753290
更新策略组件：标记你的数据进入target里面做什么操作，一般会和lookup配合使用，有时候用0,1,1代表 forward rejected rows被选中，rejected row是输出在错误文件里，不想看到reject输出，将错误输出到文件，因为有时候数据库原因导致某些column不能update，reject就会output到错误文件里面供查看，在workflow的
使用Scrapy时出现虽然队列里有很多Request但是却不下载，造成假死状态酷的飞上天空 request
现象就是：程序运行一段时间，可能是几十分钟或者几个小时，然后后台日志里面就不出现下载页面的信息，一直显示上一分钟抓取了0个网页的信息。刚开始已经猜到是某些下载线程没有正常执行回调方法引起程序一直以为线程还未下载完成，但是水平有限研究源码未果。经过不停的google终于发现一个有价值的信息，是给twisted提出的一个bugfix 连接地址如下http://twistedmatrix.
利用预测分析技术来进行辅助医疗蓝儿唯美医疗
2014年，克利夫兰诊所（Cleveland Clinic）想要更有效地控制其手术中心做膝关节置换手术的费用。整个系统每年大约进行2600例此类手术，所以，即使降低很少一部分成本，都可以为诊所和病人节约大量的资金。为了找到适合的解决方案，供应商将视野投向了预测分析技术和工具，但其分析团队还必须花时间向医生解释基于数据的治疗方案意味着什么。克利夫兰诊所负责企业信息管理和分析的医疗
java 线程(一)：基础篇 DavidIsOK java 多线程线程
&nbs
Tomcat服务器框架之Servlet开发分析 aijuans servlet
最近使用Tomcat做web服务器，使用Servlet技术做开发时，对Tomcat的框架的简易分析：疑问：为什么我们在继承HttpServlet类之后，覆盖doGet(HttpServletRequest req, HttpServetResponse rep)方法后，该方法会自动被Tomcat服务器调用，doGet方法的参数有谁传递过来？怎样传递？分析之我见： doGet方法的
揭秘玖富的粉丝营销之谜与小米粉丝社区类似 aoyouzi 揭秘玖富的粉丝营销之谜
玖富旗下悟空理财凭借着一个微信公众号上线当天成交量即破百万，第七天成交量单日破了1000万;第23天时，累计成交量超1个亿……至今成立不到10个月，粉丝已经超过500万，月交易额突破10亿，而玖富平台目前的总用户数也已经超过了1800万，位居P2P平台第一位。很多互联网金融创业者慕名前来学习效仿，但是却鲜有成功者，玖富的粉丝营销对外至今仍然是个谜。　　近日，一直坚持微信粉丝营销
Java web的会话跟踪技术百合不是茶 url会话 Cookie会话 Seession会话 Java Web 隐藏域会话
会话跟踪主要是用在用户页面点击不同的页面时,需要用到的技术点会话:多次请求与响应的过程 1,url地址传递参数,实现页面跟踪技术格式:传一个参数的 url?名=值传两个参数的 url?名=值 &名=值关键代码
web.xml之Servlet配置 bijian1013 java web.xml Servlet配置
定义： <servlet> <servlet-name>myservlet</servlet-name> <servlet-class>com.myapp.controller.MyFirstServlet</servlet-class> <init-param> <param-name>
利用svnsync实现SVN同步备份 sunjing SVN 同步 E000022 svnsync 镜像
1. 在备份SVN服务器上建立版本库 svnadmin create test 2. 创建pre-revprop-change文件 cd test/hooks/ cp pre-revprop-change.tmpl pre-revprop-change 3. 修改pre-revprop-
【分布式数据一致性三】MongoDB读写一致性 bit1129 mongodb
本系列文章结合MongoDB，探讨分布式数据库的数据一致性，这个系列文章包括：数据一致性概述与CAP 最终一致性(Eventually Consistency) 网络分裂(Network Partition)问题多数据中心(Multi Data Center) 多个写者(Multi Writer)最终一致性一致性图表(Consistency Chart) 数据
Anychart图表组件-Flash图转IMG普通图的方法白糖_ Flash
问题背景：项目使用的是Anychart图表组件，渲染出来的图是Flash的，往往一个页面有时候会有多个flash图，而需求是让我们做一个打印预览和打印功能，让多个Flash图在一个页面上打印出来。那么我们打印预览的思路是获取页面的body元素，然后在打印预览界面通过$("body").append(html)的形式显示预览效果，结果让人大跌眼镜：Flash是
Window 80端口被占用 WHY? bozch 端口占用 window
平时在启动一些可能使用80端口软件的时候，会提示80端口已经被其他软件占用，那一般又会有那些软件占用这些端口呢？下面坐下总结： 1、web服务器是最经常见的占用80端口的，例如：tomcat , apache , IIS , Php等等； 2
编程之美-数组的最大值和最小值-分治法（两种形式） bylijinnan 编程之美
import java.util.Arrays; public class MinMaxInArray { /** * 编程之美数组的最大值和最小值分治法 * 两种形式 */ public static void main(String[] args) { int[] t={11,23,34,4,6,7,8,1,2,23}; int[]
Perl正则表达式 chenbowen00 正则表达式 perl
首先我们应该知道 Perl 程序中，正则表达式有三种存在形式，他们分别是：匹配：m/<regexp>;/ （还可以简写为 /<regexp>;/ ，略去 m）替换：s/<pattern>;/<replacement>;/ 转化：tr/<pattern>;/<replacemnt>;
[宇宙与天文]行星议会是否具有本行星大气层以外的权力呢? comsci
举个例子: 地球,地球上由200多个国家选举出一个代表地球联合体的议会,那么现在地球联合体遇到一个问题,地球这颗星球上面的矿产资源快要采掘完了....那么地球议会全体投票,一致通过一项带有法律性质的议案,既批准地球上的国家用各种技术手段在地球以外开采矿产资源和其它资源........ &
Oracle Profile 使用详解 daizj oracle profile 资源限制
Oracle Profile 使用详解转一、目的： Oracle系统中的profile可以用来对用户所能使用的数据库资源进行限制，使用Create Profile命令创建一个Profile，用它来实现对数据库资源的限制使用，如果把该profile分配给用户，则该用户所能使用的数据库资源都在该profile的限制之内。二、条件：创建profile必须要有CREATE PROFIL
How HipChat Stores And Indexes Billions Of Messages Using ElasticSearch & Redis dengkane elasticsearch Lucene
This article is from an interview with Zuhaib Siddique, a production engineer at HipChat, makers of group chat and IM for teams. HipChat started in an unusual space, one you might not
循环小示例，菲波拉契序列，循环解一元二次方程以及switch示例程序 dcj3sjt126com c 算法
# include <stdio.h> int main(void) { int n; int i; int f1, f2, f3; f1 = 1; f2 = 1; printf("请输入您需要求的想的序列："); scanf("%d", &n); for (i=3; i<n; i
macbook的lamp环境 dcj3sjt126com lamp
sudo vim /etc/apache2/httpd.conf /Library/WebServer/Documents 是默认的网站根目录重启Mac上的Apache服务这个命令很早以前就查过了，但是每次使用的时候还是要在网上查：停止服务：sudo /usr/sbin/apachectl stop 开启服务：s
java ArrayList源码下 shuizhaosi888 ArrayList源码
版本 jdk-7u71-windows-x64 JavaSE7 ArrayList源码上：http://flyouwith.iteye.com/blog/2166890 /** * 从这个列表中移除所有c中包含元素 */ public boolean removeAll(Collection<?> c) {
Spring Security（08）——intercept-url配置 234390216 Spring Security intercept-url 访问权限访问协议请求方法
intercept-url配置目录 1.1 指定拦截的url 1.2 指定访问权限 1.3 指定访问协议 1.4 指定请求方法 1.1 &n
Linux环境下的oracle安装 jayung oracle
linux系统下的oracle安装本文档是Linux(redhat6.x、centos6.x、redhat7.x) 64位操作系统安装Oracle 11g(Oracle Database 11g Enterprise Edition Release 11.2.0.4.0 - 64bit Production)，本文基于各种网络资料精心整理而成，共享给有需要的朋友。如有问题可联系：QQ：52-7
hotspot虚拟机 leichenlei java HotSpot jvm 虚拟机文档
JVM参数 http://docs.oracle.com/javase/6/docs/technotes/guides/vm/index.html JVM工具 http://docs.oracle.com/javase/6/docs/technotes/tools/index.html JVM垃圾回收 http://www.oracle.com
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” noaighost Web node.js
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” 眼里的Node.JS 初初接触node是一年前的事，那时候年少不更事。还在纠结什么语言可以编写出牛逼的程序，想必每个码农都会经历这个月经性的问题：微信用什么语言写的？facebook为什么推荐系统这么智能，用什么语言写的？dota2的外挂这么牛逼，用什么语言写的？……用什么语言写这句话，困扰人也是阻碍
快速开发Android应用 rensanning android
Android应用开发过程中，经常会遇到很多常见的类似问题，解决这些问题需要花时间，其实很多问题已经有了成熟的解决方案，比如很多第三方的开源lib，参考 Android Libraries 和 Android UI/UX Libraries。编码越少，Bug越少，效率自然会高。但可能由于根本没听说过、听说过但没用过、特殊原因不能用、自己已经有了解决方案等等原因，这些成熟的解决
理解Java中的弱引用 tomcat_oracle java 工作面试
　不久之前，我面试了一些求职Java高级开发工程师的应聘者。我常常会面试他们说，“你能给我介绍一些Java中得弱引用吗？”，如果面试者这样说，“嗯，是不是垃圾回收有关的？”，我就会基本满意了，我并不期待回答是一篇诘究本末的论文描述。　　然而事与愿违，我很吃惊的发现，在将近20多个有着平均5年开发经验和高学历背景的应聘者中，居然只有两个人知道弱引用的存在，但是在这两个人之中只有一个人真正了
标签输出html标签" target="_blank">关于标签输出html标签 xshdch jsp
http://back-888888.iteye.com/blog/1181202 关于<c:out value=""/>标签的使用，其中有一个属性是escapeXml默认是true(将html标签当做转移字符，直接显示不在浏览器上面进行解析)，当设置escapeXml属性值为false的时候就是不过滤xml，这样就能在浏览器上解析html标签， &nb