王小禾

NameNode与DataNode删除块逻辑分析

1.背景

出现多次Unable to close file情况，具体如下。

Client：

Caused by: java.io.IOException: Unable to close file because the last block does not have enough number of replicas.

at org.apache.hadoop.hdfs.DFSOutputStream.completeFile(DFSOutputStream.java:2306)

at org.apache.hadoop.hdfs.DFSOutputStream.closeImpl(DFSOutputStream.java:2267)

at org.apache.hadoop.hdfs.DFSOutputStream.close(DFSOutputStream.java:2232)

at org.apache.hadoop.fs.FSDataOutputStream$PositionCache.close(FSDataOutputStream.java:72)

at org.apache.hadoop.fs.FSDataOutputStream.close(FSDataOutputStream.java:106)

NN：

2020-03-17 12:15:12,337 INFO org.apache.hadoop.hdfs.server.namenode.FSNamesystem: BLOCK* blk_xxx is COMMITTED but not COMPLETE(numNodes= 0 < minimum = 1) in file /xxx

找到文件所在的dn日志，发现量的Deleted BP-xxx blk_xxx。初步分析为dn同步处理nn删除块的命令耗时太久，心跳汇报超时，客户端向nn发送rpc请求检测到文件状态不是complete状态，因此报错。本文就dn和nn处理无效块的逻辑做梳理，并对上述问题的解决方案做评估。

2.删除逻辑分析

1.删除文件NameNode入口

NameNode响应客户端delete请求的入口是NameNodeRpcServer.delete() → FSNamesystem.delete()。这里一共分为两步：

从namespace中删除文件信息并收集删除的block
将待删除的块加到invalidateBlocks中

//FSNamesystem#delete

boolean delete(String src, boolean recursive, boolean logRetryCache)

throws IOException {

final String operationName = "delete";

BlocksMapUpdateInfo toRemovedBlocks = null;

checkOperation(OperationCategory.WRITE);

final FSPermissionChecker pc = getPermissionChecker();

writeLock();

boolean ret = false;

try {

checkOperation(OperationCategory.WRITE);

checkNameNodeSafeMode("Cannot delete " + src);

//1.从namespace中删除并返回收集到的block块

toRemovedBlocks = FSDirDeleteOp.delete(

this, pc, src, recursive, logRetryCache);

ret = toRemovedBlocks != null;

} catch (AccessControlException e) {

logAuditEvent(false, operationName, src);

throw e;

} finally {

writeUnlock(operationName);

}

//记录到editlog

getEditLog().logSync();

if (toRemovedBlocks != null) {

//2.删除数据块操作

removeBlocks(toRemovedBlocks); // Incremental deletion of blocks

}

logAuditEvent(true, operationName, src);

return ret;

}

第一步：从namespace中删除文件信息并收集待删除的block

// FSDirDeleteOp#unprotectedDelete

private static boolean unprotectedDelete(FSDirectory fsd, INodesInPath iip,

ReclaimContext reclaimContext, long mtime) {

assert fsd.hasWriteLock();

// 检查INode是否存在

// check if target node exists

INode targetNode = iip.getLastINode();

if (targetNode == null) {

return false;

}

// 修改快照

// record modification

final int latestSnapshot = iip.getLatestSnapshotId();

targetNode.recordModification(latestSnapshot);

// 核心部分：从namespace中移除INode

// Remove the node from the namespace

long removed = fsd.removeLastINode(iip);

if (removed == -1) {

return false;

}

// 更新父目录的mtime

// set the parent's modification time

final INodeDirectory parent = targetNode.getParent();

parent.updateModificationTime(mtime, latestSnapshot);

// 收集待删除的块并更新quota，reclaimContext对象就是最后要返回的待删除的块

// collect block and update quota

if (!targetNode.isInLatestSnapshot(latestSnapshot)) {

targetNode.destroyAndCollectBlocks(reclaimContext);

} else {

targetNode.cleanSubtree(reclaimContext, CURRENT_STATE_ID, latestSnapshot);

}

if (NameNode.stateChangeLog.isDebugEnabled()) {

NameNode.stateChangeLog.debug("DIR* FSDirectory.unprotectedDelete: "

+ iip.getPath() + " is removed");

}

return true;

}

第二步：将待删除的块加到invalidateBlocks中

// FSNamesystem#removeBlocks

void removeBlocks(BlocksMapUpdateInfo blocks) {

List toDeleteList = blocks.getToDeleteList();

Iterator iter = toDeleteList.iterator();

while (iter.hasNext()) {

writeLock();

try {

//循环收集到的块，这里双重限制：常量限制和块数量限制

for (int i = 0; i < blockDeletionIncrement && iter.hasNext(); i++) {

blockManager.removeBlock(iter.next());

}

} finally {

writeUnlock("removeBlocks");

}

上述需要注意的是 blockDeletionIncrement 值，每次默认限制删除块的增量是1000.

this.blockDeletionIncrement = conf.getInt(

DFSConfigKeys.DFS_NAMENODE_BLOCK_DELETION_INCREMENT_KEY,

DFSConfigKeys.DFS_NAMENODE_BLOCK_DELETION_INCREMENT_DEFAULT);

其中：

DFS_NAMENODE_BLOCK_DELETION_INCREMENT_KEY = "dfs.namenode.block.deletion.increment";

DFS_NAMENODE_BLOCK_DELETION_INCREMENT_DEFAULT = 1000;

做 blockDeletionIncrement 限制的目的是从blockManager中逐步删除块。并且每次到 blockDeletionIncrement 时，writeLock()会释放然后重新获取，确保其他服务能够进来。

// BlockManager#removeBlock

public void removeBlock(BlockInfo block) {

assert namesystem.hasWriteLock();

// No need to ACK blocks that are being removed entirely

// from the namespace, since the removal of the associated

// file already removes them from the block map below.

block.setNumBytes(BlockCommand.NO_ACK); //设置这个块的字节为LONG最大

addToInvalidates(block); //添加到invalidates集合中

removeBlockFromMap(block); //从BlocksMap中删除

// Remove the block from pendingReconstruction and neededReconstruction

//从需要构建和等待构建的block集合中删除

pendingReconstruction.remove(block);

neededReconstruction.remove(block, LowRedundancyBlocks.LEVEL);

postponedMisreplicatedBlocks.remove(block);

}

上述流程图如下。后续操作便是对无效块集合的处理。

2.RedundancyMonitor监控线程

hadoop3.2中的BlockManager$RedundancyMonitor（即hadoop2版本中的ReplicationMonitor）是随NameNode启动的后台线程。

"RedundancyMonitor" #46 daemon prio=5 os_prio=0 tid=0x00007fbf2dba2800 nid=0x8e00 waiting on condition [0x00007fbeb9481000]

java.lang.Thread.State: TIMED_WAITING (sleeping)

at java.lang.Thread.sleep(Native Method)

at java.lang.Thread.sleep(Thread.java:340)

at java.util.concurrent.TimeUnit.sleep(TimeUnit.java:386)

at org.apache.hadoop.hdfs.server.blockmanagement.BlockManager$RedundancyMonitor.run(BlockManager.java:4743)

at java.lang.Thread.run(Thread.java:745)

// BlockManager$RedundancyMonitor

private class RedundancyMonitor implements Runnable {

@Override

public void run() {

while (namesystem.isRunning()) {

try {

// Process recovery work only when active NN is out of safe mode.

if (isPopulatingReplQueues()) {

computeDatanodeWork(); //计算无效块的入口

processPendingReconstructions();

rescanPostponedMisreplicatedBlocks();

}

TimeUnit.MILLISECONDS.sleep(redundancyRecheckIntervalMs);

}

...

}

RedundancyMonitor线程周期性地进行块处理。其中无效块处理是在computeDatanodeWork方法中进行。

线程间隔时间是redundancyRecheckIntervalMs，其取值默认为3s：

DFS_NAMENODE_REDUNDANCY_INTERVAL_SECONDS_KEY = "dfs.namenode.redundancy.interval.seconds";

DFS_NAMENODE_REDUNDANCY_INTERVAL_SECONDS_DEFAULT = 3;

int computeDatanodeWork() {

// Blocks should not be replicated or removed if in safe mode.

// It's OK to check safe mode here w/o holding lock, in the worst

// case extra replications will be scheduled, and these will get

// fixed up later.

if (namesystem.isInSafeMode()) {

return 0;

}

final int numlive = heartbeatManager.getLiveDatanodeCount();

final int blocksToProcess = numlive

* this.blocksReplWorkMultiplier;

//从所有存活的DN中选择32%的节点进行处理

final int nodesToProcess = (int) Math.ceil(numlive

* this.blocksInvalidateWorkPct); //系数默认是32%

int workFound = this.computeBlockReconstructionWork(blocksToProcess);

// Update counters

namesystem.writeLock();

try {

//writeLock用来更新各种block的数量

this.updateState();

this.scheduledReplicationBlocksCount = workFound;

} finally {

namesystem.writeUnlock();

}

//从选中的32%的节点中进行无效块处理

workFound += this.computeInvalidateWork(nodesToProcess);

return workFound;

}

int computeInvalidateWork(int nodesToProcess) {

final List nodes = invalidateBlocks.getDatanodes();

Collections.shuffle(nodes);

//从32%集群dn数和总的无效块所在的dn数中取小者

nodesToProcess = Math.min(nodes.size(), nodesToProcess);

int blockCnt = 0;

for (DatanodeInfo dnInfo : nodes) {

//处理每一个datanode

int blocks = invalidateWorkForOneNode(dnInfo);

if (blocks > 0) {

blockCnt += blocks;

if (--nodesToProcess == 0) {

break;

}

return blockCnt;

}

处理每一个dn的无效块：

private int invalidateWorkForOneNode(DatanodeInfo dn) {

final List toInvalidate;

namesystem.writeLock();

try {

//...

try {

DatanodeDescriptor dnDescriptor = datanodeManager.getDatanode(dn);

//...

toInvalidate = invalidateBlocks.invalidateWork(dnDescriptor);

if (toInvalidate == null) {

return 0;

}

} catch(UnregisteredNodeException une) {

return 0;

}

} finally {

namesystem.writeUnlock();

}

return toInvalidate.size();

}

invalidateWorkForOneNode方法从BlockManager.invalidateBlocks中最多选择该dn的1000个（默认配置）数据块添加到具体的DataNodeDescriptor.invalidateBlocks（LightWeightHashSet结构）中，方法如下：

//InvalidateBlocks#invalidateWork

synchronized List invalidateWork(final DatanodeDescriptor dn) {

final long delay = getInvalidationDelay();

if (delay > 0) {

BlockManager.LOG

.debug("Block deletion is delayed during NameNode startup. "

+ "The deletion will start after {} ms.", delay);

return null;

}

//默认值是1000

int remainingLimit = blockInvalidateLimit;

final List toInvalidate = new ArrayList<>();

//从无效块集合中返回限制数量的无效块

if (nodeToBlocks.get(dn) != null) {

remainingLimit = getBlocksToInvalidateByLimit(nodeToBlocks.get(dn),

toInvalidate, numBlocks, remainingLimit);

}

//如果副本块处理完了还不到1000个，这时候再处理EC块（副本块 + EC块 <= 1000）

if ((remainingLimit > 0) && (nodeToECBlocks.get(dn) != null)) {

getBlocksToInvalidateByLimit(nodeToECBlocks.get(dn),

toInvalidate, numECBlocks, remainingLimit);

}

if (toInvalidate.size() > 0) {

if (getBlockSetsSize(dn) == 0) {

remove(dn);

}

//把blocksMap.invalidateBlocks选出限制个数的无效块添加到DatanodeDescriptor.invalidateBlocks中

dn.addBlocksToBeInvalidated(toInvalidate);

}

return toInvalidate;

}

//InvalidateBlocks#getBlocksToInvalidateByLimit

private int getBlocksToInvalidateByLimit(LightWeightHashSet blockSet,

List toInvalidate, LongAdder statsAdder, int limit) {

assert blockSet != null;

int remainingLimit = limit;

//获得限制个数的无效块

List polledBlocks = blockSet.pollN(limit);

remainingLimit -= polledBlocks.size();

toInvalidate.addAll(polledBlocks);

statsAdder.add(polledBlocks.size() * -1);

return remainingLimit;

}

上述blockInvalidateLimit的取 (20* 心跳值) = 60与所配置的1000二者中的最大值，即1000，从无效块集合中返回1000个无效块。

DFS_BLOCK_INVALIDATE_LIMIT_KEY = "dfs.block.invalidate.limit";

DFS_BLOCK_INVALIDATE_LIMIT_DEFAULT = 1000;

BlockManager$RedundancyMonitor流程如下：

3.DataNode心跳及IBR

BPServiceActor.offerService()方法是每个BlockPool汇报心跳的入口。

private void offerService() throws Exception {

// Now loop for a long time....

//

while (shouldRun()) {

try {

// 两大功能：发送心跳和块汇报

// Every so often, send heartbeat or block-report

//

// 心跳间隔3s 用当前时间与上次记录的下次心跳时间比较，到心跳时间了则开始处理

final boolean sendHeartbeat = scheduler.isHeartbeatDue(startTime);

HeartbeatResponse resp = null;

if (sendHeartbeat) {

// 所有的心跳信息包含以下4种：

// All heartbeat messages include following info:

// -- Datanode name

// -- data transfer port

// -- Total capacity

// -- Bytes remaining

//

boolean requestBlockReportLease = (fullBlockReportLeaseId == 0) &&

scheduler.isBlockReportDue(startTime);

if (!dn.areHeartbeatsDisabledForTests()) {

// 发送心跳，并将NN的返回结果放在resp中

resp = sendHeartBeat(requestBlockReportLease);

assert resp != null;

if (resp.getFullBlockReportLeaseId() != 0) {

// 关于Full Block Report，忽略

}

dn.getMetrics().addHeartbeat(scheduler.monotonicNow() - startTime);

// 关于HA，忽略

// ...

long startProcessCommands = monotonicNow();

// 处理NN返回的命令，如果处理失败则直接返回，不进行下一步的块汇报（增量块汇报、缓存汇报等）操作

if (!processCommand(resp.getCommands()))

continue;

}

if (!dn.areIBRDisabledForTests() &&

(ibrManager.sendImmediately()|| sendHeartbeat)) {

// 进行增量块汇报（在hadoop2.7中是reportReceivedDeletedBlocks方法）

ibrManager.sendIBRs(bpNamenode, bpRegistration,

bpos.getBlockPoolId());

}

// 其他处理

// There is no work to do; sleep until hearbeat timer elapses,

// or work arrives, and then iterate again.

ibrManager.waitTillNextIBR(scheduler.getHeartbeatWaitTime());

} catch(RemoteException re) {

// ...

} finally {

DataNodeFaultInjector.get().endOfferService();

}

processQueueMessages();

} // while (shouldRun())

}

上述增量快汇报（IBR）ibrManager.sendIBRs 直接调用 namenode.blockReceivedAndDeleted方法。具体在后文分析。

dn处理命令方法如下：

boolean processCommand(DatanodeCommand[] cmds) {

if (cmds != null) {

for (DatanodeCommand cmd : cmds) {

try {

// 循环处理每一条命令

if (bpos.processCommandFromActor(cmd, this) == false) {

return false;

}

} catch (IOException ioe) {

LOG.warn("Error processing datanode Command", ioe);

}

return true;

}

//processCommandFromActor调用processCommandFromActive

private boolean processCommandFromActive(DatanodeCommand cmd,

BPServiceActor actor) throws IOException {

switch(cmd.getAction()) {

//这里分各种命令进行处理，如删除无效块对应的是DNA_INVALIDATE

case DatanodeProtocol.DNA_INVALIDATE:

//

// Some local block(s) are obsolete and can be

// safely garbage-collected.

//

Block toDelete[] = bcmd.getBlocks();

try {

//这里调用FsDatasetImpl.invalidate删除

// using global fsdataset

dn.getFSDataset().invalidate(bcmd.getBlockPoolId(), toDelete);

} catch(IOException e) {

// Exceptions caught here are not expected to be disk-related.

throw e;

}

dn.metrics.incrBlocksRemoved(toDelete.length);

break;

//...

}

FsDatasetImpl.invalidate中删除块完毕后，调用BPOfferService.notifyNamenodeDeletedBlock通知NN删除完毕，其方法栈如下：

BPOfferService.notifyNamenodeDeletedBlock(ExtendedBlock, String) (org.apache.hadoop.hdfs.server.datanode)

DataNode.notifyNamenodeDeletedBlock(ExtendedBlock, String) (org.apache.hadoop.hdfs.server.datanode)

BlockSender.BlockSender(ExtendedBlock, long, long, boolean, boolean, boolean, DataNode, ...) (org.apache.hadoop.hdfs.server.datanode)

FsDatasetImpl.invalidate(String, ReplicaInfo) (org.apache.hadoop.hdfs.server.datanode.fsdataset.impl)

这里通知nn的步骤非常重要，代码如下：

synchronized void notifyNamenodeBlock(ReceivedDeletedBlockInfo rdbi,

DatanodeStorage storage, boolean isOnTransientStorage) {

addRDBI(rdbi, storage);

final BlockStatus status = rdbi.getStatus();

if (status == BlockStatus.RECEIVING_BLOCK) {

// the report will be sent out in the next heartbeat.

readyToSend = true;

} else if (status == BlockStatus.RECEIVED_BLOCK) {

// the report is sent right away.

triggerIBR(isOnTransientStorage);

}

主要根据块的不同状态来做不同的处理，块的状态有以下3种：

public enum BlockStatus {

RECEIVING_BLOCK(1), //正在被接收(写)的块

RECEIVED_BLOCK(2), //接收完毕(已被写完)的块

DELETED_BLOCK(3); //刚刚被删除的块

}

addRDBI方法是将增量块信息被加入到IBR Manager的pending IBR集合内，用于增量块汇报。对于已经写完的块，会立即触发增量块汇报；删除和正在接受的块则等待下次心跳时汇报。

NN端处理IBR将调用processIncrementalBlockReport，如下：

//NN处理增量块汇报，添加写锁。

//FSNamesystem#blockReceivedAndDeleted

public void processIncrementalBlockReport(final DatanodeID nodeID,

final StorageReceivedDeletedBlocks srdb)

throws IOException {

//加锁

writeLock();

try {

//根据block的3中不同的状态进行处理

blockManager.processIncrementalBlockReport(nodeID, srdb);

} finally {

writeUnlock("processIncrementalBlockReport");

}

综上所述，删除文件时，dn删除块及nn的处理的整个流程如下：

3.大量删除数据块的隐患及解决办法

当大量删除无效块时，BlockManager.invalidateBlocks集合变大，将会有更多的dn在进行心跳时收到删除块的命令。
dn删除完块后就会进行对应的增量块汇报（IBR）。每一个dn的一次IBR就会申请namespace一个全局锁，直至nn处理完该dn的所有block才释放锁。
当一次锁持有时间过长时，将会影响到其他文件的块的写操作。如一个RECEIVED_BLOCK在触发IBR时将会等待，不能及时更新该文件INodeFile中的文件状态。
客户端在进行指定次数的重试complete文件时，检查INodeFile中的文件状态没有COMPLETE，抛出不能关闭文件异常。（客户端complete发送RPC到NameNode的代码简单，不再粘贴）

解决办法：

加大客户端complete文件重试次数，这样可以给NN更多的时间处理IBR，如调到10：dfs.client.block.write.locateFollowingBlock.retries
增加RedundancyMonitor线程周期扫描间隔，减少无效块的增长速度，默认3s：dfs.namenode.redundancy.interval.seconds
减少NN一次给DN下达命令时block集合大小（默认1000），可以减少NN处理一次IBR时的持锁时间：dfs.block.invalidate.limit

另外社区关于的dn删除block改异步方法（issue HDFS-14997），暂未发现有助于本问题的改善。

浅谈MapReduce Android路上的人 Hadoop 分布式计算 mapreduce 分布式框架 hadoop
从今天开始，本人将会开始对另一项技术的学习，就是当下炙手可热的Hadoop分布式就算技术。目前国内外的诸多公司因为业务发展的需要，都纷纷用了此平台。国内的比如BAT啦，国外的在这方面走的更加的前面，就不一一列举了。但是Hadoop作为Apache的一个开源项目，在下面有非常多的子项目，比如HDFS，HBase,Hive，Pig,等等，要先彻底学习整个Hadoop，仅仅凭借一个的力量，是远远不够的。
Hadoop 傲雪凌霜，松柏长青后端大数据 hadoop 大数据分布式
ApacheHadoop是一个开源的分布式计算框架，主要用于处理海量数据集。它具有高度的可扩展性、容错性和高效的分布式存储与计算能力。Hadoop核心由四个主要模块组成，分别是HDFS（分布式文件系统）、MapReduce（分布式计算框架）、YARN（资源管理）和HadoopCommon（公共工具和库）。1.HDFS（HadoopDistributedFileSystem）HDFS是Hadoop生
Hadoop架构 henan程序媛 hadoop 大数据分布式
一、案列分析1.1案例概述现在已经进入了大数据(BigData)时代，数以万计用户的互联网服务时时刻刻都在产生大量的交互，要处理的数据量实在是太大了，以传统的数据库技术等其他手段根本无法应对数据处理的实时性、有效性的需求。HDFS顺应时代出现，在解决大数据存储和计算方面有很多的优势。1.2案列前置知识点1.什么是大数据大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的大量数据集合，
分享一个基于python的电子书数据采集与可视化分析 hadoop电子书数据分析与推荐系统 spark大数据毕设项目（源码、调试、LW、开题、PPT) 计算机源码社 Python项目大数据大数据 python hadoop 计算机毕业设计选题计算机毕业设计源码数据分析 spark毕设
作者：计算机源码社个人简介：本人八年开发经验，擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等，大家有这一块的问题可以一起交流！学习资料、程序开发、技术解答、文档报告如需要源码，可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|p
hbase介绍 CrazyL- 云计算+大数据 hbase
hbase是一个分布式的、多版本的、面向列的开源数据库hbase利用hadoophdfs作为其文件存储系统，提供高可靠性、高性能、列存储、可伸缩、实时读写、适用于非结构化数据存储的数据库系统hbase利用hadoopmapreduce来处理hbase、中的海量数据hbase利用zookeeper作为分布式系统服务特点：数据量大：一个表可以有上亿行，上百万列（列多时，插入变慢）面向列：面向列（族）的
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
Spark集群的三种模式 MelodyYN #Spark spark hadoop big data
文章目录1、Spark的由来1.1Hadoop的发展1.2MapReduce与Spark对比2、Spark内置模块3、Spark运行模式3.1Standalone模式部署配置历史服务器配置高可用运行模式3.2Yarn模式安装部署配置历史服务器运行模式4、WordCount案例1、Spark的由来定义：Hadoop主要解决，海量数据的存储和海量数据的分析计算。Spark是一种基于内存的快速、通用、可
月度总结 | 2022年03月 | 考研与就业的抉择 | 确定未来走大数据开发路线「已注销」个人总结 hadoop
一、时间线梳理3月3日，寻找到同专业的就业伙伴3月5日，着手准备Java八股文，决定先走Java后端路线3月8月，申请到了校图书馆的考研专座，决定暂时放弃就业，先准备考研，买了数学和408的资料书3月9日-3月13日，因疫情原因，宿舍区暂封，这段时间在准备考研，发现内容特别多3月13日-3月19日，大部分时间在刷Hadoop、Zookeeper、Kafka的视频，同时在准备实习的项目3月20日，退
HBase介绍 mingyu1016 数据库
概述HBase是一个分布式的、面向列的开源数据库,源于google的一篇论文《bigtable：一个结构化数据的分布式存储系统》。HBase是GoogleBigtable的开源实现，它利用HadoopHDFS作为其文件存储系统，利用HadoopMapReduce来处理HBase中的海量数据，利用Zookeeper作为协同服务。HBase的表结构HBase以表的形式存储数据。表有行和列组成。列划分为
Java中的大数据处理框架对比分析省赚客app开发者 java 开发语言
Java中的大数据处理框架对比分析大家好，我是微赚淘客系统3.0的小编，是个冬天不穿秋裤，天冷也要风度的程序猿！今天，我们将深入探讨Java中常用的大数据处理框架，并对它们进行对比分析。大数据处理框架是现代数据驱动应用的核心，它们帮助企业处理和分析海量数据，以提取有价值的信息。本文将重点介绍ApacheHadoop、ApacheSpark、ApacheFlink和ApacheStorm这四种流行的
Hadoop windows intelij 跑 MR WordCount piziyang12138
一、软件环境我使用的软件版本如下:IntellijIdea2017.1Maven3.3.9Hadoop分布式环境二、创建maven工程打开Idea,file->new->Project,左侧面板选择maven工程。(如果只跑MapReduce创建java工程即可，不用勾选Creatfromarchetype，如果想创建web工程或者使用骨架可以勾选)image.png设置GroupId和Artif
Hadoop学习第三课（HDFS架构--读、写流程）小小程序员呀~ 数据库 hadoop 架构 big data
1.块概念举例1：一桶水1000ml，瓶子的规格100ml=>需要10个瓶子装完一桶水1010ml，瓶子的规格100ml=>需要11个瓶子装完一桶水1010ml，瓶子的规格200ml=>需要6个瓶子装完块的大小规格，只要是需要存储，哪怕一点点，也是要占用一个块的块大小的参数：dfs.blocksize官方默认的大小为128M官网：https://hadoop.apache.org/docs/r3.
hadoop启动HDFS命令 m0_67401228 java 搜索引擎 linux 后端
启动命令：/hadoop/sbin/start-dfs.sh停止命令：/hadoop/sbin/stop-dfs.sh
【计算机毕设-大数据方向】基于Hadoop的电商交易数据分析可视化系统的设计与实现程序员-石头山大数据实战案例大数据 hadoop 毕业设计毕设
博主介绍：✌全平台粉丝5W+,高级大厂开发程序员，博客之星、掘金/知乎/华为云/阿里云等平台优质作者。【源码获取】关注并且私信我【联系方式】最下边感兴趣的可以先收藏起来，同学门有不懂的毕设选题，项目以及论文编写等相关问题都可以和学长沟通，希望帮助更多同学解决问题前言随着电子商务行业的迅猛发展，电商平台积累了海量的数据资源，这些数据不仅包括用户的基本信息、购物记录，还包括用户的浏览行为、评价反馈等多
分布式离线计算—Spark—基础介绍测试开发abbey 人工智能—大数据
原文作者：饥渴的小苹果原文地址：【Spark】Spark基础教程目录Spark特点Spark相对于Hadoop的优势Spark生态系统Spark基本概念Spark结构设计Spark各种概念之间的关系Executor的优点Spark运行基本流程Spark运行架构的特点Spark的部署模式Spark三种部署方式Hadoop和Spark的统一部署摘要：Spark是基于内存计算的大数据并行计算框架Spar
spark常用命令我是浣熊的微笑 spark
查看报错日志：yarnlogsapplicationIDspark2-submit--masteryarn--classcom.hik.ReadHdfstest-1.0-SNAPSHOT.jar进入$SPARK_HOME目录，输入bin/spark-submit--help可以得到该命令的使用帮助。hadoop@wyy:/app/hadoop/spark100$bin/spark-submit--
spark启动命令学不会又听不懂 spark 大数据分布式
hadoop启动：cd/root/toolssstart-dfs.sh，只需在hadoop01上启动stop-dfs.sh日志查看：cat/root/toolss/hadoop/logs/hadoop-root-datanode-hadoop03.outzookeeper启动：cd/root/toolss/zookeeperbin/zkServer.shstart，三台都要启动bin/zkServ
编程常用命令总结 Yellow0523 Linux BigData 大数据
编程命令大全1.软件环境变量的配置JavaScalaSparkHadoopHive2.大数据软件常用命令Spark基本命令Spark-SQL命令Hive命令HDFS命令YARN命令Zookeeper命令kafka命令Hibench命令MySQL命令3.Linux常用命令Git命令conda命令pip命令查看Linux系统的详细信息查看Linux系统架构(X86还是ARM，两种方法都可)端口号命令L
Hadoop常见面试题整理及解答叶青舟 Linux hdfs 大数据 hadoop linux
Hadoop常见面试题整理及解答一、基础知识篇：1.把数据仓库从传统关系型数据库转到hadoop有什么优势？答：（1）关系型数据库成本高，且存储空间有限。而Hadoop使用较为廉价的机器存储数据，且Hadoop可以将大量机器构建成一个集群，并在集群中使用HDFS文件系统统一管理数据，极大的提高了数据的存储及处理能力。（2）关系型数据库仅支持标准结构化数据格式，Hadoop不仅支持标准结构化数据格式
2025毕业设计指南：如何用Hadoop构建超市进货推荐系统？大数据分析助力精准采购计算机编程指导师 Java实战集 Python实战集大数据实战集课程设计 hadoop 数据分析 spring boot java 进货 python
✍✍计算机编程指导师⭐⭐个人介绍：自己非常喜欢研究技术问题！专业做Java、Python、小程序、安卓、大数据、爬虫、Golang、大屏等实战项目。⛽⛽实战项目：有源码或者技术上的问题欢迎在评论区一起讨论交流！⚡⚡Java实战|SpringBoot/SSMPython实战项目|Django微信小程序/安卓实战项目大数据实战项目⚡⚡文末获取源码文章目录⚡⚡文末获取源码基于hadoop的超市进货推荐系
Hadoop Common 之序列化机制小解猫君之上 #Apache Hadoop
1.JavaSerializable序列化该序列化通过ObjectInputStream的readObject实现序列化，ObjectOutputStream的writeObject实现反序列化。这不过此种序列化虽然跨病态兼容性强，但是因为存储过多的信息，但是传输效率比较低，所以hadoop弃用它。（序列化信息包括这个对象的类，类签名，类的所有静态，费静态成员的值，以及他们父类都要被写入）publ
深入理解hadoop(一)----Common的实现----Configuration maoxiao_jsd 深入理解----hadoop
属本人个人原创，转载请注明,希望对大家有帮助！！一,hadoop的配置管理a,hadoop通过独有的Configuration处理配置信息Configurationconf=newConfiguration();conf.addResource("core-default.xml");conf.addResource("core-site.xml");后者会覆盖前者中未final标记的相同配置项b
hadoop 0.22.0 部署笔记 weixin_33701564 大数据 java 运维
为什么80%的码农都做不了架构师？>>>因为需要使用hbase，所以开始对hbase进行学习。hbase是部署在hadoop平台上的NOSql数据库，因此在部署hbase之前需要先部署hadoop。环境：redhat5、hadoop-0.22.0.tar.gz、jdk-6u13-linux-i586.zipip192.168.1.128hostname：localhost.localdomain（
解决Windows环境下hadoop集群的运行_window运行hadoop,unknown hadoop01(4) 2401_84160087 大数据面试学习
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化资料的朋友，可以戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！org.apache.hadoophadoop-com
解决Windows环境下hadoop集群的运行_window运行hadoop,unknown hadoop01(3) 2401_84160087 大数据面试学习
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化资料的朋友，可以戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！xmlns:xsi="http://www.w3.or
深入解析HDFS：定义、架构、原理、应用场景及常用命令 CloudJourney hdfs 架构 hadoop
引言Hadoop分布式文件系统（HDFS，HadoopDistributedFileSystem）是Hadoop框架的核心组件之一，它提供了高可靠性、高可用性和高吞吐量的大规模数据存储和管理能力。本文将从HDFS的定义、架构、工作原理、应用场景以及常用命令等多个方面进行详细探讨，帮助读者全面深入地了解HDFS。1.HDFS的定义1.1什么是HDFSHDFS是Hadoop生态系统中的一个分布式文件系
Hadoop的搭建流程 lzhlizihang hadoop 大数据分布式
文章目录一、配置IP二、配置主机名三、配置主机映射四、关闭防火墙五、配置免密六、安装jdk1、第一步：2、第二步：3、第三步：4、第四步：5、第五步：七、安装hadoop1、上传2、解压3、重命名4、开始配置环境变量5、刷新配置文件6、验证hadoop命令是否可以识别八、全分布搭建7、修改配置文件core-site.xml8、修改配置文件hdfs-site.xml9、修改配置文件hadoop-en
hive搭建 -----内嵌模式和本地模式 lzhlizihang hive hadoop
文章目录一、内嵌模式（使用较少）1、上传、解压、重命名2、配置环境变量3、配置conf下的hive-env.sh4、修改conf下的hive-site.xml5、启动hadoop集群6、给hdfs创建文件夹7、修改hive-site.xml中的非法字符8、初始化元数据9、测试是否成功10、内嵌模式的缺点二、本地模式（最常用）1、检查mysql是否正常2、上传、解压、重命名3、配置环境变量4、修改c
Hadoop之mapreduce -- WrodCount案例以及各种概念 lzhlizihang hadoop mapreduce 大数据
文章目录一、MapReduce的优缺点二、MapReduce案例--WordCount1、导包2、Mapper方法3、Partitioner方法（自定义分区器）4、reducer方法5、driver（main方法）6、Writable（手机流量统计案例的实体类）三、关于片和块1、什么是片，什么是块？2、mapreduce启动多少个MapTask任务？四、MapReduce的原理五、Shuffle过
IAAS: IT公司去IOE-Alibaba系统构架解读 wishchin 心理学/职业 BigDataMini Spark PaaS
从Hadoop到自主研发，技术解读阿里去IOE后的系统架构原地址：......................云计算阿里飞天摘要：从IOE时代，到Hadoop与飞天并行，再到飞天单集群5000节点的实现，阿里一直摸索在技术衍变的前沿。这里，我们将从架构、性能、运维等多个方面深入了解阿里基础设施。【导读】互联网的普及，智能终端的增加，大数据时代悄然而至。在这个数据为王的时代，数十倍、数百倍的数据给各
Java实现的简单双向Map，支持重复Value superlxw1234 java 双向map
关键字：Java双向Map、DualHashBidiMap 有个需求，需要根据即时修改Map结构中的Value值，比如，将Map中所有value=V1的记录改成value=V2，key保持不变。数据量比较大，遍历Map性能太差，这就需要根据Value先找到Key，然后去修改。即：既要根据Key找Value，又要根据Value
PL/SQL触发器基础及例子百合不是茶 oracle数据库触发器 PL/SQL编程
触发器的简介; 触发器的定义就是说某个条件成立的时候，触发器里面所定义的语句就会被自动的执行。因此触发器不需要人为的去调用，也不能调用。触发器和过程函数类似过程函数必须要调用, 一个表中最多只能有12个触发器类型的,触发器和过程函数相似触发器不需要调用直接执行, 触发时间：指明触发器何时执行，该值可取： before：表示在数据库动作之前触发
[时空与探索]穿越时空的一些问题 comsci 问题
我们还没有进行过任何数学形式上的证明,仅仅是一个猜想..... 这个猜想就是; 任何有质量的物体(哪怕只有一微克)都不可能穿越时空,该物体强行穿越时空的时候,物体的质量会与时空粒子产生反应,物体会变成暗物质,也就是说,任何物体穿越时空会变成暗物质..(暗物质就我的理
easy ui datagrid上移下移一行商人shang js 上移下移 easyui datagrid
/** * 向上移动一行 * * @param dg * @param row */ function moveupRow(dg, row) { var datagrid = $(dg); var index = datagrid.datagrid("getRowIndex", row); if (isFirstRow(dg, row)) {
Java反射 oloz 反射
本人菜鸟，今天恰好有时间，写写博客，总结复习一下java反射方面的知识，欢迎大家探讨交流学习指教首先看看java中的Class package demo; public class ClassTest { /*先了解java中的Class*/ public static void main(String[] args) { //任何一个类都
springMVC 使用JSR-303 Validation验证杨白白 spring mvc
JSR-303是一个数据验证的规范，但是spring并没有对其进行实现，Hibernate Validator是实现了这一规范的，通过此这个实现来讲SpringMVC对JSR-303的支持。 JSR-303的校验是基于注解的，首先要把这些注解标记在需要验证的实体类的属性上或是其对应的get方法上。登录需要验证类 public class Login { @NotEmpty
log4j 香水浓 log4j
log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, HTML, DATABASE #log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, ROLLINGFILE, HTML #console log4j.appender.STDOUT=org.apache.log4j.ConsoleAppender log4
使用ajax和history.pushState无刷新改变页面URL agevs jquery 框架 Ajax html5 chrome
表现如果你使用chrome或者firefox等浏览器访问本博客、github.com、plus.google.com等网站时，细心的你会发现页面之间的点击是通过ajax异步请求的，同时页面的URL发生了了改变。并且能够很好的支持浏览器前进和后退。是什么有这么强大的功能呢？ HTML5里引用了新的API，history.pushState和history.replaceState，就是通过
centos中文乱码 AILIKES centos OS ssh
一、CentOS系统访问 g.cn ，发现中文乱码。于是用以前的方式：yum -y install fonts-chinese CentOS系统安装后，还是不能显示中文字体。我使用 gedit 编辑源码，其中文注释也为乱码。后来，终于找到以下方法可以解决，需要两个中文支持的包： fonts-chinese-3.02-12.
触发器 baalwolf 触发器
触发器(trigger)：监视某种情况，并触发某种操作。触发器创建语法四要素：1.监视地点(table) 2.监视事件(insert/update/delete) 3.触发时间(after/before) 4.触发事件(insert/update/delete) 语法： create trigger triggerName after/before
JS正则表达式的i m g bijian1013 JavaScript 正则表达式
g:表示全局（global)模式，即模式将被应用于所有字符串，而非在发现第一个匹配项时立即停止。 i:表示不区分大小写（case-insensitive）模式，即在确定匹配项时忽略模式与字符串的大小写。 m:表示
HTML5模式和Hashbang模式 bijian1013 JavaScript AngularJS Hashbang模式 HTML5模式
我们可以用$locationProvider来配置$location服务（可以采用注入的方式，就像AngularJS中其他所有东西一样）。这里provider的两个参数很有意思，介绍如下。 html5Mode 一个布尔值，标识$location服务是否运行在HTML5模式下。 ha
[Maven学习笔记六]Maven生命周期 bit1129 maven
从mvn test的输出开始说起当我们在user-core中执行mvn test时，执行的输出如下： /software/devsoftware/jdk1.7.0_55/bin/java -Dmaven.home=/software/devsoftware/apache-maven-3.2.1 -Dclassworlds.conf=/software/devs
【Hadoop七】基于Yarn的Hadoop Map Reduce容错 bit1129 hadoop
运行于Yarn的Map Reduce作业，可能发生失败的点包括 Task Failure Application Master Failure Node Manager Failure Resource Manager Failure 1. Task Failure 任务执行过程中产生的异常和JVM的意外终止会汇报给Application Master。僵死的任务也会被A
记一次数据推送的异常解决端口解决 ronin47 记一次数据推送的异常解决
　　需求：从db获取数据然后推送到B 程序开发完成，上jboss,刚开始报了很多错，逐一解决，可最后显示连接不到数据库。机房的同事说可以ping 通。　　自已画了个图，逐一排除，把linux 防火墙　和　setenforce　设置最低。　　　service iptables stop
巧用视错觉-UI更有趣 brotherlamp UI ui视频 ui教程 ui自学 ui资料
我们每个人在生活中都曾感受过视错觉（optical illusion）的魅力。视错觉现象是双眼跟我们开的一个玩笑，而我们往往还心甘情愿地接受我们看到的假象。其实不止如此，视觉错现象的背后还有一个重要的科学原理——格式塔原理。格式塔原理解释了人们如何以视觉方式感觉物体，以及图像的结构，视角，大小等要素是如何影响我们的视觉的。在下面这篇文章中，我们首先会简单介绍一下格式塔原理中的基本概念，
线段树-poj1177-N个矩形求边长（离散化+扫描线） bylijinnan 数据结构算法线段树
package com.ljn.base; import java.util.Arrays; import java.util.Comparator; import java.util.Set; import java.util.TreeSet; /** * POJ 1177 (线段树+离散化+扫描线)，题目链接为http://poj.org/problem?id=1177
HTTP协议详解 chicony http协议
引言
Scala设计模式 chenchao051 设计模式 scala
Scala设计模式我的话：在国外网站上看到一篇文章，里面详细描述了很多设计模式，并且用Java及Scala两种语言描述，清晰的让我们看到各种常规的设计模式，在Scala中是如何在语言特性层面直接支持的。基于文章很nice，我利用今天的空闲时间将其翻译，希望大家能一起学习，讨论。翻译
安装mysql daizj mysql 安装
安装mysql (1)删除linux上已经安装的mysql相关库信息。rpm -e xxxxxxx --nodeps (强制删除) 执行命令rpm -qa |grep mysql 检查是否删除干净 (2)执行命令 rpm -i MySQL-server-5.5.31-2.el
HTTP状态码大全 dcj3sjt126com http状态码
完整的 HTTP 1.1规范说明书来自于RFC 2616，你可以在http://www.talentdigger.cn/home/link.php?url=d3d3LnJmYy1lZGl0b3Iub3JnLw%3D%3D在线查阅。HTTP 1.1的状态码被标记为新特性，因为许多浏览器只支持 HTTP 1.0。你应只把状态码发送给支持 HTTP 1.1的客户端，支持协议版本可以通过调用request
asihttprequest上传图片 dcj3sjt126com ASIHTTPRequest
NSURL *url =@"yourURL"; ASIFormDataRequest*currentRequest =[ASIFormDataRequest requestWithURL:url]; [currentRequest setPostFormat:ASIMultipartFormDataPostFormat];[currentRequest se
C语言中，关键字static的作用 e200702084 C++c C#
在C语言中，关键字static有三个明显的作用： 1)在函数体，局部的static变量。生存期为程序的整个生命周期，（它存活多长时间）；作用域却在函数体内（它在什么地方能被访问（空间））。一个被声明为静态的变量在这一函数被调用过程中维持其值不变。因为它分配在静态存储区，函数调用结束后并不释放单元，但是在其它的作用域的无法访问。当再次调用这个函数时，这个局部的静态变量还存活，而且用在它的访
win7/8使用curl geeksun win7
1. WIN7/8下要使用curl，需要下载curl-7.20.0-win64-ssl-sspi.zip和Win64OpenSSL_Light-1_0_2d.exe。下载地址： http://curl.haxx.se/download.html 请选择不带SSL的版本，否则还需要安装SSL的支持包 2. 可以给Windows增加c
Creating a Shared Repository; Users Sharing The Repository hongtoushizi git
转载自： http://www.gitguys.com/topics/creating-a-shared-repository-users-sharing-the-repository/ Commands discussed in this section: git init –bare git clone git remote git pull git p
Java实现字符串反转的8种或9种方法 Josh_Persistence 异或反转递归反转二分交换反转 java字符串反转栈反转
注：对于第7种使用异或的方式来实现字符串的反转，如果不太看得明白的，可以参照另一篇博客： http://josh-persistence.iteye.com/blog/2205768 /** * */ package com.wsheng.aggregator.algorithm.string; import java.util.Stack; /**
代码实现任意容量倒水问题 home198979 PHP 算法倒水
形象化设计模式实战 HELLO!架构 redis命令源码解析倒水问题：有两个杯子，一个A升，一个B升，水有无限多，现要求利用这两杯子装C
Druid datasource zhb8015 druid
推荐大家使用数据库连接池 DruidDataSource. http://code.alibabatech.com/wiki/display/Druid/DruidDataSource DruidDataSource经过阿里巴巴数百个应用一年多生产环境运行验证，稳定可靠。它最重要的特点是：监控、扩展和性能。下载和Maven配置看这里： http
两种启动监听器ApplicationListener和ServletContextListener spjich java spring 框架
引言:有时候需要在项目初始化的时候进行一系列工作，比如初始化一个线程池，初始化配置文件，初始化缓存等等，这时候就需要用到启动监听器，下面分别介绍一下两种常用的项目启动监听器 ServletContextListener 特点: 依赖于sevlet容器，需要配置web.xml 使用方法: public class StartListener implements
JavaScript Rounding Methods of the Math object 何不笑 JavaScript Math
The next group of methods has to do with rounding decimal values into integers. Three methods — Math.ceil(), Math.floor(), and Math.round() — handle rounding in differen

NameNode与DataNode删除块逻辑分析

2.删除逻辑分析

1.删除文件NameNode入口

2.RedundancyMonitor监控线程

3.DataNode心跳及IBR

3.大量删除数据块的隐患及解决办法

你可能感兴趣的:(hadoop)