不喝酒的阿蓝

hdfs 中chunk_HDFS写文件过程分析

引自：http://shiyanjun.cn/archives/942.html

HDFS是一个分布式文件系统，在HDFS上写文件的过程与我们平时使用的单机文件系统非常不同，从宏观上来看，在HDFS文件系统上创建并写一个文件，流程如下图(来自《Hadoop：The Definitive Guide》一书)所示：

具体过程描述如下：

Client调用DistributedFileSystem对象的create方法，创建一个文件输出流(FSDataOutputStream)对象

通过DistributedFileSystem对象与Hadoop集群的NameNode进行一次RPC远程调用，在HDFS的Namespace中创建一个文件条目(Entry)，该条目没有任何的Block

通过FSDataOutputStream对象，向DataNode写入数据，数据首先被写入FSDataOutputStream对象内部的Buffer中，然后数据被分割成一个个Packet数据包

以Packet最小单位，基于Socket连接发送到按特定算法选择的HDFS集群中一组DataNode(正常是3个，可能大于等于1)中的一个节点上，在这组DataNode组成的Pipeline上依次传输Packet

这组DataNode组成的Pipeline反方向上，发送ack，最终由Pipeline中第一个DataNode节点将Pipeline ack发送给Client

完成向文件写入数据，Client在文件输出流(FSDataOutputStream)对象上调用close方法，关闭流

调用DistributedFileSystem对象的complete方法，通知NameNode文件写入成功

下面代码使用Hadoop的API来实现向HDFS的文件写入数据，同样也包括创建一个文件和写数据两个主要过程，代码如下所示：

static String[] contents = new String[] {

"aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa",

"bbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbb",

"cccccccccccccccccccccccccccccccccccccccccccccccccccccccccc",

"dddddddddddddddddddddddddddddddd",

"eeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeee",

};

public static void main(String[] args) {

Path path = new Path(file);

Configuration conf = new Configuration();

FileSystem fs = null;

FSDataOutputStream output = null;

try {

fs = path.getFileSystem(conf);

output = fs.create(path); // 创建文件

for(String line : contents) { // 写入数据

output.write(line.getBytes("UTF-8"));

output.flush();

}

} catch (IOException e) {

e.printStackTrace();

} finally {

try {

output.close();

} catch (IOException e) {

e.printStackTrace();

}

结合上面的示例代码，我们先从fs.create(path);开始，可以看到FileSystem的实现DistributedFileSystem中给出了最终返回FSDataOutputStream对象的抽象逻辑，代码如下所示：

public FSDataOutputStream create(Path f, FsPermission permission,

boolean overwrite,

int bufferSize, short replication, long blockSize,

Progressable progress) throws IOException {

statistics.incrementWriteOps(1);

return new FSDataOutputStream

(dfs.create(getPathName(f), permission, overwrite, true, replication, blockSize, progress, bufferSize), statistics);

}

上面，DFSClient dfs的create方法中创建了一个OutputStream对象，在DFSClient的create方法：

public OutputStream create(String src,

FsPermission permission,

boolean overwrite,

boolean createParent,

short replication,

long blockSize,

Progressable progress,

int buffersize

) throws IOException {

... ...

}

创建了一个DFSOutputStream对象，如下所示：

final DFSOutputStream result = new DFSOutputStream(src, masked,

overwrite, createParent, replication, blockSize, progress, buffersize,

conf.getInt("io.bytes.per.checksum", 512));

下面，我们从DFSOutputStream类开始，说明其内部实现原理。

DFSOutputStream内部原理

打开一个DFSOutputStream流，Client会写数据到流内部的一个缓冲区中，然后数据被分解成多个Packet，每个Packet大小为64k字节，每个Packet又由一组chunk和这组chunk对应的checksum数据组成，默认chunk大小为512字节，每个checksum是对512字节数据计算的校验和数据。

当Client写入的字节流数据达到一个Packet的长度，这个Packet会被构建出来，然后会被放到队列dataQueue中，接着DataStreamer线程会不断地从dataQueue队列中取出Packet，发送到复制Pipeline中的第一个DataNode上，并将该Packet从dataQueue队列中移到ackQueue队列中。ResponseProcessor线程接收从Datanode发送过来的ack，如果是一个成功的ack，表示复制Pipeline中的所有Datanode都已经接收到这个Packet，ResponseProcessor线程将packet从队列ackQueue中删除。

在发送过程中，如果发生错误，所有未完成的Packet都会从ackQueue队列中移除掉，然后重新创建一个新的Pipeline，排除掉出错的那些DataNode节点，接着DataStreamer线程继续从dataQueue队列中发送Packet。

下面是DFSOutputStream的结构及其原理，如图所示：

我们从下面3个方面来描述内部流程：

创建Packet

Client写数据时，会将字节流数据缓存到内部的缓冲区中，当长度满足一个Chunk大小(512B)时，便会创建一个Packet对象，然后向该Packet对象中写Chunk Checksum校验和数据，以及实际数据块Chunk Data，校验和数据是基于实际数据块计算得到的。每次满足一个Chunk大小时，都会向Packet中写上述数据内容，直到达到一个Packet对象大小(64K)，就会将该Packet对象放入到dataQueue队列中，等待DataStreamer线程取出并发送到DataNode节点。

发送Packet

DataStreamer线程从dataQueue队列中取出Packet对象，放到ackQueue队列中，然后向DataNode节点发送这个Packet对象所对应的数据。

接收ack

发送一个Packet数据包以后，会有一个用来接收ack的ResponseProcessor线程，如果收到成功的ack，则表示一个Packet发送成功。如果成功，则ResponseProcessor线程会将ackQueue队列中对应的Packet删除。

DFSOutputStream初始化

首先看一下，DFSOutputStream的初始化过程，构造方法如下所示：

DFSOutputStream(String src, FsPermission masked, boolean overwrite,

boolean createParent, short replication, long blockSize, Progressable progress,

int buffersize, int bytesPerChecksum) throws IOException {

this(src, blockSize, progress, bytesPerChecksum, replication);

computePacketChunkSize(writePacketSize, bytesPerChecksum); // 默认 writePacketSize=64*1024(即64K)，bytesPerChecksum=512(没512个字节计算一个校验和),

try {

if (createParent) { // createParent为true表示，如果待创建的文件的父级目录不存在，则自动创建

namenode.create(src, masked, clientName, overwrite, replication, blockSize);

} else {

namenode.create(src, masked, clientName, overwrite, false, replication, blockSize);

}

} catch(RemoteException re) {

throw re.unwrapRemoteException(AccessControlException.class,

FileAlreadyExistsException.class,

FileNotFoundException.class,

NSQuotaExceededException.class,

DSQuotaExceededException.class);

}

streamer.start(); // 启动一个DataStreamer线程，用来将写入的字节流打包成packet，然后发送到对应的Datanode节点上

}

上面computePacketChunkSize方法计算了一个packet的相关参数，我们结合代码来查看，如下所示：

int chunkSize = csize + checksum.getChecksumSize();

int n = DataNode.PKT_HEADER_LEN + SIZE_OF_INTEGER;

chunksPerPacket = Math.max((psize - n + chunkSize-1)/chunkSize, 1);

packetSize = n + chunkSize*chunksPerPacket;

我们用默认的参数值替换上面的参数，得到：

int chunkSize = 512 + 4;

int n = 21 + 4;

chunksPerPacket = Math.max((64*1024 - 25 + 516-1)/516, 1); // 127

packetSize = 25 + 516*127;

上面对应的参数，说明如下表所示：

参数名称

参数值

参数含义

chunkSize

512+4=516

每个chunk的字节数(数据+校验和)

csize

512

每个chunk数据的字节数

psize

64*1024

每个packet的最大字节数(不包含header)

DataNode.PKT_HEADER_LEN

每个packet的header的字节数

chunksPerPacket

127

组成每个packet的chunk的个数

packetSize

25+516*127=65557

每个packet的字节数(一个header+一组chunk)

在计算好一个packet相关的参数以后，调用create方法与Namenode进行RPC请求，请求创建文件：

if (createParent) { // createParent为true表示，如果待创建的文件的父级目录不存在，则自动创建

namenode.create(src, masked, clientName, overwrite, replication, blockSize);

} else {

namenode.create(src, masked, clientName, overwrite, false, replication, blockSize);

}

远程调用上面方法，会在FSNamesystem中创建对应的文件路径，并初始化与该创建的文件相关的一些信息，如租约(向Datanode节点写数据的凭据)。文件在FSNamesystem中创建成功，就要初始化并启动一个DataStreamer线程，用来向Datanode写数据，后面我们详细说明具体处理逻辑。

Packet结构与定义

Client向HDFS写数据，数据会被组装成Packet，然后发送到Datanode节点。Packet分为两类，一类是实际数据包，另一类是heatbeat包。一个Packet数据包的组成结构，如图所示：

上图中，一个Packet是由Header和Data两部分组成，其中Header部分包含了一个Packet的概要属性信息，如下表所示：

字段名称

字段类型

字段长度

字段含义

pktLen

int

4 + dataLen + checksumLen

offsetInBlock

long

Packet在Block中偏移量

seqNo

long

Packet序列号，在同一个Block唯一

lastPacketInBlock

boolean

是否是一个Block的最后一个Packet

dataLen

int

dataPos – dataStart，不包含Header和Checksum的长度

Data部分是一个Packet的实际数据部分，主要包括一个4字节校验和(Checksum)与一个Chunk部分，Chunk部分最大为512字节。

在构建一个Packet的过程中，首先将字节流数据写入一个buffer缓冲区中，也就是从偏移量为25的位置(checksumStart)开始写Packet数据的Chunk Checksum部分，从偏移量为533的位置(dataStart)开始写Packet数据的Chunk Data部分，直到一个Packet创建完成为止。如果一个Packet的大小未能达到最大长度，也就是上图对应的缓冲区中，Chunk Checksum与Chunk Data之间还保留了一段未被写过的缓冲区位置，这种情况说明，已经在写一个文件的最后一个Block的最后一个Packet。在发送这个Packet之前，会检查Chunksum与Chunk Data之间的缓冲区是否为空白缓冲区(gap)，如果有则将Chunk Data部分向前移动，使得Chunk Data 1与Chunk Checksum N相邻，然后才会被发送到DataNode节点。

我们看一下Packet对应的Packet类定义，定义了如下一些字段：

ByteBuffer buffer; // only one of buf and buffer is non-null

byte[] buf;

long seqno; // sequencenumber of buffer in block

long offsetInBlock; // 该packet在block中的偏移量

boolean lastPacketInBlock; // is this the last packet in block?

int numChunks; // number of chunks currently in packet

int maxChunks; // 一个packet中包含的chunk的个数

int dataStart;

int dataPos;

int checksumStart;

int checksumPos;

Packet类有一个默认的没有参数的构造方法，它是用来做heatbeat的，如下所示：

Packet() {

this.lastPacketInBlock = false;

this.numChunks = 0;

this.offsetInBlock = 0;

this.seqno = HEART_BEAT_SEQNO; // 值为-1

buffer = null;

int packetSize = DataNode.PKT_HEADER_LEN + SIZE_OF_INTEGER; // 21+4=25

buf = new byte[packetSize];

checksumStart = dataStart = packetSize;

checksumPos = checksumStart;

dataPos = dataStart;

maxChunks = 0;

}

通过代码可以看到，一个heatbeat的内容，实际上只有一个长度为25字节的header数据。通过this.seqno = HEART_BEAT_SEQNO;的值可以判断一个packet是否是heatbeat包，如果seqno为-1表示这是一个heatbeat包。

Client发送Packet数据

可以DFSClient类中看到，发送一个Packet之前，首先需要向选定的DataNode发送一个Header数据包，表明要向DataNode写数据，该Header的数据结构，如图所示：

上图显示的是Client发送Packet到第一个DataNode节点的Header数据结构，主要包括待发送的Packet所在的Block(先向NameNode分配Block ID等信息)的相关信息、Pipeline中另外2个DataNode的信息、访问令牌(Access Token)和校验和信息，Header中各个字段及其类型，详见下表：

字段名称

字段类型

字段长度

字段含义

Transfer Version

short

Client与DataNode之间数据传输版本号，由常量DataTransferProtocol.DATA_TRANSFER_VERSION定义，值为17

int

操作类型，由常量DataTransferProtocol.OP_WRITE_BLOCK定义，值为80

blkId

long

Block的ID值，由NameNode分配

long

时间戳(Generation Stamp)，NameNode分配blkId的时候生成的时间戳

DNCnt

int

DataNode复制Pipeline中DataNode节点的数量

Recovery Flag

boolean

Recover标志

Client

Text

Client主机的名称，在使用Text进行序列化的时候，实际包含长度len与主机名称字符串ClientHost

srcNode

boolean

是否发送src node的信息，默认值为false，不发送src node的信息

nonSrcDNCnt

int

由Client写的该Header数据，该数不包含Pipeline中第一个节点(即为DNCnt-1)

DN2

DatanodeInfo

DataNode信息，包括StorageID、InfoPort、IpcPort、capacity、DfsUsed、remaining、LastUpdate、XceiverCount、Location、HostName、AdminState

DN3

DatanodeInfo

DataNode信息，包括StorageID、InfoPort、IpcPort、capacity、DfsUsed、remaining、LastUpdate、XceiverCount、Location、HostName、AdminState

Access Token

Token

访问令牌信息，包括IdentifierLength、Identifier、PwdLength、Pwd、KindLength、Kind、ServiceLength、Service

CheckSum Header

DataChecksum

1+4

校验和Header信息，包括type、bytesPerChecksum

Header数据包发送成功，Client会收到一个成功响应码(DataTransferProtocol.OP_STATUS_SUCCESS = 0)，接着将Packet数据发送到Pipeline中第一个DataNode上，如下所示：

Packet one = null;

one = dataQueue.getFirst(); // regular data packet

ByteBuffer buf = one.getBuffer();

// write out data to remote datanode

blockStream.write(buf.array(), buf.position(), buf.remaining());

if (one.lastPacketInBlock) { // 如果是Block中的最后一个Packet，还要写入一个0标识该Block已经写入完成

blockStream.writeInt(0); // indicate end-of-block

}

否则，如果失败，则会与NameNode进行RPC调用，删除该Block，并把该Pipeline中第一个DataNode加入到excludedNodes列表中，代码如下所示：

if (!success) {

LOG.info("Abandoning " + block);

namenode.abandonBlock(block, src, clientName);

if (errorIndex < nodes.length) {

LOG.info("Excluding datanode " + nodes[errorIndex]);

excludedNodes.add(nodes[errorIndex]);

}

// Connection failed. Let's wait a little bit and retry

retry = true;

}

DataNode端服务组件

数据最终会发送到DataNode节点上，在一个DataNode上，数据在各个组件之间流动，流程如下图所示：

DataNode服务中创建一个后台线程DataXceiverServer，它是一个SocketServer，用来接收来自Client(或者DataNode Pipeline中的非最后一个DataNode节点)的写数据请求，然后在DataXceiverServer中将连接过来的Socket直接派发给一个独立的后台线程DataXceiver进行处理。所以，Client写数据时连接一个DataNode Pipeline的结构，实际流程如图所示：

每个DataNode服务中的DataXceiver后台线程接收到来自前一个节点(Client/DataNode)的Socket连接，首先读取Header数据：

Block block = new Block(in.readLong(), dataXceiverServer.estimateBlockSize, in.readLong());

LOG.info("Receiving " + block + " src: " + remoteAddress + " dest: " + localAddress);

int pipelineSize = in.readInt(); // num of datanodes in entire pipeline

boolean isRecovery = in.readBoolean(); // is this part of recovery?

String client = Text.readString(in); // working on behalf of this client

boolean hasSrcDataNode = in.readBoolean(); // is src node info present

if (hasSrcDataNode) {

srcDataNode = new DatanodeInfo();

srcDataNode.readFields(in);

}

int numTargets = in.readInt();

if (numTargets

throw new IOException("Mislabelled incoming datastream.");

}

DatanodeInfo targets[] = new DatanodeInfo[numTargets];

for (int i = 0; i < targets.length; i++) {

DatanodeInfo tmp = new DatanodeInfo();

tmp.readFields(in);

targets[i] = tmp;

}

TokenaccessToken = new Token();

accessToken.readFields(in);

上面代码中，读取Header的数据，与前一个Client/DataNode写入Header字段的顺序相对应，不再累述。在完成读取Header数据后，当前DataNode会首先将Header数据再发送到Pipeline中下一个DataNode结点，当然该DataNode肯定不是Pipeline中最后一个DataNode节点。接着，该DataNode会接收来自前一个Client/DataNode节点发送的Packet数据，接收Packet数据的逻辑实际上在BlockReceiver中完成，包括将来自前一个Client/DataNode节点发送的Packet数据写入本地磁盘。在BlockReceiver中，首先会将接收到的Packet数据发送写入到Pipeline中下一个DataNode节点，然后再将接收到的数据写入到本地磁盘的Block文件中。

DataNode持久化Packet数据

在DataNode节点的BlockReceiver中进行Packet数据的持久化，一个Packet是一个Block中一个数据分组，我们首先看一下，一个Block在持久化到磁盘上的物理存储结构，如下图所示：

每个Block文件(如上图中blk_1084013198文件)都对应一个meta文件(如上图中blk_1084013198_10273532.meta文件)，Block文件是一个一个Chunk的二进制数据(每个Chunk的大小是512字节)，而meta文件是与每一个Chunk对应的Checksum数据，是序列化形式存储。

写文件过程中Client/DataNode与NameNode进行RPC调用

Client在HDFS文件系统中写文件过程中，会发生多次与NameNode节点进行RPC调用来完成写数据相关操作，主要是在如下时机进行RPC调用：

写文件开始时创建文件：Client调用create在NameNode节点的Namespace中创建一个标识该文件的条目

在Client连接Pipeline中第一个DataNode节点之前，Client调用addBlock分配一个Block(blkId+DataNode列表+租约)

如果与Pipeline中第一个DataNode节点连接失败，Client调用abandonBlock放弃一个已经分配的Block

一个Block已经写入到DataNode节点磁盘，Client调用fsync让NameNode持久化Block的位置信息数据

文件写完以后，Client调用complete方法通知NameNode写入文件成功

DataNode节点接收到并成功持久化一个Block的数据后，DataNode调用blockReceived方法通知NameNode已经接收到Block

具体RPC调用的详细过程，可以参考源码。

你可能感兴趣的:(hdfs,中chunk)

PHP 超级全局变量 lsx202406 开发语言
PHP超级全局变量引言在PHP编程中，超级全局变量是一个非常重要的概念。它们在所有函数、类和文件中自动可用，无需使用global关键字。理解并正确使用超级全局变量对于编写高效、安全的PHP代码至关重要。本文将详细介绍PHP中的超级全局变量，包括它们的用途、如何使用以及一些最佳实践。什么是超级全局变量？超级全局变量是指在PHP脚本的所有函数、类和文件中都可以访问的全局变量。这些变量在全局作用域中声明
使用 Nginx 实现镜像流量：提升系统可用性与负载均衡绝顶少年 nginx 负载均衡 java
在现代分布式系统中，确保高可用性和负载均衡是至关重要的。Nginx作为一个高性能的反向代理服务器，不仅可以用于负载均衡，还可以通过镜像流量（TrafficMirroring）功能，将实时流量复制到其他服务器，用于测试、监控或数据分析，而不会影响生产环境。本文将详细介绍如何使用Nginx实现镜像流量。(有时候只是实现单接口的数据共享也同样可以采用单接口配置！如果你遇到按照配置完成后主服务器实现了转发
Spring AOP相关常见问题 PXM的算法星球 Java后端 spring java 数据库
前言在日常开发中，我们经常需要给方法添加一些横切关注点（Cross-CuttingConcerns），比如日志记录、事务管理、权限控制等。而SpringAOP（Aspect-OrientedProgramming，面向切面编程）提供了一种优雅的方式，让我们可以在不修改业务代码的情况下增强方法行为。1.AOP和OOP的区别是什么？许多初学者会疑惑，OOP（面向对象编程）已经很好地组织了代码，为什么还
HTML5前端第七章节 NaZiMeKiY HTML5 1024程序员节
本章节为前端网页页面实战，包含我们之前所学的全部内容一.创建项目目录1.网站根目录：网站根目录指的是存放网站的第一层文件夹，内部包含当前网站的所有素材，包含HTML，CSS，需要的素材图片等等2.根目录之下的文件夹（1）.images文件夹：存放固定使用的图片素材（2）.uploads文件夹：存放非固定使用的图片素材（3）.CSS文件夹：存放CSS文件（使用link标签引入）在CSS文件夹中又分为
GeoTrust SSL证书有哪些种类？怎么申请？ william082012 ssl https 网络协议服务器网络安全微信小程序
SSL证书作为一种数字证书，通过加密技术为网站与浏览器之间的数据传输提供安全保障。在众多SSL证书提供商中，GeoTrust以其丰富的证书种类、高效的申请流程和可靠的安全性能，赢得了全球众多企业的信赖。一、GeoTrustSSL证书的种类作为业界知名的SSL证书提供商，PinTrust提供包括Geotrust品牌多种类型的SSL证书，涵盖DV、OV、EV等类型。域名验证（DV）SSL证书单域名DV
软件工程简答题整理 ~进无止境~ 软件工程软件工程简答题
软件工程考试简答题整理瀑布模型是软件工程中应用最广泛的过程模型，试述采用瀑布模型进行软件开发的基本过程，该过程有何特点？答:1.基本过程:瀑布模型规定了各项软件工程活动，包括需求分析、规格说明、设计、编码、测试和维护，并规定了它们自上而下、相互衔接的固定次序，如同瀑布流水，逐级而下。2.特点阶段间具有顺序性和依赖性；清楚区分逻辑设计和物理设计，尽可能推迟程序的物理实现；每个阶段都必须完成规定的文档
JAVA泛型的作用时光呢 java windows python
‌1.类型安全（TypeSafety）‌在泛型出现之前，集合类（如ArrayList、HashMap）只能存储Object类型元素，导致以下问题：‌问题‌：从集合中取出元素时，需手动强制类型转换，容易因类型不匹配导致运行时错误（如ClassCastException）。//JDK1.4时代：非泛型示例Listlist=newArrayList();list.add("Hello");Integer
使用 React 和 Cypress 进行单元测试 pxr007 单元测试 react.js junit
每个开发人员都希望发布一个没有错误的生产应用程序。为了实现这一点，我们需要考虑如何将测试集成到我们的应用程序中。我们可以使用许多测试工具、框架和测试类型。Cypress是一个现代化的自动化测试套件。它是一个基于JavaScript的完全开源的测试框架，由Mocha和Chai等支持BDD和TDD断言样式的库构建。此外，如果您熟悉用JavaScript编写测试，那么使用Cypress会很容易。Cypr
OSI七层模型 _洛_神网络协议
OSI七层模型传输过程当你在微信上发送一句“你吃了吗”时，这条消息会经历一个从你的手机到接收者手机的复杂旅程。这个过程涉及到网络通信中的七层模型，即OSI（开放系统互连）模型。每一层都有特定的功能，并且在这个过程中，信息会被逐步封装成适合网络传输的形式。等到达目的地后，再一层层解开，最终呈现给接收者。一、OSI七层模型简介：物理层-负责定义物理连接的电气、机械、过程和功能特性，如电压水平、电缆规格
2017安全之势：云、大数据、IoT、人工智能 weixin_34392906 人工智能大数据嵌入式
“新技术让信息系统变成了孙悟空，开始无所不能，但安全仍是它的‘紧箍咒’！怎样解开这个‘紧箍咒’？各路安全厂商各显其能，但似乎路漫漫兮离目标还很遥远。”三未信安董事长张岳公在ZD至顶网《百位意见领袖寄语2017》中说出了这样一句话，我觉着很有道理。安全是一个永恒的话题，如果说它与新的信息技术相生相克也不过分。即便如此，我们更要尽可能的减少安全带来的束缚。2017已经到来，不妨来看看至顶网与业界大咖总
服务器中防火墙的重要性 wanhengidc 服务器网络运维
服务器作为重要的网络设备，需要承担存储、处理和传输大量数据信息，所以服务器经常被恶意软件和网络攻击者视为主要目标，企业为了能够保护服务器不受各种网络威胁的影响，安装防火墙是最为基本的一种安全保护措施。服务器防火墙是网络安全的第一道防线，可以控制服务器上的网络访问权限，通过设置适合的规则和策略，管理员可以限制IP地址的访问权限，保护服务器不会受到未经授权的IP地址访问，保护了服务器中重要数据信息的安
无锁并发环形队列(Java版) 呆呆的蜗牛数据结构和算法队列 java 多线程
环形队列是顺序队列的一种。普通的顺序队列，当队列不满且tail指针移动到数组的最后位置时，就需要将数组中的元素整体向前搬移，而环形队列却不用。这就提高了入队的效率。无锁并发主要基于CAS原理，在java中Unsafe类中提供了底层的CAS操作。但是我们可以不直接操作Unsafe类，JDK提供了一系列的Atomic类来满足一般的无锁需求。importjava.util.concurrent.atom
Stream 流中 flatMap 方法详解遇见伯灵说 Java 开发语言 java stream流
1.flatMap()到底是啥？flatMap()是Stream里的中间操作，它的作用可以分两步理解：第一步：对流里的每个元素，先**映射（转换）**成一个Stream。第二步：把多个子流拍平成一个大的扁平流。简单记忆：map()是一对一，flatMap()是一对多。️2.基础用法拆解来看个例子：Listlist=List.of("HelloWorld","JavaStream");Listres
笔记本装机系统选择指南 mmoo_python windows
笔记本装机系统选择指南在众多笔记本用户中，选择一款合适的装机系统始终是一个热门话题。不同的系统不仅影响着电脑的性能，还关乎用户的使用体验和安全性。那么，在众多装机系统中，哪款最适合你的笔记本呢？本文将为你推荐几款热门的笔记本装机系统，帮助你做出明智的选择。一、游戏本专用：Windows1064位性能优化专业版对于游戏爱好者来说，一款高性能的游戏本是必不可少的装备。而为了充分发挥游戏本的潜力，一个专
深入解析 Java Stream API：筛选根节点的优雅实现！！！小丁学Java #Lambda表达式 #Stream java Stream Lambda 表达式 Collectors
深入解析JavaStreamAPI：筛选根节点的优雅实现大家好！今天我们来聊聊Java8中一个非常常见的操作：使用StreamAPI从List中筛选出特定条件的元素。具体来说，我们将深入分析以下代码片段：Listroots=inviteCodes.stream().filter(ic->ic.getCreatedBy()==null).collect(Collectors.toList());这段
前端面试：[React] scheduler 调度机制原理？ returnShitBoy 前端 react.js javascript
ReactScheduler是React16.8引入的一种调度机制，旨在对高效渲染和复杂应用程序的性能进行优化。它允许React在空闲时间进行渲染，优先处理对用户体验最为重要的任务。以下是Scheduler调度机制的原理，以及它在实际工作中如何帮助管理渲染。1.调度机制的背景React的渲染过程可能会受到多个因素的影响，例如用户输入、网络请求以及其他状态变化。传统的渲染机制在某些情况下可能导致性能
python if用法 IT技术土狗 python从入门到入狱 python
pythonif用法流程控制流程控制即控制流程，具体指控制程序的执行流程，而程序的执行流程分为三种结构：顺序结构（之前我们写的代码都是顺序结构）、分支结构（用到if判断）、循环结构（用到while与for）1、分支结构分支结构就是根据条件判断的真假去执行不同分支对应的子代码2、为什么需要分支结构人类某些时候需要根据条件来决定做什么事情，比如：如果今天下雨，就带伞所以程序中必须有相应的机制来控制计算
Effective Modern C++ 条款6：auto推导若非己愿，使用显式类型初始化惯用法举个栗子2 Effective Modern C++c++
更多C++学习笔记，关注wx公众号：cpp读书笔记Item6:Usetheexplicitlytypedinitializeridiomwhenautodeducesundesiredtypes在Item5中解释了比起显式指定类型使用auto声明变量有若干技术优势，但是有时当你想向左转auto却向右转。举个例子，假如我有一个函数，参数为Widget，返回一个std::vector，这里的bool表
一文看懂PCB和集成电路的关系 boyueqiu9000
一文看懂PCB和集成电路的关系在学习电子的过程中，我们经常看到印制电路板（PCB）和集成电路（IC），很多人对这两个概念“傻傻分不清楚”。其实，他们并没有那么复杂，今天我们就来理清下PCB和集成电路的区别。什么是PCB？PCB（PrintedCircuitBoard），中文名称为印制电路板，又称印刷线路板，是重要的电子部件，是电子元器件的支撑体，是电子元器件电气连接的载体。由于它是采用电子印刷术制
TreeNode底层实现原理 zhglhy 开发语言 java
TreeNode是树结构的基本单元，通常用于表示树形数据结构中的节点。其底层实现原理涉及以下几个方面：1.TreeNode的基本结构在Java中，TreeNode通常是一个类，包含以下核心属性：数据域：存储节点的数据。子节点引用：指向子节点的引用（对于二叉树，通常是左子节点和右子节点）。父节点引用：指向父节点的引用（可选，取决于具体实现）。以下是一个典型的二叉树节点的实现：classTreeNod
Android应用中实现Google登录 @半夏微凉科技 Android●知识点与疑难 Google登录 Google Android 谷歌登陆
背景Google登录是指使用Google账号（通常是Gmail地址及其关联的密码）来登录第三方网站或应用程序。它的背景可以追溯到Google希望建立一个统一的身份验证系统，让用户能够更方便地访问和使用各种在线服务。这种单点登录系统不仅方便了用户，还使开发者能够利用Google的身份验证服务，减少他们自行实施登录系统的工作量。Google登录的出现背景可以归结为以下几点：1.用户便利性：用户们拥有越
悬镜安全获评专精特新企业！ DevSecOps选型指南软件供应链安全工具悬镜安全开源治理软件成分分析 ASPM 专精特新小巨人
近日，北京安普诺信息技术有限公司（以下简称：悬镜安全）凭借在DevSecOps敏捷安全和中国数字供应链安全领域的关键技术自主创新、市场引领以及在守护中国数字供应链安全做出的行业贡献等多重维度，从众多参评企业中脱颖而出，成功入选第六批专精特新“小巨人”企业！01关键前沿科技引领在此背景下，悬镜安全以关键前沿技术为引领方向，不断完善企业发展体系，增强核心竞争力，持续为行业提供更加高效、安全的数字化服务
通信之段开销、管理单元指针、净负荷玖Yee 信息与通信
今天来讲讲sdh段开销、管理单元指针、净负荷吧~SDH段开销（SOH）是指STM-N帧结构中为了保证信息净负荷正常灵活传送所必需的附加字节，用于网络的运行、管理和维护。它位于STM-N帧的第1至第9×N列中，第1至第3行和第5行至第9行，可进一步划分为再生段开销（RSOH）和复用段开销（MSOH）。具体介绍如下：再生段开销（RSOH）-帧定位字节（A1、A2）：规定为两种固定代码，A1=11110
算法刷题记录——LeetCode篇(1) [第1~100题](持续更新) Allen Wurlitzer 实战-算法解题算法 leetcode 职场和发展
更新时间：2025-03-21LeetCode刷题目录：算法刷题记录——专题目录汇总技术博客总目录：计算机技术系列博客——目录页优先整理热门100及面试150，不定期持续更新，欢迎关注！1.两数之和给定一个整数数组nums和一个整数目标值target，请你在该数组中找出和为目标值target的那两个整数，并返回它们的数组下标。你可以假设每种输入只会对应一个答案，并且你不能使用两次相同的元素。你可以
android Firebase Cloud Messaging (FCM) 接入遥不可及zzz firebase推送
在Android应用中接入FirebaseCloudMessaging(FCM)可实现消息推送功能，以下是详细的接入步骤和示例代码：步骤1：创建Firebase项目访问Firebase控制台并登录你的Google账号。点击“添加项目”，按提示填写项目名称等信息完成项目创建。步骤2：将Android应用添加到Firebase项目在Firebase控制台中，点击项目概览页面的“添加应用”按钮，选择An
python接口自动化全世界最帅的男人 python 自动化开发语言
Python是一种非常流行的编程语言，也是许多接口自动化测试框架的首选语言。下面是一个简单的接口自动化测试框架的思路：1.安装必要的库和工具：在Python中，我们可以使用requests库来发送HTTP请求，使用unittest库来编写测试用例，使用HTMLTestRunner库来生成测试报告。此外，我们还需要安装一个代码编辑器，如PyCharm或VSCode。2.创建测试用例：编写测试用例是接
深入理解 Redis SDS：高效字符串存储的秘密沉默的煎蛋 bootstrap 前端 html maven 架构开发语言数据库
目录1.引言1.1Redis中字符串的广泛应用2.SDS结构定义2.1Redis3.2之前的SDS结构2.2Redis3.2及之后的SDS结构3.SDS与传统C字符串的比较3.1获取字符串长度3.2缓冲区溢出问题3.3二进制安全性3.4内存分配次数4.SDS的内存分配策略4.1空间预分配4.2惰性空间释放5.SDS的其他特性5.1兼容C字符串函数5.2类型灵活6.SDS的使用场景6.1键值对存储6
Python异步编程：从基础到高级 CarlowZJ python 网络数据库
前言在现代软件开发中，异步编程已经成为一种必不可少的技能。Python的异步编程模型（基于asyncio）为开发者提供了一种高效的方式来处理高并发任务，而无需依赖多线程或多进程。异步编程不仅可以提高程序的性能，还能简化并发代码的复杂性。本文将带你从异步编程的基础概念出发，逐步深入到高级应用，帮助你掌握Python异步编程的核心技能。一、异步编程的基础概念1.1什么是异步编程？异步编程是一种编程范式
深度解读 C 语言运算符：编程运算的核心工具烂蜻蜓 C语言 c语言 java 前端
一、引言在C语言的编程世界中，运算符是构建逻辑与运算的基石，它如同一位指挥家，精准地协调着程序中各种数据的操作与处理。C语言丰富多样的运算符涵盖了算术、关系、逻辑、位运算、赋值以及其他杂项运算等多个领域，为开发者提供了强大而灵活的编程手段。深入理解和熟练运用这些运算符，对于编写高效、准确的C语言代码至关重要。接下来，让我们一同走进C语言运算符的精彩世界，探寻其奥秘与应用。二、算术运算符：数值运算的
【Q&A】装饰模式在Qt中有哪些运用？浅慕Antonio Q&A qt 数据库服务器
在Qt框架中，装饰模式（DecoratorPattern）主要通过继承或组合的方式实现，常见于IO设备扩展和图形渲染增强场景。以下是Qt原生实现的装饰模式典型案例：一、QIODevice装饰体系（继承方式）场景为基础IO设备（如文件、缓冲区）添加数据格式解析、缓冲优化等功能。类图（Mermaid）«abstract»QIODevice+readData()+writeData()QFileQBuf
统一思想认识永夜-极光思想
1.统一思想认识的基础,才能有的放矢原因: 总有一种描述事物的方式最贴近本质,最容易让人理解. 如何让教育更轻松,在于找到最适合学生的方式. 难点在于,如何模拟对方的思维基础选择合适的方式. &
Joda Time使用笔记 bylijinnan java joda time
Joda Time的介绍可以参考这篇文章： http://www.ibm.com/developerworks/cn/java/j-jodatime.html 工作中也常常用到Joda Time，为了避免每次使用都查API，记录一下常用的用法： /** * DateTime变化（增减） */ @Tes
FileUtils API eksliang FileUtils FileUtils API
转载请出自出处：http://eksliang.iteye.com/blog/2217374 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
各种新兴技术不懂事的小屁孩技术
1:gradle Gradle 是以 Groovy 语言为基础，面向Java应用为主。基于DSL（领域特定语言）语法的自动化构建工具。现在构建系统常用到maven工具，现在有更容易上手的gradle，搭建java环境: http://www.ibm.com/developerworks/cn/opensource/os-cn-gradle/ 搭建android环境： http://m
tomcat6的https双向认证酷的飞上天空 tomcat6
1.生成服务器端证书 keytool -genkey -keyalg RSA -dname "cn=localhost,ou=sango,o=none,l=china,st=beijing,c=cn" -alias server -keypass password -keystore server.jks -storepass password -validity 36
托管虚拟桌面市场势不可挡蓝儿唯美
用户还需要冗余的数据中心，dinCloud的高级副总裁兼首席营销官Ali Din指出。该公司转售一个MSP可以让用户登录并管理和提供服务的用于DaaS的云自动化控制台，提供服务或者MSP也可以自己来控制。在某些情况下，MSP会在dinCloud的云服务上进行服务分层，如监控和补丁管理。 MSP的利润空间将根据其参与的程度而有所不同，Din说。 “我们有一些合作伙伴负责将我们推荐给客户作为个
spring学习——xml文件的配置 a-john spring
在Spring的学习中，对于其xml文件的配置是必不可少的。在Spring的多种装配Bean的方式中，采用XML配置也是最常见的。以下是一个简单的XML配置文件： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.or
HDU 4342 History repeat itself 模拟 aijuans 模拟
来源：http://acm.hdu.edu.cn/showproblem.php?pid=4342 题意：首先让求第几个非平方数，然后求从1到该数之间的每个sqrt(i)的下取整的和。思路：一个简单的模拟题目，但是由于数据范围大，需要用__int64。我们可以首先把平方数筛选出来，假如让求第n个非平方数的话，看n前面有多少个平方数，假设有x个，则第n个非平方数就是n+x。注意两种特殊情况，即
java中最常用jar包的用途 asia007 java
java中最常用jar包的用途 jar包用途axis.jarSOAP引擎包commons-discovery-0.2.jar用来发现、查找和实现可插入式接口，提供一些一般类实例化、单件的生命周期管理的常用方法.jaxrpc.jarAxis运行所需要的组件包saaj.jar创建到端点的点到点连接的方法、创建并处理SOAP消息和附件的方法，以及接收和处理SOAP错误的方法. w
ajax获取Struts框架中的json编码异常和Struts中的主控制器异常的解决办法百合不是茶 js json编码返回异常
一:ajax获取自定义Struts框架中的json编码出现以下问题: 1,强制flush输出 json编码打印在首页 2, 不强制flush js会解析json 打印出来的是错误的jsp页面却没有跳转到错误页面 3, ajax中的dataType的json 改为text 会
JUnit使用的设计模式 bijian1013 java 设计模式 JUnit
JUnit源代码涉及使用了大量设计模式 1、模板方法模式（Template Method）定义一个操作中的算法骨架，而将一些步骤延伸到子类中去，使得子类可以不改变一个算法的结构，即可重新定义该算法的某些特定步骤。这里需要复用的是算法的结构，也就是步骤，而步骤的实现可以在子类中完成。
Linux常用命令（摘录） sunjing crond chkconfig
chkconfig --list 查看linux所有服务 chkconfig --add servicename 添加linux服务 netstat -apn | grep 8080 查看端口占用 env 查看所有环境变量 echo $JAVA_HOME 查看JAVA_HOME环境变量安装编译器 yum install -y gcc
【Hadoop一】Hadoop伪集群环境搭建 bit1129 hadoop
结合网上多份文档，不断反复的修正hadoop启动和运行过程中出现的问题，终于把Hadoop2.5.2伪分布式安装起来，跑通了wordcount例子。Hadoop的安装复杂性的体现之一是，Hadoop的安装文档非常多，但是能一个文档走下来的少之又少，尤其是Hadoop不同版本的配置差异非常的大。Hadoop2.5.2于前两天发布，但是它的配置跟2.5.0，2.5.1没有分别。 &nb
Anychart图表系列五之事件监听白糖_ chart
创建图表事件监听非常简单：首先是通过addEventListener('监听类型',js监听方法)添加事件监听，然后在js监听方法中定义具体监听逻辑。以钻取操作为例，当用户点击图表某一个point的时候弹出point的name和value，代码如下： <script> //创建AnyChart var chart = new AnyChart(); //添加钻取操作&quo
Web前端相关段子 braveCS web前端
Web标准：结构、样式和行为分离使用语义化标签 0）标签的语义：使用有良好语义的标签，能够很好地实现自我解释，方便搜索引擎理解网页结构，抓取重要内容。去样式后也会根据浏览器的默认样式很好的组织网页内容，具有很好的可读性，从而实现对特殊终端的兼容。 1）div和span是没有语义的：只是分别用作块级元素和行内元素的区域分隔符。当页面内标签无法满足设计需求时，才会适当添加div
编程之美-24点游戏 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Arrays; import java.util.HashSet; import java.util.List; import java.util.Random; import java.util.Set; public class PointGame { /**编程之美
主页面子页面传值总结 chengxuyuancsdn 总结
1、showModalDialog returnValue是javascript中html的window对象的属性,目的是返回窗口值,当用window.showModalDialog函数打开一个IE的模式窗口时,用于返回窗口的值主界面 var sonValue=window.showModalDialog("son.jsp"); 子界面 window.retu
[网络与经济]互联网+的含义 comsci 互联网+
互联网+后面是一个人的名字 = 网络控制系统互联网+你的名字 = 网络个人数据库每日提示:如果人觉得不舒服,千万不要外出到处走动,就呆在床上,玩玩手游,更不能够去开车,现在交通状况不
oracle 创建视图 with check option daizj 视图 view oralce
我们来看下面的例子： create or replace view testview as select empno,ename from emp where ename like ‘M%’ with check option; 这里我们创建了一个视图，并使用了with check option来限制了视图。然后我们来看一下视图包含的结果： select * from testv
ToastPlugin插件在cordova3.3下使用 dibov Cordova
自己开发的Todos应用，想实现“ 再按一次返回键退出程序 ”的功能，采用网上的ToastPlugins插件，发现代码或文章基本都是老版本，运行问题比较多。折腾了好久才弄好。下面吧基于cordova3.3下的ToastPlugins相关代码共享。 ToastPlugin.java package&nbs
C语言22个系统函数 dcj3sjt126com c function
C语言系统函数一、数学函数下列函数存放在math.h头文件中Double floor(double num) 求出不大于num的最大数。Double fmod(x, y) 求整数x/y的余数。Double frexp(num, exp); double num; int *exp; 将num分为数字部分（尾数）x和以2位的指数部分n，即num=x*2n，指数n存放在exp指向的变量中，返回x。D
开发一个类的流程 dcj3sjt126com 开发
本人近日根据自己的开发经验总结了一个类的开发流程。这个流程适用于单独开发的构件，并不适用于对一个项目中的系统对象开发。开发出的类可以存入私人类库，供以后复用。以下是开发流程： 1. 明确类的功能，抽象出类的大概结构 2. 初步设想类的接口 3. 类名设计（驼峰式命名） 4. 属性设置(权限设置) 判断某些变量是否有必要作为成员属
java 并发 shuizhaosi888 java 并发
能够写出高伸缩性的并发是一门艺术在JAVA SE5中新增了3个包 java.util.concurrent java.util.concurrent.atomic java.util.concurrent.locks 在java的内存模型中，类的实例字段、静态字段和构成数组的对象元素都会被多个线程所共享，局部变量与方法参数都是线程私有的，不会被共享。
Spring Security（11）——匿名认证 234390216 Spring Security ROLE_ANNOYMOUS 匿名
匿名认证目录 1.1 配置 1.2 AuthenticationTrustResolver 对于匿名访问的用户，Spring Security支持为其建立一个匿名的AnonymousAuthenticat
NODEJS项目实践0.2[ express,ajax通信...] 逐行分析JS源代码 Ajax nodejs express
一、前言通过上节学习，我们已经 ubuntu系统搭建了一个可以访问的nodejs系统，并做了nginx转发。本节原要做web端服务及 mongodb的存取，但写着写着，web端就
在Struts2 的Action中怎样获取表单提交上来的多个checkbox的值 lhbthanks java html struts checkbox
第一种方法：获取结果String类型在 Action 中获得的是一个 String 型数据，每一个被选中的 checkbox 的 value 被拼接在一起，每个值之间以逗号隔开(,)。所以在 Action 中定义一个跟 checkbox 的 name 同名的属性来接收这些被选中的 checkbox 的 value 即可。以下是实现的代码：前台 HTML 代码：
003.Kafka基本概念 nweiren hadoop kafka
Kafka基本概念：Topic、Partition、Message、Producer、Broker、Consumer。 Topic：消息源（Message）的分类。 Partition： Topic物理上的分组，一
Linux环境下安装JDK roadrunners jdk linux
1、准备工作创建JDK的安装目录： mkdir -p /usr/java/ 下载JDK，找到适合自己系统的JDK版本进行下载： http://www.oracle.com/technetwork/java/javase/downloads/index.html 把JDK安装包下载到/usr/java/目录，然后进行解压： tar -zxvf jre-7
Linux忘记root密码的解决思路 tomcat_oracle linux
1：使用同版本的linux启动系统，chroot到忘记密码的根分区passwd改密码　　2：grub启动菜单中加入init=/bin/bash进入系统，不过这时挂载的是只读分区。根据系统的分区情况进一步判断. 　　3: grub启动菜单中加入 single以单用户进入系统. 　　4:用以上方法mount到根分区把/etc/passwd中的root密码去除　　例如: 　　ro
跨浏览器 HTML5 postMessage 方法以及 message 事件模拟实现 xueyou jsonp jquery 框架 UI html5
postMessage 是 HTML5 新方法，它可以实现跨域窗口之间通讯。到目前为止，只有 IE8+, Firefox 3, Opera 9, Chrome 3和 Safari 4 支持，而本篇文章主要讲述 postMessage 方法与 message 事件跨浏览器实现。postMessage 方法 JSONP 技术不一样，前者是前端擅长跨域文档数据即时通讯，后者擅长针对跨域服务端数据通讯，p