HDFS dfsclient写文件过程源码分析

HDFS写入文件的重要概念

HDFS一个文件由多个block构成。HDFS在进行block读写的时候是以packet(默认每个packet为64K)为单位进行的。每一个packet由若干个chunk（默认512Byte）组成。Chunk是进行数据校验的基本单位，对每一个chunk生成一个校验和(默认4Byte)并将校验和进行存储。

在写入一个block的时候，数据传输的基本单位是packet，每个packet由若干个chunk组成。

HDFS客户端写文件示例代码

FileSystem hdfs = FileSystem.get(new Configuration());

Path path = new Path("/testfile");



// writing

FSDataOutputStream dos = hdfs.create(path);

byte[] readBuf = "Hello World".getBytes("UTF-8");

dos.write(readBuf, 0, readBuf.length);

dos.close();



hdfs.close();

文件的打开

上传一个文件到hdfs，一般会调用DistributedFileSystem.create，其实现如下：

public FSDataOutputStream create(Path f, FsPermission permission,boolean overwrite,int bufferSize, short replication, long blockSize,Progressable progress) throws IOException {

    return new FSDataOutputStream

       (dfs.create(getPathName(f), permission,overwrite, replication, blockSize, progress, bufferSize),

        statistics);

}

其最终生成一个FSDataOutputStream用于向新生成的文件中写入数据。其成员变量dfs的类型为DFSClient，DFSClient的create函数如下：

public OutputStream create(String src,FsPermission permission,boolean overwrite,short replication,long blockSize,Progressable progress,int buffersize) throws IOException {

    checkOpen();

    if (permission == null) {

      permission = FsPermission.getDefault();

    }

    FsPermission masked = permission.applyUMask(FsPermission.getUMask(conf));

    OutputStream result = new DFSOutputStream(src, masked,overwrite, replication, blockSize, progress, buffersize,

        conf.getInt("io.bytes.per.checksum", 512));

    leasechecker.put(src, result);

    return result;

}

其中构造了一个DFSOutputStream，在其构造函数中，同过RPC调用NameNode的create来创建一个文件。
当然，构造函数中还做了一件重要的事情，就是streamer.start()，也即启动了一个pipeline，用于写数据，在写入数据的过程中，我们会仔细分析。

DFSOutputStream(String src, FsPermission masked, boolean overwrite,short replication, long blockSize, Progressable progress,
                int buffersize, int bytesPerChecksum) throws IOException {

    this(src, blockSize, progress, bytesPerChecksum);

    computePacketChunkSize(writePacketSize, bytesPerChecksum);

    try {

      namenode.create(src, masked, clientName, overwrite, replication, blockSize);

    } catch(RemoteException re) {

      throw re.unwrapRemoteException(AccessControlException.class,QuotaExceededException.class);

    }

    streamer.start();

}

通过rpc调用NameNode的create函数，调用namesystem.startFile函数，其又调用startFileInternal函数，它创建一个新的文件，状态为under construction，没有任何data block与之对应。

dfsclient文件的写入

下面轮到客户端向新创建的文件中写入数据了，一般会使用FSDataOutputStream的write方法：

按照hdfs的设计，对block的数据写入使用的是pipeline的方式，也即将数据分成一个个的package，如果需要复制三分，分别写入DataNode 1, 2, 3，则会进行如下的过程：

首先将package 1写入DataNode 1
然后由DataNode 1负责将package 1写入DataNode 2，同时客户端可以将pacage 2写入DataNode 1
然后DataNode 2负责将package 1写入DataNode 3, 同时客户端可以讲package 3写入DataNode 1，DataNode 1将package 2写入DataNode 2
就这样将一个个package排着队的传递下去，直到所有的数据全部写入并复制完毕

FSDataOutputStream的write方法会调用DFSOutputStream的write方法，而DFSOutputStream继承自FSOutputSummer，所以实际上是调用FSOutputSummer的write方法，如下:

public synchronized void write(byte b[], int off, int len)

  throws IOException {

    //参数检查

    for (int n=0;n<len;n+=write1(b, off+n, len-n)) {

    }

  }

FSOutputSummer的write1的方法如下:

private int write1(byte b[], int off, int len) throws IOException {

    if(count==0 && len>=buf.length) {

      // buf初始化的大小是chunk的大小，默认是512，这里的代码会在写入的数据的剩余内容大于或等于一个chunk的大小时调用

      // 这里避免多余一次复制

      final int length = buf.length;

      sum.update(b, off, length);//length是一个完整chunk的大小，默认是512，这里根据一个chunk内容计算校验和

      writeChecksumChunk(b, off, length, false);

      return length;

    }

    

    // buf初始化的大小是chunk的大小，默认是512，这里的代码会在写入的数据的剩余内容小于一个chunk的大小时调用

    // 规避了数组越界问题

    int bytesToCopy = buf.length-count;

    bytesToCopy = (len<bytesToCopy) ? len : bytesToCopy;

    sum.update(b, off, bytesToCopy);//bytesToCopy不足一个chunk，是写入的内容的最后一个chunk的剩余字节数目

    System.arraycopy(b, off, buf, count, bytesToCopy);

    count += bytesToCopy;

    if (count == buf.length) {//如果不足一个chunk，就缓存到本地buffer，如果还有下一次写入，就填充这个chunk，满一个chunk再flush,count清0

      // local buffer is full

      flushBuffer();//最终调用writeChecksumChunk方法实现

    } 

    return bytesToCopy;

  }

writeChecksumChunk的实现如下:

//写入一个chunk的数据长度(默认512),忽略len的长度

private void writeChecksumChunk(byte b[], int off, int len, boolean keep)

  throws IOException {

    int tempChecksum = (int)sum.getValue();

    if (!keep) {

      sum.reset();

    }

    int2byte(tempChecksum, checksum);//把当前chunk的校验和从int转换为字节

    writeChunk(b, off, len, checksum);

}

writeChunk由子类DFSOutputStream实现，如下:

 protected synchronized void writeChunk(byte[] b, int offset, int len, byte[] checksum)throws IOException {



      //创建一个package，并写入数据

      currentPacket = new Packet(packetSize, chunksPerPacket,bytesCurBlock);

      currentPacket.writeChecksum(checksum, 0, cklen);

      currentPacket.writeData(b, offset, len);

      currentPacket.numChunks++;

      bytesCurBlock += len;



      //如果此package已满，则放入队列中准备发送

      if (currentPacket.numChunks == currentPacket.maxChunks ||bytesCurBlock == blockSize) {

          ......

          dataQueue.addLast(currentPacket);

          //唤醒等待dataqueue的传输线程，也即DataStreamer

          dataQueue.notifyAll();

          currentPacket = null;

          ......

      }

 }

writeChunk比较简单，就是把数据填充packet，填充完毕，就放到dataQueue，再唤醒DataStreamer。

DataStreamer完成了数据的传输，DataStreamer的run函数如下：

  public void run() {

    while (!closed && clientRunning) {

      Packet one = null;

      synchronized (dataQueue) {

　　　　  boolean doSleep = processDatanodeError(hasError, false);//如果ack出错，则处理IO错误

        //如果队列中没有package，则等待

        while ((!closed && !hasError && clientRunning && dataQueue.size() == 0) || doSleep) {

          try {

            dataQueue.wait(1000);

          } catch (InterruptedException  e) {

          }

          doSleep = false;

        }

        try {

          //得到队列中的第一个package

          one = dataQueue.getFirst();

          long offsetInBlock = one.offsetInBlock;

          //由NameNode分配block，并生成一个写入流指向此block

          if (blockStream == null) {

            nodes = nextBlockOutputStream(src);

            response = new ResponseProcessor(nodes);

            response.start();

          }



          ByteBuffer buf = one.getBuffer();

          //将packet从dataQueue移至ackQueue,等待确认

          dataQueue.removeFirst();

          dataQueue.notifyAll();

          synchronized (ackQueue) {

            ackQueue.addLast(one);

            ackQueue.notifyAll();

          }



          //利用生成的写入流将数据写入DataNode中的block

          blockStream.write(buf.array(), buf.position(), buf.remaining());

          if (one.lastPacketInBlock) {

            blockStream.writeInt(0); //表示此block写入完毕

          }

          blockStream.flush();

        } catch (Throwable e) {

        }

        

        if (one.lastPacketInBlock) {

            //数据块写满，做一些清理工作，下次再申请块

            response.close();        // ignore all errors in Response

            

            synchronized (dataQueue) {

              IOUtils.cleanup(LOG, blockStream, blockReplyStream);

              nodes = null;

              response = null;

              blockStream = null;//设置为null，下次就会判断blockStream为null，申请新的块

              blockReplyStream = null;

            }

        }

    }

      ......

  }

DataStreamer线程负责把准备好的数据packet，顺序写入到DataNode，未确认写入成功的packet则移动到ackQueue，等待确认。

DataStreamer线程传输数据到DataNode时，要向namenode申请数据块，方法是nextBlockOutputStream，再调用locateFollowingBlock，通过RPC调用namenode.addBlock(src, clientName)，在NameNode分配了DataNode和block以后，createBlockOutputStream开始写入数据。

客户端在DataStreamer的run函数中创建了写入流后，调用blockStream.write将packet写入DataNode

DataStreamer还会启动ResponseProcessor线程，它负责接收datanode的ack，当接收到所有datanode对一个packet确认成功的ack，ResponseProcessor从ackQueue中删除相应的packet。在出错时，从ackQueue中移除packet到dataQueue，移除失败的datanode，恢复数据块，建立新的pipeline。实现如下：

public void run() {

...

PipelineAck ack = new PipelineAck();

while (!closed && clientRunning && !lastPacketInBlock) {

  try {

    // read an ack from the pipeline

    ack.readFields(blockReplyStream);

    ...

    //处理所有DataNode响应的状态

    for (int i = ack.getNumOfReplies()-1; i >=0 && clientRunning; i--) {

        short reply = ack.getReply(i);  

      if (reply != DataTransferProtocol.OP_STATUS_SUCCESS) {//ack验证，如果DataNode写入packet失败，则出错    

        errorIndex = i; //记录损坏的DataNode,会在processDatanodeError方法移除该失败的DataNode

        throw new IOException("Bad response " + reply + " for block " + block +  " from datanode " + targets[i].getName());    

      }   

    }



    long seqno = ack.getSeqno();

    if (seqno == Packet.HEART_BEAT_SEQNO) {  // 心跳ack，忽略

      continue;

    }

    Packet one = null;

    synchronized (ackQueue) {

      one = ackQueue.getFirst();

    }

    ...

    synchronized (ackQueue) {

      assert ack.getSeqno() == lastAckedSeqno + 1;//验证ack

      lastAckedSeqno = ack.getSeqno();

      ackQueue.removeFirst();//移除确认写入成功的packet

      ackQueue.notifyAll();

    }

  } catch (Exception e) {

    if (!closed) {

      hasError = true;//设置ack错误,让

      ...

      closed = true;

    }

  }

}

}

当ResponseProcessor在确认packet失败时，processDatanodeError方法用于处理datanode的错误，当调用返回后需要休眠一段时间时，返回true。下面是其简单的处理流程：

1.关闭blockStream和blockReplyStream
2.将packet从ackQueue移到dataQueue
3.删除坏datanode
4.通过RPC调用datanode的recoverBlock方法来恢复块，如果有错，返回true
5.如果没有可用的datanode，关闭DFSOutputStream和streamer，返回false
6.创建块输出流，如果不成功，转到3

实现如下:

private boolean processDatanodeError(boolean hasError, boolean isAppend) {

  if (!hasError) {//DataNode没有发生错误，直接返回

    return false;

  }

  

  //将未确认写入成功的packets从ack queue移动到data queue的前面

  synchronized (ackQueue) {

    dataQueue.addAll(0, ackQueue);

    ackQueue.clear();

  }



  boolean success = false;

  while (!success && clientRunning) {

    DatanodeInfo[] newnodes = null;

    

    //根据errorIndex确定失败的DataNode，从所有的DataNode nodes移除失败的DataNode，复制到newnodes



    // 通知primary datanode做数据块恢复，更新合适的时间戳

    LocatedBlock newBlock = null;

    ClientDatanodeProtocol primary =  null;

    DatanodeInfo primaryNode = null;

    try {

      // Pick the "least" datanode as the primary datanode to avoid deadlock.

      primaryNode = Collections.min(Arrays.asList(newnodes));

      primary = createClientDatanodeProtocolProxy(primaryNode, conf, block, accessToken, socketTimeout);

      newBlock = primary.recoverBlock(block, isAppend, newnodes);//恢复数据块

    } catch (IOException e) {

        //循环创建块输出流，如果不成功，移除失败的DataNode

          return true;          // 需要休眠

    } finally {

      RPC.stopProxy(primary);

    }

    recoveryErrorCount = 0; // 数据块恢复成功

    block = newBlock.getBlock();

    accessToken = newBlock.getBlockToken();

    nodes = newBlock.getLocations();



    this.hasError = false;

    lastException = null;

    errorIndex = 0;

    success = createBlockOutputStream(nodes, clientName, true);

  }



  response = new ResponseProcessor(nodes);

  response.start();//启动ResponseProcessor做ack确认处理

  return false; // 不休眠，继续处理

}

总结

hdfs文件的写入是比较复杂的，所以本文重点介绍了dfsclient端的处理逻辑，对namenode和datanode的响应，就不做详细分析了。

更多参考

http://www.cnblogs.com/forfuture1978/archive/2010/11/10/1874222.html (HDFS读写过程解析)

http://blog.jeoygin.org/2012/07/hdfs-source-analysis-hdfs-input-output-stream.html (讲解dfsclient的重要类的职责)

http://caibinbupt.iteye.com/blog/286259 (datanode对于块写入的处理)

原文：http://www.cnblogs.com/ggjucheng/

c#连接MySql数据库一一数据库 mysql c#
1.右击引用点击管理NuGet程序包2.下载MySql.Data数据包3.引用usingMySql.Data.MySqlClient;4.利用ADO.NET技术就可以连接到MySql数据库了
【MySQL】C# 连接MySQL m0_74824802 面试学习路线阿里巴巴 mysql c#数据库
C#连接MySQL1.添加MySQL引用安装完MySQL之后，在安装的默认目录C:ProgramFiles(x86)MySQLConnectorNET8.0中查找MySQLData.dll文件。在VisualStudio中为项目中添加引用。2.引入命名空间usingMySql.Data.MySqlClient;3.构建连接privatestaticMySqlConnectionm_Connect=
web端广告飘窗努力搬砖的程序媛儿前端 javascript html
漂浮广告varx=50,y=60varxin=true,yin=truevarstep=1vardelay=10varobj=document.getElementById("codefans_net")functionfloat(){varL=T=0varR=document.body.clientWidth-obj.offsetWidthvarB=document.body.clientHei
Java网络编程逆风局？ java 网络服务器
基本的通信架构1.CS架构（Client客户端/Server服务端）Client客户端：需要程序员开发客户端软件需要用户下载安装客户端软件Server服务端：需要程序员开发服务端程序BS架构（Browser浏览器/Server服务端）。Browser浏览器不需要程序员开发需要用户下载安装浏览器Server服务端需要程序员开发服务端程序网络通信三要素IP地址设备在网络中的地址，是设备在网络中的唯一标
使用github.com/prometheus/client_golang/prometheus包的注意事项 qq_1536161955 prometheus golang 服务器
1.panic:duplicatemetricscollectorregistrationattempted重复注册。错误代码如下promauto.NewCounter(prometheus.CounterOpts{Name:"name",ConstLabels:prometheus.Labels{"k1":"v1"},})promauto.NewCounter(prometheus.Counte
《Java核心技术卷II》HTTP客户端阿立聊全栈《Java核心技术II》Java Java核心II 服务器
HTTP客户端URLConnection是HTTP称为Web普通适用协议之前设计的，提供大量协议支持，但笨重。HttpClient提供了更便捷的API和HTTP/2的支持。HttpClient类HttpClient对象可以发出请求并接收响应，调用方法获取客户端：HttpClientclient=HttpClient.newHttpClient();需要配置客户端，如下构建器API:HttpClie
分布式-服务通信飘飘渺渺渺红尘 Java Web Service 分布式
目录一、RestTemplate1、简介2、使用2.1、GET2.2、POST2.3、exchange2.4、execute2.5、总结二、Feign1、简介2、使用2.1、OpenFeignServer2.2、OpenFeignClient3、@FeignClient4、参数三、Dubbo一、RestTemplate1、简介我们在访问http服务时，直接使用jdk的HttpURLConnecti
feign调用远程服务如何忽略SSL证书 Capslockcc ssl https java
feign调用远程服务如何忽略SSL证书1.引入依赖2.添加配置3.原理解释1.引入依赖org.springframework.cloudspring-cloud-starter-openfeignio.github.openfeignfeign-okhttp10.2.02.添加配置#禁用ssl证书验证feign.httpclient.disable-ssl-validation=true完成以上
Elasticsearch 8.17.1 JAVA工具类熟透的蜗牛牛X的开源框架 elasticsearch
一、ElasticSearchUtilspackagecom.wssnail.elasticsearch.util;importco.elastic.clients.elasticsearch.ElasticsearchClient;importco.elastic.clients.elasticsearch._types.FieldValue;importco.elastic.clients.e
TLS1.3握手过程龙贝尔莱利 c c语言服务器
tls1.3首次连接密码套件："TLS_AES_256_GCM_SHA384"==0x1302为例；椭圆曲线为x25519;C->S表示client->server,S->C表示server->client.相同方向的包可以并在一起发送，占用一次RTT（往返时间）。[Server视角]1.a_tls_get_client_hello()C->SExtension:Key_share(x25519l
后端开发基础——JavaWeb（根基，了解原理）浓缩 Wanna715 后端开发基础 java tomcat servlet 后端
总述学习Tomcat、JSON、Servlet、Filter、Session、Cookie、Ajax异步请求、RESTful接口规范、JSP(很老的技术，了解)Servlet系统架构C/S架构(Client/Server（客户端/服务器）)B/S架构（Browser/Server，浏览器/服务器）javaJavaSE:Java标准版JavaEE:企业版（WEB方向，WEB系统）13种规范，其中Se
dotnet-blazor-crud 项目教程尚舰舸Elsie
dotnet-blazor-crud项目教程dotnet-blazor-crudDemoapplicationbuiltwiththeBlazorclient-sidehostingmodel(WebAssembly)and.NETCoreRESTAPIssecuredbyaJWTservice.项目地址:https://gitcode.com/gh_mirrors/do/dotnet-blazo
SpringCloud之OpenFeign简单使用 tuoerke springcloud
SpringCloud之OpenFeign简单使用文章目录SpringCloud之OpenFeign简单使用一、远程调用功能使用url形式的方式测试二、负载功能测试三、熔断降级OpenFeign是springcloud在Feign的基础上支持了SpringMVC的注解，如@RequestMapping等等。OpenFeign的@FeignClient可以解析SpringMVC的@RequestMa
赶紧收藏！2024 年最常见 20道分布式、微服务面试题（八）学长爱编程分布式微服务程序员面试分布式微服务架构面试后端跳槽中间件
上一篇地址：赶紧收藏！2024年最常见20道分布式、微服务面试题（七）-CSDN博客十五、什么是负载均衡，它在微服务架构中如何工作？负载均衡是一种在计算机网络中分配工作负载（如网络流量、请求处理等）到多个计算资源（如服务器、数据库、存储设备等）的策略。其主要目的是优化资源的利用、提高吞吐量、增强系统可用性和容错性，以及避免任何单一资源的过载。负载均衡的关键概念：前端（Client-Side）负载均
【Elasticsearch】RestClient操作文档乙卯年QAQ elasticsearch jenkins 大数据 java
RestClient操作文档新增文档实体类API语法查询文档删除文档修改文档批量导入文档小结新增文档将数据库中的信息导入elasticsearch中以商品数据为例实体类定义一个索引库结构对应的实体。@Data@ApiModel(description="索引库实体")publicclassItemDoc{@ApiModelProperty("商品id")privateStringid;@ApiMo
全网最详细Gradio教程系列5——Gradio Client: javascript 龙焰智能 Gradio全解教程 javascript gradio client playcode.co npm cdn node.js
全网最详细Gradio教程系列5——GradioClient:javascript前言本篇摘要5.GradioClient的三种使用方式5.2使用GradioJavaScriptClient5.2.1安装1.npm方式：node.js2.CDN方式3.在线运行环境：PLAYCODE5.2.2连接到Gradio程序1.通过URL或SpaceID连接2.辅助：duplicate()和hf_token5
Java创建型设计模式-原型模式程风破～ Java设计模式实战 java 设计模式原型模式
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录1.前言2.原型模式的主要角色2.1原型接口或抽象类2.2具体原型类2.3客户端2.4克隆方法3.原型模式使用场景3.1创建对象是昂贵的3.2对象的变化3.3动态配置3.4减少初始化开销4.原型模式的代码示例4.1原型接口：Shape4.2具体原型（）：Circle4.3客户端（）：ShapeClient4.4上述示例的完整代
Python 3 编程教程 - Tkinter 事件处理 sentdex python
这段文字主要讲解了在使用Tkinter构建GUI窗口时，如何为按钮添加事件处理功能，具体来说是：创建窗口和按钮:这段代码首先创建了一个简单的GUI窗口，并添加了一个按钮。添加事件处理功能:为了让按钮点击后执行特定操作，需要为按钮添加command属性，该属性的值是一个函数名，当按钮被点击时，该函数会被调用。定义事件处理函数:这段代码定义了一个名为client_exit的函数，该函数将作为按钮点击后
python复制word全部内容，包括图片、文字、格式 clean_water python python python复制word
importwin32com.clientapp=win32com.client.Dispatch('Word.Application') doc=app.Documents.Open(r'D:\winGUI\test\1.doc')doc.Content.Copy()doc.Close()
@EnableFeignClients 和 @FeignClient 在自动装配时失败 ‘FeignContext’ NoSuchBeanDefinitionException 肉三 Java java 开发语言
我正在编写的微服务需要与我们平台中的其他微服务进行通信。对于这一尝试，对我们来说理想的解决方案是SpringCloudNetflixFeign，它实现了@FeignClient。但是，当我尝试时遇到以下异常@AutowiredReviewProvider：Causedby:org.springframework.beans.factory.NoSuchBeanDefinitionException
关闭vue项目中Uncaught runtime errors弹窗 qx09 vue.js 前端 javascript
module.exports=defineConfig({//关闭eslinelintOnSave:false,transpileDependencies:true,publicPath:'./',//关闭弹窗devServer:{client:{overlay:false}}})
基于 Colyseus 的实时消息处理与广播机制 maply Colyseus 前端 colyseus 消息队列 node.js
基于Colyseus的实时消息处理与广播机制Colyseus是一个用于构建实时多人游戏和协作应用的开源框架，基于Node.js运行，并使用WebSocket进行高效的消息传输。它提供了一套结构化的API来管理房间（Rooms）、客户端（Clients）和游戏状态（State），从而支持高效的实时消息处理与广播机制。1.Colyseus消息处理与广播的基本概念Colyseus主要通过以下组件来管理实
NGINX 报错 413 Request Entity Too Large 解决方案技术探索者 NGINX nginx
1、问题原因用Nginx反向代理服务器，进行附件相关的操作时，当文件大小超过1M，会出现413RequestEntityTooLarge，这是由于nginx客户端默认的最大请求体是1M。2、解决方案通过修改Nginx配置文件的“client_max_body_size”属性来解决。nginx的默认配置文件是conf目录下的nginx.conf。注意：如果有自行扩展的配置文件可在nginx.conf
在VScode设置R语言 weixin_39287540 R windows mac
在VScode设置R语言1.下载R语言和VScode2.安装所需要的插件3.下载对接RLSP的R包3.下载Radian4.设置VScode中的路径1.下载R语言和VScodeR语言官网：https://www.r-project.orgVScode官网：https://code.visualstudio.com/2.安装所需要的插件必须的插件有2个：R和RLSPClient3.下载对接RLSP的R
掌握 Spring Boot 中的 WebClient：何时以及为何使用它而不是 RestTemplate 小蜗牛慢慢爬行 spring boot 后端 java 开发语言 spring
在开发SpringBoot应用程序时，与RESTfulWeb服务进行通信是一项常见需求。从历史上看，开发人员已将RestTemplate用于此目的。然而，随着反应式编程的出现和对更高效资源利用的需求，WebClient已成为首选。本文探讨了RestTemplate和WebClient之间的差异，并通过实际示例强调了为什么WebClient更适合现代应用程序。何时使用RestTemplate？Res
用 aiofiles 模块的 asyncio.to_thread() 方法将同步文件操作转换为异步操作 PyAIGCMaster python
importaiofilesimportreasyncdefdownload_text_to_file(url,name):asyncwithaiohttp.ClientSession()assession:asyncwithsession.get(url)asresponse:text=awaitresponse.text()obj_content=re.compile(r"content:'(
你说通过Kafka AdminClient获取Lag会有性能问题？尊嘟假嘟0.o javakafka大数据
版本日期备注1.02024.8.25文章首发本文内容已用一种抽象的方式做成了视频，喜欢看视频的同学可以在B站上搜索“抽象狗哥”观看相应的内容。0.前言前阵子团队里出了个大故障，本质是因为其他语言实现的client有问题，非常频繁的请求大量元数据，而Kafka服务端这边也没有做什么限制，导致KafkaBroker宕了。在相关的复盘报告中，复盘方提到了我这边的监控程序（用于观察线上实时作业的堆压）会频
Java的DatagramPacket在C#中体现 hh_fine c#java
C#创建UDP客户端和服务端在C#中，DatagramPacket是Java中用于UDP通信的一个类，而C#并没有直接对应的DatagramPacket类。不过，C#提供了类似的机制来处理基于UDP的数据报（datagram）通信，主要通过System.Net.Sockets命名空间中的UdpClient和Socket类来实现使用UDP客户端发送UdpClient是相对于Socket更高级的类，适
C++网络程序设计 0zxm c++网络 stm32 linux
在C++网络编程中，使用BerkeleySocketsAPI是一种常见的方法来实现跨平台的TCP通信。BerkeleySocketsAPI最初是在UNIX系统上开发的，但它已经被广泛移植到其他操作系统，包括Windows。示例代码client.cpp#include#include#ifdef_WIN32#include#pragmacomment(lib,"ws2_32.lib")//Winso
golang httpClient请求，时不时EOF，怎么解决？ Ai 编码 Golang教程 golang xcode 开发语言
在使用Go的http.Client进行HTTP请求时，有时会遇到EOF错误。这个错误通常与网络连接问题或HTTP客户端的使用方式不当有关。下面我将详细解释一些常见原因以及解决方法。常见原因连接被意外关闭：EOF错误的意思是"EndOfFile"，在HTTP请求中通常表示连接被提前关闭。可能是服务端关闭了连接，也可能是客户端的连接池管理不当导致的。HTTP连接复用（Keep-Alive）问题：Go的
java的(PO,VO,TO,BO,DAO,POJO) Cb123456 VO TO BO POJO DAO
转: http://www.cnblogs.com/yxnchinahlj/archive/2012/02/24/2366110.html ------------------------------------------------------------------- O/R Mapping 是 Object Relational Mapping（对象关系映
spring ioc原理（看完后大家可以自己写一个spring） aijuans spring
最近，买了本Spring入门书：spring In Action 。大致浏览了下感觉还不错。就是入门了点。Manning的书还是不错的，我虽然不像哪些只看Manning书的人那样专注于Manning,但怀着崇敬的心情和激情通览了一遍。又一次接受了IOC 、DI、AOP等Spring核心概念。先就IOC和DI谈一点我的看法。IO
MyEclipse 2014中Customize Persperctive设置无效的解决方法 Kai_Ge MyEclipse2014
高高兴兴下载个MyEclipse2014，发现工具条上多了个手机开发的按钮，心生不爽就想弄掉他！结果发现Customize Persperctive失效！！有说更新下就好了，可是国内Myeclipse访问不了，何谈更新... so~这里提供了更新后的一下jar包，给大家使用！ 1、将9个jar复制到myeclipse安装目录\plugins中 2、删除和这9个jar同包名但是版本号较
SpringMvc上传 120153216 springMVC
@RequestMapping(value = WebUrlConstant.UPLOADFILE) @ResponseBody public Map<String, Object> uploadFile(HttpServletRequest request,HttpServletResponse httpresponse) { try { //
Javascript----HTML DOM 事件何必如此 JavaScript html Web
HTML DOM 事件允许Javascript在HTML文档元素中注册不同事件处理程序。事件通常与函数结合使用，函数不会在事件发生前被执行！注：DOM：指明使用的 DOM 属性级别。 1.鼠标事件属性
动态绑定和删除onclick事件 357029540 JavaScript jquery
因为对JQUERY和JS的动态绑定事件的不熟悉，今天花了好久的时间才把动态绑定和删除onclick事件搞定!现在分享下我的过程。在我的查询页面，我将我的onclick事件绑定到了tr标签上同时传入当前行(this值)参数，这样可以在点击行上的任意地方时可以选中checkbox，但是在我的某一列上也有一个onclick事件是用于下载附件的，当
HttpClient|HttpClient请求详解 7454103 apache 应用服务器网络协议网络应用 Security
HttpClient 是 Apache Jakarta Common 下的子项目，可以用来提供高效的、最新的、功能丰富的支持 HTTP 协议的客户端编程工具包，并且它支持 HTTP 协议最新的版本和建议。本文首先介绍 HTTPClient，然后根据作者实际工作经验给出了一些常见问题的解决方法。HTTP 协议可能是现在 Internet 上使用得最多、最重要的协议了，越来越多的 Java 应用程序需
递归逐层统计树形结构数据 darkranger 数据结构
将集合递归获取树形结构: /** * * 递归获取数据 * @param alist:所有分类 * @param subjname:对应统计的项目名称 * @param pk:对应项目主键 * @param reportList: 最后统计的结果集 * @param count:项目级别 */ public void getReportVO(Arr
访问WEB-INF下使用frameset标签页面出错的原因 aijuans struts2
<frameset rows="61,*,24" cols="*" framespacing="0" frameborder="no" border="0">
MAVEN常用命令 avords
Maven库： http://repo2.maven.org/maven2/ Maven依赖查询： http://mvnrepository.com/ Maven常用命令： 1. 创建Maven的普通java项目： mvn archetype:create -DgroupId=packageName
PHP如果自带一个小型的web服务器就好了 houxinyou apache 应用服务器 Web PHP 脚本
最近单位用PHP做网站，感觉PHP挺好的，不过有一些地方不太习惯，比如，环境搭建。PHP本身就是一个网站后台脚本，但用PHP做程序时还要下载apache，配置起来也不太很方便，虽然有好多配置好的apache+php+mysq的环境，但用起来总是心里不太舒服，因为我要的只是一个开发环境，如果是真实的运行环境，下个apahe也无所谓，但只是一个开发环境，总有一种杀鸡用牛刀的感觉。如果php自己的程序中
NoSQL数据库之Redis数据库管理(list类型) bijian1013 redis 数据库 NoSQL
3.list类型及操作 List是一个链表结构，主要功能是push、pop、获取一个范围的所有值等等，操作key理解为链表的名字。Redis的list类型其实就是一个每个子元素都是string类型的双向链表。我们可以通过push、pop操作从链表的头部或者尾部添加删除元素，这样list既可以作为栈，又可以作为队列。 &nbs
谁在用Hadoop？ bingyingao hadoop 数据挖掘公司应用场景
Hadoop技术的应用已经十分广泛了，而我是最近才开始对它有所了解，它在大数据领域的出色表现也让我产生了兴趣。浏览了他的官网，其中有一个页面专门介绍目前世界上有哪些公司在用Hadoop，这些公司涵盖各行各业，不乏一些大公司如alibaba,ebay,amazon,google,facebook,adobe等，主要用于日志分析、数据挖掘、机器学习、构建索引、业务报表等场景,这更加激发了学习它的热情。
【Spark七十六】Spark计算结果存到MySQL bit1129 mysql
package spark.examples.db import java.sql.{PreparedStatement, Connection, DriverManager} import com.mysql.jdbc.Driver import org.apache.spark.{SparkContext, SparkConf} object SparkMySQLInteg
Scala: JVM上的函数编程 bookjovi scala erlang haskell
说Scala是JVM上的函数编程一点也不为过，Scala把面向对象和函数型编程这两种主流编程范式结合了起来，对于熟悉各种编程范式的人而言Scala并没有带来太多革新的编程思想，scala主要的有点在于Java庞大的package优势，这样也就弥补了JVM平台上函数型编程的缺失，MS家.net上已经有了F#，JVM怎么能不跟上呢？对本人而言
jar打成exe bro_feng java jar exe
今天要把jar包打成exe，jsmooth和exe4j都用了。遇见几个问题。记录一下。两个软件都很好使，网上都有图片教程，都挺不错。首先肯定是要用自己的jre的，不然不能通用，其次别忘了把需要的lib放到classPath中。困扰我很久的一个问题是，我自己打包成功后，在一个同事的没有装jdk的电脑上运行，就是不行，报错jvm.dll为无效的windows映像，如截图最后发现
读《研磨设计模式》-代码笔记-策略模式-Strategy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 策略模式定义了一系列的算法，并将每一个算法封装起来，而且使它们还可以相互替换。策略模式让算法独立于使用它的客户而独立变化简单理解： 1、将不同的策略提炼出一个共同接口。这是容易的，因为不同的策略，只是算法不同，需要传递的参数
cmd命令值cvfM命令 chenyu19891124 cmd
cmd命令还真是强大啊。今天发现jar -cvfM aa.rar @aaalist 就这行命令可以根据aaalist取出相应的文件例如：在d：\workspace\prpall\test.java 有这样一个文件，现在想要将这个文件打成一个包。运行如下命令即可比如在d：\wor
OpenJWeb(1.8) Java Web应用快速开发平台 comsci java 框架 Web 项目管理企业应用
OpenJWeb(1.8) Java Web应用快速开发平台的作者是我们技术联盟的成员，他最近推出了新版本的快速应用开发平台 OpenJWeb(1.8)，我帮他做做宣传 OpenJWeb快速开发平台以快速开发为核心，整合先进的java 开源框架，本着自主开发+应用集成相结合的原则，旨在为政府、企事业单位、软件公司等平台用户提供一个架构透
Python 报错：IndentationError: unexpected indent daizj python tab 空格缩进
IndentationError: unexpected indent 是缩进的问题，也有可能是tab和空格混用啦 Python开发者有意让违反了缩进规则的程序不能通过编译，以此来强制程序员养成良好的编程习惯。并且在Python语言里，缩进而非花括号或者某种关键字，被用于表示语句块的开始和退出。增加缩进表示语句块的开
HttpClient 超时设置 dongwei_6688 httpclient
HttpClient中的超时设置包含两个部分： 1. 建立连接超时，是指在httpclient客户端和服务器端建立连接过程中允许的最大等待时间 2. 读取数据超时，是指在建立连接后，等待读取服务器端的响应数据时允许的最大等待时间在HttpClient 4.x中如下设置： HttpClient httpclient = new DefaultHttpC
小鱼与波浪 dcj3sjt126com
一条小鱼游出水面看蓝天，偶然间遇到了波浪。　　小鱼便与波浪在海面上游戏，随着波浪上下起伏、汹涌前进。　　小鱼在波浪里兴奋得大叫：“你每天都过着这么刺激的生活吗？简直太棒了。”　　波浪说：“岂只每天过这样的生活，几乎每一刻都这么刺激！还有更刺激的，要有潮汐变化，或者狂风暴雨，那才是兴奋得心脏都会跳出来。”　　小鱼说：“真希望我也能变成一个波浪，每天随着风雨、潮汐流动，不知道有多么好！”　　很快，小鱼
Error Code: 1175 You are using safe update mode and you tried to update a table dcj3sjt126com mysql
快速高效用：SET SQL_SAFE_UPDATES = 0；下面的就不要看了！今日用MySQL Workbench进行数据库的管理更新时，执行一个更新的语句碰到以下错误提示： Error Code: 1175 You are using safe update mode and you tried to update a table without a WHERE that
枚举类型详细介绍及方法定义 gaomysion enum javaee
转发 http://developer.51cto.com/art/201107/275031.htm 枚举其实就是一种类型，跟int, char 这种差不多，就是定义变量时限制输入的，你只能够赋enum里面规定的值。建议大家可以看看，这两篇文章，《java枚举类型入门》和《C++的中的结构体和枚举》，供大家参考。枚举类型是JDK5.0的新特征。Sun引进了一个全新的关键字enum
Merge Sorted Array hcx2013 array
Given two sorted integer arrays nums1 and nums2, merge nums2 into nums1 as one sorted array. Note:You may assume that nums1 has enough space (size that is
Expression Language 3.0新特性 jinnianshilongnian el 3.0
Expression Language 3.0表达式语言规范最终版从2013-4-29发布到现在已经非常久的时间了；目前如Tomcat 8、Jetty 9、GlasshFish 4已经支持EL 3.0。新特性包括：如字符串拼接操作符、赋值、分号操作符、对象方法调用、Lambda表达式、静态字段/方法调用、构造器调用、Java8集合操作。目前Glassfish 4/Jetty实现最好，对大多数新特性
超越算法来看待个性化推荐 liyonghui160com 超越算法来看待个性化推荐
一提到个性化推荐，大家一般会想到协同过滤、文本相似等推荐算法，或是更高阶的模型推荐算法，百度的张栋说过，推荐40%取决于UI、30%取决于数据、20%取决于背景知识，虽然本人不是很认同这种比例，但推荐系统中，推荐算法起的作用起的作用是非常有限的。就像任何
写给Javascript初学者的小小建议 pda158 JavaScript
　　一般初学JavaScript的时候最头痛的就是浏览器兼容问题。在Firefox下面好好的代码放到IE就不能显示了，又或者是在IE能正常显示的代码在firefox又报错了。　　如果你正初学JavaScript并有着一样的处境的话建议你：初学JavaScript的时候无视DOM和BOM的兼容性，将更多的时间花在了解语言本身（ECMAScript）。只在特定浏览器编写代码（Chrome/Fi
Java 枚举 ShihLei java enum 枚举
注：文章内容大量借鉴使用网上的资料，可惜没有记录参考地址，只能再传对作者说声抱歉并表示感谢！一基础 1）语法枚举类型只能有私有构造器（这样做可以保证客户代码没有办法新建一个enum的实例）枚举实例必须最先定义 2）特性 &nb
Java SE 6 HotSpot虚拟机的垃圾回收机制 uuhorse java HotSpot GC 垃圾回收 VM
官方资料，关于Java SE 6 HotSpot虚拟机的garbage Collection，非常全，英文。 http://www.oracle.com/technetwork/java/javase/gc-tuning-6-140523.html Java SE 6 HotSpot[tm] Virtual Machine Garbage Collection Tuning &

HDFS dfsclient写文件过程 源码分析

HDFS写入文件的重要概念

HDFS客户端写文件示例代码

文件的打开

dfsclient文件的写入

总结

你可能感兴趣的:(client)

HDFS dfsclient写文件过程源码分析