午后的红茶meton

Hdfs 客户端写过程源码解析

承接上文Hdfs客户端读过程；接着来分析一下hdfs客户端写入文件的过程；说道到写文件过程，都会知道写入文件的过程如下示意图：

客户端写过程示意图：

总体来说，最简单的HDFS写文件大体流程如下：

客户端获取文件系统实例FileSyStem，并通过其create()方法获取文件系统输出流outputStream。
1. 首先会联系名字节点NameNode，通过ClientProtocol.create()进行rpc调用，在名字节点上创建文件元数据，并获取文件状态FileStatus；
2. 通过文件状态FileStatus构造文件系统输出流outputStream；
通过文件系统输出流outputStream写入数据。
1. 首次写入会首先向名字节点申请数据块，名字节点能够掌握集群DataNode整体状况，分配数据块后，连同DataNode列表信息返回给客户端；
2. 客户端采用流式管道的方式写入数据节点列表中的第一个DataNode，并由列表中的前一个DataNode将数据转发给后面一个DataNode；
3. 确认数据包由DataNode经过管道依次返回给上游DataNode和客户端；
4. 写满一个数据块后，向名字节点提交一个数据块；
5. 再次重复1-4的过程；
向名字节点提交文件（complete file），即告知名字节点文件已写完，然后关闭文件系统输出流outputStream等释放资源。

接下来从源码的角度一步步解析，看hdfs client是如何与NameNode，DataNode进行写文件交互的。

1、首先客户端调用FSDataOutputStream outputStream = DistributedFileSystem.create()方法，创建一个空的hdfs文件，并获取这个文件的输出流FSDataOutputStream；可以看到FSDataOutputStream其内部真正用于输出流的对象是DFSOutputStream，其用来将数据写入该hdfs文件。其构造流程及源码如下：

  public DFSOutputStream create(String src, 
                             FsPermission permission,
                             EnumSet flag, 
                             boolean createParent,
                             short replication,
                             long blockSize,
                             Progressable progress,
                             int buffersize,
                             ChecksumOpt checksumOpt,
                             InetSocketAddress[] favoredNodes) throws IOException {
    // 检查客户端是否已经打开
	checkOpen();
    // 权限设置等
	// ......
	// 调用DFSOutputStream.newStreamForCreate()创建DFSOutputStream对象
    final DFSOutputStream result = DFSOutputStream.newStreamForCreate(this,
        src, masked, flag, createParent, replication, blockSize, progress,
        buffersize, dfsClientConf.createChecksum(checksumOpt),
        favoredNodeStrs);
    beginFileLease(result.getFileId(), result);
    return result;
  }

  static DFSOutputStream newStreamForCreate(DFSClient dfsClient, String src,
      FsPermission masked, EnumSet flag, boolean createParent,
      short replication, long blockSize, Progressable progress, int buffersize,
      DataChecksum checksum, String[] favoredNodes) throws IOException {
    HdfsFileStatus stat = null;
    // ......
    while (shouldRetry) {
      shouldRetry = false;
      try {
	    // 通过RPC调用ClientProtocol.create()方法，在命名空间中创建hdfs文件
        stat = dfsClient.namenode.create(src, masked, dfsClient.clientName,
            new EnumSetWritable(flag), createParent, replication,
            blockSize, SUPPORTED_CRYPTO_VERSIONS);
        break;
      } catch (RemoteException re) {
        // ......
      }
    }
    Preconditions.checkNotNull(stat, "HdfsFileStatus should not be null!");
	// 构造DFSOutputStream对象 并启动该线程DataStreamer
    final DFSOutputStream out = new DFSOutputStream(dfsClient, src, stat,
        flag, progress, checksum, favoredNodes);
    out.start();
    return out;
  }

在构造DFSOutputStream对象中，其会初始化属性，并且调用computePacketChunkSize()方法确定数据包packet大小，同时确定一个数据包当中包含多少个校验块Chunk。接着会创建DataStreamer线程，其就是客户端写文件的输出流主体：后续就依靠这个数据流对象来通过管道发送流式数据；其主要负责建立数据流管道pipeline，并将数据包发送到数据流管道中的第一个DataNode。

  /** Construct a new output stream for creating a file. */
  private DFSOutputStream(DFSClient dfsClient, String src, HdfsFileStatus stat,
      EnumSet flag, Progressable progress,
      DataChecksum checksum, String[] favoredNodes) throws IOException {
    // 基本属性初始化
    this(dfsClient, src, progress, stat, checksum);
    this.shouldSyncBlock = flag.contains(CreateFlag.SYNC_BLOCK);
    // 计算数据包packet大小，以及校验块chunk
    computePacketChunkSize(dfsClient.getConf().writePacketSize, bytesPerChecksum);

    Span traceSpan = null;
    if (Trace.isTracing()) {
      traceSpan = Trace.startSpan(this.getClass().getSimpleName()).detach();
    }
    // 构造stream线程
    streamer = new DataStreamer(stat, traceSpan);
    if (favoredNodes != null && favoredNodes.length != 0) {
      streamer.setFavoredNodes(favoredNodes);
    }
  }

2、在构造好了基本的文件输出流DFSOutputStream之后；便可以调用DFSOutputStream.write()方法进行数据的写入，在DFSOutputStream的写入过程中，其使用packet类来封装一个数据包。每个数据包中都包含多个校验块和校验和，其基本的数据包结构如下：

数据包头PacketHeader(PacketLength、HeaderLength、Header)
CheckSums(checksum：1-n)
Data(Chunk：1-n)

在write()写入方法中，其基本的写入流程如下：

可以看到其调用write()写入方法会继续循环调用write1()方法将数据写入到buffer缓冲区中，当buffer缓冲区已满时，会调用flushBuffer()将buffer中的多个校验块数据封装成一个packet包，并在该packet包中数据写满时，将其放入dataQueu队列中，等待写出到输出的IO流中；其基本的write1()和writeChunk()【writeChunk由子类DFSOutputStream实现】方法如下：

  private int write1(byte b[], int off, int len) throws IOException {
    if(count==0 && len>=buf.length) {
      // buf初始化的大小是chunk的大小，默认是512，这里的代码会在写入的数据的剩余内容大于或等于一个chunk的大小时调用
      // 这里避免多余一次复制
      final int length = buf.length;
      sum.update(b, off, length);//length是一个完整chunk的大小，默认是512，这里根据一个chunk内容计算校验和
      writeChecksumChunk(b, off, length, false);
      return length;
    }
    
    // buf初始化的大小是chunk的大小，默认是512，这里的代码会在写入的数据的剩余内容小于一个chunk的大小时调用
    // 规避了数组越界问题
    int bytesToCopy = buf.length-count;
    bytesToCopy = (len

 
     protected synchronized void writeChunk(byte[] b, int offset, int len, byte[] checksum)throws IOException {
      //创建一个package，并写入数据
      currentPacket = new Packet(packetSize, chunksPerPacket,bytesCurBlock);
      currentPacket.writeChecksum(checksum, 0, cklen);
      currentPacket.writeData(b, offset, len);
      currentPacket.numChunks++;
      bytesCurBlock += len;

      //如果此package已满，则放入队列中准备发送
      if (currentPacket.numChunks == currentPacket.maxChunks ||bytesCurBlock == blockSize) {
          ......
          dataQueue.addLast(currentPacket);
          //唤醒等待dataqueue的传输线程，也即DataStreamer
          dataQueue.notifyAll();
          currentPacket = null;
          ......
      }
   } 
  在packet包中数据写满时，会将其放入dataQueue队列中，并通知发送线程；之后的具体发送过程便是DataStreamer线程的工作了；接下来分析DataStreamer线程的工作原理： 
  3、DataStreamer线程：DataStreamer线程是DFSOutputStream的一个内部线程类；其基本工作流程为：1、先向NameNode申请一个新的数据块，然后建立与这个数据块之间的数据流管道pipeline，最后从待发送队列dataQueue中取出需要发送的packet数据包并通过数据流管道pipeline发送给对应的DataNode。每个数据包packet都会有要求有ack确认信息；当一个数据块中的所有数据包都发送完毕并接收到对应的ack响应后，DataStreamer线程就会关闭与当前数据块的数据流管道pipeline。如果DFSOutputStream中还有数据需要发送，则DataStreamer线程会再次向NameNode申请一个新的数据块，获取到新分配的数据块后，DataStreamer会再次建立到这个新数据块的数据流管道，然后进行数据的发送； 
  在DataStreamer线程类中，其定义了相应的字段用来记录保存数据流管道中的DataNode信息与对应数据流管道的状态信息如下： 
  class DataStreamer extends Daemon {
        // 当前数据块对应的数据流管道中的DN信息
        private volatile DatanodeInfo[] nodes = null; // list of targets for current block
        // 在DN上保存这个数据块存储的存储类型
        private volatile StorageType[] storageTypes = null;
        // 在DN上保存这个数据块的存储storage
        private volatile String[] storageIDs = null;
        // 数据流管道的状态(PIPELINE_SETUP_CREATE、DATA_STREAMING、PIPELINE_CLOSE)
        private BlockConstructionStage stage;  // block construction stage
 } 
  接着来看一下DataStreamer线程类的主体运行方法run()： 
    public void run() {
    while (!closed && clientRunning) {
      Packet one = null;
      synchronized (dataQueue) {
    　　 boolean doSleep = processDatanodeError(hasError, false);//如果ack出错，则处理IO错误
        //如果队列中没有package，则等待
        while ((!closed && !hasError && clientRunning && dataQueue.size() == 0) || doSleep) {
          try {
            dataQueue.wait(1000);
          } catch (InterruptedException  e) {
          }
          doSleep = false;
         }
	     // get packet to be sent.
	     // 得到队列中的第一个packet or 创建心跳数据包(防止数据流管道超时关闭)
         if (dataQueue.isEmpty()) {
		    one = createHeartbeatPacket();
	      } else {
		    one = dataQueue.getFirst(); // regular data packet
	     }
	    }
	  
	  // get new block from namenode.
	  // 从namenode处申请获得新的数据块
	  if (stage == BlockConstructionStage.PIPELINE_SETUP_CREATE) { // create新建文件写入模式
		setPipeline(nextBlockOutputStream());
		initDataStreaming();
	  } else if (stage == BlockConstructionStage.PIPELINE_SETUP_APPEND) { // append追加写模式
		setupPipelineForAppendOrRecovery();
		initDataStreaming();
	  }
      
	  // send the packet
	  // 将packet从dataQueue移至ackQueue,等待确认；数据包发送前准备
	  synchronized (dataQueue) {
		// move packet from dataQueue to ackQueue
		if (!one.isHeartbeatPacket()) {
		  dataQueue.removeFirst();
		  ackQueue.addLast(one);
		  dataQueue.notifyAll();
		}
	  }
	  // write out data to remote datanode
	  try {
		// 利用生成的写入流将数据写入DataNode中的block
		one.writeTo(blockStream);
		blockStream.flush();   
	  } catch (IOException e) {
	  }
     
	  if (one.lastPacketInBlock) {
	    // wait for the close packet has been acked
		synchronized (dataQueue) {
		   while (!streamerClosed && !hasError && 
				  ackQueue.size() != 0 && dfsClient.clientRunning) {
			 dataQueue.wait(1000);// wait for acks to arrive from datanodes
			 }
		   }
		   if (streamerClosed || hasError || !dfsClient.clientRunning) {
			 continue;
		   }
		endBlock();
	  }
    }
    // ......   
    // 循环体之外, 关闭清理工作
	closeInternal();
  } 
  对于写入文件的写操作，DataStreamer线程会调用nextBlockOutputStream()方法向NameNode申请新的数据块，并调用setPipeline()建立数据流管道，在成功建立数据流管道之后便会调用initDataStreaming()方法将数据流管道的状态进行更改为：DATA_STREAMING，之后便可以通过数据流管道进行相应数据包的发送了；当最后一个数据包发完完毕后，并且DataStreamer接收到这个数据包的响应信息后，也就是标识数据流管道中的所有DataNode都成功的写入了当前的数据块中的所有数据；便可调用endBlock()来关闭该数据流管道；之后DataStreamer会再次申请新的数据块，并建立数据流管道写入数据，直到DataStreamer线程最终关闭； 
  数据流管道的建立方法如下，接下来一步步分析数据流管道的建立过程；其流程及设计的源码部分如下： 
  setPipeline(nextBlockOutputStream());
initDataStreaming(); 
  1、首先来看nextBlockOutputStream()方法：其用于向NameNode申请一个新的数据块(locateFollowingBlock中通过RPC调用namenode.addBlock(src, clientName)函数)，并返回对应存储新数据块的DataNode节点信息；并且建立从客户端client到数据流管道中第一个DataNode的数据流： 
      private LocatedBlock nextBlockOutputStream() throws IOException {
      LocatedBlock lb = null;
      DatanodeInfo[] nodes = null;
      StorageType[] storageTypes = null;
      int count = dfsClient.getConf().nBlockWriteRetry;
      boolean success = false;
      ExtendedBlock oldBlock = block;
      do {
	    // ......
        // 由NameNode为文件分配DataNode和block
        // locateFollowingBlock中通过RPC调用namenode.addBlock(src, clientName)函数
        block = oldBlock;
        lb = locateFollowingBlock(startTime,
            excluded.length > 0 ? excluded : null);
        block = lb.getBlock();
        nodes = lb.getLocations();
        storageTypes = lb.getStorageTypes();

        //
        // Connect to first DataNode in the list.
        //
		// 创建向DataNode的写入流
        success = createBlockOutputStream(nodes, storageTypes, 0L, false);

        // ......
      } while (!success && --count >= 0);
      return lb;
    } 
  在nextBlockOutputStream中有一个向NameNode申请添加新block的过程；其调用locateFollowingBlock()函数通过RPC调用namenode.addBlock(src, clientName)函数；向NameNode申请新的block；其在NameNode处的block申请调用栈为： 
   
   blockManager.chooseTarget4NewBlock()申请分配新的block 
     
     BlockPlacementPolicyDefault.chooseTarget() 
       
       其最终会根据存放的副本数量以及客户端所在的节点位置分别调用：chooseLocalStorage()、chooseRemoteRack()、chooseLocalRack()、chooseRandom()等方法进行确定 
       
     
   
  其基本的申请策略如下： 
   
          在获取到分配的数据块的DataNode地址后，其会调用createBlockOutputStream()建立到数据流管道中第一个DataNode的输出流；s = createSocketForPipeline(nodes[0], nodes.length, dfsClient)；之后便向对应的DataNode发送数据块写入的操作指令：new Sender(out).writeBlock()； 
  2、之后便会调用setPipeline()，initDataStreaming()的方法进行分配数据节点的保存，以及启动对应的ResponseProcessor响应线程。在数据流管道建立好后，便可以进行写入数据的传输了。 
  在数据流管道建立好后，DataStreamer会循环的从dataQueue中取出对应的packet数据包，并将其加入ackQueue队列等待响应，之后便通过底层的socket io将数据包packet发送至远端的DataNode上。其对应的源码部分在DataStreamer.run()主体方法中，其涉及发送数据包部分如下： 
  // send the packet
synchronized (dataQueue) {
  // move packet from dataQueue to ackQueue
  // 将packet从dataQueue移至ackQueue,等待确认；数据包发送前准备
  if (!one.isHeartbeatPacket()) {
    dataQueue.removeFirst();
    ackQueue.addLast(one);
    dataQueue.notifyAll();
  }
}

// write out data to remote datanode
// 利用生成的写入流将数据写入DataNode中的block
try {
  one.writeTo(blockStream);
  blockStream.flush();   
} catch (IOException e) {
}
 
  4、ResponseProcessor响应线程：其负责接收来自datanode的ack，当接收到所有datanode对一个packet确认成功的ack，ResponseProcessor从ackQueue中删除相应的packet。在出错时，从ackQueue中移除packet到dataQueue，移除失败的datanode，恢复数据块，建立新的pipeline。实现如下： 
  public void run() {
  ...
  PipelineAck ack = new PipelineAck();
  while (!closed && clientRunning && !lastPacketInBlock) {
    try {
      // read an ack from the pipeline
      ack.readFields(blockReplyStream);
      ...
      // 处理所有DataNode响应的状态
      for (int i = ack.getNumOfReplies()-1; i >=0 && clientRunning; i--) {
          short reply = ack.getReply(i);  
        // ack验证，如果DataNode写入packet失败，则出错    
        if (reply != DataTransferProtocol.OP_STATUS_SUCCESS) {
          // 记录损坏的DataNode,会在processDatanodeError方法移除该失败的DataNode
          errorIndex = i;
          throw new IOException("Bad response " + reply + " for block " + block +  " from datanode " + targets[i].getName());    
        }   
      }

      long seqno = ack.getSeqno();
      // 心跳ack，忽略
      if (seqno == Packet.HEART_BEAT_SEQNO) {
        continue;
      }
      Packet one = null;
      synchronized (ackQueue) {
        one = ackQueue.getFirst();
      }
      ...
      synchronized (ackQueue) {
        // 验证ack
        assert ack.getSeqno() == lastAckedSeqno + 1;
        lastAckedSeqno = ack.getSeqno();
        // 移除确认写入成功的packet
        ackQueue.removeFirst();
        ackQueue.notifyAll();
      }
    } catch (Exception e) {
    }
  }
} 
  至此，已经详细分析完客户端写入数据的整体客户端流程，再回顾下其基本流程为： 
   
   客户端端构造实际用于数据写入的DFSOutputStream，其会初始化并开启DataStreamer线程； 
   当客户端client写入的字节流数据到达一个数据包packet的长度时，其会构造封装成packet对象，并将其放入到待发送队列dataQueue中，等待DataStreamer线程处理； 
   DataStreamer线程会循环从dataQueue中取出packet对象，若pipeline未建立，则会先向NameNode申请数据块block，并与对应的DataNode建立相应的数据流管道；然后通过底层IO流将packet发送到数据流管道中的第一个DataNode上。发送完毕后，会将该packet从dataQueue中移除，并将其添加到ackQueue中等待下游节点的确认消息。 
   ResponseProcessor线程等待下游节点的响应ack，判断ack状态，并将其从ackQueue队列中移除，该数据包的发送过程就完成了。 
   
  其整体的数据包发送流程如下：

flink作业访问zk出现acl报错问题分析 spring208208 大数据组件线上问题分析 flink zookeeper 大数据
#问题现象向yarn集群提交flink作业的时候会出现zkacl的异常经确认：1.zk相关acl密码没有更改过2.重新部署客户端配置后提交任务同样报错3.修改flink的zk目录，重启后可以正常运行任务(在zk重新生了新的znode节点)#问题分析1.首先确认是否是权限的问题，即程序中zk用户没有权限操作zk上的flink节点目录确认集群上zookeeper的flink的acl权限，确认为flin
Hadoop 集群规划与部署最佳实践 AI天才研究院 Python实战 DeepSeek R1 &大数据AI人工智能大模型自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术1.简介2009年2月2日，ApacheHadoop项目诞生。它是一个开源的分布式系统基础架构，用于存储、处理和分析海量的数据。Hadoop具有高容错性、可靠性、可扩展性、适应性等特征，因而广泛应用于数据仓库、日志分析、网络流量监测、推荐引擎、搜索引擎等领域。由于Hadoop采用“分而治之”的架构设计理念，因此可以轻松应对数据量、计算能力和存储成本的增长。2013年底，
使用 Argilla 进行大语言模型数据管理与监控 qahaj 语言模型 python 人工智能
技术背景介绍Argilla是一个开源的数据管理平台，专为大语言模型（LLMs）设计。它旨在通过快速的数据管理以及结合人类和机器的反馈，帮助开发者构建更强大的语言模型。同时，Argilla支持整个MLOps周期的每个步骤，从数据标注到模型监控。核心原理解析Argilla的核心优势在于其灵活的数据管理流程和强大的反馈机制。通过Argilla，开发者可以实时监控模型性能，并根据需要调整数据标注策略。这种
JAVA代码实现ElasticSearch搜索（入门-进阶）(一):搜索方法、多字段查询、高亮展示 majunssz elasticsearch elasticsearch
一、搜索方法对比首先存入一条数据count="ilikeeatingandkuing"默认分词器应该将内容分为“i”“like”“eating”“and”“kuing”1.QueryBuilders.matchQuery("count",count);会将搜索词分词，再与目标查询字段进行匹配，若分词中的任意一个词与目标字段匹配上，则可查询到。count="i"可查出count="ili"可查出co
轻松入门Apache SeaTunnel：数据集成利器窝窝和牛牛 SeaTunnel ETL 数据集成
文章目录轻松入门ApacheSeaTunnel：数据集成利器什么是SeaTunnel基本原理运行流程SeaTunnelvsDataX：两大数据集成工具对比实战场景：MySQL数据同步至ElasticsearchSeaTunnel实现方案DataX实现方案实现原理对比底层依赖环境方案优缺点分析快速上手环境准备简单示例总结轻松入门ApacheSeaTunnel：数据集成利器什么是SeaTunnelAp
线性代数介绍 ZhuBin365 其它机器学习线性代数人工智能
线性代数介绍线性代数是数学的一个重要分支，它研究向量空间、线性变换和线性方程组。其概念抽象，应用广泛，是现代科学技术中不可或缺的数学工具。本篇将详细解释线性代数中的核心概念，包括行列式、矩阵、向量与向量空间、线性方程组、特征值与特征向量以及二次型，力求深入浅出，帮助读者全面理解。一、行列式(Determinants)行列式是线性代数中一个fundamental的概念，它是一个将方阵映射到一个标量的
MySQL 到 Hadoop：Sqoop 数据迁移 ETL Ice星空 ETL
文章目录ETL：Extract-Transform-Load数据迁移过程一、Extract数据抽取1.ODS：OperationalDataStore-可操作数据存储2.DW：DataWarehouse-数据仓库3.DM：DataMart-数据集市二、Transform数据清洗和转换1.数据清洗2.数据转换三、Load数据加载四、数据迁移方法1.Sqoop1.1MySQL->Hive1.1.1im
Angular-Slickgrid中的数据更新与聚合计算 t0_54program 编程问题解决手册 angular.js javascript 前端个人开发
在使用Angular-Slickgrid进行数据展示时，经常会遇到数据的实时更新和聚合计算的问题。本文将结合实例，详细介绍如何在Angular-Slickgrid中处理数据的编辑后更新聚合计算结果。背景介绍Angular-Slickgrid是一款强大而灵活的网格组件，支持复杂的数据操作，包括分组、排序和聚合计算。假设我们有一个数据表，包含用户的性别（Gender）、费用（Cost）和时长（Dura
java毕业设计，网上商城系统爱编程的小哥 java毕设 java 课程设计 spring boot vue
️OnlineMall商城系统全解析|Vue3+SpringBoot全栈实战（附高并发与数据安全方案）一、系统架构全景基于七张效果图分析，该系统是企业级电商综合管理平台，采用SpringBoot3+Vue3+ElementPlus+MyBatisPlus技术栈，覆盖商品管理、订单处理、会员运营等核心场景。通过RBAC权限控制+Elasticsearch搜索+分布式事务三大技术亮点，支持10万级商品
通用AI Agent的进化图谱：架构革新与安全可控的双重突破——以Manus为范本的启示我也秃了人工智能架构安全
通用AIAgent的进化路径：架构创新与安全管控的双重突破引言近年来，AI智能体正经历前所未有的变革。2025年3月，中国团队Monica推出的全球首款通用AIAgent——Manus，以“全链路自主执行”为核心，通过多签名系统架构和渐进式任务执行引擎，实现了从“生成建议”到“自主闭环交付任务”的范式跃迁。具体而言，Manus通过规划（Planner）-执行（Executor）-验证（Verifi
Flink Cdc TiDB详解 24k小善 flink 大数据 java
1.什么是FlinkTiDBCDC？简单说就是用Flink实时抓取TiDB数据库的数据变化（比如新增、修改、删除），并将这些变化数据以流的形式处理，用于实时分析、同步到其他系统等场景。TiDB本身是分布式数据库，而Flink是流处理引擎，两者的结合适合需要高吞吐、低延迟的大规模数据处理场景[7][8]。2.底层原理TiDB侧：通过TiCDC组件（TiDB的变更数据捕获工具）捕获数据变更，类似MyS
Flink CDC 与 SeaTunnel CDC 简单对比窝窝和牛牛 flink 大数据 cdc SeaTunnel
FlinkCDC与SeaTunnelCDC简单对比CDC技术概述变更数据捕获（ChangeDataCapture，简称CDC）是一种用于捕获数据库中数据变更的技术，能够实时识别、捕获并输出数据库中的插入、更新和删除操作。CDC技术在现代数据架构中扮演着至关重要的角色，特别是在实时数据集成、数据同步和事件驱动架构等场景中。CDC的工作原理CDC主要通过以下几种方式捕获数据变更：基于日志的CDC：直接
Python程序设计（入门） xyyykx python 开发语言
目录一丶Python概述二丶Python数据类型三丶常用的进制四丶字符串型五丶程序控制结构六丶组合数据类型一丶Python概述Python是一种高级编程语言，由GuidovanRossum于1991年开发并发布。它具有简洁、易读、易学的语法特点，被广泛应用于多个领域，包括软件开发、数据科学、人工智能、网络编程等。以下是Python的一些主要特点和优势：简单易学：Python的语法简洁明了，易于理解
java将动态图转换成静态图_如何用最简单的方法把静态图变成动图？ PEI Lobster java将动态图转换成静态图
在今日头条浏览文章时，我们经常会看到有些作者在文章中插入了一些动态图片，不但美化了页面，而且起到了简明扼要的说明作用，让读者对文章内容加深了理解，也提高了文章的阅读量和点击量。这样的动态效果是如何制作的呢？主要有两个步骤：首先要制作出图片动态效果的视频，一般是MP4格式，第二步用格式工厂等文件格式转换软件，把MP4转换为gif动画格式，然后就可以把它插入到网页中。这其中的难点和重点就在于制作图片的
使用Dall-E生成图像：文本到图像的魔力 shuoac 计算机视觉人工智能 python
使用Dall-E生成图像：文本到图像的魔力技术背景介绍Dall-E是OpenAI开发的一个强大的文本到图像生成模型，它能够根据自然语言描述创造出全新的数字图像。这一技术基于深度学习的方法，使得创意与AI图像生成的结合更具可能性。本文将介绍如何调用Dall-EAPI来生成图像，从而使开发者能够将这一技术应用到自己的项目中。核心原理解析Dall-E利用大型语言模型（LLM）从用户提供的文本描述中提取详
Python语言程序设计 1 摸你就像摸自己 python
目录1Python基本语法元素￲1.1程序设计基本方法1.1.1计算机与程序设计1.1.2编译与解释1.1.3程序的基本编写方法—IPO1.1.4计算机编程1.2Python开发环境配置1.2.1Python语言概述1.2.2Python程序的编写与运行例1：计算圆面积例2：绘制同切圆例3：绘制五角星1.3实例一：温度转换1.3.1问题分析：实例编写：1.4Python程序语法元素分析1.4.1格
头条原创文章一键转换剪映生成视频 Mr数据杨 Python 视频剪辑 python moveipy 图文转视频西瓜视频剪映
随着技术的进步，平台逐渐为创作者提供了更多便捷的功能来增强内容的表达效果。近期，某平台新增了一个实用功能，允许用户将自己发布的文章通过后台的视频生成工具一键转换为短视频。然而，这一功能的使用存在一些限制，比如仅支持原创文章，并且生成的视频只能在该平台发布，暂时无法同步至其他社交平台。尽管如此，通过对生成视频的观察与分析，可以发现其处理方式与剪映等主流视频编辑软件有相似之处，这为进一步扩展视频的应用
JVM常用概念之编译器黑洞剑海风云 JDK（Java Development Kit）jvm 编译器编译器黑洞
问题JMH如何避免微小基准测试中的不会运行的代码的消除工作？是否有隐式或显式编译器支持？基础知识优化编译器擅长优化简单的东西。例如，如果存在任何人都无法观察到的计算，则可以将其视为“不会运行的代码”并将其删除。这通常是一件好事，直到你运行基准测试。在那里，你想要计算，但你不需要结果。本质上，你观察基准测试所占用的“资源”，但没有简单的方法可以与编译器争论这一点。比如下面的测试用例，该方法中只涉及到
深入了解盘古大模型：技术、应用与未来 Hardess-god Literature review 人工智能
随着人工智能技术的迅猛发展，预训练大模型已成为AI领域最前沿、最热门的研究方向之一。近年来，中国自主研发的大模型之一——盘古模型（PanGuModel）逐渐进入公众视野，凭借其强大的性能和广泛的应用前景，引发了行业内外的广泛关注。什么是盘古大模型？盘古大模型是华为公司联合多家科研机构共同研发的超大规模预训练语言模型。该模型以中文数据为主进行训练，旨在推动中文自然语言处理（NLP）以及跨模态应用的技
【从零开始学习计算机科学】软件测试（三）回归测试、系统测试与验收测试贫苦游商学习软件测试回归测试系统测试验收测试测试工具 ab测试
【从零开始学习计算机科学】软件测试（三）回归测试、系统测试与验收测试回归测试回归测试的组织和实施回归测试集回归测试的范围自动回归测试框架自动回归测试框架的技术特点回归测试克服的几个问题回归测试人员应掌握的测试手段回归用例库的维护系统测试系统测试的组织和分工系统测试的过程系统测试方法用户界面测试用户界面测试-符合标准和规范用户界面测试-一致性用户界面测试-直观性用户界面测试-灵活性用户界面测试-舒适
零基础上手Python数据分析 (6)：Python 异常处理，告别程序崩溃的烦恼！ kakaZhui python 数据分析数据库 excel 数据挖掘
回顾一下，前几篇博客我们学习了Python的基本语法、数据结构和文件操作。现在，我们已经掌握了Python编程的基础知识，可以开始编写更复杂的数据分析代码了。但是，在实际的数据分析工作中，程序并非总能一帆风顺地运行，总会遇到各种意外情况，例如：文件找不到：程序尝试读取一个不存在的数据文件。数据格式错误：数据文件中包含非预期的格式，例如本应是数字的列包含了文本。网络连接中断：程序尝试从网络获取数据，
【深度学习|地学应用】滑坡灾害早期隐患的概念、特征及识别方法，同时解释其与人工边坡、滑坡易发性之间的联系与区别。 985小水博一枚呀深度学习人工智能
【深度学习|地学应用】滑坡灾害早期隐患的概念、特征及识别方法，同时解释其与人工边坡、滑坡易发性之间的联系与区别。【深度学习|地学应用】滑坡灾害早期隐患的概念、特征及识别方法，同时解释其与人工边坡、滑坡易发性之间的联系与区别。文章目录【深度学习|地学应用】滑坡灾害早期隐患的概念、特征及识别方法，同时解释其与人工边坡、滑坡易发性之间的联系与区别。1.滑坡灾害早期隐患的概念与特征概念主要特征2.通过光学
python语言程序设计基础,python编程代码大全 Rtee1 python 开发语言服务器
大家好，小编为大家解答python语言程序设计基础第二版课后答案的问题。很多人还不知道PYTHON语言程序设计实践教程(陈东)答案，现在让我们一起来看看吧！目录1Python基本语法元素￲1.1程序设计基本方法1.1.1计算机与程序设计1.1.2编译与解释1.1.3程序的基本编写方法—IPO1.1.4计算机编程1.2Python开发环境配置1.2.1Python语言概述1.2.2Python程序的
人工智能 - 通用 AI Agent 之 LangManus、Manus、OpenManus 和 OWL 技术选型天机️灵韵具身智能人工智能人工智能具身智能智能体
一、核心项目概览1.Manus（闭源通用AIAgent）定位：全球首个全流程自动化通用AIAgent，GAIA基准测试SOTA水平。核心能力：全流程自动化：从任务规划（如撰写报告）到执行（代码生成、表格制作）的端到端处理。智能纠错机制：基于沙箱环境的实时错误反思与调整（类似CodeAct技术）。云端依赖：需联网运行，集成浏览器操作、信息检索等工具。局限性：闭源且采用邀请制，二手市场邀请码溢价至数万
Multisim在射频电路仿真与实验教学中的应用探究 She Ran 546 课程设计
摘要本文深入探究Multisim在射频电路仿真与实验教学中的应用。阐述Multisim软件在射频领域的功能特点，通过具体射频电路实验案例，详细说明如何运用Multisim进行电路搭建、参数设置与仿真分析。探讨其在实验教学中对学生理解射频电路原理、提升实践能力的积极作用，以及在丰富教学手段、提高教学质量方面的显著优势，为射频电路实验教学改革提供新思路与方法。关键词Multisim；射频电路；仿真；实
利用HFSS软件对射频电路电磁兼容性的深入研究 DidYour 课程设计
摘要本文旨在借助HFSS（HighFrequencyStructureSimulator）软件深入研究射频电路的电磁兼容性（EMC）。通过对射频电路中电磁干扰产生机制的剖析，阐述如何运用HFSS软件建立精确的射频电路模型，进行电磁兼容性仿真分析，包括近场和远场分析、信号完整性分析等。结合实际案例，探讨不同因素对射频电路EMC性能的影响，提出基于HFSS仿真结果的优化设计策略，为提升射频电路电磁兼容
C语言【文件操作】详解下 Run_Teenage C语言基础 c语言
引言详细介绍了文件的随机读写函数和文件读取结束的判定看这篇博文前，希望您先仔细看一下这篇博文，理解一下文件指针和流的概念：C语言【文件操作】详解上-CSDN博客一、文件的随机读写函数1.fseek函数根据文件指针的位置和偏移量来定位文件指针（文件内容的光标）。函数原型：intfseek(FILE*stream,longintoffset,intorigin);作用：重新定位流位置指示器参数：str
c++算法赛万能模板个人笔记适用蓝桥杯，天梯赛，acm等赛事 a东方青个人笔记 c++算法笔记
算法笔记-更新与2025-3-22点赞收藏+关注持续更新算法基础二分整数二分//在一个单调区间里面去找答案boolcheck(intx){/*...*/}//检查x是否满足某种性质//区间[l,r]被划分成[l,mid]和[mid+1,r]时使用：intbsearch_1(intl,intr){while(l>1;if(check(mid))r=mid;//check()判断mid是否满足性质el
MySQL 8.0新特性深度解析：窗口函数与JSON数据处理的10大技巧墨瑾轩一起学学数据库【一】mysql json
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣第1章：MySQL8.0简介嗨，亲爱的小伙伴们！欢迎来到MySQL8.0的奇妙世界，这里充满了新鲜和惊喜。MySQL8.0是一个数据库界的超级英雄，它带着一系列令人兴奋的新特性，比如窗口函数和JSON数据处理，来拯救我们的数据处理任务。1.1MySQL8.0的
《自动化开发之路：使用 Jenkins、GitLab CI 与 GitHub Actions 构建高效 CI/CD 流水线》清水白石008 python Python题库自动化 jenkins gitlab
《自动化开发之路：使用Jenkins、GitLabCI与GitHubActions构建高效CI/CD流水线》前言在现代软件开发中，持续集成（CI）与持续部署/交付（CD）已成为必不可少的实践。构建自动化流水线不仅可以加快开发迭代速度，还能显著提升代码质量，降低手工操作所带来的风险。在这篇文章中，我们将探讨如何利用三种主流工具——Jenkins、GitLabCI以及GitHubActions，实现从
Spring4.1新特性——综述 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Schema与数据类型优化 annan211 数据结构 mysql
目前商城的数据库设计真是一塌糊涂，表堆叠让人不忍直视，无脑的架构师，说了也不听。在数据库设计之初，就应该仔细揣摩可能会有哪些查询，有没有更复杂的查询，而不是仅仅突出很表面的业务需求，这样做会让你的数据库性能成倍提高，当然，丑陋的架构师是不会这样去考虑问题的。选择优化的数据类型 1 更小的通常更好更小的数据类型通常更快，因为他们占用更少的磁盘、内存和cpu缓存，
第一节 HTML概要学习 chenke html Web css
第一节 HTML概要学习 1. 什么是HTML HTML是英文Hyper Text Mark-up Language(超文本标记语言)的缩写，它规定了自己的语法规则，用来表示比“文本”更丰富的意义，比如图片，表格，链接等。浏览器（IE,FireFox等）软件知道HTML语言的语法，可以用来查看HTML文档。目前互联网上的绝大部分网页都是使用HTML编写的。打开记事本输入一下内
MyEclipse里部分习惯的更改 Array_06 eclipse
继续补充中---------------------- 1.更改自己合适快捷键windows-->prefences-->java-->editor-->Content Assist--> Activation triggers for java的右侧“.”就可以改变常用的快捷键选中 Text
近一个月的面试总结 cugfy 面试
本文是在学习中的总结，欢迎转载但请注明出处：http://blog.csdn.net/pistolove/article/details/46753275 前言打算换个工作，近一个月面试了不少的公司，下面将一些面试经验和思考分享给大家。另外校招也快要开始了，为在校的学生提供一些经验供参考，希望都能找到满意的工作。
HTML5一个小迷宫游戏 357029540 html5
通过《HTML5游戏开发》摘抄了一个小迷宫游戏，感觉还不错，可以画画，写字，把摘抄的代码放上来分享下，喜欢的同学可以拿来玩玩！ <html> <head> <title>创建运行迷宫</title> <script type="text/javascript"
10步教你上传githib数据张亚雄 git
官方的教学还有其他博客里教的都是给懂的人说得，对已我们这样对我大菜鸟只能这么来锻炼，下面先不玩什么深奥的，先暂时用着10步干净利索。等玩顺溜了再用其他的方法。操作过程（查看本目录下有哪些文件NO.1）ls （跳转到子目录NO.2）cd+空格+目录（继续NO.3）ls （匹配到子目录NO.4）cd+ 目录首写字母+tab键+（首写字母“直到你所用文件根就不再按TAB键了”）（查看文件
MongoDB常用操作命令大全 adminjun mongodb 操作命令
成功启动MongoDB后，再打开一个命令行窗口输入mongo，就可以进行数据库的一些操作。输入help可以看到基本操作命令，只是MongoDB没有创建数据库的命令，但有类似的命令如：如果你想创建一个“myTest”的数据库，先运行use myTest命令，之后就做一些操作（如：db.createCollection('user')）,这样就可以创建一个名叫“myTest”的数据库。一
bat调用jar包并传入多个参数 aijuans
下面的主程序是通过eclipse写的： 1.在Main函数接收bat文件传递的参数（String[] args）如： String ip =args[0]; String user=args[1]; &nbs
Java中对类的主动引用和被动引用 ayaoxinchao java 主动引用对类的引用被动引用类初始化
在Java代码中，有些类看上去初始化了，但其实没有。例如定义一定长度某一类型的数组，看上去数组中所有的元素已经被初始化，实际上一个都没有。对于类的初始化，虚拟机规范严格规定了只有对该类进行主动引用时，才会触发。而除此之外的所有引用方式称之为对类的被动引用，不会触发类的初始化。虚拟机规范严格地规定了有且仅有四种情况是对类的主动引用，即必须立即对类进行初始化。四种情况如下：1.遇到ne
导出数据库提示 outfile disabled BigBird2012 mysql
在windows控制台下，登陆mysql，备份数据库： mysql>mysqldump -u root -p test test > D:\test.sql 使用命令 mysqldump 格式如下： mysqldump -u root -p *** DBNAME > E:\\test.sql。注意：执行该命令的时候不要进入mysql的控制台再使用，这样会报
Javascript 中的 && 和 || bijian1013 JavaScript &&||
准备两个对象用于下面的讨论 var alice = { name: "alice", toString: function () { return this.name; } } var smith = { name: "smith",
[Zookeeper学习笔记之四]Zookeeper Client Library会话重建 bit1129 zookeeper
为了说明问题，先来看个简单的示例代码： package com.tom.zookeeper.book; import com.tom.Host; import org.apache.zookeeper.WatchedEvent; import org.apache.zookeeper.ZooKeeper; import org.apache.zookeeper.Wat
【Scala十一】Scala核心五：case模式匹配 bit1129 scala
package spark.examples.scala.grammars.caseclasses object CaseClass_Test00 { def simpleMatch(arg: Any) = arg match { case v: Int => "This is an Int" case v: (Int, String)
运维的一些面试题 yuxianhua linux
1、Linux挂载Winodws共享文件夹 mount -t cifs //1.1.1.254/ok /var/tmp/share/ -o username=administrator,password=yourpass 或 mount -t cifs -o username=xxx,password=xxxx //1.1.1.1/a /win
Java lang包-Boolean BrokenDreams boolean
Boolean类是Java中基本类型boolean的包装类。这个类比较简单，直接看源代码吧。 public final class Boolean implements java.io.Serializable,
读《研磨设计模式》-代码笔记-命令模式-Command bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.List; /** * GOF 在《设计模式》一书中阐述命令模式的意图：“将一个请求封装
matlab下GPU编程笔记 cherishLC matlab
不多说，直接上代码 gpuDevice % 查看系统中的gpu,,其中的DeviceSupported会给出matlab支持的GPU个数。 g=gpuDevice(1); %会清空 GPU 1中的所有数据,,将GPU1 设为当前GPU reset(g) %也可以清空GPU中数据。 a=1; a=gpuArray(a); %将a从CPU移到GPU中 onGP
SVN安装过程 crabdave SVN
SVN安装过程 subversion-1.6.12 ./configure --prefix=/usr/local/subversion --with-apxs=/usr/local/apache2/bin/apxs --with-apr=/usr/local/apr --with-apr-util=/usr/local/apr --with-openssl=/
sql　行列转换 daizj sql 行列转换行转列列转行
行转列的思想是通过case when 来实现列转行的思想是通过union all 来实现下面具体例子：假设有张学生成绩表(tb)如下: Name Subject Result 张三语文　　74 张三数学　　83 张三物理　　93 李四语文　　74 李四数学　　84 李四物理　　94 */ /* 想变成姓名 &
MySQL--主从配置 dcj3sjt126com mysql
linux下的mysql主从配置：说明：由于MySQL不同版本之间的(二进制日志)binlog格式可能会不一样，因此最好的搭配组合是Master的MySQL版本和Slave的版本相同或者更低， Master的版本肯定不能高于Slave版本。（版本向下兼容） mysql1 : 192.168.100.1 //master mysq
关于yii 数据库添加新字段之后model类的修改 dcj3sjt126com Model
rules: array('新字段','safe','on'=>'search') 1、array('新字段', 'safe')//这个如果是要用户输入的话，要加一下， 2、array('新字段', 'numerical'),//如果是数字的话 3、array('新字段', 'length', 'max'=>100),//如果是文本 1、2、3适当的最少要加一条，新字段才会被
sublime text3 中文乱码解决 dyy_gusi Sublime Text
sublime text3中文乱码解决原因：缺少转换为UTF-8的插件目的：安装ConvertToUTF8插件包第一步：安装能自动安装插件的插件，百度“Codecs33”，然后按照步骤可以得到以下一段代码： import urllib.request,os,hashlib; h = 'eb2297e1a458f27d836c04bb0cbaf282' + 'd0e7a30980927
概念了解：CGI，FastCGI，PHP-CGI与PHP-FPM geeksun PHP
CGI CGI全称是“公共网关接口”(Common Gateway Interface)，HTTP服务器与你的或其它机器上的程序进行“交谈”的一种工具，其程序须运行在网络服务器上。 CGI可以用任何一种语言编写，只要这种语言具有标准输入、输出和环境变量。如php,perl,tcl等。 FastCGI FastCGI像是一个常驻(long-live)型的CGI，它可以一直执行着，只要激活后，不
Git push 报错 "error: failed to push some refs to " 解决 hongtoushizi git
Git push 报错 "error: failed to push some refs to " . 此问题出现的原因是：由于远程仓库中代码版本与本地不一致冲突导致的。由于我在第一次git pull --rebase 代码后，准备push的时候，有别人往线上又提交了代码。所以出现此问题。解决方案： 1： git pull 2：
第四章 Lua模块开发 jinnianshilongnian nginx lua
在实际开发中，不可能把所有代码写到一个大而全的lua文件中，需要进行分模块开发；而且模块化是高性能Lua应用的关键。使用require第一次导入模块后，所有Nginx 进程全局共享模块的数据和代码，每个Worker进程需要时会得到此模块的一个副本（Copy-On-Write），即模块可以认为是每Worker进程共享而不是每Nginx Server共享；另外注意之前我们使用init_by_lua中初
java.lang.reflect.Proxy liyonghui160com
1.简介 Proxy 提供用于创建动态代理类和实例的静态方法（1）动态代理类的属性代理类是公共的、最终的，而不是抽象的未指定代理类的非限定名称。但是，以字符串 "$Proxy" 开头的类名空间应该为代理类保留代理类扩展 java.lang.reflect.Proxy 代理类会按同一顺序准确地实现其创建时指定的接口
Java中getResourceAsStream的用法 pda158 java
1.Java中的getResourceAsStream有以下几种： 1. Class.getResourceAsStream(String path) ： path 不以’/'开头时默认是从此类所在的包下取资源，以’/'开头则是从ClassPath根下获取。其只是通过path构造一个绝对路径，最终还是由ClassLoader获取资源。　　2. Class.getClassLoader.get
spring 包官方下载地址（非maven） sinnk spring
SPRING官方网站改版后，建议都是通过 Maven和Gradle下载，对不使用Maven和Gradle开发项目的，下载就非常麻烦，下给出Spring Framework jar官方直接下载路径: http://repo.springsource.org/libs-release-local/org/springframework/spring/ s
Oracle学习笔记(7) 开发PLSQL子程序和包 vipbooks oracle sql 编程
哈哈，清明节放假回去了一下，真是太好了，回家的感觉真好啊！现在又开始出差之旅了，又好久没有来了，今天继续Oracle的学习！这是第七章的学习笔记，学习完第六章的动态SQL之后，开始要学习子程序和包的使用了……，希望大家能多给俺一些支持啊！编程时使用的工具是PLSQL

Hdfs 客户端写过程 源码解析

你可能感兴趣的:(Hadoop分析与理解,hadoop,hdfs,客户端写)

Hdfs 客户端写过程源码解析