wf1982

[置顶] NameNode HA 采用方案

原文：http://yanbohappy.sinaapp.com/?p=50

Hadoop的设计初衷是服务于off-line的数据存储和处理应用。随着这个产品的不断成熟和发展，对于支持on-line应用的需求越来越强烈。例如HBase已经被Facebook和淘宝用到了在线存储应用中。所以Hadoop的on-line化也是一个趋势。目前制约Hadoop作为on-line存储和处理的瓶颈主要是系统的availability。衡量一个分布式系统的主要指标有：reliability, availability & scalability。Hadoop可以做到横向扩展，所以scalability非常好；而用户存在Hadoop里的数据几乎不会丢失，所以reliability也是非常不错的；目前的主要问题在availability，也就是用户向HDFS集群请求数据的时候集群是否能够保证100%提供服务，目前的主要问题体现在HDFS的SPOF（single point of failure），整个HDFS集群的启动/重启时间非常长，配置参数无法动态更改等。这些方面都是apache社区目前工作的重点，本文主要讨论HDFS NameNode的SPOF问题相关的HA机制。

Hadoop目前的trunk中的代码已经merge了原来的ha-branch，所以现在的trunk中的代码已经实现了基本的HA机制的功能。Hadoop PMC的人表示将会在后面的版本中发布这个功能。下面这张图是目前的HDFS HA的实现逻辑。

Right now the HA branch supports HOT-Failover, except that it is manual failover. We are now moving into a phase to implement automatic failover.

Significant enhancements were completed to make HOT Failover work:
- Configuration changes for HA
- Notion of active and standby states were added to the Namenode
- Client-side redirection
- Standby processing editlogs form Active
- Dual block reports to Active and Standby.

这是Hadoop mailing list中关于目前HA现状的阐述。下面首先简单介绍下这5个方面是怎么实现的，后面从源代码的角度分析具体的实现细节。

(1) Configuration changes for HA

在配置文件中会增加关于HA配置的参数，具体参数配置可以参考CDH4 Beta 2 High Availability Guide，这里介绍一些比较重要的参数。

例如dfs.ha.namenodes.[nameservice ID]这个参数表示在[nameservice ID]这个nameservice下的两台NameNode（分别作为Active和Standby模式运行）的主机名。然后针对每一台NN配置其对应的dfs.namenode.rpc-address.[nameservice ID].[name node ID]用来标示每一台NN。

由于目前的两台主机之间的HA机制是通过一个共享存储来存放editlog来实现的。所以需要配置参数dfs.namenode.shared.edits.dir表示共享存储的位置，一般是通过NFS挂载的形式，所以其实这个参数的值就是一个本地文件系统中的目录。

dfs.client.failover.proxy.provider.[nameservice ID]这个参数指定具体的failover proxy provider类，也就是在client端发现原来Active的NameNode变成了Standby模式时（在client发送RPC请求时返回了StandbyException时），该如何去连接当前Active的NameNode。目前的Hadoop里只有一个具体实现策略ConfiguredFailoverProxyProvider，实现方法就是如果client failover时，下次把RPC发送给另外一个NameNode的proxy。

另外就是dfs.ha.fencing.methods参数，指定在Active NameNode切换到Standby模式时，确保切换成功或者进程被杀死。
(2) Notion of active and standby states were added to the Namenode

有两种模式的NameNode，分别是Active和Standby模式。Active模式的NameNode接受client的RPC请求并处理，同时写自己的Editlog和共享存储上的Editlog，接收DataNode的Block report, block location updates和heartbeat；Standby模式的NameNode同样会接到来自DataNode的Block report, block location updates和heartbeat，同时会从共享存储的Editlog上读取并执行这些log操作，使得自己的NameNode中的元数据（Namespcae information + Block locations map）都是和Active NameNode中的元数据是同步的。所以说Standby模式的NameNode是一个热备（Hot Standby NameNode），一旦切换成Active模式，马上就可以提供NameNode服务。

(3) Client-side redirection

Client的通过RPC的Proxy与NameNode交互。在client端会有两个代理同时存在，分别代表与Active和Standby的NameNode的连接。由于Client端有Retry机制，当与Active NameNode正常通信的client proxy收到RPC返回的StandbyException时，说明这个Active NameNode已经变成了Standby模式，所以触发dfs.client.failover.proxy.provider.[nameservice ID]这个参数指定的类来做failover，目前唯一的实现是ConfiguredFailoverProxyProvider，实现方法就是下次开始把RPC发向另外一个NameNode。此后的RPC都是发往另外一个NameNode，也就是NameNode发生了主从切换。

 
         public 
          synchronized 
          void 
          performFailover(T currentProxy) { 
        
         currentProxyIndex = (currentProxyIndex +  
         1 
         ) % proxies.size(); 
        
         }

(4) Standby processing editlogs form Active

开启Standby模式后，Standby NameNode会通过EditLogTailerThread从共享存储中读取Active NameNode写到那里的Editlog，然后执行操作，从而保持自己的元数据是最新的，所以说是热备。

(5)Dual block reports to Active and Standby.

DataNode的Block report, block location updates和heartbeat等RPC操作会发向两个NameNode，从而使得两个NameNode的Block locations map都是最新的，这样可以做到切换主从后原来的从（新的主）不再需要block report的时间。

可以看出client与NameNode之间的RPC是只向一个NameNode发送的（收到StandbyException后才会重试另外一个）；而DataNode与NameNode之间的RPC在任何时候都是同时向两个NameNode发送的。

（1）NameNode启动流程

对于HDFS HA机制来说，NameNode是核心，NameNode有Active和Standby两种状态。在NameNode的构造函数中，读取配置文件，如果配置文件配置了开启HA，那么NameNode进入STANDBY_STATE状态；反之则进入ACTIVE_STATE状态。

 
         this 
         .haEnabled = HAUtil.isHAEnabled(conf, nsId); 
        
         if 
          (!haEnabled) { 
        
         state = ACTIVE_STATE; 
        
         }  
         else 
          { 
        
         state = STANDBY_STATE; 
        
         }

创建HA上下文，NameNodeHAContext类包含了NameNode的Active和Standby模式变换相关操作的函数实现。

 
         this 
         .haContext = createHAContext();

然后就是初始化操作，包括配置参数，RPC server，metrics，加载Namespace，然后进入当前的haContext

 
         try 
          { 
        
         initializeGenericKeys(conf, nsId, namenodeId); 
        
         initialize(conf); 
        
         state.prepareToEnterState(haContext); 
        
         state.enterState(haContext); 
        
         }  
         catch 
          (IOException e) { 
        
         this 
         .stop(); 
        
         throw 
          e; 
        
         }  
         catch 
          (HadoopIllegalArgumentException e) { 
        
         this 
         .stop(); 
        
         throw 
          e; 
        
         }

（2）管理员执行HA管理命令流程

当两个NameNode都已经启动并进入Standby模式之后，就可以通过bin/hdfs脚本执行HDFS管理功能，执行如下命令：

 
         bin 
         /hdfs 
          haadmin

就会调用DFSHAAdmin.java这个类来执行用户指定的功能，例如：

 
         bin 
         /hdfs 
          haadmin -transitionToActive serviceId 
        
         bin 
         /hdfs 
          haadmin -transitionToStandby serviceId 
        
         bin 
         /hdfs 
          haadmin -failover serviceId serviceId

以-failover为例，就会调用HAAdmin.java类中的failover方法。

 
         private 
          int 
          failover( 
         final 
          String[] argv) 
        
         throws 
          IOException, ServiceFailedException { 
        
         boolean 
          forceFence =  
         false 
         ; 
        
         boolean 
          forceActive =  
         false 
         ; 
        
         Options failoverOpts =  
         new 
          Options(); 
        
         failoverOpts.addOption(“failover”,  
         false 
         , “failover”); 
        
         failoverOpts.addOption(FORCEFENCE,  
         false 
         , “force fencing”); 
        
         failoverOpts.addOption(FORCEACTIVE,  
         false 
         , “force failover”); 
        
         CommandLineParser parser =  
         new 
          GnuParser(); 
        
         CommandLine cmd; 
        
         try 
          { 
        
         cmd = parser.parse(failoverOpts, argv); 
        
         forceFence = cmd.hasOption(FORCEFENCE); 
        
         forceActive = cmd.hasOption(FORCEACTIVE); 
        
         }  
         catch 
          (ParseException pe) { 
        
         errOut.println(“failover: incorrect arguments”); 
        
         printUsage(errOut, “-failover”); 
        
         return 
          - 
         1 
         ; 
        
         } 
        
         int 
          numOpts = cmd.getOptions() ==  
         null 
          ?  
         0 
          : cmd.getOptions().length; 
        
         final 
          String[] args = cmd.getArgs(); 
        
         if 
          (numOpts >  
         2 
          || args.length !=  
         2 
         ) { 
        
         errOut.println(“failover: incorrect arguments”); 
        
         printUsage(errOut, “-failover”); 
        
         return 
          - 
         1 
         ; 
        
         } 
        
         HAServiceTarget fromNode = resolveTarget(args[ 
         0 
         ]); 
        
         HAServiceTarget toNode = resolveTarget(args[ 
         1 
         ]); 
        
         FailoverController fc =  
         new 
          FailoverController(getConf()); 
        
         try 
          { 
        
         fc.failover(fromNode, toNode, forceFence, forceActive); 
        
         out.println(“Failover from “+args[ 
         0 
         ]+” to “+args[ 
         1 
         ]+” successful”); 
        
         }  
         catch 
          (FailoverFailedException ffe) { 
        
         errOut.println(“Failover failed: ” + ffe.getLocalizedMessage()); 
        
         return 
          - 
         1 
         ; 
        
         } 
        
         return 
          0 
         ; 
        
         }

在这个函数中首先解析参数，然后会生成两个HAServiceTarget，分别表示发生主从切换的两个NameNode。由于这个DFSHAAdmin命令可以在任何一台可以连接到集群中的机器上运行，所以HAServiceTarget实际上是发生主从切换的两个NameNode的代理的封装。这个代理与两个NameNode通信的RPC协议时HAServiceProtocol。目前的Hadoop的RPC已经默认了Protocol Buffer作为RPC的实现。

然后生成FailoverController对象，这个类就是用于控制主从切换的。然后执行这个类中的failover方法。

 
         public 
          void 
          failover(HAServiceTarget fromSvc, 
        
         HAServiceTarget toSvc, 
        
         boolean 
          forceFence, 
        
         boolean 
          forceActive) 
        
         throws 
          FailoverFailedException { 
        
         Preconditions.checkArgument(fromSvc.getFencer() !=  
         null 
         , 
        
         “failover requires a fencer”);  
         //强制需要一种fencing方法 
        
         // Failover前的检查，例如fromSvc和toSvc是不是同一NameNode，toSvc是不是已经处于Active状态等 
        
         preFailoverChecks(fromSvc, toSvc, forceActive); 
        
         // 第一步是先把fromSvc转换成standby模式 
        
         boolean 
          tryFence =  
         true 
         ; 
        
         // 通过向fromSvc的发送HAServiceProtocol的方式使得fromSvc transition to Standby mode 
        
         // 如果这个RPC返回的结果是ServiceFailedException或者IOException， 
        
         // 那么说明transition fail，从而是否要tryFence就是true，就必须fencing了。 
        
         if 
          (tryGracefulFence(fromSvc)) { 
        
         tryFence = forceFence; 
        
         } 
        
         // Fence fromSvc if it’s required or forced by the user 
        
         if 
          (tryFence) { 
        
         if 
          (!fromSvc.getFencer().fence(fromSvc)) { 
        
         throw 
          new 
          FailoverFailedException(“Unable to fence ” + 
        
         fromSvc + “. Fencing failed.”); 
        
         } 
        
         } 
        
         // 第二步就是让toSvc转换成active模式，操作方法和上面类似， 
        
         // 通过RPC给toSvc发送transitionToActive命令。 
        
         boolean 
          failed =  
         false 
         ; 
        
         Throwable cause =  
         null 
         ; 
        
         try 
          { 
        
         HAServiceProtocolHelper.transitionToActive( 
        
         toSvc.getProxy(conf, rpcTimeoutToNewActive)); 
        
         }  
         catch 
          (ServiceFailedException sfe) { 
        
         LOG.error(“Unable to make ” + toSvc + ” active (” + 
        
         sfe.getMessage() + “). Failing back.”); 
        
         failed =  
         true 
         ; 
        
         cause = sfe; 
        
         }  
         catch 
          (IOException ioe) { 
        
         LOG.error(“Unable to make ” + toSvc + 
        
         ” active (unable to connect). Failing back.”, ioe); 
        
         failed =  
         true 
         ; 
        
         cause = ioe; 
        
         } 
        
         // 如果我们在第二步的时候，把toSvc转换成Active模式失败，需要考虑回滚。 
        
         // 如果我们没有强制fencing原来的fromSvc，那么就回滚。 
        
         // 如果我们强制fencing掉原来的fromSvc，那么只能抛异常了。 
        
         if 
          (failed) { 
        
         String msg = “Unable to failover to ” + toSvc; 
        
         // Only try to failback if we didn’t fence fromSvc 
        
         if 
          (!tryFence) { 
        
         try 
          { 
        
         // Unconditionally fence toSvc in case it is still trying to 
        
         // become active, eg we timed out waiting for its response. 
        
         // Unconditionally force fromSvc to become active since it 
        
         // was previously active when we initiated failover. 
        
         failover(toSvc, fromSvc,  
         true 
         ,  
         true 
         ); 
        
         }  
         catch 
          (FailoverFailedException ffe) { 
        
         msg += “. Failback to ” + fromSvc + 
        
         ” failed (” + ffe.getMessage() + “)”; 
        
         LOG.fatal(msg); 
        
         } 
        
         } 
        
         throw 
          new 
          FailoverFailedException(msg, cause); 
        
         } 
        
         }

（3）NameNode端的HA状态切换执行的操作代码

以上是DFSHAAdmin的操作，那么当它把对应的RPC命令发送到NameNode时，NameNode端的逻辑是怎么处理的呢？新的机遇Protocol Buffer实现的RPC请求在NameNode端会调用NameNodeRpcServer.java类中的方法。

 
         @Override 
          // HAServiceProtocol 
        
         public 
          synchronized 
          void 
          transitionToActive() 
        
         throws 
          ServiceFailedException, AccessControlException { 
        
         nn.transitionToActive(); 
        
         } 
        
         @Override 
          // HAServiceProtocol 
        
         public 
          synchronized 
          void 
          transitionToStandby() 
        
         throws 
          ServiceFailedException, AccessControlException { 
        
         nn.transitionToStandby(); 
        
         } 
        
         @Override 
          // HAServiceProtocol 
        
         public 
          synchronized 
          HAServiceStatus getServiceStatus() 
        
         throws 
          AccessControlException, ServiceFailedException { 
        
         return 
          nn.getServiceStatus(); 
        
         }

然后调用NameNode.java类中对应的方法，把NameNode的HAState置为Active或者Standby。NameNode处于这两种不同的State会有不同的代码执行逻辑。

 
         synchronized 
          void 
          transitionToActive() 
        
         throws 
          ServiceFailedException, AccessControlException { 
        
         namesystem.checkSuperuserPrivilege(); 
        
         if 
          (!haEnabled) { 
        
         throw 
          new 
          ServiceFailedException(“HA  
         for 
          namenode is not enabled”); 
        
         } 
        
         state.setState(haContext, ACTIVE_STATE); 
        
         }

无论当前的state是哪种，state.setState()函数都会调用setStateInternal()函数，执行状态切换。

 
         protected 
          final 
          void 
          setStateInternal( 
         final 
          HAContext context,  
         final 
          HAState s) 
        
         throws 
          ServiceFailedException { 
        
         prepareToExitState(context); 
        
         s.prepareToEnterState(context); 
        
         context.writeLock(); 
        
         try 
          { 
        
         exitState(context); 
        
         context.setState(s); 
        
         s.enterState(context); 
        
         }  
         finally 
          { 
        
         context.writeUnlock(); 
        
         } 
        
         }

prepareToExitState(context)函数目前只有当前处于StandbyState的实现，用于取消Standby NameNode正在进行的checkpoint操作(StandbyCheckpointer类)，不需要锁住NameNodeHAContext。下面是prepareToExitState()函数的调用关系。

s.prepareToEnterState(context)函数目前没有执行任何操作。

Exit和Enter的准备工作做好之后，就要真正进行状态切换了。在进行状态切换的时候Namespace是要加锁的，不允许同时还有其他的状态切换。下面以Standby模式向Active模式切换为例说明。

exitState(context)调用NameNodeHAContext.stopStandbyService()函数，然后调用FSNamesystem.stopStandbyService()函数。

 
         void 
          stopStandbyServices()  
         throws 
          IOException { 
        
         LOG.info(“Stopping services started  
         for 
          standby state”); 
        
         //关闭standbyCheckpointer线程，这个线程负责定期把共享存储上的Editlog合并成FsImage， 
        
         //保存在本地存储并且发送到Active NameNode 
        
         if 
          (standbyCheckpointer !=  
         null 
         ) { 
        
         standbyCheckpointer.stop(); 
        
         } 
        
         //由于要切换到Active模式，不需要EditLogTailer线程，所以关闭这个线程。 
        
         if 
          (editLogTailer !=  
         null 
         ) { 
        
         editLogTailer.stop(); 
        
         } 
        
         //由于要切换到Active模式，需要开启新的EditLog文件，所以关闭旧的文件输出流 
        
         if 
          (dir !=  
         null 
          && dir.fsImage !=  
         null 
          && dir.fsImage.editLog !=  
         null 
         ) { 
        
         dir.fsImage.editLog.close(); 
        
         } 
        
         }

s.enterState(context)的调用流程类似，最终会走到FSNamesystem.startActiveServices()方法中。

 
         void 
          startActiveServices()  
         throws 
          IOException { 
        
         LOG.info(“Starting services required  
         for 
          active state”); 
        
         writeLock(); 
        
         try 
          { 
        
         // 开启新的EditLog输出流，读取最后的TxId 
        
         FSEditLog editLog = dir.fsImage.getEditLog(); 
        
         if 
          (!editLog.isOpenForWrite()) { 
        
         // During startup, we’re already open for write during initialization. 
        
         editLog.initJournalsForWrite(); 
        
         // May need to recover 
        
         editLog.recoverUnclosedStreams(); 
        
         LOG.info(“Catching up to latest edits from old active before ” + 
        
         “taking over writer role in edits logs.”); 
        
         editLogTailer.catchupDuringFailover(); 
        
         LOG.info(“Reprocessing replication and invalidation queues…”); 
        
         blockManager.getDatanodeManager().markAllDatanodesStale(); 
        
         blockManager.clearQueues(); 
        
         blockManager.processAllPendingDNMessages(); 
        
         blockManager.processMisReplicatedBlocks(); 
        
         if 
          (LOG.isDebugEnabled()) { 
        
         LOG.debug(“NameNode metadata after re-processing ” + 
        
         “replication and invalidation queues during failover:n” + 
        
         metaSaveAsString()); 
        
         } 
        
         long 
          nextTxId = dir.fsImage.getLastAppliedTxId() +  
         1 
         ; 
        
         LOG.info(“Will take over writing edit logs at txnid ” + 
        
         nextTxId); 
        
         editLog.setNextTxId(nextTxId); 
        
         dir.fsImage.editLog.openForWrite(); 
        
         } 
        
         if 
          (haEnabled) { 
        
         // Renew all of the leases before becoming active. 
        
         // This is because, while we were in standby mode, 
        
         // the leases weren’t getting renewed on this NN. 
        
         // Give them all a fresh start here. 
        
         leaseManager.renewAllLeases(); 
        
         } 
        
         leaseManager.startMonitor(); 
        
         startSecretManagerIfNecessary(); 
        
         }  
         finally 
          { 
        
         writeUnlock(); 
        
         } 
        
         }

（4）NameNode对RPC操作的处理流程代码

到此为止NameNode的状态切换就完成了。我们前面提到过Active模式的NameNode会处理所有的RPC请求，而Standby模式的NameNode只会处理一部分请求（Standby模式的NameNode元数据更新是通过执行共享存储中存放的EditLog来实现的）。那么NameNode在执行RPC时是怎么区分的呢？前面已经提到过了，RPC到达NameNode后，都是调用NameNodeRpcServer.java类里相应的函数来执行的，而这些操作又会调用FSNamesystem.java类里对应的方法，然后在这些方法里检查当前处于的模式，时候继续执行下去还是抛出异常。

以一个典型的文件系统操作命令create为例说明：

NameNodeRpcServer.create()函数调用FSNamesystem.startFile()函数，在这个函数里调用checkOperation(OperationCategory.WRITE)函数检查。如果当前NameNode处于Active模式，这个函数返回true；如果处于Standby模式，这个函数抛出StandbyException，结束执行，然后通过RPC返回给client一个StandbyException。Client就知道刚才的那个RPC发错了，然后向另外一个NameNode发送。

在client发给NameNode的RPC操作中，读命令是两种模式的NameNode都可以执行的，写命令只有Active NameNode才能执行。后面HDFS也考虑向MySQL那样“主可读写，从可读”的主从HA机制。

说完client-NameNode的相关RPC协议之后，再来说说DataNode-NameNode的RPC相关协议。由于Active和Standby NameNode都保存有Block locations map信息，所以DataNode向两个NameNode发送的RPC都会被处理，不会有StandbyException。这样能够保证Standby的NameNode是热备，一旦切换直接可用。

至此NameNode端的HA机制相关代码告一段落，下一篇主要讨论client端是如何做fail over的。

参考文献：

http://www.cloudera.com/blog/2012/03/high-availability-for-the-hadoop-distributed-file-system-hdfs/

你可能感兴趣的:(hadoop,report,存储,processing,transition,Scalability)

【Hadoop】如何理解MapReduce？ 2302_79952574 hadoop mapreduce 数据库
MapReduce是一种用于处理大规模数据集的编程模型和计算框架。它的核心思想是将复杂的计算任务分解为两个简单的阶段：Map（映射）和Reduce（归约）。通过这种方式，MapReduce可以高效地并行处理海量数据。一.MapReduce的核心概念1.Map（映射）：将输入数据分割成小块，并对每个小块进行初步处理。输出键值对（key-valuepairs），例如。2.Shuffle和Sort（洗牌
Cache在嵌入式处理器中的使用问题 zhtek Operating System cache 嵌入式存储嵌入式操作系统出版工作
Cache在嵌入式处理器中的使用问题作者：西北工业大学王艳吴旭光赵勋峰随着嵌入式计算机应用的发展，嵌入式CPU的主频不断提高，这就造成了慢速系统存储器不能匹配高速CPU处理能力的情况。为了解决这个问题，许多高性能的嵌入式处理器内部集成了高速缓存Cache。其中，三星公司的S3C44B0X内部就集成了8KB空间统一的指令和数据Cache。Cache即高速缓冲存储器，是位于CPU与主存之间一种容量较小
元数据存储与网络日志详解（小白版）漠月瑾-西安数据分析网络安全
元数据存储与网络日志详解（小白版）一、元数据存储：网络的「快递单管理系统」1.1核心概念元数据是描述数据特征的==‌结构化标签‌==，类似于：快递单（记录包裹重量、发件人，但‌‌不含包裹内的物品‌‌）‌照片属性（拍摄时间、GPS坐标*，但‌‌不含图像内容‌‌）‌图书馆索引卡（书名、ISBN号，但‌‌不含书中文字‌‌）‌*注：GPS坐标等元数据可能涉及位置隐私，需谨慎授权‌1.2工作原理系统通过协议
Python 自动化探索性数据分析（EDA）工具东方佑量子变法 python 自动化数据分析
1.PandasProfiling功能特点：自动生成详细的统计报告，包含数据概览、单变量分析、相关性矩阵、缺失值分析等。支持交互式HTML报告，可导出为PDF或其他格式。适合快速生成数据集的全面摘要。使用示例：importpandasaspdfrompandas_profilingimportProfileReportdf=pd.read_csv("data.csv")profile=Profil
区块链大数据平台搭建系列（二）：如何搭建以太坊RPC节点 WuJiWeb3 从0到1搭建区块链大数据平台 rpc web3 big data kafka 数据仓库 github
Erigon是Ethereum（执行客户端）的一个实现，效率高，用Go编写。这里我们将采用Erigon进行搭建生产环境的以太坊RPC节点。环境准备1.系统要求操作系统：Ubuntu20.04或更高版本。硬件要求：由于Erigon会存储大量区块链数据，需要至少2TB的NVMeSSD磁盘、32GB或更多的内存（推荐64GB），以及8核CPU或更高的配置以提高性能。2.安装必需的软件包运行以下命令来安装
ABP框架概念是刘彦宏吖 ABP框架应用数据库
二、领域层10，实体11，值对象12，仓储13，领域服务14，规格模式15，工作单元16，事件总线17，数据过滤器三、应用层18，应用服务19，数据传输对象20，验证数据传输对象21，授权22，功能管理23，审计日志四、分布式服务层24，ASP.NETWebAPIControllers25，动态Webapi层26，OData整合27，SwaggerUI整合10，实体实体具有Id并存储在数据库中，实
【Redis 系列】Redis 常问简单面试题 msbQQ java redis 经验分享
咱们一起来看看redis常问常用的面试题Redis是个啥？http://www.redis.cn/redis中文网给了很明确且清晰的定义[图片上传失败...(image-ff92fa-1650460734395)]Redis是一个开源（BSD许可）的，内存中的数据结构存储系统Redis可以用作数据库、缓存和消息中间件支持的数据结构有8种字符串（strings），散列（hashes），列表（list
Redis常问八股（一）华东设计之美 java学习 redis 数据库缓存
1.什么是缓存穿透？怎么解决？答：缓存穿透是指查询一个一定不存在的数据，由于存储层查不到数据因此不写入缓存，这将导致这个不存在的数据每次请求都要到DB去查询，可能导致DB挂掉。这种情况大概率是遭到了攻击。解决方案的话，通常都会用布隆过滤器来解决它。2.你能介绍一下布隆过滤器吗？答：布隆过滤器主要是用于检索一个元素是否在一个集合中。可以使用Redisson实现的布隆过滤器。它的底层原理是，先初始化一
protobuf、protoc、proto这3个什么关系 fzip Doris Doris数据序列化
Protobuf、protoc和proto是ProtocolBuffers技术栈中的三个核心组成部分，它们的关系可概括为协议标准、编译器工具链与接口定义文件的协同体系。以下是具体解析：1.Protobuf（ProtocolBuffers）•定义：Protobuf是Google开发的一种跨语言、跨平台的结构化数据序列化协议，用于高效传输和存储数据。其核心优势在于序列化后的数据体积小、编解码速度快。•
可狱可囚的爬虫系列课程 19：静态页面和动态页面之分 HerrFu@灵思智行科技爬虫 python 爬虫
在爬虫开发中，静态页面和动态页面的核心区别在于数据的生成和加载方式，理解两者的差异直接影响爬虫技术选型和数据抓取策略；掌握静态/动态页面的区别，可显著提升爬虫效率和成功率。一、静态页面（StaticPage）静态页面的内容（1）在服务器预先生成，以.html文件形式存储，用户每次访问时返回相同的HTML代码。（2）数据直接嵌入在HTML中（如文本、表格、链接等）。（3）纯HTML+CSS，无复杂交
spring mvc实现自定义验证器Validator 罗汉爷 #玩转Spring spring mvc java 自定义Validator
使用场景在接口开发的日常实践中，确保数据准确性是保障业务稳定性的关键一环。面对诸如登录时验证用户名密码非空、创建用户时检查邮箱和手机号格式的正确性等需求，手动编写校验逻辑不仅耗时费力，还会显著降低代码的可读性和维护性。鉴于网络环境的不确定性及前端数据易遭篡改的特性，后端实施严格的参数校验变得尤为关键，以确保存储和处理的数据在逻辑上的无懈可击。Validator介绍Validator框架凭借其遵循的
深入C语言：指针与数组的经典笔试题剖析 lili-felicity C语言编程启航算法
1.sizeof和strlen的对比1.1sizeofsizeof是C语言中的一个操作符，用于计算变量或数据类型所占内存空间的大小，单位是字节。它不关心内存中存储的具体数据内容，只关注内存空间的大小。#includeintmain(){inta=10;printf("%d\n",sizeof(a));//输出：4（int类型通常占4个字节）printf("%d\n",sizeofa);//输出：4
如何管理 Github 组织中成员的权限 mikes zhang Github github 安全
Github组织是管理多个项目成员的好方法。但是，权限配置的工作方式与普通存储库有点不同，如果你想给成员写权限，你需要去挖掘设置。更改基本权限由于Github组织是一个单独的帐户类型，因此不会像您的个人帐户那样处理权限。通常，如果您想协作，您只需手动邀请协作者到每个存储库。但是，组织可以将“成员”直接添加到组织中。成为成员后，组织帐户中的所有存储库都将获得基本权限，从而可以更轻松地同时访问多个存储
上传文件到对象存储是选择前端还是后端 nangonghen linux 对象存储
对于云上对象存储的上传方式选择（前端直传或后端代理上传），需综合考虑安全性、性能、成本、业务需求等因素。1.推荐前端直传的场景适用条件：大文件上传（如视频、大型数据集）高并发场景（如用户生成内容平台）需节省服务器带宽成本业务对实时性要求高方案设计：临时凭证（STS）或预签名URL：通过后端服务生成短期有效的安全凭证（如AWSS3预签名URL、阿里云OSSSTS），避免暴露长期密钥。分片上传与断点续
详细介绍c++标准库中的vector容器成风693 c++算法
std::vector是C++标准库中的一个动态数组容器，属于序列容器的一种。它能够存储一组相同类型的元素，并且支持动态调整大小。std::vector提供了高效的随机访问、动态扩展和收缩功能，是C++中最常用的容器之一。主要特性动态数组：std::vector在内部使用动态分配的数组来存储元素，因此它可以在运行时动态调整大小。连续存储：元素在内存中是连续存储的，这使得std::vector支持高
Hadoop：全面深入解析 CloudJourney hadoop 大数据分布式
Hadoop是一个用于大规模数据处理的开源框架，其设计旨在通过集群的方式进行分布式存储和计算。本篇博文将从Hadoop的定义、架构、原理、应用场景以及常见命令等多个方面进行详细探讨，帮助读者全面深入地了解Hadoop。1.Hadoop的定义1.1什么是HadoopHadoop是由Apache软件基金会开发的开源软件框架，用于存储和处理大规模数据。其核心组件包括Hadoop分布式文件系统（HDFS）
Hadoop介绍：什么是Hadoop？了解Hadoop的应用 Zzzxt007 hadoop 大数据分布式
一、认识Hadoop框架Hadoop是一个提供分布式存储和计算的开源软件框架，使用Java语言编写，具有高扩展性、高容错性、无共享和高可用（HA）等特点，非常适合处理海量数据。它基于Google发布的MapReduce论文实现，并且应用了函数式编程的思想。Hadoop框架主要包括HDFS（HadoopDistributedFileSystem，Hadoop分布式文件系统）、MapReduce、YA
mysql面试知识点 mysql
leftjoin和innerjoin区别leftjoin在右表没有匹配项的时候，会将左表拼接上右表，右表的字段以null填充。innerjoin在右表没有匹配项的时候，该结果不显示innoDB默认的存储引擎支持事务、支持物理外键天生支持行锁、手动支持表锁使用聚簇索引（索引和数据在同一个文件）索引概念一种排好序，能够提升查询性能的数据结构分类聚簇索引（主键索引）索引和行数据都在一个叶子节点上非聚簇索
Doris存储的逻辑架构和物理架构 fzip Doris 数据湖架构 Doris
ApacheDoris的存储架构分为逻辑架构和物理架构两个层面，其设计核心围绕数据分布与查询优化展开。以下为详细解析：一、逻辑架构1.表结构分层逻辑表（LogicalTable）用户直接操作的抽象表，支持多种数据模型：明细模型（DuplicateKeyModel）：原始数据存储，无预聚合，适合日志类场景。聚合模型（AggregateKeyModel）：写入时按维度预聚合（如SUM、COUNT），适
FPGA学习篇——Verilog学习4（常见语句） ooo-p Verilog学习 fpga开发学习
1.1结构语句结构语句主要是initial语句和always语句，initial语句它在模块中只执行一次，而always语句则不断重复执行，以下是一个比较好解释的图:(图片来源于知乎博主罗成，画的很好很直观！)1.1.1initial语句initial语句它在模块中只执行一次。它常用于测试文件的编写，用来产生仿真测试信号(激励信号)，或者用于对存储器变量赋初值。语法格式：initialbegin.
MySql数据库等级考试学习分享2（Day1） weixin_53545579 学习
模式/内模式映像保证数据库系统中的数据能够具有较高的()OA、逻辑独立性OB、物理独立性OC、共享性OD、结构化知识点总结1.数据库三级模式结构外模式（用户级）：用户视图，描述数据的局部逻辑结构（如用户查询的表）。模式（概念级）：全局逻辑结构，定义数据的逻辑组织和关系（如数据库表结构）。内模式（物理级）：数据的物理存储方式（如文件存储格式、索引结构）。2.模式/内模式映像的作用定义：模式与内模式之
gethostname 若云止水 c语言
在POSIX兼容系统（如Linux、Unix、macOS）中，使用的是gethostname()函数，定义在头文件中：#includeintgethostname(char*name,size_tlen);参数说明name:用于存储主机名的字符数组（缓冲区）len:缓冲区的最大长度（以字节为单位）返回值成功时返回0失败时返回-1，并设置errno来指示错误
软考初级程序员知识点汇总水瓶丫头站住考试软考程序员考试
以下是计算机技术与软件专业技术资格（水平）考试（简称“软考”）中程序员（初级）考试的核心知识点汇总，涵盖考试大纲的主要方向，帮助你系统复习：一、计算机基础计算机组成与体系结构计算机五大部件：运算器、控制器、存储器、输入设备、输出设备进制转换：二进制、八进制、十进制、十六进制的相互转换数据表示：原码、反码、补码、浮点数表示、ASCII码、汉字编码（GB2312、Unicode）存储单位：位（bit）
#include＜set＞的用法（自用） Whisper_Ke c++算法数据结构
是C++标准库中的一个头文件，提供了std::set容器的实现。std::set是一个关联容器，用于存储唯一元素的集合，元素按特定顺序（默认是升序）排列。以下是关于和std::set的详细讲解：1.std::set的特点唯一性：std::set中的元素是唯一的，不允许重复。有序性：元素默认按升序排列（可以通过自定义比较函数改变顺序）。底层实现：通常基于红黑树（一种平衡二叉搜索树），因此插入、删除和
C++【STL--- set】疯狂的代M夫 c++c++开发语言
1、什么是set?set是一个不包含重复元素的内部自动有序的容器。set和map是经典的关联容器，与之前的vector,list,string,stack,priority_queue,deque等顺序容器不同；关联容器和顺序容器的区别在于：数据的存储方式不同：顺序容器按照元素插入的顺序依次存放数据，就像在一个数组或者链表中依次摆放数据一样。元素在内存中是连续存储(如vector和string)或
mysql创建数据库和表程序员小羊！数据库 mysql oracle
大家好，我是程序员小羊！前言：一、MySQL数据库和表的基础概念在深入讲解如何在MySQL中创建数据库和表之前，先了解一些基础概念。1.1数据库和表的概念数据库（Database）：数据库是数据存储的容器，存储着相关数据集合。每个数据库可以包含多个表，并为这些表提供结构和组织。表（Table）：表是数据库中的基本存储单位。它由行和列组成，每行表示一条记录，每列表示记录的某个属性。1.2关系型数据库
STL容器 —— vector了解、接口使用，以及模拟实现vector（部分常用接口） Wihkum C++c++开发语言
注意：以下所有文档都来源此网站：http://cplusplus.com/一、vector的介绍及使用vector文档的介绍：https://cplusplus.com/reference/vector/vector/1.vector的介绍（1）vector是表示可变大小数组的序列容器。（2）就像数组一样，vector也采用的连续存储空间来存储元素。也就是意味着可以采用下标对vector的元素进行
C++笔记 01文件流操作 nedaf C++c++
1基本概念文件(file)存储在磁盘上的数据集合，可以是文本、二进制等格式，具有名称、大小、类型等属性。流(stream)一连串的字节，是一种抽象的数据传输方式。在C++中，文件操作是基于流的概念，有3种主要类型的流：输入流(istream)：允许程序从源(如键盘、文件)读取数据。输出流(ostream)：允许程序将数据发送到目标(如显示器、文件)。输入/输出流(iostream)：结合了输入流和
MyBatis-Plus 与 Redis #sakura mybatis redis 数据库
1MyBatis-Plus1.1MyBatis-Plus简介MyBatis是一款优秀的持久层框架，它能将接口和JavaPOJO（PlainOldJavaObjects，普通Java对象）映射为数据库中的数据。支持自定义SQL、存储过程，功能强大。MyBatis承担了几乎所有的JDBC代码，包括设置参数和获取结果等工作，可通过简单的XML或注解进行配置。MyBatis-Plus是MyBatis的最佳
【CVTE】嵌入式软件开发-Linux方向{一面} 阿猿收手吧！面经 linux 运维服务器面试
文章目录数组和链表的区别？特点？使用场景？**1.数组（Array）****特点：****使用场景：****2.链表（LinkedList）****特点：****使用场景：****3.数组vs链表对比****4.代码示例****数组示例****链表示例（单链表）****5.结论**全局变量和局部变量在linux内存存储的区别**1.全局变量（GlobalVariables）****存储位置：***
apache ftpserver-CentOS config gengzg apache
<server xmlns="http://mina.apache.org/ftpserver/spring/v1" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation=" http://mina.apache.o
优化MySQL数据库性能的八种方法 AILIKES sql mysql
1、选取最适用的字段属性　　MySQL可以很好的支持大数据量的存取，但是一般说来，数据库中的表越小，在它上面执行的查询也就会越快。因此，在创建表的时候，为了获得更好的性能，我们可以将表中字段的宽度设得尽可能小。例如，在定义邮政编码这个字段时，如果将其设置为CHAR(255),显然给数据库增加了不必要的空间，甚至使用VARCHAR这种类型也是多余的，因为CHAR(6)就可以很
JeeSite 企业信息化快速开发平台 Kai_Ge JeeSite
JeeSite 企业信息化快速开发平台平台简介 JeeSite是基于多个优秀的开源项目，高度整合封装而成的高效，高性能，强安全性的开源Java EE快速开发平台。 JeeSite本身是以Spring Framework为核心容器，Spring MVC为模型视图控制器，MyBatis为数据访问层， Apache Shiro为权限授权层，Ehcahe对常用数据进行缓存，Activit为工作流
通过Spring Mail Api发送邮件 120153216 邮件 main
原文地址：http://www.open-open.com/lib/view/open1346857871615.html 使用Java Mail API来发送邮件也很容易实现，但是最近公司一个同事封装的邮件API实在让我无法接受，于是便打算改用Spring Mail API来发送邮件，顺便记录下这篇文章。【Spring Mail API】 Spring Mail API都在org.spri
Pysvn 程序员使用指南 2002wmj SVN
源文件:http://ju.outofmemory.cn/entry/35762 这是一篇关于pysvn模块的指南. 完整和详细的API请参考 http://pysvn.tigris.org/docs/pysvn_prog_ref.html. pysvn是操作Subversion版本控制的Python接口模块. 这个API接口可以管理一个工作副本, 查询档案库, 和同步两个. 该
在SQLSERVER中查找被阻塞和正在被阻塞的SQL 357029540 SQL Server
SELECT R.session_id AS BlockedSessionID , S.session_id AS BlockingSessionID , Q1.text AS Block
Intent 常用的用法备忘 7454103 .net android Google Blog F#
Intent 应该算是Android中特有的东西。你可以在Intent中指定程序要执行的动作（比如：view,edit,dial），以及程序执行到该动作时所需要的资料。都指定好后，只要调用startActivity()，Android系统会自动寻找最符合你指定要求的应用程序，并执行该程序。下面列出几种Intent 的用法显示网页:
Spring定时器时间配置 adminjun spring 时间配置定时器
红圈中的值由6个数字组成，中间用空格分隔。第一个数字表示定时任务执行时间的秒，第二个数字表示分钟，第三个数字表示小时，后面三个数字表示日，月，年，< xmlnamespace prefix ="o" ns ="urn:schemas-microsoft-com:office:office" /> 测试的时候，由于是每天定时执行，所以后面三个数
POJ 2421 Constructing Roads 最小生成树 aijuans 最小生成树
来源：http://poj.org/problem?id=2421 题意：还是给你n个点，然后求最小生成树。特殊之处在于有一些点之间已经连上了边。思路：对于已经有边的点，特殊标记一下，加边的时候把这些边的权值赋值为0即可。这样就可以既保证这些边一定存在，又保证了所求的结果正确。代码： #include <iostream> #include <cstdio>
重构笔记——提取方法（Extract Method） ayaoxinchao java 重构提炼函数局部变量提取方法
提取方法（Extract Method）是最常用的重构手法之一。当看到一个方法过长或者方法很难让人理解其意图的时候，这时候就可以用提取方法这种重构手法。下面是我学习这个重构手法的笔记：提取方法看起来好像仅仅是将被提取方法中的一段代码，放到目标方法中。其实，当方法足够复杂的时候，提取方法也会变得复杂。当然，如果提取方法这种重构手法无法进行时，就可能需要选择其他
为UILabel添加点击事件 bewithme UILabel
默认情况下UILabel是不支持点击事件的，网上查了查居然没有一个是完整的答案，现在我提供一个完整的代码。 UILabel *l = [[UILabel alloc] initWithFrame:CGRectMake(60, 0, listV.frame.size.width - 60, listV.frame.size.height)]
NoSQL数据库之Redis数据库管理(PHP-REDIS实例) bijian1013 redis 数据库 NoSQL
一.redis.php <?php //实例化 $redis = new Redis(); //连接服务器 $redis->connect("localhost"); //授权 $redis->auth("lamplijie"); //相关操
SecureCRT使用备注 bingyingao secureCRT 每页行数
SecureCRT日志和卷屏行数设置一、使用securecrt时，设置自动日志记录功能。 1、在C:\Program Files\SecureCRT\下新建一个文件夹(也就是你的CRT可执行文件的路径），命名为Logs； 2、点击Options -> Global Options -> Default Session -> Edite Default Sett
【Scala九】Scala核心三：泛型 bit1129 scala
泛型类 package spark.examples.scala.generics class GenericClass[K, V](val k: K, val v: V) { def print() { println(k + "," + v) } } object GenericClass { def main(args: Arr
素数与音乐 bookjovi 素数数学 haskell
由于一直在看haskell，不可避免的接触到了很多数学知识，其中数论最多，如素数，斐波那契数列等，很多在学生时代无法理解的数学现在似乎也能领悟到那么一点。闲暇之余，从图书馆找了<<The music of primes>>和<<世界数学通史>>读了几遍。其中素数的音乐这本书与软件界熟知的&l
Java-Collections Framework学习与总结-IdentityHashMap BrokenDreams Collections
这篇总结一下java.util.IdentityHashMap。从类名上可以猜到，这个类本质应该还是一个散列表，只是前面有Identity修饰，是一种特殊的HashMap。简单的说，IdentityHashMap和HashM
读《研磨设计模式》-代码笔记-享元模式-Flyweight bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.HashMap; import java.util.List; import java
PS人像润饰&调色教程集锦 cherishLC PS
1、仿制图章沿轮廓润饰——柔化图像，凸显轮廓 http://www.howzhi.com/course/retouching/ 新建一个透明图层，使用仿制图章不断Alt+鼠标左键选点，设置透明度为21%，大小为修饰区域的1/3左右（比如胳膊宽度的1/3），再沿纹理方向（比如胳膊方向）进行修饰。所有修饰完成后，对该润饰图层添加噪声，噪声大小应该和
更新多个字段的UPDATE语句 crabdave update
更新多个字段的UPDATE语句 update tableA a set (a.v1, a.v2, a.v3, a.v4) = --使用括号确定更新的字段范围
hive实例讲解实现in和not in子句 daizj hive not in in
本文转自：http://www.cnblogs.com/ggjucheng/archive/2013/01/03/2842855.html 当前hive不支持 in或not in 中包含查询子句的语法，所以只能通过left join实现。假设有一个登陆表login(当天登陆记录,只有一个uid),和一个用户注册表regusers(当天注册用户，字段只有一个uid)，这两个表都包含
一道24点的10+种非人类解法（2,3,10,10） dsjt 算法
这是人类算24点的方法？！！！事件缘由：今天晚上突然看到一条24点状态，当时惊为天人，这NM叫人啊？以下是那条状态朱明西 : 24点，算2 3 10 10，我LX炮狗等面对四张牌痛不欲生，结果跑跑同学扫了一眼说，算出来了，2的10次方减10的3次方。。我草这是人类的算24点啊。。然后么。。。我就在深夜很得瑟的问室友求室友算刚出完题，文哥的暴走之旅开始了 5秒后
关于YII的菜单插件 CMenu和面包末breadcrumbs路径管理插件的一些使用问题 dcj3sjt126com yii framework
在使用 YIi的路径管理工具时，发现了一个问题。 <?php
对象与关系之间的矛盾：“阻抗失配”效应[转] come_for_dream 对象
概述 “阻抗失配”这一词组通常用来描述面向对象应用向传统的关系数据库（RDBMS）存放数据时所遇到的数据表述不一致问题。C++程序员已经被这个问题困扰了好多年，而现在的Java程序员和其它面向对象开发人员也对这个问题深感头痛。 “阻抗失配”产生的原因是因为对象模型与关系模型之间缺乏固有的亲合力。“阻抗失配”所带来的问题包括：类的层次关系必须绑定为关系模式（将对象
学习编程那点事 gcq511120594 编程互联网
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
Reverse Linked List II hcx2013 list
Reverse a linked list from position m to n. Do it in-place and in one-pass. For example:Given 1->2->3->4->5->NULL, m = 2 and n = 4, return
Spring4.1新特性——页面自动化测试框架Spring MVC Test HtmlUnit简介 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Hadoop集群工具distcp liyonghui160com
1. 环境描述两个集群：rock 和 stone rock无kerberos权限认证，stone有要求认证。 1. 从rock复制到stone，采用hdfs Hadoop distcp -i hdfs://rock-nn:8020/user/cxz/input hdfs://stone-nn:8020/user/cxz/运行在rock端，即源端问题：报版本
一个备份MySQL数据库的简单Shell脚本 pda158 mysql 脚本
　　主脚本（用于备份mysql数据库）：　　该Shell脚本可以自动备份数据库。只要复制粘贴本脚本到文本编辑器中，输入数据库用户名、密码以及数据库名即可。我备份数据库使用的是mysqlump 命令。后面会对每行脚本命令进行说明。　　 1. 分别建立目录“backup”和“oldbackup” 　　#mkdir /backup 　　#mkdir /oldbackup 　
300个涵盖IT各方面的免费资源（中）——设计与编码篇 shoothao IT资源图标库图片库色彩板字体
A. 免费的设计资源 Freebbble:来自于Dribbble的免费的高质量作品。 Dribbble:Dribbble上“免费”的搜索结果——这是巨大的宝藏。 Graphic Burger:每个像素点都做得很细的绝佳的设计资源。 Pixel Buddha:免费和优质资源的专业社区。 Premium Pixels:为那些有创意的人提供免费的素材。
thrift总结 - 跨语言服务开发 uule thrift
官网官网JAVA例子 thrift入门介绍 IBM-Apache Thrift - 可伸缩的跨语言服务开发框架 Thrift入门及Java实例演示 thrift的使用介绍 RPC POM： <dependency> <groupId>org.apache.thrift</groupId>