KRBY

Flink - 源码阅读笔记(主节点JobManager启动分析)

一、JobManager三大核心组件

Flink 主从架构：主节点： JobManager + 从节点： TaskManager

JobManager 是 Flink 集群的主节点，它包含三大重要的组件：

1、ResourceManager
   Flink的集群资源管理器，只有一个，关于slot的管理和申请等工作，都由他负责
2、Dispatcher
   负责接收用户提交的 JobGragh, 然后启动一个 JobMaster，类似于 YARN 集群中的 AppMaster 角色和 Spark Job 中的 Driver 角色
   内部有一个持久服务：JobGraghStore，主节点迁移时恢复JobGragh执行
3、WebMonitorEndpoint Rest服务内部启动了netty服务端，Rest请求注册到netty服务端
   里面维护了很多很多的Handler，如果客户端通过 flink run 的方式来提交一个 job 到 flink 集群，最终，是由 WebMonitorEndpoint 来接收，并且决定使用哪一个 Handler 来执行处理
例如：submitJob ===> JobSubmitHandler

当提交一个 Job 到 Flink 集群运行的时候：

4、JobMaster/JobManager
   负责一个具体的 Job 的执行，在一个集群中，可能会有多个 JobManager 同时执行
   类似于 YARN 集群中的 AppMaster 角色，类似于 Spark Job 中的 Driver 角色
   由 createJobManagerRunner() 创建实现

关于 JobManager 的区分：

1、Flink 是主从架构，JobManager 就是指主节点，它包含上面讲述的三种角色：
   ResourceManager，Dispatcher，WebMonitorEndpoint

2、将 Job 提交到 YARN 运行的时候，事实上，可以通过启动一个小集群的方式来运行，这个小集群的主节点也是 JobManager，这就是 Flink on YARN 的 Session 模式。

        把 job 提交到 YARN 运行的时候，有三种模式：per-job, session, application

总结一下：

Flink 集群的主节点内部运行着：ResourceManager 和 Dispatcher，当 client 提交一个 job 到集群运行的时候（客户端会把该 Job 构建成一个 JobGragh 对象），主节点接收到提交 job 的 rest 请求之后，WebMonitorEndpoint 执行处理：会通过 Router 进行解析找到对应的 Hanlder 来执行处理，处理完毕之后，转交给 Dispatcher 来处理，Dispatcher 负责拉起 JobMaster 来负责这个 Job 内部的 Task 的部署执行，执行 Task 所需要的资源，JobMaster 向 ResourceManager 申请。

根据启动脚本分析：

JobManager 的启动主类：StandaloneSessionClusterEntrypoint (parent class -> ClusterEntrypoint)

// 入口，解析 命令行参数 和 配置文件 flink-conf.yaml 
StandaloneSessionClusterEntrypoint.main()
     
    //entrypoint -> StandaloneSessionClusterEntrypoint 
	ClusterEntrypoint.runClusterEntrypoint(entrypoint);
	
      // 启动插件组件，配置文件系统实例等(clusterEntrypoint -> StandaloneSessionClusterEntrypoint)
      clusterEntrypoint.startCluster(); 
    
    	runCluster(configuration, pluginManager); 
    	
    		// 第一步：初始化各种服务（8个基础服务） 
    		initializeServices(configuration, pluginManager);
    		
    		// 第二步：创建 DispatcherResourceManagerComponentFactory, 初始化各种组件的工厂实例
            // 其实内部包含了三个重要的成员变量：
            // 创建 ResourceManager 的工厂实例 
            // 创建 Dispatcher 的工厂实例 
            // 创建 WebMonitorEndpoint 的工厂实例 	
            createDispatcherResourceManagerComponentFactory(configuration); 
            
            // 第三步：创建JobManager三大核心角色实例：WebMonitorEndpoint，Dispatcher， ResourceManager 等
            // 创建和启动 ResourceManager
            // 创建和启动 Dispatcher 
            // 创建和启动 WebMonitorEndpoint
            clusterComponent = dispatcherResourceManagerComponentFactory.create(...)

第一步 initializeServices() 中做了很多服务组件的初始化：

JobManager对外提供服务的时候所需要的三大核心组件启动时所需要的基础服务

// 初始化和启动 AkkaRpcService，内部其实包装了一个 ActorSystem 
commonRpcService = AkkaRpcServiceUtils.createRemoteRpcService(...) 
	return new AkkaRpcService(actorSystem, AkkaRpcServiceConfiguration.fromConfiguration(configuration));

// 启动一个 JMXService，用于客户端链接 JobManager JVM 进行监控 
//jmxServer: 9123
//可能端口被占用了，通过一个范围轮询的机制，找到一个未占用的 
JMXService.startInstance(configuration.getString(JMXServerOptions.JMX_SERVER_PORT)); 
 
// 初始化一个负责 IO 的线程池 
//假设当前节点32C cpu启动128个线程：4*Hardware.getNumberCPUCores()
//解决：Flink集群中很多地方的代码都是异步编程
ioExecutor = Executors.newFixedThreadPool(...) 

// 初始化 HA 服务组件，负责 HA 服务的是：ZooKeeperHaServices，内部封装了一个zk客户端
//在flink-conf.yaml配置文件中：high-availability = zookeeper
haServices = createHaServices(configuration, ioExecutor); 

// 初始化 BlobServer 服务端，大文件存储系统（jar、TaskManager上传的log文件等等）
blobServer = new BlobServer(configuration, haServices.createBlobStore()); 
blobServer.start(); 

// 初始化心跳服务组件, heartbeatServices = HeartbeatServices 
//heartbeatInterval：10s
//heartbeatTimeout: 50s
heartbeatServices = createHeartbeatServices(configuration); 
	return new HeartbeatServices(heartbeatInterval, heartbeatTimeout);

// 启动 metrics（性能监控） 相关的服务，内部也是启动一个 ActorSystem 
MetricUtils.startRemoteMetricsRpcService(configuration, 
commonRpcService.getAddress()); 

// 初始化一个用来存储 ExecutionGraph 的 Store, 实现是： 
//per-job模式存储在内存中
//session模式存储在磁盘中
FileArchivedExecutionGraphStore 
archivedExecutionGraphStore = createSerializableExecutionGraphStore(...)

第二步 createDispatcherResourceManagerComponentFactory(configuration) 中负责初始化了很多组件的工厂实例：

1、DispatcherRunnerFactory，默认实现：DefaultDispatcherRunnerFactory，生产 DefaultDispatcherRunner

2、ResourceManagerFactory，默认实现：StandaloneResourceManagerFactory，生产 StandaloneResourceManager

3、RestEndpointFactory，默认实现：SessionRestEndpointFactory，生产 DispatcherRestEndpoint

关于 DefaultDispatcherResourceManagerComponentFactory 这个组件工厂，它的内部组成：

其中，DispatcherRunnerFactory 内部也实例化了一个：

SessionDispatcherLeaderProcessFactoryFactory 组件

第三步 dispatcherResourceManagerComponentFactory.create(...) 中主要去创建三个重要的组件（参数为初始化的八个基础服务组件）：

1、DispatcherRunner，实现是：DefaultDispatcherRunner

2、ResourceManager，实现是：StandaloneResourceManager

3、WebMonitorEndpoint，实现是：DispatcherRestEndpoint

最终总结一下：

二：八个基础服务的初始化

1、创建 Akka rpc 服务 commonRpcService

// 创建一个 Akka rpc 服务 commonRpcService： 基于 Akka 的 RpcService 实现
//commonRpcService 其实是一个基于 akka 得 actorSystem，其实就是一个 tcp 的 rpc 服务，端口为：6123
commonRpcService = AkkaRpcServiceUtils                    .createRemoteRpcService(configuration,configuration.getString(JobManagerOptions.ADDRESS),getRPCPortRange(configuration),                 configuration.getString(JobManagerOptions.BIND_HOST),configuration.getOptional(JobManagerOptions.RPC_BIND_PORT));
	akkaRpcServiceBuilder.createAndStart()
		//初始化 ActorSystem
		final ActorSystem actorSystem;
		
		if(externalAddress == null) {
			// create local actor system
			actorSystem = BootstrapTools.startLocalActorSystem(configuration, actorSystemName, logger, actorSystemExecutorConfiguration, customConfig);
		} else {
			// create remote actor system
			actorSystem = BootstrapTools
					.startRemoteActorSystem(configuration, actorSystemName, externalAddress, externalPortRange, bindAddress, Optional.ofNullable(bindPort),
							logger, actorSystemExecutorConfiguration, customConfig);
		}
		
		new AkkaRpcService(actorSystem, AkkaRpcServiceConfiguration.fromConfiguration(configuration));

2、启动 JMXService

作用：用于监控jobmanager jvm

/**
 *  注释： jmxServer ：  9123
 *  可能这个端口号被占用了： 通过一个范围轮询的机制，找一个未占用的
 *  while(true){
 *      try{
 *          正经业务代码
 *          break;
 *      }catch(){
 *          异常处理
 *      }
 *  }
 */
JMXService.startInstance(configuration.getString(JMXServerOptions.JMX_SERVER_PORT));
	//轮询获取端口
	Iterator ports = NetUtils.getPortRangeFromString(portsConfig);
	//启动jmx服务
	jmxServer = startJMXServerWithPortRanges(ports);
		JMXServer server = new JMXServer();
		server.start(port);

3、启动io线程池

//启动一个线程池
//如果你当前节点有 32 个 cpu ,那么当前这个 ioExecutor 启动的线程的数量为：128
//因为整个Flink 集群很多的地方的代码都是异步编程，
ioExecutor = Executors.newFixedThreadPool(ClusterEntrypointUtils.getPoolSize(configuration), new ExecutorThreadFactory("cluster-io"));
	//获取核心线程数的方法
	ClusterEntrypointUtils.getPoolSize(configuration)
		4 * Hardware.getNumberCPUCores()
			//cpu core
			Runtime.getRuntime().availableProcessors();

4、初始化 HA 高可用服务

//初始化 HA 高可用服务
//一般都搭建 基于 zk 的 HA 服务： ZooKeeperHaServices
haServices = createHaServices(configuration, ioExecutor);
	HighAvailabilityServicesUtils.createHighAvailabilityServices(configuration, executor,HighAvailabilityServicesUtils.AddressResolution.NO_ADDRESS_RESOLUTION);
	
		//在 fink-conf.yaml 配置文件中，我们会去配置：high-availability = zookeeper
		case ZOOKEEPER:BlobStoreService blobStoreService = BlobUtils.createBlobStoreFromConfig(configuration);
		
		//得到一个 ZooKeeperHaServices ，内部封装了一个 ZK 客户端(curator框架实现的)
		new ZooKeeperHaServices(ZooKeeperUtils.startCuratorFramework(configuration), executor, configuration, blobStoreService);
			CuratorFramework cf = CuratorFrameworkFactory.builder().connectString(zkQuorum).sessionTimeoutMs(sessionTimeout).connectionTimeoutMs(connectionTimeout)
				.retryPolicy(new ExponentialBackoffRetry(retryWait, maxRetryAttempts))
				.namespace(rootWithNamespace.startsWith("/") ? rootWithNamespace.substring(1) : rootWithNamespace).aclProvider(aclProvider).build();

5、初始化 BlobServer

//主要管理一些大文件的上传等，比如用户作业的 jar 包、TaskManager 上传 log 文件等
blobServer = new BlobServer(configuration, haServices.createBlobStore());

6、初始化心跳服务，具体实现是：HeartBeatImpl

// 初始化心跳服务，具体实现是：HeartBeatImpl
//后续的运行的一些心跳服务，都是基于这个 基础心跳服务来构建的
heartbeatServices = createHeartbeatServices(configuration);
	HeartbeatServices.fromConfiguration(configuration);
		// TODO_MA 注释： 10s (心跳间隔时间：heartbeat.interval)
		long heartbeatInterval = configuration.getLong(HeartbeatManagerOptions.HEARTBEAT_INTERVAL);
		// TODO_MA 注释： 50s (心跳超时时间：heartbeat.timeout)
		long heartbeatTimeout = configuration.getLong(HeartbeatManagerOptions.HEARTBEAT_TIMEOUT);
		
		new HeartbeatServices(heartbeatInterval, heartbeatTimeout);

7、metrics（性能监控）相关的服务

//比如web ui看到的就是他实现的
metricRegistry = createMetricRegistry(configuration, pluginManager);
	new MetricRegistryImpl(MetricRegistryConfiguration.fromConfiguration(configuration)
		,ReporterSetup.fromConfiguration(configuration, pluginManager));

8、存储 ExecutionGraph 的服务

/*************************************************
 *  注释： ArchivedExecutionGraphStore: 存储 ExecutionGraph 的服务， 默认有两种实现
 *  1、MemoryArchivedExecutionGraphStore 主要是在内存中缓存
 *  2、FileArchivedExecutionGraphStore 会持久化到文件系统，也会在内存中缓存
 *  默认实现是基于 File 的： FileArchivedExecutionGraphStore
 *  -
 *  1、per-job 模式在内存中
 *  2、session 模式在磁盘中
 */
archivedExecutionGraphStore = createSerializableExecutionGraphStore(configuration, commonRpcService.getScheduledExecutor());

三、三大组件启动入口

入口

DispatcherResourceManagerComponent create(
        Configuration configuration,
        Executor ioExecutor,
        RpcService rpcService,
        HighAvailabilityServices highAvailabilityServices,
        BlobServer blobServer,
        HeartbeatServices heartbeatServices,
        MetricRegistry metricRegistry,
        ArchivedExecutionGraphStore archivedExecutionGraphStore,
        MetricQueryServiceRetriever metricQueryServiceRetriever,
        FatalErrorHandler fatalErrorHandler)
        throws Exception;
        
			// TODO 注释： DefaultLeaderRetrievalService 监控 Dispatcher
			dispatcherLeaderRetrievalService = highAvailabilityServices.getDispatcherLeaderRetriever();
			// TODO 注释： DefaultLeaderRetrievalService 监控 ResourceManager
			resourceManagerRetrievalService = highAvailabilityServices.getResourceManagerLeaderRetriever();
			// TODO 注释： Dispatcher 的 GatewayRetriever
			final LeaderGatewayRetriever dispatcherGatewayRetriever = new RpcGatewayRetriever<>(rpcService, DispatcherGateway.class,
					DispatcherId::fromUuid, new ExponentialBackoffRetryStrategy(12, Duration.ofMillis(10), Duration.ofMillis(50)));
			// TODO 注释： ResourceManager 的 GatewayRetriever
			final LeaderGatewayRetriever resourceManagerGatewayRetriever = new RpcGatewayRetriever<>(rpcService,
					ResourceManagerGateway.class, ResourceManagerId::fromUuid,
					new ExponentialBackoffRetryStrategy(12, Duration.ofMillis(10), Duration.ofMillis(50)));
			// TODO 注释： 创建线程池，用于执行 WebMonitorEndpoint 所接收到的 client 发送过来的请求
			final ScheduledExecutorService executor = WebMonitorEndpoint.createExecutorService(
					configuration.getInteger(RestOptions.SERVER_NUM_THREADS),
					configuration.getInteger(RestOptions.SERVER_THREAD_PRIORITY),
					"DispatcherRestEndpoint"
			);
			
			
			/*************************************************
			 * 创建三个核心组件
			 */

			/*************************************************
             *  注释： 创建 WebMonitorEndpoint 实例， 在 Standalone 模式下： DispatcherRestEndpoint
             *  1、restEndpointFactory = SessionRestEndpointFactory
             *  2、webMonitorEndpoint = DispatcherRestEndpoint
             *  当前这个 DispatcherRestEndpoint 的作用是：
             *  1、初始化的过程中，会初始化一大堆的 Handler
             *  2、启动一个 Netty 的服务端，绑定了这些 注册和排序这些 Handler
             *  3、当 client 通过 flink 命令提交了某些操作（发起 restful 请求），服务端由 webMonitorEndpoint 来执行处理
             *  举个例子：
             *  如果用户通过 flink run 提交一个 Job，那么最后是由 WebMonitorEndpoint 中的 JobSubmitHandler 来执行处理
             *  job 由 JobSubmitHandler 执行完毕之后，转交给 Dispatcher 去调度执行
             */
            webMonitorEndpoint = restEndpointFactory
                    .createRestEndpoint(configuration, dispatcherGatewayRetriever, resourceManagerGatewayRetriever, blobServer, executor, metricFetcher,highAvailabilityServices.getClusterRestEndpointLeaderElectionService(), fatalErrorHandler);

            log.debug("Starting Dispatcher REST endpoint.");
            webMonitorEndpoint.start();

            final String hostname = RpcUtils.getHostname(rpcService);

            /*************************************************
             *  注释：
             *  其实三个要点：
             *  1、ResourceManager 是一个 RpcEndpoint，当构建好了这个对象之后，去看它的 onStart() 即可
             *  2、ResourceManager 也是一个 LeaderContender，也会执行竞选，竞选处理
             *  3、启动 ResourceManager Service
             *      两个心跳服务
             *          从节点 和 主节点之间的心跳
             *          Job的主控程序 和 主节点之间的心跳
             *      两个定时服务
             *          TaskManager 的超时检查服务
             *          Slot申请的 超时检查服务
             */
            resourceManager = resourceManagerFactory
                    .createResourceManager(configuration, ResourceID.generate(), rpcService, highAvailabilityServices, heartbeatServices, fatalErrorHandler,new ClusterInformation(hostname, blobServer.getPort()), webMonitorEndpoint.getRestBaseUrl(), metricRegistry, hostname, ioExecutor);

            final HistoryServerArchivist historyServerArchivist = HistoryServerArchivist
                    .createHistoryServerArchivist(configuration, webMonitorEndpoint, ioExecutor);

            final PartialDispatcherServices partialDispatcherServices = new PartialDispatcherServices(configuration, highAvailabilityServices,resourceManagerGatewayRetriever, blobServer, heartbeatServices,() -> MetricUtils.instantiateJobManagerMetricGroup(metricRegistry, hostname), archivedExecutionGraphStore, fatalErrorHandler,historyServerArchivist, metricRegistry.getMetricQueryServiceGatewayRpcAddress(), ioExecutor);

            log.debug("Starting Dispatcher.");

            /*************************************************
             *  注释：
             *  1、在该代码的内部，会创建 Dispatcher 组件
             *  2、调用 start() 启动
             */
            dispatcherRunner = dispatcherRunnerFactory.createDispatcherRunner(highAvailabilityServices.getDispatcherLeaderElectionService(), fatalErrorHandler,new HaServicesJobGraphStoreFactory(highAvailabilityServices), ioExecutor, rpcService,partialDispatcherServices);

            log.debug("Starting ResourceManager.");
            resourceManager.start();

            resourceManagerRetrievalService.start(resourceManagerGatewayRetriever);
            dispatcherLeaderRetrievalService.start(dispatcherGatewayRetriever);

            /*************************************************
             *  注释：
             */
            return new DispatcherResourceManagerComponent(dispatcherRunner, DefaultResourceManagerService.createFor(resourceManager),dispatcherLeaderRetrievalService, resourceManagerRetrievalService, webMonitorEndpoint, fatalErrorHandler);

1、WebMonitorEndpoint 启动和初始化源码剖析

第一件事、继承关系：

DispatcherRestEndpoint extends WebMonitorEndpoint 
WebMonitorEndpoint extends RestServerEndpoint implements LeaderContender, JsonArchivist

1、LeaderContender过程：
LeaderContender 是一个 竞选角色
leaderElectionService.start(LeaderContender)
如果成功：则回调 leaderElectionService 的 isLeader() 方法
	// TODO 注释： isLeader() 的方法的内部回调： LeaderContender 的 grantLeaderShip()
如果失败：则回调 leaderElectionService 的 notLeader() 方法

2、RestServerEndpoint并不是rpcEndpoint，里面没有onStart()方法

具体实现：

// 初始化 WebMonitorEndpoint（restEndpointFactory = SessionRestEndpointFactory）
webMonitorEndpoint = restEndpointFactory.createRestEndpoint(
            configuration, 
            dispatcherGatewayRetriever,
            resourceManagerGatewayRetriever,
            blobServer, 
            executor, 
            metricFetcher,
  			highAvailabilityServices.getClusterRestEndpointLeaderElectionService(),
            fatalErrorHandler);
                
// 启动 WebMonitorEndpoint
webMonitorEndpoint.start();
	//注释： 路由器
	final Router router = new Router();	
	
	//1、初始化一堆Handler
	handlers = initializerHandlers(restAddressFuture);
		//初始化一些通用的Handler (80-100多个)
		super.initializerHandlers(localAddressFuture)
		//初始化JobsubmitHandler
		JobSubmitHandler jobSubmitHandler = new JobSubmitHandler(leaderRetriever, timeout, responseHeaders, executor, clusterConfiguration);
			//处理client提交的restful提交作业请求
			handlerRequest(...)
				final JobSubmitRequestBody requestBody = request.getRequestBody();
				//注释： 恢复得到 JobGraph
				CompletableFuture jobGraphFuture = loadJobGraph(requestBody, nameToFile);
				//处理 jar
				Collection jarFiles = getJarFilesToUpload(requestBody.jarFileNames, nameToFile);
				Collection> artifacts = getArtifactFilesToUpload(requestBody.artifactFileNames,nameToFile);
				CompletableFuture finalizedJobGraphFuture = uploadJobGraphFiles(gateway,
        			jobGraphFuture,
        			jarFiles,
        			artifacts,
       			 	configuration);
       			//转交给 Dispatcher
       			CompletableFuture jobSubmissionFuture = finalizedJobGraphFuture.thenCompose(jobGraph -> gateway.submitJob(jobGraph, timeout));
       			return jobSubmissionFuture.thenCombine(jobGraphFuture,(ack, jobGraph) -> new JobSubmitResponseBody("/jobs/" + jobGraph.getJobID()));
       			
	//排序,字典序,用于确认唯一性时只需要对比相邻的url即可 (handle地址排序)
	Collection.sort(handlers, RestHandlerUrlComparator.INSTANCE)
	//确认handler唯一性,url和handler一一对应
	checkAllEndpointsAndHandlersAreUnique(handlers)
	//注册handler（注册到了router，在router中管理了很多handle，通过它解析client rest请求，转发到对应的handler处理）
	handlers.forEach(handler -> registerHandler(router,handler,log))
		//根据 URL 来注册：hashMap
		//方便到时候接收到用户请求根据 URL 来找到对应的 Handler
		//拼接得到 URL
		final String versionedHandlerURL = '/' + supportedVersion.getURLVersionPrefix() + handlerURL;
		//完成注册
		registerHandler(router, versionedHandlerURL, specificationHandler.f0.getHttpMethod(), specificationHandler.f1);
			//对应不同类的 Http 请求方式，来注册不同类型的 Handler
			switch(httpMethod) {
            case GET:
                router.addGet(handlerURL, handler);
                break;
            case POST:
                router.addPost(handlerURL, handler);
                break;
            case DELETE:
                router.addDelete(handlerURL, handler);
                break;
            case PATCH:
                router.addPatch(handlerURL, handler);
                break;
            default:
                throw new RuntimeException("Unsupported http method: " + httpMethod + '.');
        	}
        	
	
	//2、启动Netty Server,绑定端口号的时候通过轮休的方式,并将绑定端口号等信息都会持久化到ZK中
	NioEventLoopGroup bossGroup = new NioEventLoopGroup(1, new ExecutorThreadFactory("flink-rest-server-netty-boss"));
	NioEventLoopGroup workerGroup = new NioEventLoopGroup(0, new ExecutorThreadFactory("flink-rest-server-netty-worker"));
	bootstrap = new ServerBootstrap();
	bootstrap.group(bossGroup, workerGroup).channel(NioServerSocketChannel.class).childHandler(initializer);
		//channel pipeline
		ChannelInitializer initializer = new ChannelInitializer() {
			@Override
			protected void initChannel(SocketChannel ch) {
				RouterHandler handler = new RouterHandler(router, responseHeaders);
				// SSL should be the first handler in the pipeline
				if(isHttpsEnabled()) {
					ch.pipeline().addLast("ssl", new RedirectingSslHandler(restAddress, restAddressFuture, sslHandlerFactory));
				}
				ch.pipeline()
						.addLast(new HttpServerCodec())
						.addLast(new FileUploadHandler(uploadDir))
						.addLast(new FlinkHttpObjectAggregator(maxContentLength, responseHeaders))
						.addLast(new ChunkedWriteHandler())
						.addLast(handler.getName(), handler)
						.addLast(new PipelineErrorHandler(log, responseHeaders));
			}
		};
	/**
	*  bootstrao端口号（chosenPort）选择：
	*  可能这个端口号被占用了： 通过一个范围轮询的机制，找一个未占用的
	*  while(true){
	*      try{
	*          正经业务代码
	*          break;
	*      }catch(){
	*          异常处理
	*      }
	*  }
	*/
	channel = bootstrap.bind(restBindAddress, chosenPort);
	
	//3、启动一些基础服务
	//到此为止，我们的 主节点上的 WebMonitorEndpoint 组件的 Netty 服务端起好了。
	//任务提交的时候： 启动 Netty 的客户端
	startInternal();
		//执行选举,通过curator api向zk注册。
        //将sessionid，port，url持久化到zk中
		leaderElectionService.start(this)
		
		/*************************************************
 		*  注释： 启动 WebMonitorEndpoint
 		*  这个启动和 Flink-1.11 版本有个不同，把选举的代码做了一层封装，核心逻辑并没有改动
 		*  把选举的代码封装在： ZooKeeperLeaderElectionDriver
 		*
 		*  如果成功：则回调 leaderElectionService 的 isLeader() 方法
 		*		// TODO 注释： isLeader() 的方法的内部回调： LeaderContender 的 grantLeaderShip()
		*  如果失败：则回调 leaderElectionService 的 notLeader() 方法
 		*/
		leaderElectionService.start(this);
			//DefaultLeaderElectionService.start(LeaderContender contender)
			// LeaderContender = DispatcherRestEndpoint
			leaderContender = contender;
			//当前这个 leaderElectionDriver 就是负责给 leaderContender 执行选举的
			//如果选举成功，则回调： leaderElectionDriver 的 isLeader 方法
			leaderElectionDriver = leaderElectionDriverFactory.createLeaderElectionDriver(this, new LeaderElectionFatalErrorHandler(), leaderContender.getDescription());
				//ZooKeeperLeaderElectionDriver.createLeaderElectionDriver(...)
				//通过 Curator 的 LeaderLatch 来执行选举
				new ZooKeeperLeaderElectionDriver(client, latchPath, leaderPath, leaderEventHandler, fatalErrorHandler, leaderContenderDescription);
					//leaderLatch是curator框架中选举的实现
					LeaderLatch leaderLatch = new LeaderLatch(client, checkNotNull(latchPath));
					//Cache 是 Curator 对事件监听的包装，会自动的再次监听
					NodeCache cache = new NodeCache(client, leaderPath);
					//进行选举
					//leaderContender 就是当前的 ZooKeeperLeaderElectionDriver
					//所以选举后 调用的就是它本身的 isLeader()/notLeader()方法
					leaderLatch.addListener(this);
        			leaderLatch.start();
        			
					/*************************************************
					*  注释： 选举开始之后，会在不久接收到响应：
					*  1、如果选举成功，则回调该类的 isLeader() 方法。
					*  2、如果选举失败，则回调该类的 notLeader() 方法。
					*/
			
					/*************************************************
					*  注释： Cache 是 Curator 对事件监听的包装，会自动的再次监听，我们就不需要自己手动的重复监听了。
					*  补充： ZooKeeper 的 Cache 有三种：
					*  NodeCache：用来监听节点的数据变化，当监听的节点的数据发生变化的时候就会回调对应的函数
					*  PathChildrenCache：用来监听指定节点 的子节点变化情况
					*  TreeCache：TreeCache既能够监听自身节点的变化、也能够监听子节点的变化
					*/
					cache.getListenable().addListener(this);
					cache.start();
					client.getConnectionStateListenable().addListener(listener);
					
					//竞选成功
					isLeader()
						leaderElectionEventHandler.onGrantLeadership();
							/*************************************************
							*  注释： 特别注意： LeaderContender 有四种情况：
							*  1、Dispatcher = DefaultDispatcherRunner
							*  2、JobMaster = JobManagerRunnerImpl
							*  3、ResourceManager = ResourceManager
							*  4、WebMonitorEndpint = WebMonitorEndpoint
							*/
							//当前leaderContender为WebMonitorEndpint
							leaderContender.grantLeadership(issuedLeaderSessionID);
								leaderElectionService.confirmLeadership(leaderSessionID, getRestBaseUrl());
									confirmLeaderInformation(leaderSessionID, leaderAddress);
										leaderElectionDriver.writeLeaderInformation(
											LeaderInformation.known(confirmedLeaderSessionID, confirmedLeaderAddress));
												// TODO 注释： 检查 znode 节点是否存在
												Stat stat = client.checkExists().forPath(leaderPath);
												//当前的sessionid = zk中记录的sessionid
												if(owner == sessionID) {
													//写入 zk 中(记录的是leaderAddress和leaderSessionID)
													client.setData().forPath(leaderPath, baos.toByteArray());
														//final ByteArrayOutputStream baos = new ByteArrayOutputStream();
														//final ObjectOutputStream oos = new ObjectOutputStream(baos);
														//oos.writeUTF(leaderInformation.getLeaderAddress());
														//oos.writeObject(leaderInformation.getLeaderSessionID());
												}
														
					//竞选失败
					notLeader()
						leaderElectionEventHandler.onRevokeLeadership();
		
		startExecutionGraphCacheCleanupTask();

核心流程：

1. 初始化一大堆 Handler

2. 启动一个 Netty 的服务端，注册这些 Handler（80-100个）

3. 当client通过flink命令提交了某些操作（发起restful请求），服务端通过webMoniterEndPoint来处理

   例如：用户通过flink run提交一个Job，那么最后有WebMoniterEndpoint中的JobSubmitHandler来执行处理，处理完成后转交给Dispatcher去调度执行，然后启动JobMaster去调度执行

4. WebMoniterEndpoint **implements** LeaderContender

       LeaderContender是一个竞选角色

       执行竞选leaderElectionService.start(LeaderContender)

（1）如果成功：则回调leaderElectionService 的 isLeader()方法

               isLeader()的方法的内部回调：LeaderContender的grantLeaderShip()，将 WebMontiroEndpoint 的 address 以及跟 zookeeper 的 sessionID 写入到 znode 中

（2）如果失败：则回调leaderElectionService 的 notLeader()方法

2、ResourceManager 启动和初始化源码剖析

核心入口：

/*************************************************
 *  注释：
 *  其实三个要点：
 *  1、ResourceManager 是一个 RpcEndpoint，当构建好了这个对象之后，去看它的 onStart() 即可
 *  2、ResourceManager 也是一个 LeaderContender，也会执行竞选，竞选处理
 *  3、启动 ResourceManager Service
 *      两个心跳服务
 *          从节点 和 主节点之间的心跳
 *          Job的主控程序 和 主节点之间的心跳
 *      两个定时服务
 *          TaskManager 的超时检查服务
 *          Slot申请的 超时检查服务
 */
resourceManager = resourceManagerFactory
        .createResourceManager(configuration, ResourceID.generate(), rpcService, highAvailabilityServices, heartbeatServices, fatalErrorHandler,new ClusterInformation(hostname, blobServer.getPort()), webMonitorEndpoint.getRestBaseUrl(), metricRegistry, hostname, ioExecutor);

//内部没做什么重要的事情
resourceManager.start();
	//自己给自己发送消息，表示rpcEndpint已经启动好了
	rpcEndpoint.tell(ControlMessages.START, ActorRef.noSender());

第二件事：

// 初始化 ResourceManager
resourceManager = resourceManagerFactory.createResourceManager(
            configuration,
            ResourceID.generate(),
            rpcService, 
            highAvailabilityServices, 
            heartbeatServices,
            fatalErrorHandler,
            new ClusterInformation(hostname,blobServer.getPort()),
            webMonitorEndpoint.getRestBaseUrl(),
            metricRegistry,
            hostname
         );

	//构建ResourceManagerRuntimeServices,初始化了很多配置
	ResourceManagerRuntimeServices resourceManagerRuntimeServices = createResourceManagerRuntimeServices(conf,highAvailabilityServices,slotManagerMetricGroup);
		ResourceManagerRuntimeServices.fromConfiguration(createResourceManagerRuntimeServicesConfiguration(configuration), highAvailabilityServices,rpcService.getScheduledExecutor(), slotManagerMetricGroup);
			// createResourceManagerRuntimeServicesConfiguration(configuration)
			//Job提交超时: 5min(job提交了5min还没有被处理，则该job任务就是超时了)
			String strJobTimeout = configuration.getString(ResourceManagerOptions.JOB_TIMEOUT);
			//SlotManager相关配置
			SlotManagerConfiguration slotManagerConfiguration = SlotManagerConfiguration.fromConfiguration(..)
				//slot申请超时时间： 5*60*1000ms
				final Time slotRequestTimeout = getSlotRequestTimeout(configuration);
				//TaskManager超时时间：30s,用于yarn session模式
				final Time taskManagerTimeout = Time.milliseconds(configuration.getLong(ResourceManagerOptions.TASK_MANAGER_TIMEOUT));
				// 每个节点的 slot 个数： 默认是 1， 可配置
				int numSlotsPerWorker = configuration.getInteger(TaskManagerOptions.NUM_TASK_SLOTS);
				//  每个节点最大的 slot 个数： Integer.MAX_VALUE
				int maxSlotNum = configuration.getInteger(ResourceManagerOptions.MAX_SLOT_NUM);
				// 多余的 TaskManager 个数： 默认是 0
				int redundantTaskManagerNum = configuration.getInteger(ResourceManagerOptions.REDUNDANT_TASK_MANAGER_NUM);
				return new SlotManagerConfiguration(rpcTimeout, slotRequestTimeout, taskManagerTimeout,waitResultConsumedBeforeRelease, slotMatchingStrategy,defaultWorkerResourceSpec, numSlotsPerWorker, maxSlotNum, redundantTaskManagerNum);

			
	//创建ResourceManager
	return createResourceManager(...)
		/*************************************************
 		*  注释： ResourceManager 启动时间： 从启动到 有 TaskManager 汇报这段时间
 		*  可以通过： resourcemanager.standalone.start-up-time 进行设置
 		*  如果没有设置，则默认等于 Slot 申请的超时时间
 		*/
		final Time standaloneClusterStartupPeriodTime = ConfigurationUtils.getStandaloneClusterStartupPeriodTime(configuration);
		
		new StandaloneResourceManager(...)
			/*************************************************
         	*  注释： 记住：由于 ResourceManager 是一个 RpcEndpoint
         	*  所以在构造好了 ResourceManager 实例对象之后，需要执行 onStart() 方法
         	*/
        	super(rpcService, AkkaRpcServiceUtils.createRandomName(RESOURCE_MANAGER_NAME), null);
			//ResourceManager是一个RpcEndpoint，构建好了之后需要执行onStart()
			//执行 onStart() 方法
			startResourceManagerServices();
			  //获取DefaultLeaderElectionServices,基于ZK
			  leaderElectionServices = highAvailabilityServices.getResourceManagerLeaderElectionServices()
			  //初始化(standalone 模式下该方法为空)
			  initialize();
			  //执行竞选（当前竞选角色为：ResourceManager，leaderElectionService为：DefaultLeaderElectionService）
			  leaderElectionService.start(this)
				//通过Curator的LeaderLatch来执行选举
				new ZookeeperLeaderElectionDriver(..)
					//进行选举
					leaderLatch.start() 
						//选举成功
						isLeader()
							//当前的leaderContender为ResourceManager
							leaderContender.grantLeadership(issuedLeaderSessionID)
								//回调
								tryAcceptLeaderShip(newLeaderSessionID)
									/*************************************************
 									*  注释： 启动服务
 									*  1、启动心跳服务
 									*  	启动两个心跳定时服务
									*  2、启动 SlotManager 服务
 									*  	启动两个定时任务
 									*/
									startServicesOnLeaderShip();
										//1、启动心跳服务：启动两个心跳定时服务
										startHeartbeatServies();
											//heartbeatServices是开始初始的八个基础服务中的心跳服务
											//ResourceManager 维持和 TaskExecutor 之间的心跳
											taskManagerHeartbeatManager = heartbeatServices.createHeartManagerSender(resourId,new TaskManagerHeartbeatListener(),getMainThreadExecutor());
											  new HeartbeatManagerSenderImpl<>(heartbeatInterval, heartbeatTimeout, resourceId, heartbeatListener, mainThreadExecutor, log);
												//延时调度
												//调用this的run()方法，立即执行一次
												mainThreadExecutor.schedule(this, 0L, TimeUnit.MILLISECONDS);	
												//run()方法：心跳服务
												//HeartbeatMonitor
												//HeartbeatTartget
												requestHeartbeat(heartbeatMointor)
												//这句代码就实现心跳 的无限循环，每10s执行一次！一直执行上面的requestHeartbeat(...)方法
												getMainThreadExecutor().schedule(this, heartbeatPeriod, TimeUnit.MILLISECONDS);
												
											//ResourceManager 维持和 JobMaster 之间的心跳
											jobManagerHeartbeatManager = heartbeatServices.createHeartManagerSender(resourId,new JobManagerHeartbeatListener(),getMainThreadExecutor());
											
										//2、启动SlotManager服务：启动两个定时服务
										//SlotManager是存在于ResourceManager中用于管理所有TaskManager汇报和注册Slot工作的
										slotManager.start(getFencingToken(), getMainThreadExecutor(), new ResourceActionsImpl());
											//checkTaskManagerTimeoutsAndRedundancy() 30s执行一次,检查空闲的taskmanager
											taskManagerTimeoutsAndRedundancyCheck = scheduledExecutor.scheduleWithFixedDelay(() -> mainThreadExecutor.execute(() -> checkTaskManagerTimeoutsAndRedundancy()), 0L,taskManagerTimeout.toMilliseconds(),TimeUnit.MILLISECONDS);
											//checkSlotRequestTimeouts() 5min执行一次
											//SlotRequest -> 处于申请中，则这个slotRequest -> PendingRequest
											//检查PendingRequest超时时间
											 slotRequestTimeoutCheck = scheduledExecutor.scheduleWithFixedDelay(() -> mainThreadExecutor.execute(() -> checkSlotRequestTimeouts()), 0L, slotRequestTimeout.toMilliseconds(),TimeUnit.MILLISECONDS);
											 	//获取所有的 处于待定状态中的 SlotRequest
											 	Iterator> slotRequestIterator = pendingSlotRequests.entrySet().iterator();
											 	//执行超时校验
											 	if(currentTime - slotRequest.getCreationTimestamp() >= slotRequestTimeout.toMilliseconds()) {			  //移除对该slot的请求
											 		slotRequestIterator.remove();
											 		//Assigned
											 		//ResourceManager 已经分配某个 TaskManager 上的某个 Slot 给了某个 Job
											 		//但是，到现在为止： TaskManager 还不知道！
											 		//所以需要取消该slot请求
											 		if(slotRequest.isAssigned()) {
											 			cancelPendingSlotRequest(slotRequest);
											 		}
											 		//通知失败！
											 		resourceActions.notifyAllocationFailure(slotRequest.getJobId(), slotRequest.getAllocationId(),new TimeoutException("The allocation could not be fulfilled in time."));
											 	}
											 	
										//开启 启动期
										OnleaderShip();
											//开启 启动期
											//jobManager启动好了之后，如果过了一段时间，还是没有任何的TaskManager从节点注册
											//当JobManager启动好了，到第一个TaskManager过来注册的时间，如果超过这段时间，则启动失败
											startStartUpPeriod()
												//将不能满足的请求置为失败
												//例如：当有些请求slot，但是没有任何的从节点过来注册，没有slot资源，将该请求置为失败
												setFailUnfulfillableRequest(false);
												//启动定时任务
												final long startupPeriodMillis = startupPeriodTime.toMilliseconds();
												if(startupPeriodMillis > 0) {
													scheduleRunAsync(() -> setFailUnfulfillableRequest(true), startupPeriodMillis, TimeUnit.MILLISECONDS);
												}
										
										
						//选举失败，删除zk中本节点session相关信息
						notLeader()
									
 
// 启动 ResourceManager
resourceManager.start();
	//自己给自己发送消息，表示rpcEndpint已经启动好了
	rpcEndpoint.tell(ControlMessage.START, ActorRef.noSender());

总结：

1、它是 RpcEndpoint 的子类，关注 onStart()
2、它是 LeaderContender 的子类，所以要关注：选举
3、启动 ResourceManagerService:
（1）两个心跳服务
        从节点和主节点之间的心跳
                Job的主控程序和主节点之间的心跳
（2）两个定时服务
                TaskManager的超时检查服务
                Slot申请的超时检查服务

3、Dispatcher 启动和初始化源码剖

第三件事：

/*************************************************
 *  注释：
 *  1、在该代码的内部，会创建 Dispatcher 组件
 *  2、调用 start() 启动
 */
dispatcherRunner = dispatcherRunnerFactory.createDispatcherRunner(
          
	highAvailabilityServices.getDispatcherLeaderElectionService(),
	fatalErrorHandler,
    // TODO 注释： 注意第三个参数
    new HaServicesJobGraphStoreFactory(highAvailabilityServices),
    ioExecutor,
    rpcService,
    partialDispatcherServices);
dispatchper = createDispatcher();
dispatchper.start();

	return DefaultDispatcherRunner.create(leaderElectionService, fatalErrorHandler, dispatcherLeaderProcessFactory);
		//DefaultDispatcherRunner是dispatcherRunner的具体实现
		final DefaultDispatcherRunner dispatcherRunner = new DefaultDispatcherRunner(leaderElectionService, fatalErrorHandler, dispatcherLeaderProcessFactory);
		return DispatcherRunnerLeaderElectionLifecycleManager.createFor(dispatcherRunner, leaderElectionService);
			//执行竞选
			//注意这个 LeaderContender = DefaultDispatcherRunner
			leaderContender = contender;
			//当前这个 leaderElectionDriver 就是负责给 leaderContender 执行选举的
			//如果选举成功，则回调： leaderElectionDriver 的 isLeader 方法
    		leaderElectionDriver = leaderElectionDriverFactory.createLeaderElectionDriver(this, new LeaderElectionFatalErrorHandler(), leaderContender.getDescription());
    			//通过 Curator 的 LeaderLatch 来执行选举
    			return new ZooKeeperLeaderElectionDriver(client, latchPath, leaderPath, leaderEventHandler, fatalErrorHandler, leaderContenderDescription);
    				LeaderLatch leaderLatch = new LeaderLatch(client, checkNotNull(latchPath));
        			NodeCache cache = new NodeCache(client, leaderPath);
    				//进行选举
    				leaderLatch.addListener(this);
					leaderLatch.start();
					/*************************************************
 					 *  注释： 选举开始之后，会在不久接收到响应：
 					 *  1、如果选举成功，则回调该类的 isLeader() 方法。
 					 *  2、如果选举失败，则回调该类的 notLeader() 方法。
 					 */
 					/*************************************************
					*  注释： Cache 是 Curator 对事件监听的包装，会自动的再次监听，我们就不需要自己手动的重复监听了。
					*  补充： ZooKeeper 的 Cache 有三种：
					*  NodeCache：用来监听节点的数据变化，当监听的节点的数据发生变化的时候就会回调对应的函数
					*  PathChildrenCache：用来监听指定节点 的子节点变化情况
					*  TreeCache：TreeCache既能够监听自身节点的变化、也能够监听子节点的变化
					*/
					cache.getListenable().addListener(this);
					cache.start();
					client.getConnectionStateListenable().addListener(listener);
					
					
					//1、如果选举成功，则回调该类的 isLeader() 方法。
					leaderElectionEventHandler.onGrantLeadership();
						//当前的leaderContender为：DefaultDispatcherRunner
						leaderContender.grantLeadership(issuedLeaderSessionID);
							runActionIfRunning(() -> startNewDispatcherLeaderProcess(leaderSessionID));
								//关闭已有的dispatcher
								stopDispatcherLeaderProcess();
								//创建新的dispatcher： SessionDispatcherLeaderProcess
								dispatcherLeaderProcess = createNewDispatcherLeaderProcess(leaderSessionID);
								//启动 Dispatcher
								FutureUtils.assertNoException(
								previousDispatcherLeaderProcessTerminationFuture.thenRun(newDispatcherLeaderProcess::start));
									runIfStateIs(State.CREATED, this::startInternal);
										onStart();
										
											//启动 Dispatcher 的服务
											startServices();
												jobGraphStore.start(this);
													//DefaultJobGraphStore.start(JobGraphListener jobGraphListener)
													//启动监听,基于ZooKeeperJobGraphStoreWatcher
													jobGraphStoreWatcher.start(this);
													running = true;
													//存在两个回调函数：
													//1、onAddedJobGraph(JobID jobId)
													jobGraphListener.onAddedJobGraph(jobId);
													//2、onRemovedJobGraph(JobID jobId)
													jobGraphListener.onRemovedJobGraph(jobId);
													
											//1、recoverJobsAsync(): 恢复 job， 从 JobGraphStore 中恢复得到所有的 JobGraph
											//2、createDispatcherIfRunning(): 启动
											onGoingRecoveryOperation = recoverJobsAsync().thenAccept(
												this::createDispatcherIfRunning).handle(this::onErrorIfRunning);
												
												//1、recoverJobsAsync()
												CompletableFuture.supplyAsync(this::recoverJobsIfRunning, ioExecutor);
												//恢复 job
												CompletableFuture.supplyAsync(this::recoverJobsIfRunning, ioExecutor);
													Collection recoveredJobGraphs = new ArrayList<>();
													for(JobID jobId : jobIds) {
    													recoveredJobGraphs.add(recoverJob(jobId));
													}
														//recoverJob(jobId)
														//jobGraphStore = DefaultJobGraphStore
														jobGraphStore.recoverJobGraph(jobId);
														
												//2、createDispatcherIfRunning()
												runIfStateIs(State.RUNNING, () -> createDispatcher(jobGraphs));
													final DispatcherGatewayService dispatcherService = dispatcherGatewayServiceFactory.create(DispatcherId.fromUuid(getLeaderSessionId()), jobGraphs, jobGraphStore);
														//DefaultDispatcherGatewayServiceFactory.create(...)
														dispatcher = dispatcherFactory.createDispatcher(
															rpcService, 
															fencingToken, 
															recoveredJobs,
															(dispatcherGateway, scheduledExecutor, errorHandler) 
																-> new NoOpDispatcherBootstrap(),
                    										PartialDispatcherServicesWithJobGraphStore
                    											.from(partialDispatcherServices, jobGraphWriter));
                    											new StandaloneDispatcher(...)
                    												//执行完毕，去到Dispatcher.onStart() 方法
                    												//1、只是启动了一个 性能监控服务
                    												startDispatcherServices();
                    												//2、恢复job
                    												startRecoveredJobs();
                    													for(JobGraph recoveredJob : recoveredJobs) {
    																		runRecoveredJob(recoveredJob);
    																			//job运行模式是：RECOVERY
    																			runJob(recoveredJob, ExecutionType.RECOVERY);
    																				//flink client 提交一个 job 之前， 会去启动一个 JobMaster，会去调用这个 runJob
																		}
																		recoveredJobs.clear();
																	//3、什么也没做
																	this.dispatcherBootstrap = this.dispatcherBootstrapFactory.create(getSelfGateway(DispatcherGateway.class), this.getRpcService().getScheduledExecutor(), this::onFatalError);
                    											
                    										//Dispatcher 也是一个 RpcEndpoint 
                    										//启动起来了之后,给自己发送一个 Hello 消息证明启动
                    										dispatcher.start();
                    											rpcEndpoint.tell(ControlMessages.START, ActorRef.noSender());
                                                            
												completeDispatcherSetup(dispatcherService);
					 
					2、如果选举失败，则回调该类的 notLeader() 方法。
					//删除zk信息

总结：

1、启动JobGraphStore 服务
   通过JobGraphStoreWatcher监控器，监听JobGraphStore的状态
       onAddedJobGraph
       onRemoveJobGraph
2、从 JobGraphStrore 恢复执行 Job, 要启动 Dispatcher
   recoverJobsAsync() 恢复Job，从JobGraphStore中得到所有待恢复的JonGraph
   createDispatcherIfRunniong() 启动dispathcer

四、总结

主要讲解了主节点 JobManager 的启动，在启动过程中，会有各种服务组件的初始化工作

1、Flink RPC 剖析
2、Flink 集群启动脚本分析
3、Flink 集群启动 JobManager 启动源码剖析
        4、WebMonitorEndpoint 启动和初始化源码剖析
         5、ResourceManager 启动和初始化源码剖析
         6、Dispatcher 启动和初始化源码剖

Flink Standalone 集群的主节点 JobManager 的内部包含非常重要的三大组件，在启动过过程中，会依次启动，这三大组件分别是：

1、WebMonitorEndpoint
2、ResourceManager
3、Dispatcher

你可能感兴趣的:(flink,zookeeper,大数据)

k8s:安装 Helm 私有仓库ChartMuseum、helm-push插件并上传、安装Zookeeper 云游 docker helm helm-push
ChartMuseum是Kubernetes生态中用于存储、管理和发布HelmCharts的开源系统，主要用于扩展Helm包管理器的功能核心功能‌集中存储‌：提供中央化仓库存储Charts，支持版本管理和权限控制。‌‌跨集群部署‌：支持多集群环境下共享Charts，简化部署流程。‌‌离线部署‌：适配无网络环境，可将Charts存储在本地或局域网内。‌‌HTTP接口‌：通过HTTP协议提供服务，用户
数字孪生技术为UI前端注入新活力：实现产品设计的沉浸式体验 ui设计前端开发老司机 ui
hello宝子们...我们是艾斯视觉擅长ui设计、前端开发、数字孪生、大数据、三维建模、三维动画10年+经验!希望我的分享能帮助到您!如需帮助可以评论关注私信我们一起探讨!致敬感谢感恩!一、引言：从“平面交互”到“沉浸体验”的UI革命当用户在电商APP中翻看3D家具模型却无法感知其与自家客厅的匹配度，当设计师在2D屏幕上绘制汽车内饰却难以预判实际乘坐体验——传统UI设计的“平面化、静态化、割裂感”
[特殊字符] 实时数据洪流突围战：Flink+Paimon实现毫秒级分析的架构革命（附压测报告）——日均百亿级数据处理成本降低60%的工业级方案 Lucas55555555 flink 大数据
引言：流批一体的时代拐点据阿里云2025白皮书显示，实时数据处理需求年增速达240%，但传统Lambda架构资源消耗占比超运维成本的70%。某电商平台借助Flink+Paimon重构实时数仓后，端到端延迟从分钟级压缩至800ms，计算资源节省5.6万核/月。技术红利窗口期：2025年ApachePaimon1.0正式发布，支持秒级快照与湖仓一体，成为替代Iceberg的新范式一、痛点深挖：实时数仓
提升企业级数据处理效率！TDengine 四个集群优化点详解 TDengine （老段） TDengine 运维大数据数据库物联网时序数据库服务器运维 tdengine
为了帮助企业更好地进行大数据处理，我们在此前TDengine3.x系列版本中进行了几项与集群相关的优化和新功能开发，以提升集群的稳定性和在异常情况下的恢复能力。这些优化包括clusterID隔离、leaderrebalance、raftlearner和restorednode。本文将对这几项重要优化进行详细阐述，以解答企业在此领域的疑问，并帮助大家更好地应对相关挑战。clusterID隔离问题fi
ZooKeeper架构及应用场景详解走过冬季学习笔记 zookeeper 架构分布式
ZooKeeper是一个开源的分布式协调服务，由Apache软件基金会维护。它旨在为分布式应用提供高性能、高可用、强一致性的基础服务，解决分布式系统中常见的协调难题（如配置管理、命名服务、分布式锁、服务发现、领导者选举等）。核心软件架构ZooKeeper的架构设计围绕其核心目标（协调）而优化，主要包含以下关键组件：集群模式(Ensemble):ZooKeeper通常部署为集群（称为ensemble
zookeeper etcd区别 sun007700 zookeeper etcd 分布式
ZooKeeper与etcd的核心区别体现在设计理念、数据模型、一致性协议及适用场景等方面。‌ZooKeeper基于ZAB协议实现分布式协调，采用树形数据结构和临时节点特性，适合传统分布式系统；而etcd基于Raft协议，以高性能键值对存储为核心，专为云原生场景优化，是Kubernetes等容器编排系统的默认存储组件。‌‌1‌‌2‌架构与设计目标差异‌‌ZooKeeper‌。‌设计定位‌:专注于分
中国银联豪掷1亿采购海光C86架构服务器信创新态势海光芯片 C86 国产芯片海光信息
近日，中国银联国产服务器采购大单正式敲定，基于海光C86架构的服务器产品中标，项目金额超过1亿元。接下来，C86服务器将用于支撑中国银联的虚拟化、大数据、人工智能、研发测试等技术场景，进一步提升其业务处理能力、用户服务效率和信息安全水平。作为我国重要的银行卡组织和金融基础设施，中国银联在全球183个国家和地区设有银联受理网络，境内外成员机构超过2600家，是世界三大银行卡品牌之一。此次中国银联发力
全面探索Kafka：架构、应用与流处理
Kafka：企业级消息系统与流处理平台的深度解析ApacheKafka作为分布式流处理平台，广泛应用于大数据处理和实时分析领域。本文将基于其官方文档，详细探讨Kafka的核心功能、应用场景以及如何进行有效管理。背景简介Kafka作为高吞吐量的消息系统，支持企业级的发布-订阅模式。它能够处理大量实时数据，并支持高并发读写操作。本文将依据Kafka官方文档的内容，逐层深入，从入门到高级应用，帮助读者全
Flink 2.0 DataStream算子全景 Edingbrugh.南空大数据 flink flink 人工智能
在实时流处理中，ApacheFlink的DataStreamAPI算子是构建流处理pipeline的基础单元。本文基于Flink2.0，聚焦算子的核心概念、分类及高级特性。一、算子核心概念：流处理的"原子操作1.数据流拓扑（StreamTopology）每个Flink应用可抽象为有向无环图（DAG），由源节点（Source）、算子节点（Operator）和汇节点（Sink）构成，算子通过数据流（S
FlinkSQL 自定义函数详解 Tit先生基础 flink sql 大数据 java
FlinkSQL函数详解自定义函数除了内置函数之外，FlinkSQL还支持自定义函数，我们可以通过自定义函数来扩展函数的使用FlinkSQL当中自定义函数主要分为四大类:1.ScalarFunction:标量函数特点:每次只接收一行的数据，输出结果也是1行1列典型的标量函数如:upper(str),lower(str),abs(salary)2.TableFunction:表生成函数特点:运行时每
Flink自定义函数之聚合函数（UDAGG函数）土豆马铃薯 Flink flink 大数据
1.聚合函数概念聚合函数：将一个表的一个或多个行并且具有一个或多个属性聚合为标量值。聚合函数理解：假设一个关于饮料的表。表里面有三个字段，分别是id、name、price，表里有5行数据。假设你需要找到所有饮料里最贵的饮料的价格，即执行一个max()聚合。你需要遍历所有5行数据，而结果就只有一个数值。2.聚合函数实现聚合函数主要通过扩展AggregateFunction类实现。AggregateF
Flink时间窗口详解 bxlj_jcj Flink flink 大数据
一、引言在大数据流处理的领域中，Flink的时间窗口是一项极为关键的技术，想象一下，你要统计一个电商网站每小时的订单数量。由于订单数据是持续不断产生的，这就形成了一个无界数据流。如果没有时间窗口的概念，你就需要处理无穷无尽的数据，难以进行有效的统计分析。而时间窗口的作用，就是将这无界的数据流按照时间维度切割成一个个有限的“数据块”，方便我们对这些数据进行处理和分析。比如，我们可以定义一个1小时的时
Flink DataStream API详解（一） bxlj_jcj Flink flink 大数据
一、引言Flink的DataStreamAPI，在流处理领域大显身手的核心武器。在很多实时数据处理场景中，如电商平台实时分析用户购物行为以实现精准推荐，金融领域实时监控交易数据以防范风险，DataStreamAPI都发挥着关键作用，能够对源源不断的数据流进行高效处理和分析。接下来，就让我们一起深入探索FlinkDataStreamAPI。二、DataStream编程基础搭建在开始使用FlinkDa
探索实时流处理的未来：Kafka Streams 深度指南秋或依
探索实时流处理的未来：KafkaStreams深度指南项目介绍欢迎进入KafkaStreams：实时流处理的世界！这不仅仅是一本书，更是一个通往流处理领域深层奥秘的门户。由PrashantPandey编著，这本书以ApacheKafka2.1中的KafkaStreams库为核心，为读者铺就了一条从理解基础概念到熟练掌握KafkaStreams编程的路径。无论是软件工程师、数据架构师，还是对大数据处
flink自定义函数逆风飞翔的小叔 flink 入门到精通 flink 大数据 big data
前言在很多情况下，尽管flink提供了丰富的转换算子API可供开发者对数据进行各自处理，比如map()，filter()等，但在实际使用的时候仍然不能满足所有的场景，这时候，就需要开发人员基于常用的转换算子的基础上，做一些自定义函数的处理1、来看一个常用的操作原始待读取的文件核心代码importorg.apache.flink.api.common.functions.FilterFunction
Flink自定义函数的常用方式飞Link Water flink java 大数据
一、实现Flink提供的接口//自定义函数classMyMapFunctionimplementsMapFunction{publicIntegermap(Stringvalue){returnInteger.parseInt(value
Elasticsearch搜索引擎存储：从原理到实践的全景解析 Python×CATIA工业智造搜索引擎 elasticsearch 大数据
引言在大数据时代，数据规模呈指数级增长，传统数据库的模糊查询、实时分析能力逐渐成为瓶颈。Elasticsearch（简称ES）凭借其分布式架构、实时搜索和灵活的数据分析能力，成为企业级搜索与存储的核心引擎。截至2025年，ES在全球日志分析、电商搜索、实时监控等场景的市场占有率超过60%。本文将从存储架构、核心技术、应用场景及优化策略四个维度，深入解析Elasticsearch的设计哲学与实践价值
Flink DataStream API详解（二）
一、引言咱两书接上回，上一篇文章主要介绍了DataStreamAPI一些基本的使用，主要是针对单数据流的场景下，但是在实际的流处理场景中，常常需要对多个数据流进行合并、拆分等操作，以满足复杂的业务需求。Flink的DataStreamAPI提供了一系列强大的多流转换算子，如union、connect和split等，下面我们来详细了解一下它们的功能和用法。二、多流转换2.1union算子union算
Apache Dubbo实战：JavaSDK使用秃了也弱了。 Dubbo apache dubbo
文章目录一、写在前面二、基于zookeeper：快速创建dubbo应用1、maven包（客户端+服务端）（注意spring版本）2、application.yml配置文件（客户端+服务端）3、定义公共接口4、启动类添加注解@EnableDubbo5、服务端6、客户端7、启动试试吧8、拓展：使用JavaConfig代替注解三、拓展配置1、注册中心2、版本与分组3、传递调用参数4、泛化调用5、泛化实现
【Kafka专栏 13】Kafka的消息确认机制：不是所有的“收到”都叫“确认”！
作者名称：夏之以寒作者简介：专注于Java和大数据领域，致力于探索技术的边界，分享前沿的实践和洞见文章专栏：夏之以寒-kafka专栏专栏介绍：本专栏旨在以浅显易懂的方式介绍Kafka的基本概念、核心组件和使用场景，一步步构建起消息队列和流处理的知识体系，无论是对分布式系统感兴趣，还是准备在大数据领域迈出第一步，本专栏都提供所需的一切资源、指导，以及相关面试题，立刻免费订阅，开启Kafka学习之旅！
C语言学生成绩管理系统<；自创>；(功能7有小错误,但可运行） han_xue_feng java
腾讯云加速企业和个人开发创新公开直播预告直播预告：07/18(周四)15:00-16:00随着人工智能与大模型的蓬勃发展，我们正步入一个由技微信实习第一天周五入职，早上早早来到了公司，发现好多人都没上班，到十点才陆陆续续有人来，办理完入职后，mentor中联夏令营遗憾没有入选不过hr的回复真的很好，辛苦啦#提前批简历挂麻了怎么办##机械制造投递记录#大数据开发的工作有点过于简单了吧sq大数据开发的
Python爬虫：从图片或扫描文档中提取文字数据的完整指南 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言数据挖掘 c++
1.引言随着大数据技术的不断进步，图像数据逐渐成为了许多行业中重要的数据源之一。图像中不仅包含了丰富的视觉信息，还可能蕴含着大量的文字数据。对于科研、企业、政府等多个领域而言，如何从图片或扫描文档中提取出有价值的文字信息是一个亟待解决的问题。在这一过程中，OCR（OpticalCharacterRecognition，光学字符识别）技术成为了解决这一问题的重要工具。在本文中，我们将探讨如何使用Py
【C语言经典面试题】memcpy函数有没有更高效的拷贝实现方法？架构师李肯嵌入式物联网开发进阶 c语言面试性能优化
【C语言经典面试题】memcpy函数有没有更高效的拷贝实现方法？我相信大部分初中级C程序员在面试的过程中，可能都被问过关于memcpy函数的问题，甚至需要手撕memcpy。本文从另一个角度带你领悟一下memcpy的面试题，你可以看看是否能接得住？文章目录1写在前面2源码实现2.1函数申明2.2简单的功能实现2.3满足大数据量拷贝的功能实现3源码测试4小小总结5更多分享1写在前面假如你遇到下面的面试
python基于Hadoop的NBA球员大数据分析与可视化系统
目录技术栈介绍具体实现截图系统设计研究方法：设计步骤设计流程核心代码部分展示研究方法详细视频演示试验方案论文大纲源码获取/详细视频演示技术栈介绍Django-SpringBoot-php-Node.js-flask本课题的研究方法和研究步骤基本合理，难度适中，本选题是学生所学专业知识的延续，符合学生专业发展方向，对于提高学生的基本知识和技能以及钻研能力有益。该学生能够在预定时间内完成该课题的设计。
大数据技术之集群数据迁移
dfs.namenode.rpc-address.nameservice1.namenode30hadoop104:8020dfs.namenode.rpc-address.nameservice1.namenode37hadoop106:8020dfs.namenode.http-address.nameservice1.namenode30hadoop104:9870dfs.namenode.
如何通过YashanDB优化企业大数据处理流程数据库
在当今数据驱动的商业环境中，企业面临着巨大的数据处理挑战。性能瓶颈、数据一致性问题和可扩展性需求使得大数据处理成为一项复杂任务。作为一种新兴的数据库管理系统，YashanDB以其独特的架构设计和强大的数据处理能力，在解决这些挑战方面提供了有效的手段。本文旨在探讨如何利用YashanDB优化大数据处理流程，为企业提供高效、可靠的解决方案。YashanDB的体系架构与部署形态YashanDB支持多种部
Pandas 学习教程 _pass_ Data-Alaysis pandas 信息可视化
目录定义基本操作一维数组操作二维数组操作数据选择过滤数据处理数据清洗数据转换数据分析排序分组聚合数据透视表高级操作合并数据时间序列处理自定义函数调用数据可视化集成数据导出和导入大数据分块处理定义全称：'paneldata'and'pythondataanalysis'Analy:Series(一维数据)、DataFrame(二维数据)主要应用：数据清洗：处理缺失数据、重复数据等数据转换：改变数据的
Kafka系列之：安装具有安全认证的kafka-2.8.2分布式集群快乐骑行^_^ 大数据 Kafka系列安全认证 kafka-2.8.2 分布式集群
Kafka系列之：安装具有安全认证的kafka-2.8.2分布式集群一、下载Zookeeper3.7.1和Kafka2.8.2二、解压Zookeeper3.7.1和Kafka2.8.2三、安装Zookeeper3.7.1详细步骤1.修改zookeeper配置文件2.创建zookeeper数据目录3.zookeeper创建myid4.设置zookeeper访问kafka认证5.拷贝zookeeper
【Kafka】Failed to send data to Kafka: Expiring 30 record(s) for xxx 732453 ms has passed since last 九师兄 kafka big data zookeeper
文章目录1.美图2.背景2.尝试方案13.尝试解决24.场景再现25.场景46.场景57.场景78.场景8M.拓展本文为博主九师兄（QQ:541711153欢迎来探讨技术）原创文章，未经允许博主不允许转载。1.美图问题与【Flink】Flink写入kafka报错FailedtosenddatatoKafka:Expiring4record(s)for20001mshaspassed重复了。2.背景
【Flink】flink Kafka报错 : Failed to send data to Kafka: This server is not the leader for that topic-pa 九师兄 flink kafka 大数据
1.背景出现这个问题的背景请参考：【Kafka】FailedtosenddatatoKafka:Expiring30record(s)forxxx732453mshaspassedsincelast[2020-09-0513:16:09
Java序列化进阶篇 g21121 java序列化
1.transient 类一旦实现了Serializable 接口即被声明为可序列化，然而某些情况下并不是所有的属性都需要序列化，想要人为的去阻止这些属性被序列化，就需要用到transient 关键字。
escape()、encodeURI()、encodeURIComponent()区别详解 aigo JavaScript Web
原文：http://blog.sina.com.cn/s/blog_4586764e0101khi0.html JavaScript中有三个可以对字符串编码的函数，分别是： escape,encodeURI,encodeURIComponent，相应3个解码函数：,decodeURI,decodeURIComponent 。下面简单介绍一下它们的区别 1 escape()函
ArcgisEngine实现对地图的放大、缩小和平移 Cb123456 添加矢量数据对地图的放大、缩小和平移 Engine
ArcgisEngine实现对地图的放大、缩小和平移: 个人觉得是平移，不过网上的都是漫游，通俗的说就是把一个地图对象从一边拉到另一边而已。就看人说话吧. 具体实现: 一、引入命名空间 using ESRI.ArcGIS.Geometry; using ESRI.ArcGIS.Controls; 二、代码实现.
Java集合框架概述天子之骄 Java集合框架概述
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
旗正4.0页面跳转传值问题何必如此 java jsp
跳转和成功提示 a) 成功字段非空forward 成功字段非空forward，不会弹出成功字段，为jsp转发，页面能超链接传值,传输变量时需要拼接。接拼接方式list.jsp?test="+strweightUnit+"或list.jsp?test="+weightUnit+&qu
全网唯一:移动互联网服务器端开发课程 cocos2d-x小菜 web开发移动开发移动端开发移动互联程序员
移动互联网时代来了！ App市场爆发式增长为Web开发程序员带来新一轮机遇，近两年新增创业者，几乎全部选择了移动互联网项目！传统互联网企业中超过98%的门户网站已经或者正在从单一的网站入口转向PC、手机、Pad、智能电视等多端全平台兼容体系。据统计，AppStore中超过85%的App项目都选择了PHP作为后端程
Log4J通用配置|注意问题笔记 7454103 DAO apache tomcat log4j Web
关于日志的等级那些去百度就知道了！这几天要搭个新框架配置了日志记下来！做个备忘！ #这里定义能显示到的最低级别,若定义到INFO级别,则看不到DEBUG级别的信息了~! log4j.rootLogger=INFO,allLog # DAO层 log记录到dao.log 控制台和总日志文件 log4j.logger.DAO=INFO,dao,C
SQLServer TCP/IP 连接失败问题 ---SQL Server Configuration Manager darkranger sql c windows SQL Server XP
当你安装完之后,连接数据库的时候可能会发现你的TCP/IP 没有启动.. 发现需要启动客户端协议 : TCP/IP 需要打开 SQL Server Configuration Manager... 却发现无法打开 SQL Server Configuration Manager..?? 解决方法: C:\WINDOWS\system32目录搜索framedyn.
[置顶] 做有中国特色的程序员 aijuans 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有些技术书读得可
document.domain 跨域问题 avords document
document.domain用来得到当前网页的域名。比如在地址栏里输入：javascript:alert(document.domain); //www.315ta.com我们也可以给document.domain属性赋值，不过是有限制的，你只能赋成当前的域名或者基础域名。比如：javascript:alert(document.domain = "315ta.com");
关于管理软件的一些思考 houxinyou 管理
工作好多看年了,一直在做管理软件,不知道是我最开始做的时候产生了一些惯性的思维,还是现在接触的管理软件水平有所下降.换过好多年公司,越来越感觉现在的管理软件做的越来越乱. 在我看来,管理软件不论是以前的结构化编程,还是现在的面向对象编程,不管是CS模式,还是BS模式.模块的划分是很重要的.当然,模块的划分有很多种方式.我只是以我自己的划分方式来说一下. 做为管理软件,就像现在讲究MVC这
NoSQL数据库之Redis数据库管理(String类型和hash类型) bijian1013 redis 数据库 NoSQL
一.Redis的数据类型 1.String类型及操作 String是最简单的类型，一个key对应一个value，string类型是二进制安全的。Redis的string可以包含任何数据，比如jpg图片或者序列化的对象。 Set方法：设置key对应的值为string类型的value
Tomcat 一些技巧征客丶 java tomcat dos
以下操作都是在windows 环境下一、Tomcat 启动时配置 JAVA_HOME 在 tomcat 安装目录，bin 文件夹下的 catalina.bat 或 setclasspath.bat 中添加 set JAVA_HOME=JAVA 安装目录 set JRE_HOME=JAVA 安装目录/jre 即可；二、查看Tomcat 版本在 tomcat 安装目
【Spark七十二】Spark的日志配置 bit1129 spark
在测试Spark Streaming时，大量的日志显示到控制台，影响了Spark Streaming程序代码的输出结果的查看(代码中通过println将输出打印到控制台上)，可以通过修改Spark的日志配置的方式，不让Spark Streaming把它的日志显示在console 在Spark的conf目录下，把log4j.properties.template修改为log4j.p
Haskell版冒泡排序 bookjovi 冒泡排序 haskell
面试的时候问的比较多的算法题要么是binary search，要么是冒泡排序，真的不想用写C写冒泡排序了，贴上个Haskell版的，思维简单，代码简单，下次谁要是再要我用C写冒泡排序，直接上个haskell版的，让他自己去理解吧。 sort [] = [] sort [x] = [x] sort (x:x1:xs) | x>x1 = x1:so
java 路径配置文件读取 bro_feng java
这几天做一个项目，关于路径做如下笔记，有需要供参考。取工程内的文件，一般都要用相对路径，这个自然不用多说。在src统计目录建配置文件目录res,在res中放入配置文件。读取文件使用方式： 1. MyTest.class.getResourceAsStream("/res/xx.properties") 2. properties.load(MyTest.
读《研磨设计模式》-代码笔记-简单工厂模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 个人理解：简单工厂模式就是IOC; * 客户端要用到某一对象，本来是由客户创建的，现在改成由工厂创建，客户直接取就好了 */ interface IProduct {
SVN与JIRA的关联 chenyu19891124 SVN
SVN与JIRA的关联一直都没能装成功，今天凝聚心思花了一天时间整合好了。下面是自己整理的步骤：一、搭建好SVN环境，尤其是要把SVN的服务注册成系统服务二、装好JIRA，自己用是jira-4.3.4破解版三、下载SVN与JIRA的插件并解压，然后拷贝插件包下lib包里的三个jar，放到Atlassian\JIRA 4.3.4\atlassian-jira\WEB-INF\lib下，再
JWFDv0.96 最新设计思路 comsci 数据结构算法工作企业应用公告
随着工作流技术的发展，工作流产品的应用范围也不断的在扩展，开始进入了像金融行业(我已经看到国有四大商业银行的工作流产品招标公告了)，实时生产控制和其它比较重要的工程领域，而
vi 保存复制内容格式粘贴 daizj vi 粘贴复制保存原格式不变形
vi是linux中非常好用的文本编辑工具，功能强大无比，但对于复制带有缩进格式的内容时，粘贴的时候内容错位很严重，不会按照复制时的格式排版，vi能不能在粘贴时，按复制进的格式进行粘贴呢？答案是肯定的，vi有一个很强大的命令可以实现此功能。在命令模式输入:set paste，则进入paste模式，这样再进行粘贴时
shell脚本运行时报错误：/bin/bash^M: bad interpreter 的解决办法 dongwei_6688 shell脚本
出现原因：windows上写的脚本，直接拷贝到linux系统上运行由于格式不兼容导致解决办法： 1. 比如文件名为myshell.sh，vim myshell.sh 2. 执行vim中的命令 : set ff?查看文件格式，如果显示fileformat=dos，证明文件格式有问题 3. 执行vim中的命令 :set fileformat=unix 将文件格式改过来就可以了，然后:w
高一上学期难记忆单词 dcj3sjt126com word english
honest 诚实的；正直的 argue 争论 classical 古典的 hammer 锤子 share 分享；共有 sorrow 悲哀；悲痛 adventure 冒险 error 错误；差错 closet 壁橱；储藏室 pronounce 发音；宣告 repeat 重做；重复 majority 大多数；大半 native 本国的，本地的，本国
hibernate查询返回DTO对象，DTO封装了多个pojo对象的属性 frankco POJO hibernate查询 DTO
DTO-数据传输对象；pojo-最纯粹的java对象与数据库中的表一一对应。简单讲：DTO起到业务数据的传递作用，pojo则与持久层数据库打交道。有时候我们需要查询返回DTO对象，因为DTO
Partition List hcx2013 partition
Given a linked list and a value x, partition it such that all nodes less than x come before nodes greater than or equal to x. You should preserve the original relative order of th
Spring MVC测试框架详解——客户端测试 jinnianshilongnian
上一篇《Spring MVC测试框架详解——服务端测试》已经介绍了服务端测试，接下来再看看如果测试Rest客户端，对于客户端测试以前经常使用的方法是启动一个内嵌的jetty/tomcat容器，然后发送真实的请求到相应的控制器；这种方式的缺点就是速度慢；自Spring 3.2开始提供了对RestTemplate的模拟服务器测试方式，也就是说使用RestTemplate测试时无须启动服务器，而是模拟一
关于推荐个人观点 liyonghui160com 推荐系统关于推荐个人观点
回想起来，我也做推荐了3年多了，最近公司做了调整招聘了很多算法工程师，以为需要多么高大上的算法才能搭建起来的，从实践中走过来，我只想说【不是这样的】第一次接触推荐系统是在四年前入职的时候，那时候，机器学习和大数据都是没有的概念，什么大数据处理开源软件根本不存在，我们用多台计算机web程序记录用户行为，用.net的w
不间断旋转的动画 pangyulei 动画
CABasicAnimation* rotationAnimation; rotationAnimation = [CABasicAnimation animationWithKeyPath:@"transform.rotation.z"]; rotationAnimation.toValue = [NSNumber numberWithFloat: M
自定义annotation sha1064616837 java enum annotation reflect
对象有的属性在页面上可编辑，有的属性在页面只可读，以前都是我们在页面上写死的，时间一久有时候会混乱，此处通过自定义annotation在类属性中定义。越来越发现Java的Annotation真心很强大，可以帮我们省去很多代码，让代码看上去简洁。下面这个例子主要用到了 1.自定义annotation：@interface，以及几个配合着自定义注解使用的几个注解 2.简单的反射 3.枚举
Spring 源码 up2pu spring
1.Spring源代码 https://github.com/SpringSource/spring-framework/branches/3.2.x 注：兼容svn检出 2.运行脚本 import-into-eclipse.bat 注：需要设置JAVA_HOME为jdk 1.7 build.gradle compileJava { sourceCompatibilit
利用word分词来计算文本相似度 yangshangchuan word word分词文本相似度余弦相似度简单共有词
word分词提供了多种文本相似度计算方式：方式一：余弦相似度，通过计算两个向量的夹角余弦值来评估他们的相似度实现类：org.apdplat.word.analysis.CosineTextSimilarity 用法如下： String text1 = "我爱购物"; String text2 = "我爱读书"; String text3 =