Nacos 服务注册源码解析

nacos官方提供额架构图:

Nacos 服务注册源码解析_第1张图片

  • Provider App:服务提供者
  • Consumer App:服务消费者
  • Name Server:通过VIP(Vritual IP)或者DNS的方式实现Nacos高可用集群的服务路由
  • Nacos Server:Nacos服务提供者,包含OpenApi访问入口,Config Service 和 Naming Service是Nacos的配置服务,名字服务模块。Consistency Protocol是一致性协议,用来实现Nacos集群接节点的数据同步,使用的是 Raft算法。
  • Nacos Console:控制台

详细信息可以进入官方文档查看Nacos官方架构

Nacos服务注册源码解析

主要三部分:

  • 服务注册
  • 服务地址的获取
  • 服务地址变化的感知

 

Spring-Cloud-common包中有一个类ServiceRegistry,它是提供服务注册的标准。集成Spring Cloud实现服务注册的组件都会实现该接口。

package org.springframework.cloud.client.serviceregistry;

public interface ServiceRegistry {
    void register(R registration);

    void deregister(R registration);

    void close();

    void setStatus(R registration, String status);

     T getStatus(R registration);
}

Nacos正是实现了这个接口:

Nacos 服务注册源码解析_第2张图片

 

Nacos触发服务注册的时机:

首先在Spring-cloud-common包中有一个配置文件spring.factories

Nacos 服务注册源码解析_第3张图片

Nacos 服务注册源码解析_第4张图片

AutoServiceRegistrationAutoConfiguration 是服务注册相关的配置类

Nacos 服务注册源码解析_第5张图片

 

AutoServiceRegistration

这块有个小插曲 ,官方 nacos-example中使用的是2.0.0版本的spring-cloud-commons,发现只 实现了3个接口。

Nacos 服务注册源码解析_第6张图片

  ApplicationEvent是通过注解实现的

Nacos 服务注册源码解析_第7张图片

 

Nacos 服务注册源码解析_第8张图片

而2.1.1版本的 spring-cloud-commons中实现了4个接口,区别 就是 ApplicationListener

Nacos 服务注册源码解析_第9张图片

Nacos 服务注册源码解析_第10张图片

这里看达到监听了WebServerInitializedEvent事件,当Webserver初始化完成后,调用 bind方法 。

  1. bind中 调用了 start方法。
  2. start中调用了register方法。
  3. register方法,就是ServiceRegistry接口中的方法。
  4. NacosServiceRegistry  实现了ServiceRegistry接口,通过register方法进行注册

Nacos 服务注册源码解析_第11张图片

最终再回来看这个:

Nacos 服务注册源码解析_第12张图片

创建心跳信息实现 健康检查 

Nacos 服务注册源码解析_第13张图片

 通过定时线程池实现,Nacos服务端会根据客户端的心跳包 不断更新服务的状态 

Nacos 服务注册源码解析_第14张图片

 

 

这里针对目前最新版1.3.1版本的Nacos的源码进行分析:

由于Nacos底层 是 基于HTTP协议完成的请求,所以直接分析Open API即可。

1.服务注册

 @CanDistro
    @PostMapping
    @Secured(parser = NamingResourceParser.class, action = ActionTypes.WRITE)
    public String register(HttpServletRequest request) throws Exception {
        
        final String serviceName = WebUtils.required(request, CommonParams.SERVICE_NAME);
        final String namespaceId = WebUtils
                .optional(request, CommonParams.NAMESPACE_ID, Constants.DEFAULT_NAMESPACE_ID);
        
        final Instance instance = parseInstance(request);
        
        serviceManager.registerInstance(namespaceId, serviceName, instance);
        return "ok";
    }

servicename 就是注册的服务名:

Nacos 服务注册源码解析_第15张图片

namespaceId:值为public

public void registerInstance(String namespaceId, String serviceName, Instance instance) throws NacosException {
        //创建1个空服务
        createEmptyService(namespaceId, serviceName, instance.isEphemeral());
        //从serviceMap中获取服务对象
        Service service = getService(namespaceId, serviceName);
        
        if (service == null) {
            throw new NacosException(NacosException.INVALID_PARAM,
                    "service not found, namespace: " + namespaceId + ", service: " + serviceName);
        }
        //添加服务实例
        addInstance(namespaceId, serviceName, instance.isEphemeral(), instance);
    }

 创建服务代码 :

public void createServiceIfAbsent(String namespaceId, String serviceName, boolean local, Cluster cluster)
            throws NacosException {
        //从缓存中获取service
        Service service = getService(namespaceId, serviceName);
        if (service == null) { //如果为空保存到缓存中
            
            Loggers.SRV_LOG.info("creating empty service {}:{}", namespaceId, serviceName);
            service = new Service();
            service.setName(serviceName);
            service.setNamespaceId(namespaceId);
            service.setGroupName(NamingUtils.getGroupName(serviceName));
            // now validate the service. if failed, exception will be thrown
            service.setLastModifiedMillis(System.currentTimeMillis());
            service.recalculateChecksum();
            if (cluster != null) {
                cluster.setService(service);
                service.getClusterMap().put(cluster.getName(), cluster);
            }
            service.validate();
            
            putServiceAndInit(service);
            if (!local) {
                addOrReplaceService(service);
            }
        }
    }

 主要是putServiceAndInit代码

private void putServiceAndInit(Service service) throws NacosException {
        //将缓存中的service put到内存
        putService(service);
        //建立心跳检测机制
        service.init();
        //实现数据一致性的监听
        consistencyService
                .listen(KeyBuilder.buildInstanceListKey(service.getNamespaceId(), service.getName(), true), service);
        consistencyService
                .listen(KeyBuilder.buildInstanceListKey(service.getNamespaceId(), service.getName(), false), service);
        Loggers.SRV_LOG.info("[NEW-SERVICE] {}", service.toJson());
    }
  • 1.将缓存放入内存
 public void putService(Service service) {
        if (!serviceMap.containsKey(service.getNamespaceId())) {
            synchronized (putServiceLock) {
                if (!serviceMap.containsKey(service.getNamespaceId())) {
                    serviceMap.put(service.getNamespaceId(), new ConcurrentHashMap<>(16));
                }
            }
        }
        serviceMap.get(service.getNamespaceId()).put(service.getName(), service);
    }

 最终Nacos内存中的 service组装 Map

 

  • 2.建立心跳机制
public void init() {
        HealthCheckReactor.scheduleCheck(clientBeatCheckTask);
        for (Map.Entry entry : clusterMap.entrySet()) {
            entry.getValue().setService(this);
            entry.getValue().init();
        }
    }

 可以看到这里的默认心跳机制是5秒

public static void scheduleCheck(ClientBeatCheckTask task) {
        futureMap.putIfAbsent(task.taskKey(), GlobalExecutor.scheduleNamingHealth(task, 5000, 5000, TimeUnit.MILLISECONDS));
    }
  • 3.数据一致性监听 

这里调用了 ConsistencyService.java接口中的 listen方法

void listen(String key, RecordListener listener) throws NacosException;

可以发现这里有3个实现类 

Nacos 服务注册源码解析_第16张图片

 

可以发现只有 DelegateConsistencyServiceImpl.java 才是真正 的 实现者,这里采用了委派 机制 ,同时执行了Distro和Raft两个实现类。由此可以说明Nacos同时使用Raft协议和 Distro协议维护数据一致性的。

Nacos 服务注册源码解析_第17张图片

2.服务查询

@GetMapping("/list")
    @Secured(parser = NamingResourceParser.class, action = ActionTypes.READ)
    public ObjectNode list(HttpServletRequest request) throws Exception {
        
        String namespaceId = WebUtils.optional(request, CommonParams.NAMESPACE_ID, Constants.DEFAULT_NAMESPACE_ID);
        
        String serviceName = WebUtils.required(request, CommonParams.SERVICE_NAME);
        String agent = WebUtils.getUserAgent(request);
        String clusters = WebUtils.optional(request, "clusters", StringUtils.EMPTY);
        String clientIP = WebUtils.optional(request, "clientIP", StringUtils.EMPTY);
        int udpPort = Integer.parseInt(WebUtils.optional(request, "udpPort", "0"));
        String env = WebUtils.optional(request, "env", StringUtils.EMPTY);
        boolean isCheck = Boolean.parseBoolean(WebUtils.optional(request, "isCheck", "false"));
        
        String app = WebUtils.optional(request, "app", StringUtils.EMPTY);
        
        String tenant = WebUtils.optional(request, "tid", StringUtils.EMPTY);
        
        boolean healthyOnly = Boolean.parseBoolean(WebUtils.optional(request, "healthyOnly", "false"));
        
        return doSrvIpxt(namespaceId, serviceName, agent, clusters, clientIP, udpPort, env, isCheck, app, tenant,
                healthyOnly);
    }

核心逻辑 :

  • 根据namespaceId,serviceName获取service实例
  • 从service事例中基于srvIps得到 所有 服务提供者 信息。
  • 遍历组装JSON字符串 返回
    public ObjectNode doSrvIpxt(String namespaceId, String serviceName, String agent, String clusters, String clientIP,
            int udpPort, String env, boolean isCheck, String app, String tid, boolean healthyOnly) throws Exception {
        
        ClientInfo clientInfo = new ClientInfo(agent);
        ObjectNode result = JacksonUtils.createEmptyJsonNode();
        Service service = serviceManager.getService(namespaceId, serviceName);
        
        if (service == null) {
            if (Loggers.SRV_LOG.isDebugEnabled()) {
                Loggers.SRV_LOG.debug("no instance to serve for service: {}", serviceName);
            }
            result.put("name", serviceName);
            result.put("clusters", clusters);
            result.replace("hosts", JacksonUtils.createEmptyArrayNode());
            return result;
        }
        
        checkIfDisabled(service);
        
        long cacheMillis = switchDomain.getDefaultCacheMillis();
        
        // now try to enable the push
        try {
            if (udpPort > 0 && pushService.canEnablePush(agent)) {
                
                pushService
                        .addClient(namespaceId, serviceName, clusters, agent, new InetSocketAddress(clientIP, udpPort),
                                pushDataSource, tid, app);
                cacheMillis = switchDomain.getPushCacheMillis(serviceName);
            }
        } catch (Exception e) {
            Loggers.SRV_LOG
                    .error("[NACOS-API] failed to added push client {}, {}:{}", clientInfo, clientIP, udpPort, e);
            cacheMillis = switchDomain.getDefaultCacheMillis();
        }
        
        List srvedIPs;
        
        srvedIPs = service.srvIPs(Arrays.asList(StringUtils.split(clusters, ",")));
        
        // filter ips using selector:
        if (service.getSelector() != null && StringUtils.isNotBlank(clientIP)) {
            srvedIPs = service.getSelector().select(clientIP, srvedIPs);
        }
        
        if (CollectionUtils.isEmpty(srvedIPs)) {
            
            if (Loggers.SRV_LOG.isDebugEnabled()) {
                Loggers.SRV_LOG.debug("no instance to serve for service: {}", serviceName);
            }
            
            if (clientInfo.type == ClientInfo.ClientType.JAVA
                    && clientInfo.version.compareTo(VersionUtil.parseVersion("1.0.0")) >= 0) {
                result.put("dom", serviceName);
            } else {
                result.put("dom", NamingUtils.getServiceName(serviceName));
            }
            
            result.put("hosts", JacksonUtils.createEmptyArrayNode());
            result.put("name", serviceName);
            result.put("cacheMillis", cacheMillis);
            result.put("lastRefTime", System.currentTimeMillis());
            result.put("checksum", service.getChecksum());
            result.put("useSpecifiedURL", false);
            result.put("clusters", clusters);
            result.put("env", env);
            result.put("metadata", JacksonUtils.transferToJsonNode(service.getMetadata()));
            return result;
        }
        
        Map> ipMap = new HashMap<>(2);
        ipMap.put(Boolean.TRUE, new ArrayList<>());
        ipMap.put(Boolean.FALSE, new ArrayList<>());
        
        for (Instance ip : srvedIPs) {
            ipMap.get(ip.isHealthy()).add(ip);
        }
        
        if (isCheck) {
            result.put("reachProtectThreshold", false);
        }
        
        double threshold = service.getProtectThreshold();
        
        if ((float) ipMap.get(Boolean.TRUE).size() / srvedIPs.size() <= threshold) {
            
            Loggers.SRV_LOG.warn("protect threshold reached, return all ips, service: {}", serviceName);
            if (isCheck) {
                result.put("reachProtectThreshold", true);
            }
            
            ipMap.get(Boolean.TRUE).addAll(ipMap.get(Boolean.FALSE));
            ipMap.get(Boolean.FALSE).clear();
        }
        
        if (isCheck) {
            result.put("protectThreshold", service.getProtectThreshold());
            result.put("reachLocalSiteCallThreshold", false);
            
            return JacksonUtils.createEmptyJsonNode();
        }
        
        ArrayNode hosts = JacksonUtils.createEmptyArrayNode();
        
        for (Map.Entry> entry : ipMap.entrySet()) {
            List ips = entry.getValue();
            
            if (healthyOnly && !entry.getKey()) {
                continue;
            }
            
            for (Instance instance : ips) {
                
                // remove disabled instance:
                if (!instance.isEnabled()) {
                    continue;
                }
                
                ObjectNode ipObj = JacksonUtils.createEmptyJsonNode();
                
                ipObj.put("ip", instance.getIp());
                ipObj.put("port", instance.getPort());
                // deprecated since nacos 1.0.0:
                ipObj.put("valid", entry.getKey());
                ipObj.put("healthy", entry.getKey());
                ipObj.put("marked", instance.isMarked());
                ipObj.put("instanceId", instance.getInstanceId());
                ipObj.put("metadata", JacksonUtils.transferToJsonNode(instance.getMetadata()));
                ipObj.put("enabled", instance.isEnabled());
                ipObj.put("weight", instance.getWeight());
                ipObj.put("clusterName", instance.getClusterName());
                if (clientInfo.type == ClientInfo.ClientType.JAVA
                        && clientInfo.version.compareTo(VersionUtil.parseVersion("1.0.0")) >= 0) {
                    ipObj.put("serviceName", instance.getServiceName());
                } else {
                    ipObj.put("serviceName", NamingUtils.getServiceName(instance.getServiceName()));
                }
                
                ipObj.put("ephemeral", instance.isEphemeral());
                hosts.add(ipObj);
                
            }
        }
        
        result.replace("hosts", hosts);
        if (clientInfo.type == ClientInfo.ClientType.JAVA
                && clientInfo.version.compareTo(VersionUtil.parseVersion("1.0.0")) >= 0) {
            result.put("dom", serviceName);
        } else {
            result.put("dom", NamingUtils.getServiceName(serviceName));
        }
        result.put("name", serviceName);
        result.put("cacheMillis", cacheMillis);
        result.put("lastRefTime", System.currentTimeMillis());
        result.put("checksum", service.getChecksum());
        result.put("useSpecifiedURL", false);
        result.put("clusters", clusters);
        result.put("env", env);
        result.replace("metadata", JacksonUtils.transferToJsonNode(service.getMetadata()));
        return result;
    }
}

 

 3.服务地址动态感知原理

NamingService.java  中的 subscribe方法

Nacos 服务注册源码解析_第18张图片

核心代码:

@Override
    public void subscribe(String serviceName, EventListener listener) throws NacosException {
        subscribe(serviceName, new ArrayList(), listener);
    }
    
    @Override
    public void subscribe(String serviceName, String groupName, EventListener listener) throws NacosException {
        subscribe(serviceName, groupName, new ArrayList(), listener);
    }
    
    @Override
    public void subscribe(String serviceName, List clusters, EventListener listener) throws NacosException {
        subscribe(serviceName, Constants.DEFAULT_GROUP, clusters, listener);
    }
    
    @Override
    public void subscribe(String serviceName, String groupName, List clusters, EventListener listener)
            throws NacosException {
        eventDispatcher.addListener(hostReactor
                        .getServiceInfo(NamingUtils.getGroupedName(serviceName, groupName), StringUtils.join(clusters, ",")),
                StringUtils.join(clusters, ","), listener);
    }

这里有一个HostReactor类  ,它的功能是实现服务的 动态 更新,基本原理是:

  • 客户端 发起事件的订阅 后,在HostReactor中有一个 UpdateTask线程 ,每1秒法发送一次请求,获得服务端最新的地址列表。

Nacos 服务注册源码解析_第19张图片

Nacos 服务注册源码解析_第20张图片

  • 对于服务端,它和服务提供者的实例之间维持了心跳检测,一旦 服务提供者出现 异常,则会发送一个Push消息给Nacos客户端,也就是服务消费者。
  • 服务消费者收到请求后 ,使用HostReactor中提供的processServiceJSON解析消息,并更新本地服务地址列表

 

 

 

 

 

 

你可能感兴趣的:(springcloud)