SakamataZ

Fate-Serving推理服务源码解读

https://fate-serving.readthedocs.io/en/develop/?query=guest
什么是Fate-Serving
fate-serving是FATE的在线部分，在使用FATE进行联邦建模完成之后，可以使用fate-serving进行包括单笔预测、多笔预测以及多host预测在内的在线联合预测。
模型的初始化流程
在FATE中建好模型之后，通过fate-flow的推送模型脚本可以将模型推送至serving-server。推送成功之后，serving-server会将该模型相关的预测接口注册进zookeeper，外部系统可以通过服务发现获取接口地址并调用。
参与方划分
fate在调用在线预测接口时，需要数据使用方（Guest）、数据提供方（Host）双方联合预测，Guest方对模型和特征数据进行业务处理后，Guest方接口参数中的sendToRemoteFeatureData会发往Host端，Host方则是通过自定义的Adaptor跟己方业务系统交互（eg：通过访问远程rpc接口、或者通过访问存储）来获取特征数据，并将获取的特征交给算法模块进行计算，最终得出合并后的预测结果并返回给Guest。

Fate和Secretflow推理服务的比较

Fate-serving适用jdk1.8+SSM，服务提供HTTP接口和RPC接口（grpc），代码量11w行；Secretflow-serving使用C++17+brpc，服务提供RPC接口，代码量1w行。
Secret-serving将模型的执行拆分成了Exector，实现了动态的调度执行，Fate不具备这样的能力。
Fate比隐语多的能力：

服务的故障恢复/重启能力，能够保留Server的版本记录并从备份中恢复；
服务注册、发现和鉴权
模型动态加载和卸载（热更新）[内存占用率更低]
弹性扩容，负载均衡，高可用

服务发现有两个维度，一个是类似serving里面的queryModel接口，另一个是借助curator实现的zk监听回调的能力。第二个能力没有暴露给用户，而只是在内部使用。

server-mode 推理执行模块

model是推理模块的核心，我们先看这部分。fate官网提供了推理算法的讲解，https://fate-serving.readthedocs.io/en/develop/algo/base/，所以这里只关注调度链路。
model模块的架构如下：

注意BaseComponent只实现了LocalInferenceAware。

PipelineModelProcessor初始化

model在server模块中被ModeLoader加载，ModeLoader会调用initModel进行模型的初始化。
每个模型对应一个PipelineModelProcessor。
serving-server在收到推送模型的请求后，会在内存中初始化一个PipelineModelProcessor实例。和隐语拆分成executor类似，PipelineModelProcessor也会将model拆分成components。但是，fate拆分的components并不是调度的最小单位，因此没有隐语那种动态执行能力。
fate的model同样适用proto定义，由dslParser进行parse后动态加载每一个components。**这里我们可以看到，通过反射，fate提供了动态模型加载能力。**对于线上服务，动态注册模型能力还是很重要的，可以实现服务的热更新。


public int initModel(Context context, Map<String, byte[]> modelProtoMap) {
    if (modelProtoMap != null) {
        logger.info("start init pipeline,model components {}", modelProtoMap.keySet());
        try {
            Map<String, byte[]> newModelProtoMap = changeModelProto(modelProtoMap);
            logger.info("after parse pipeline {}", newModelProtoMap.keySet());
            Preconditions.checkArgument(newModelProtoMap.get(PIPLELINE_IN_MODEL) != null);
            PipelineProto.Pipeline pipeLineProto = PipelineProto.Pipeline.parseFrom(newModelProtoMap.get(PIPLELINE_IN_MODEL));
            String dsl = pipeLineProto.getInferenceDsl().toStringUtf8();
            dslParser.parseDagFromDSL(dsl);
            ArrayList<String> components = dslParser.getAllComponent();
            HashMap<String, String> componentModuleMap = dslParser.getComponentModuleMap();
            // 调用每一个components的initModel
            for (int i = 0; i < components.size(); ++i) {
                String componentName = components.get(i);
                String className = componentModuleMap.get(componentName);
                logger.info("try to get class:{}", className);
                try {
                    // 动态加载components
                    Class modelClass = Class.forName(this.modelPackage + "." + className);
                    BaseComponent mlNode = (BaseComponent) modelClass.getConstructor().newInstance();
                    mlNode.setComponentName(componentName);
                    byte[] protoMeta = newModelProtoMap.get(componentName + ".Meta");
                    byte[] protoParam = newModelProtoMap.get(componentName + ".Param");
                    int returnCode = mlNode.initModel(protoMeta, protoParam);
                    if (returnCode == Integer.valueOf(StatusCode.SUCCESS)) {
                        componentMap.put(componentName, mlNode);
                        pipeLineNode.add(mlNode);
                        logger.info(" add class {} to pipeline task list", className);
                    } else {
                        throw new RuntimeException("init model error");
                    }
                } catch (Exception ex) {
                    pipeLineNode.add(null);
                    logger.warn("Can not instance {} class", className);
                }
            }
        } catch (Exception ex) {
            logger.info("initModel error:{}", ex);
            throw new RuntimeException("initModel error");
        }
        logger.info("Finish init Pipeline");
        return Integer.valueOf(StatusCode.SUCCESS);
    } else {
        logger.error("model content is null ");
        throw new RuntimeException("model content is null");
    }
}

guest推理

PipelineModelProcessor的guestInference同样在server中被调用，它的接口是：
public ReturnResult guestInference(Context context, InferenceRequest inferenceRequest, Map futureMap, long timeout)
这里的futureMap并不是特征，而是remote inference的结果。
guestInference首先进行singleLocalPredict，顺序调用components的LocalInferenceAware方法。
之后和remote inference的结果进行合并，顺序调用components的mergeRemoteInference方法。

模型服务

fate-serving-server的controller层定义了一些HTTP请求，grpc.service定义了rpc请求，因为controller也是构造rpc调用，所以不多介绍。

Service公共抽象类和Context

我们先看ModelService部分，ModelServiceProvider继承了AbstractServingServiceProvider，AbstractServingServiceProvider是一个抽象类，它继承了AbstractServiceAdaptor。
AbstractServiceAdaptor是所有Service和ServiceProvider的公共父抽象类，我们来看它提供了哪些接口和公用方法。

公共方法/变量：

getFlowCounterManage/setFlowCounterManagerr: 获取/设置flowCounterManager，flowCounterManager是模型的计数器，用来统计访问信息
getMethodMap/setMethodMap：获取设置一个string->method的映射
preChain/postChain：服务的前处理和后处理逻辑
AbstractStub：grpc的stub，每个Service和ServiceProvider都对应到一个grpc stub

需要实现的接口：

doService service的实际实现
transformExceptionInfo

接下来我们看service方法，service会传入一个服务上下文context，context实际上就是一个k-v，记载了执行中的一些信息。

    @Override
    public OutboundPackage<resp> service(Context context, InboundPackage<req> data) throws RuntimeException {

        OutboundPackage<resp> outboundPackage = new OutboundPackage<resp>();
        // 将requestInProcess + 1
        context.preProcess();
        List<Throwable> exceptions = Lists.newArrayList();
        context.setReturnCode(StatusCode.SUCCESS);
        // main方法退出时，会将此值设为0
        if (!isOpen) {
            return this.serviceFailInner(context, data, new ShowDownRejectException());
        }
        if(data.getBody()!=null) {
            context.putData(Dict.INPUT_DATA, data.getBody());
        }

        try {
            // 记录服务调用次数
            requestInHandle.addAndGet(1);
            resp result = null;
            context.setServiceName(this.serviceName);
            try {
                preChain.doPreProcess(context, data, outboundPackage);
                // 调用子类方法
                result = doService(context, data, outboundPackage);
                if (logger.isDebugEnabled()) {
                    logger.debug("do service, router info: {}, service name: {}, result: {}", JsonUtil.object2Json(data.getRouterInfo()), serviceName, result);
                }
            } catch (Throwable e) {
                exceptions.add(e);
                logger.error("do service fail, cause by: {}", e.getMessage());
            }
            outboundPackage.setData(result);
            postChain.doPostProcess(context, data, outboundPackage);

        }

模型服务代理类

ModelService主要用到了ModelServiceProvider这个Bean，它是模型服务的代理，我们来看这边的代码。
ModelServiceProvider使用了ModelManager，负责实际的模型管理，下一节会介绍ModelManager。
ModelServiceProvider提供了下面几个模型服务：

模型加载
模型在线发布
模型查询
模型卸载
模型解绑定
模型拉取
模型数据拉取

@FateService注解设置AbstractServiceAdaptor的preChain和postChain：

@FateService(name = "modelService", preChain = {
        "requestOverloadBreaker"
}, postChain = {
})

@FateService注解设置的chain在admin、service、proxy的Register中被调用：


/**
 * 当spring应用启动完成后，onApplicationEvent 方法会被调用
 **/
@Override
public void onApplicationEvent(ApplicationReadyEvent applicationEvent) {
    String[] beans = applicationContext.getBeanNamesForType(AbstractServiceAdaptor.class);
    FlowCounterManager flowCounterManager = applicationContext.getBean(FlowCounterManager.class);
    for (String beanName : beans) {
        AbstractServiceAdaptor serviceAdaptor = applicationContext.getBean(beanName, AbstractServiceAdaptor.class);
        serviceAdaptor.setFlowCounterManager(flowCounterManager);
        // 获取被FateService注解的bean
        FateService proxyService = serviceAdaptor.getClass().getAnnotation(FateService.class);
        Method[] methods = serviceAdaptor.getClass().getMethods();
        for (Method method : methods) {
            
            FateServiceMethod fateServiceMethod = method.getAnnotation(FateServiceMethod.class);
            if (fateServiceMethod != null) {
                String[] names = fateServiceMethod.name();
                for (String name : names) {
                    serviceAdaptor.getMethodMap().put(name, method);
                }
            }
        }
        if (proxyService != null) {
            serviceAdaptor.setServiceName(proxyService.name());
            String[] postChain = proxyService.postChain();
            String[] preChain = proxyService.preChain();
            for (String post : postChain) {
                Interceptor postInterceptor = applicationContext.getBean(post, Interceptor.class);
                serviceAdaptor.addPostProcessor(postInterceptor);
            }
            for (String pre : preChain) {
                Interceptor preInterceptor = applicationContext.getBean(pre, Interceptor.class);
                serviceAdaptor.addPreProcessor(preInterceptor);
            }

            this.serviceAdaptorMap.put(proxyService.name(), serviceAdaptor);
        }
    }

    logger.info("service register info {}", this.serviceAdaptorMap.keySet());
}

模型管理

ModelManager是非常重要的模块，负责模型服务的实际执行，我们分别看下上面提到的几个执行方法。

绑定

绑定的作用是给service id绑定一个已有的模型。
这里会维护一个serviceid -> key的映射（下图来自官网）：

模型池就是namespaceMap，存储一个模型名称到ModelProcessor的映射关系。
注意，每次操作都会进行本地缓存的更新，本地缓存用于服务恢复。

    public synchronized ReturnResult bind(Context context, ModelServiceProto.PublishRequest req) {
        if (logger.isDebugEnabled()) {
            logger.debug("try to bind model, receive request : {}", req);
        }
        ReturnResult returnResult = new ReturnResult();
        String serviceId = req.getServiceId();
        Preconditions.checkArgument(StringUtils.isNotBlank(serviceId), "param service id is blank");
        Preconditions.checkArgument(!StringUtils.containsAny(serviceId, URL_FILTER_CHARACTER), "Service id contains special characters, " + JsonUtil.object2Json(URL_FILTER_CHARACTER));

        returnResult.setRetcode(StatusCode.SUCCESS);
        Model model = this.buildModelForBind(context, req);
        String modelKey = this.getNameSpaceKey(model.getTableName(), model.getNamespace());
        Model loadedModel = this.namespaceMap.get(modelKey);
        if (loadedModel == null) {
            throw new ModelNullException("model " + modelKey + " is not exist ");
        }
        this.serviceIdNamespaceMap.put(serviceId, modelKey);
        if (zookeeperRegistry != null) {
            if (StringUtils.isNotEmpty(serviceId)) {
                zookeeperRegistry.addDynamicEnvironment(serviceId);
            }
            zookeeperRegistry.register(FateServer.guestServiceSets, Lists.newArrayList(serviceId));
        }
        //update cache
        this.store(serviceIdNamespaceMap, serviceIdFile);
        return returnResult;
    }
    private Model buildModelForBind(Context context, ModelServiceProto.PublishRequest req) {
        // 从请求的modelMap中读取mode info，
        // 可以发现，这里用的全都是从req读出来的数据
        Model model = new Model();
        String role = req.getLocal().getRole();
        model.setPartId(req.getLocal().getPartyId());
        model.setRole(Dict.GUEST.equals(role) ? Dict.GUEST : Dict.HOST);
        String serviceId = req.getServiceId();
        model.getServiceIds().add(serviceId);
        Map<String, ModelServiceProto.RoleModelInfo> modelMap = req.getModelMap();
        ModelServiceProto.RoleModelInfo roleModelInfo = modelMap.get(model.getRole());
        Map<String, ModelServiceProto.ModelInfo> modelInfoMap = roleModelInfo.getRoleModelInfoMap();
        Map<String, ModelServiceProto.Party> roleMap = req.getRoleMap();
        ModelServiceProto.Party selfParty = roleMap.get(model.getRole());
        String selfPartyId = selfParty.getPartyIdList().get(0);
        ModelServiceProto.ModelInfo selfModelInfo = modelInfoMap.get(selfPartyId);
        String selfNamespace = selfModelInfo.getNamespace();
        String selfTableName = selfModelInfo.getTableName();
        model.setNamespace(selfNamespace);
        model.setTableName(selfTableName);
        return model;
    }

加载

这里数据提供方（host）加载模型时，记录数据使用方(guest) name + namespace -> (host) model 映射关系，实现使用方和提供方模型的一一对应。
partnerModelMap在guest方始终为空。namespaceMap在host和guest方都存在，记录本地模型池映射关系。


    public synchronized ReturnResult load(Context context, ModelServiceProto.PublishRequest req) {
        if (logger.isDebugEnabled()) {
            logger.debug("try to load model, receive request : {}", req);
        }
        ReturnResult returnResult = new ReturnResult();
        returnResult.setRetcode(StatusCode.SUCCESS);
        Model model = this.buildModelForLoad(context, req);
        String namespaceKey = this.getNameSpaceKey(model.getTableName(), model.getNamespace());
        ModelLoader.ModelLoaderParam modelLoaderParam = new ModelLoader.ModelLoaderParam();
        String loadType = req.getLoadType();
        if (StringUtils.isNotEmpty(loadType)) {
            modelLoaderParam.setLoadModelType(ModelLoader.LoadModelType.valueOf(loadType));
        } else {
            modelLoaderParam.setLoadModelType(ModelLoader.LoadModelType.FATEFLOW);
        }
        modelLoaderParam.setTableName(model.getTableName());
        modelLoaderParam.setNameSpace(model.getNamespace());
        modelLoaderParam.setFilePath(req.getFilePath());
        ModelLoader modelLoader = this.modelLoaderFactory.getModelLoader(context, modelLoaderParam.getLoadModelType());
        Preconditions.checkArgument(modelLoader != null, "model loader not found");
        ModelProcessor modelProcessor = modelLoader.loadModel(context, modelLoaderParam);
        if (modelProcessor == null) {
            throw new ModelProcessorInitException("model initialization error, please check if the model exists and the configuration of the FATEFLOW load model process is correct.");
        }
        model.setModelProcessor(modelProcessor);
        modelProcessor.setModel(model);
        // 本地模型池映射关系
        this.namespaceMap.put(namespaceKey, model);
        // 数据提供方（host）加载模型时，记录数据使用方(guest) name + namespace -> (host) model 映射关系
        // 实现使用方和提供方模型的一一对应
        if (Dict.HOST.equals(model.getRole())) {
            model.getFederationModelMap().values().forEach(remoteModel -> {
                String remoteNamespaceKey = this.getNameSpaceKey(remoteModel.getTableName(), remoteModel.getNamespace());
                this.partnerModelMap.put(remoteNamespaceKey, model);
            });
        }
        /**
         *  host model
         */
        if (Dict.HOST.equals(model.getRole()) && zookeeperRegistry != null) {
            String modelKey = ModelUtil.genModelKey(model.getTableName(), model.getNamespace());
            zookeeperRegistry.addDynamicEnvironment(EncryptUtils.encrypt(modelKey, EncryptMethod.MD5));
            zookeeperRegistry.register(FateServer.hostServiceSets);
        }
        // update cache
        this.store(namespaceMap, namespaceFile);
        return returnResult;

    }

buildModelForLoad执行实际的模型动态加载：

private Model buildModelForLoad(Context context, ModelServiceProto.PublishRequest req) {
    Model model = new Model();
    String role = req.getLocal().getRole();
    model.setPartId(req.getLocal().getPartyId());
    model.setRole(Dict.GUEST.equals(role) ? Dict.GUEST : Dict.HOST);
    Map<String, ModelServiceProto.RoleModelInfo> modelMap = req.getModelMap();
    ModelServiceProto.RoleModelInfo roleModelInfo = modelMap.get(model.getRole());
    Map<String, ModelServiceProto.ModelInfo> modelInfoMap = roleModelInfo.getRoleModelInfoMap();
    Map<String, ModelServiceProto.Party> roleMap = req.getRoleMap();
    String remotePartyRole = model.getRole().equals(Dict.GUEST) ? Dict.HOST : Dict.GUEST;
    ModelServiceProto.Party remoteParty = roleMap.get(remotePartyRole);
    List<String> remotePartyIdList = remoteParty.getPartyIdList();
    for (String remotePartyId : remotePartyIdList) {
        ModelServiceProto.RoleModelInfo remoteRoleModelInfo = modelMap.get(remotePartyRole);
        ModelServiceProto.ModelInfo remoteModelInfo = remoteRoleModelInfo.getRoleModelInfoMap().get(remotePartyId);
        Model remoteModel = new Model();
        remoteModel.setPartId(remotePartyId);
        remoteModel.setNamespace(remoteModelInfo.getNamespace());
        remoteModel.setTableName(remoteModelInfo.getTableName());
        remoteModel.setRole(remotePartyRole);
        model.getFederationModelMap().put(remotePartyId, remoteModel);
    }
    ModelServiceProto.Party selfParty = roleMap.get(model.getRole());
    String selfPartyId = selfParty.getPartyIdList().get(0);
    ModelServiceProto.ModelInfo selfModelInfo = modelInfoMap.get(model.getPartId());
    Preconditions.checkArgument(selfModelInfo != null, "model info is invalid");
    String selfNamespace = selfModelInfo.getNamespace();
    String selfTableName = selfModelInfo.getTableName();
    model.setNamespace(selfNamespace);
    model.setTableName(selfTableName);
    // 从FATEFLOW中加载模型
    if (ModelLoader.LoadModelType.FATEFLOW.name().equals(req.getLoadType())) {
        try {
            ModelLoader.ModelLoaderParam modelLoaderParam = new ModelLoader.ModelLoaderParam();
            modelLoaderParam.setLoadModelType(ModelLoader.LoadModelType.FATEFLOW);
            modelLoaderParam.setTableName(model.getTableName());
            modelLoaderParam.setNameSpace(model.getNamespace());
            modelLoaderParam.setFilePath(req.getFilePath());
            ModelLoader modelLoader = this.modelLoaderFactory.getModelLoader(context, ModelLoader.LoadModelType.FATEFLOW);
            model.setResourceAdress(getAdressForUrl(modelLoader.getResource(context, modelLoaderParam)));
        } catch (Exception e) {
            logger.error("getloadModelUrl error = {}", e);
        }
    }
    return model;
}

故障恢复

服务注册、发现和鉴权

服务注册的时间

加载时

加载时只会在数据提供方进行服务注册：

       /**
         *  host model
         */
        if (Dict.HOST.equals(model.getRole()) && zookeeperRegistry != null) {
            String modelKey = ModelUtil.genModelKey(model.getTableName(), model.getNamespace());
            zookeeperRegistry.addDynamicEnvironment(EncryptUtils.encrypt(modelKey, EncryptMethod.MD5));
            zookeeperRegistry.register(FateServer.hostServiceSets);
        }

那么这里的DynamicEnvironment作用是什么呢？FateServer.hostServiceSets又是在什么时候被注册的呢？
首先我们看下FateServer.hostServiceSets的初始化，通过阅读源码我们可以发现，在ServingServer这个bean实现了InitializingBean，在初始化完成之后，会调用下面这一段代码，这段代码注册了Fate-Serving需要初始化的几个服务，后面我们可以看到，新的服务都是由这几个初始服务衍生的。

@Override
public void afterPropertiesSet() throws Exception {
    logger.info("try to star server ,meta info {}", MetaInfo.toMap());
    Executor executor = new ThreadPoolExecutor(MetaInfo.PROPERTY_SERVING_CORE_POOL_SIZE, MetaInfo.PROPERTY_SERVING_MAX_POOL_SIZE, MetaInfo.PROPERTY_SERVING_POOL_ALIVE_TIME, TimeUnit.MILLISECONDS,
            MetaInfo.PROPERTY_SERVING_POOL_QUEUE_SIZE == 0 ? new SynchronousQueue<Runnable>() :
                    (MetaInfo.PROPERTY_SERVING_POOL_QUEUE_SIZE < 0 ? new LinkedBlockingQueue<Runnable>()
                            : new LinkedBlockingQueue<Runnable>(MetaInfo.PROPERTY_SERVING_POOL_QUEUE_SIZE)), new NamedThreadFactory("ServingServer", true));
    FateServerBuilder serverBuilder = (FateServerBuilder) ServerBuilder.forPort(MetaInfo.PROPERTY_SERVER_PORT);
    serverBuilder.keepAliveTime(100, TimeUnit.MILLISECONDS);
    serverBuilder.executor(executor);
    serverBuilder.addService(ServerInterceptors.intercept(guestInferenceService, new ServiceExceptionHandler(), new ServiceOverloadProtectionHandle()), GuestInferenceService.class);
    serverBuilder.addService(ServerInterceptors.intercept(modelService, new ServiceExceptionHandler(), new ServiceOverloadProtectionHandle()), ModelService.class);
    serverBuilder.addService(ServerInterceptors.intercept(hostInferenceService, new ServiceExceptionHandler(), new ServiceOverloadProtectionHandle()), HostInferenceService.class);
    serverBuilder.addService(ServerInterceptors.intercept(commonService, new ServiceExceptionHandler(), new ServiceOverloadProtectionHandle()), CommonService.class);
    server = serverBuilder.build();
    server.start();
    boolean useRegister = MetaInfo.PROPERTY_USE_REGISTER;
    if (useRegister) {
        logger.info("serving-server is using register center");
        zookeeperRegistry.subProject(Dict.PROPERTY_PROXY_ADDRESS);
        zookeeperRegistry.subProject(Dict.PROPERTY_FLOW_ADDRESS);
        zookeeperRegistry.register(FateServer.serviceSets);
    } else {
        logger.warn("serving-server not use register center");
    }
    modelManager.restore(new BaseContext());
    logger.warn("serving-server start over");
}

接下来看第二个问题，DynamicEnvironment的作用，我们来看register这里的代码：

public synchronized void register(Set<RegisterService> sets) {
    if (logger.isDebugEnabled()) {
        logger.debug("prepare to register {}", sets);
    }
    String hostAddress = NetUtils.getLocalIp();
    Preconditions.checkArgument(port != 0);
    Preconditions.checkArgument(StringUtils.isNotEmpty(environment));

    Set<URL> registered = this.getRegistered();
    for (RegisterService service : sets) {
        try {
            URL url = generateUrl(hostAddress, service);
            URL serviceUrl = url.setProject(project);
            // 对于推理服务，useDynamicEnvironment为True
            if (service.useDynamicEnvironment()) {
                if (CollectionUtils.isNotEmpty(dynamicEnvironments)) {
                    dynamicEnvironments.forEach(environment -> {
                        URL newServiceUrl = service.protocol().equals(Dict.HTTP) ? url : serviceUrl.setEnvironment(environment);
                        // use cache service params
                        loadCacheParams(newServiceUrl);
                        // 对于每一个environment，生成一个新的service
                        // 生成的数量是environment的个数*sets的size
                        String serviceName = service.serviceName() + environment;
                        if (!registedString.contains(serviceName)) {
                            this.register(newServiceUrl);
                            this.registedString.add(serviceName);
                        } else {
                            logger.info("url {} is already registed, will not do anything ", newServiceUrl);
                        }
                    });
                }
            } else {
                if (!registedString.contains(service.serviceName() + environment)) {
                    URL newServiceUrl = service.protocol().equals(Dict.HTTP) ? url : serviceUrl.setEnvironment(environment);
                    if (logger.isDebugEnabled()) {
                        logger.debug("try to register url {}", newServiceUrl);
                    }
                    // use cache service params
                    loadCacheParams(newServiceUrl);

                    this.register(newServiceUrl);
                    this.registedString.add(service.serviceName() + environment);
                } else {
                    logger.info("url {} is already registed, will not do anything ", service.serviceName());
                }
            }
        } catch (Exception e) {
            e.printStackTrace();
            logger.error("try to register service {} failed", service);
        }
    }

    syncServiceCacheFile();

    if (logger.isDebugEnabled()) {
        logger.debug("registed urls {}", registered);
    }
}

可以看出来，这里通过environment的个数*sets的size的方式，减少了代码复杂度；只在数据提供方注册一次，防止重复注册。

绑定时

和上面加载的思路一样，只不过绑定只会被guest调用，所以不需要区分guest和host：

if (zookeeperRegistry != null) {
    if (StringUtils.isNotEmpty(serviceId)) {
        zookeeperRegistry.addDynamicEnvironment(serviceId);
    }
    // 给guestServiceSets中的每一个服务都注册一个新的serviceId服务
    zookeeperRegistry.register(FateServer.guestServiceSets, Lists.newArrayList(serviceId));
}

unload和unregister的代码逻辑差不多，因此就不展开了。

服务注册和服务发现

接下来我们看register模块，你会发现这里的代码特别多，因为路由、负载均衡等模块也在这里实现了。
本节主要关注注册逻辑，这样只需要看common和zookeeper两个文件夹就行了，接下来结合官网这张部署实例的图来讲。

首先，我们可以看到，fate-serving不实现zookeeper，zk集群需要客户自己部署。
这里用到的主要是ZookeeperRegistry这个类，我们就从这里展开。

zookeeper client的创建

public static ConcurrentMap registeryMap = new ConcurrentHashMap()是一个URL - > ZookeeperRegistry单例的map。
它的初始化流程如下：

public static synchronized ZookeeperRegistry getRegistry(String url, String project, String environment, int port) {
    if (url == null) {
        return null;
    }
    URL registryUrl = URL.valueOf(url);
    registryUrl = registryUrl.addParameter(Constants.ENVIRONMENT_KEY, environment);
    registryUrl = registryUrl.addParameter(Constants.SERVER_PORT, port);
    registryUrl = registryUrl.addParameter(Constants.PROJECT_KEY, project);
    List<URL> backups = registryUrl.getBackupUrls();
    if (registeryMap.get(registryUrl) == null) {
        URL finalRegistryUrl = registryUrl;
        registeryMap.computeIfAbsent(registryUrl, n -> {
            CuratorZookeeperTransporter curatorZookeeperTransporter = new CuratorZookeeperTransporter();
            ZookeeperRegistryFactory zookeeperRegistryFactory = new ZookeeperRegistryFactory();
            zookeeperRegistryFactory.setZookeeperTransporter(curatorZookeeperTransporter);
            ZookeeperRegistry zookeeperRegistry = (ZookeeperRegistry) zookeeperRegistryFactory.createRegistry(finalRegistryUrl);
            return zookeeperRegistry;
        });
    }
    return registeryMap.get(registryUrl);
}

我们先来看CuratorZookeeperTransporter，它负责维护一个Map zookeeperClientMap ，保留URL -> ZookeeperClient的关系。
我们看ZookeeperClient初始化的过程：

@Override
public ZookeeperClient connect(URL url) {
    ZookeeperClient zookeeperClient;
    // 解析所有url
    List<String> addressList = getURLBackupAddress(url);
    // The field define the zookeeper server , including protocol, host, port, username, password
    // 更新url->zookeeperClient映射
    if ((zookeeperClient = fetchAndUpdateZookeeperClientCache(addressList)) != null && zookeeperClient.isConnected()) {
        logger.info("find valid zookeeper client from the cache for address: " + url);
        return zookeeperClient;
    }
    // avoid creating too many connections， so add lock
    synchronized (zookeeperClientMap) {
        if ((zookeeperClient = fetchAndUpdateZookeeperClientCache(addressList)) != null && zookeeperClient.isConnected()) {
            logger.info("find valid zookeeper client from the cache for address: " + url);
            return zookeeperClient;
        }

        zookeeperClient = createZookeeperClient(toClientURL(url));
        logger.info("No valid zookeeper client found from cache, therefore create a new client for url. " + url);
        writeToClientMap(addressList, zookeeperClient);
        // 调度到下面的构造方法
    }
    return zookeeperClient;
}

public CuratorZookeeperClient(URL url) {
    super(url);
    try {
        // 从 URL 中获取连接超时设置，默认为 5000 毫秒
        int timeout = url.getParameter(TIMEOUT_KEY, 5000);

        // 使用 CuratorFrameworkFactory.Builder 构建 Curator 客户端
        CuratorFrameworkFactory.Builder builder = CuratorFrameworkFactory.builder()
                .connectString(url.getBackupAddress()) // 获取连接地址，这里使用了 getBackupAddress 方法
                .retryPolicy(new RetryNTimes(1, 1000)) // 设置重试策略，这里是重试一次，每次间隔 1000 毫秒
                .connectionTimeoutMs(timeout); // 设置连接超时时间

        aclEnable = MetaInfo.PROPERTY_ACL_ENABLE;
        if (aclEnable) {
            aclUsername = MetaInfo.PROPERTY_ACL_USERNAME;
            aclPassword = MetaInfo.PROPERTY_ACL_PASSWORD;

            // 如果启用 ACL，检查用户名和密码是否为空
            if (StringUtils.isBlank(aclUsername) || StringUtils.isBlank(aclPassword)) {
                aclEnable = false;
                MetaInfo.PROPERTY_ACL_ENABLE = false;
            } else {
                // 如果用户名和密码不为空，添加授权信息和 ACL 规则
                builder.authorization(SCHEME, (aclUsername + ":" + aclPassword).getBytes());

                Id allow = new Id(SCHEME, DigestAuthenticationProvider.generateDigest(aclUsername + ":" + aclPassword));
                // add more
                acls.add(new ACL(ZooDefs.Perms.ALL, allow));
            }
        }

        // 使用 builder 构建 Curator 客户端
        client = builder.build();

        // 添加连接状态监听器，处理连接状态变化事件
        client.getConnectionStateListenable().addListener(new ConnectionStateListener() {
            @Override
            public void stateChanged(CuratorFramework client, ConnectionState state) {
                // 处理连接状态变化事件，根据不同状态调用 stateChanged 方法
                // 只实现了RECONNECTED
                if (state == ConnectionState.LOST) {
                    CuratorZookeeperClient.this.stateChanged(StateListener.DISCONNECTED);
                } else if (state == ConnectionState.CONNECTED) {
                    CuratorZookeeperClient.this.stateChanged(StateListener.CONNECTED);
                } else if (state == ConnectionState.RECONNECTED) {
                    CuratorZookeeperClient.this.stateChanged(StateListener.RECONNECTED);
                }
            }
        });

        // 启动 Curator 客户端
        client.start();

        // 如果启用 ACL，为根节点设置 ACL
        if (aclEnable) {
            client.setACL().withACL(acls).forPath("/");
        }
    } catch (Exception e) {
        // 处理异常，抛出 IllegalStateException
        throw new IllegalStateException(e.getMessage(), e);
    }
}

ZookeeperRegistry 注册

继续看ZookeeperRegistry，在client初始化完后，ZookeeperRegistry会add一个状态监听器，用于断线重连之后服务的恢复。


public ZookeeperRegistry(URL url, ZookeeperTransporter zookeeperTransporter) {
    super(url);
    String group = url.getParameter(ROOT_KEY, Dict.DEFAULT_FATE_ROOT);
    if (!group.startsWith(PATH_SEPARATOR)) {
        group = PATH_SEPARATOR + group;
    }
    this.environment = url.getParameter(ENVIRONMENT_KEY, "online");
    project = url.getParameter(PROJECT_KEY);
    port = url.getParameter(SERVER_PORT) != null ? new Integer(url.getParameter(SERVER_PORT)) : 0;

    this.root = group;
    zkClient = zookeeperTransporter.connect(url);
    zkClient.addStateListener(state -> {
        if (state == StateListener.RECONNECTED) {
            logger.error("state listener reconnected");
            try {
                recover();
            } catch (Exception e) {
                logger.error(e.getMessage(), e);
            }
        }
    });
}
// recover最后会调用到：
public void addFailedRegisterComponentTask(URL url) {
    if(url!=null) {
        String instanceId = AbstractRegistry.INSTANCE_ID;

        FailedRegisterComponentTask oldOne = this.failedRegisterComponent.get(instanceId);
        if (oldOne != null) {
            return;
        }
        // 新的重试任务
        FailedRegisterComponentTask newTask = new FailedRegisterComponentTask(url, this);
        oldOne = failedRegisterComponent.putIfAbsent(instanceId, newTask);
        if (oldOne == null) {
            // never has a retry task. then start a new task for retry.
            // 设置超时时间，超时后调用doRegisterComponent()
            retryTimer.newTimeout(newTask, retryPeriod, TimeUnit.MILLISECONDS);
        }
    }
}

服务注册最后会调用到下面的client代码：

// 创建临时节点
@Override
public void createEphemeral(String path) {
    try {
        if (logger.isDebugEnabled()) {
            logger.debug("createEphemeral {}", path);
        }

        if (aclEnable) {
            // 如果启用 ACL，则使用指定的 ACL（acls）创建临时节点
            client.create().withMode(CreateMode.EPHEMERAL).withACL(acls).forPath(path);
        } else {
            // 如果未启用 ACL，则以默认权限创建临时节点
            client.create().withMode(CreateMode.EPHEMERAL).forPath(path);
        }
    } catch (NodeExistsException e) {
    } catch (Exception e) {
        throw new IllegalStateException(e.getMessage(), e);
    }
}
// 创建永久节点

@Override
protected void createPersistent(String path, String data) {
    byte[] dataBytes = data.getBytes(CHARSET);
    try {
        if (logger.isDebugEnabled()) {
            logger.debug("createPersistent {} data {}", path, data);
        }
        if (aclEnable) {
            client.create().withACL(acls).forPath(path, dataBytes);
        } else {
            client.create().forPath(path, dataBytes);
        }
    } catch (NodeExistsException e) {
        try {
            if (aclEnable) {
                Stat stat = client.checkExists().forPath(path);
                client.setData().withVersion(stat.getAversion()).forPath(path, dataBytes);
            } else {
                client.setData().forPath(path, dataBytes);
            }
        } catch (Exception e1) {
            throw new IllegalStateException(e.getMessage(), e1);
        }
    } catch (Exception e) {
        throw new IllegalStateException(e.getMessage(), e);
    }
}

ZookeeperRegistry 发现

subProject实现了服务发现，最终会调用到client.getChildren().usingWatcher(listener).forPath(path)：

@Override
public void subProject(String project) {
    if (logger.isDebugEnabled()) {
        logger.debug("try to subProject: {}", project);
    }
    super.subProject(project);
    failedSubProject.remove(project);
    try {
        doSubProject(project);
    } catch (Exception e) {
        addFailedSubscribedProjectTask(project);
    }
}
@Override
public void doSubProject(String project) {
    String path = root + Constants.PATH_SEPARATOR + project;
    // 监听 root + Constants.PATH_SEPARATOR + project
    List<String> environments = zkClient.addChildListener(path, (parent, childrens) -> {
        if (StringUtils.isNotEmpty(parent)) {
            logger.info("fire environments changes {}", childrens);
            // 监听新出现的children
            subEnvironments(path, project, childrens);
        }
    });

    if (logger.isDebugEnabled()) {
        logger.debug("environments {}", environments);
    }
    if (environments == null) {
        if (logger.isDebugEnabled()) {
            logger.debug("path {} is not exist in zk", path);
        }
        throw new RuntimeException("environment is null");
    }

    subEnvironments(path, project, environments);
}

private void subEnvironments(String path, String project, List<String> environments) {
    if (environments != null) {
        for (String environment : environments) {
            String tempPath = path + Constants.PATH_SEPARATOR + environment;
        	// 监听 root + Constants.PATH_SEPARATOR + project + onstants.PATH_SEPARATOR + environment
            List<String> services = zkClient.addChildListener(tempPath, (parent, childrens) -> {
                if (StringUtils.isNotEmpty(parent)) {
                    if (logger.isDebugEnabled()) {
                        logger.debug("fire services changes {}", childrens);
                    }
                    subServices(project, environment, childrens);
                }
            });

            subServices(project, environment, services);
        }
    }
}

如果父节点发生了变化，那么就会调用下面的方法，进行订阅：

private void subServices(String project, String environment, List<String> services) {
    if (services != null) {
        for (String service : services) {
            String subString = project + Constants.PATH_SEPARATOR + environment + Constants.PATH_SEPARATOR + service;
            if (logger.isDebugEnabled()) {
                logger.debug("subServices sub {}", subString);
            }
            subscribe(URL.valueOf(subString), urls -> {
                if (logger.isDebugEnabled()) {
                    logger.debug("change services urls =" + urls);
                }
            });
        }
    }
}

因为在fate-serving中使用的zk结构如下：
yml /FATE-SERVICES/{模块名}/{ID}/{接口名}/provider/{服务提供者信息}
从前面我们可以知道用户新的服务都是由固定的模块生成的，所以用户注册了新的服务之后，也能够被client发现。原始服务的注册在afterPropertiesSet()中进行，上面已经介绍过了。

HashedWheelTimer 定时任务

我们注意到ZookeeperRegistry的基类FailbackRegistry中出现了retryTimer，我们来看下它的实现。
在ZookeeperRegistry和FailbackRegistry中，任务失败后会设置：retryTimer.newTimeout(newTask, retryPeriod, TimeUnit.MILLISECONDS);
来启动一个定时重试任务，它会执行：

HashedWheelTimeout timeout = new HashedWheelTimeout(this, task, deadline);
timeouts.add(timeout);

�把任务加入队列中，worker会poll这个队列，到时间后执行任务。
HashedWheelTimer构造函数会执行worker的初始化逻辑，

workerThread = threadFactory.newThread(worker);

threadFactory是一个名称标记的线程池实现，给每个线程进行了命名。
我们继续看worker这边的run方法：

@Override
public void run() {
    // Initialize the startTime.
    startTime = System.nanoTime();
    if (startTime == 0) {
        // We use 0 as an indicator for the uninitialized value here, so make sure it's not 0 when initialized.
        startTime = 1;
    }

    // Notify the other threads waiting for the initialization at start().
    // HashedWheelTimer执行线程和worker线程之间同步
    // 等待worker初始化完成后才能添加任务
    startTimeInitialized.countDown();

    do {
        final long deadline = waitForNextTick();
        if (deadline > 0) {
            // 这里将相同tick的timeouts放到同一个bucket，就是所谓的HashedWheelBucket
            int idx = (int) (tick & mask);
            processCancelledTasks();
            HashedWheelBucket bucket =
                    wheel[idx];
            transferTimeoutsToBuckets();
            // 过期掉bucket中的所有timeouts
            bucket.expireTimeouts(deadline);
            tick++;
        }
    } while (WORKER_STATE_UPDATER.get(HashedWheelTimer.this) == WORKER_STATE_STARTED);

    // Fill the unprocessedTimeouts so we can return them from stop() method.
    for (HashedWheelBucket bucket : wheel) {
        bucket.clearTimeouts(unprocessedTimeouts);
    }
    for (; ; ) {
        // 处理所有的timeouts
        HashedWheelTimeout timeout = timeouts.poll();
        if (timeout == null) {
            break;
        }
        if (!timeout.isCancelled()) {
            unprocessedTimeouts.add(timeout);
        }
    }
    processCancelledTasks();
}

这里的逻辑就很简单，也没用小顶堆，因为这里的过期任务数量其实并不多。

路由和负载均衡

proxy模块用于路由服务的基类是BaseServingRouter，它有两个实现，一个是ConfigFileBasedServingRouter，另一个是ZkServingRouter。被用在如下地方：

HealthCheckEndPointService 用到了ConfigFileBasedServingRouter
DefaultServingRouter 用到了zkServingRouter，目前还没有实现

register模块用于路由服务的基类的RouterService，它的使用如下所示：

FederationRouterInterceptor 未实现（我没找到哪里用这个）
DefaultServingRouter 未实现
RegistedClient 路由到server
HealthCheckEndPointService 路由到fateflow
RouterService 路由到资源服务器
FateFlowModelLoader 路由到flow
DefaultFederatedRpcInvoker 未实现

我们看register这边的逻辑，负载均衡主要被路由模块使用，所以就一起看了。

register模块

我们可以看到，被AbstractRouterService使用的是LoadBalanceModel.random，RandomLoadBalance只有一个选择算法，按照这个算法，落在权重大的节点中的概率更高。

public class RandomLoadBalance extends AbstractLoadBalancer {

    public static final String NAME = "random";

    @Override
    protected List<URL> doSelect(List<URL> urls) {
        // 获取URL列表的长度
        int length = urls.size();

        // 初始化标志，表示所有URL的权重是否相同
        boolean sameWeight = true;

        // 初始化数组，用于存储每个URL的权重
        int[] weights = new int[length];

        // 获取第一个URL的权重，用于后续比较
        int firstWeight = getWeight(urls.get(0));
        weights[0] = firstWeight;

        // 初始化总权重，并加上第一个URL的权重
        int totalWeight = firstWeight;
        
        // 遍历剩余的URL，计算总权重，同时检查各个URL的权重是否相同
        for (int i = 1; i < length; i++) {
            int weight = getWeight(urls.get(i));

            weights[i] = weight;

            totalWeight += weight;
            
            // 如果有一个URL的权重不同于第一个URL，则标志位置为false
            if (sameWeight && weight != firstWeight) {
                sameWeight = false;
            }
        }

        // 如果总权重为正且不是所有URL的权重都相同，进行随机选择
        if (totalWeight > 0 && !sameWeight) {

            // 生成一个随机偏移量，范围在总权重内
            int offset = ThreadLocalRandom.current().nextInt(totalWeight);

            // 遍历URL列表，根据随机偏移量选择一个URL，使得该URL的权重占比与总权重相匹配
            for (int i = 0; i < length; i++) {
                offset -= weights[i];
                if (offset < 0) {
                    // 将选定的URL放入列表并返回
                    return Lists.newArrayList(urls.get(i));
                }
            }
        }

        // 特殊情况处理：如果总权重为非正数或所有URL的权重都相同，返回随机选择的URL
        return Lists.newArrayList(urls.get(ThreadLocalRandom.current().nextInt(length)));
    }
}

权重参数被存放在URL的private volatile transient Map numbers;中，我们可以看到这里没有修改的逻辑，所以最终都会使用默认值。

你可能感兴趣的:(推理引擎)

BaiduSitemap - Typecho站点地图生成与多搜索引擎推送插件独立开发者阿乐原创 javascript 云计算自动化大数据数据分析
文章目录BaiduSitemap-Typecho站点地图生成与多搜索引擎推送插件✨功能特点插件架构核心模块文件结构安装方法方法一：手动安装方法二：Git克隆⚙️配置说明站点地图基本设置搜索引擎配置百度搜索引擎必应（Bing）搜索引擎谷歌（Google）搜索引擎使用指南站点地图访问手动操作站点地图包含内容高级功能图片索引优化推送状态监控技术实现详解站点地图生成流程搜索引擎推送机制缓存机制❓常见问题站
具身智能基础 frostmelody 人工智能
1.MuJoCo：高保真物理仿真的核心引擎技术本质定义：MuJoCo（Multi-JointDynamicswithContact）是由EmoTodorov开发的物理仿真引擎，专注于多关节系统接触动力学的高效计算。核心突破：约束动力学模型：采用约束优化（而非传统弹簧阻尼模型）模拟物体接触，避免穿透和数值不稳定（公式：min12q˙TMq˙+q˙Tf\text{min}\frac{1}{2}\dot
什么是IDS IPS以及IDS，IPS的区别 ke0hly 应急响应网络系统安全安全
目录IDS入侵检测系统定义工作原理主要功能主要类型：主动被动局限性：IPS入侵检测系统定义为什么会有IPS？功能主要类型主动被动IDS，IPS区别，选择IDS入侵检测系统定义入侵检测即通过从网络系统中的若干关键节点收集并分析信息，监控网络中是否有违反安全策略的行为或者是否存在入侵行为。入侵检测系统通常包含3个必要的功能组件：信息来源、分析引擎和响应组件。工作原理信息收集：信息收集包括收集系统，网络
揭秘MySQL索引下推（ICP）的底层原理与高并发场景性能调优 Minxinbb 数据库 mysql 数据库 dba
引言在千万级数据量的OLTP场景中，索引下推（IndexConditionPushdown,ICP）作为MySQL5.6引入的核心优化技术，可将特定场景的查询性能提升10倍以上。本文将从InnoDB存储引擎的索引结构出发，结合B+树遍历原理，深入解析ICP的工作机制，并通过压力测试对比验证优化效果。一、索引下推的核心原理剖析1.1传统索引查询的瓶颈未启用ICP时的查询流程（以复合索引(a,b,c)
Apache SeaTunnel Flink引擎执行流程源码分析 Code Monkey’s Lab 源码分析 Flink flink 大数据架构 seatunnel
目录1.任务启动入口2.任务执行命令类：FlinkTaskExecuteCommand3.FlinkExecution的创建与初始化3.1核心组件初始化3.2关键对象说明4.任务执行：FlinkExecution.execute()5.Source处理流程5.1插件初始化5.2数据流生成6.Transform处理流程6.1插件初始化6.2转换执行7.Sink处理流程7.1插件初始化7.2数据输出执
庙算兵棋推演AI开发初探（支线-AI平台注意及tips）超自然祈祷智能决策人工智能
总是停留在stage阶段一的问题输出回放数据，在显示中发现一动不动，发现stage字段一直是1部署阶段……解决方法：代码层面需要有type=333的行为告诉引擎部署完毕。pip卸载重装兵棋引擎这个我每次关机后都得重新来一遍，很讨厌（经过试验，此举会重新复制一个.engine_config到python包的目录）删除某文件确定发出了部署命令还没效果，看看你的用户根目录(root或者用户名)下有没有.
Alluxio在数据索引和模型分发中的核心价值与应用 Alluxio 人工智能深度学习机器学习
在当前的技术环境下，搜索、推荐、广告、大模型、自动驾驶等领域的业务依赖于海量数据的处理和复杂模型的训练。这些任务通常涉及从用户行为数据和社交网络数据中提取大量信息，进行模型训练和推理。这一过程需要强大的数据分发能力，尤其是在多个服务器同时拉取同一份数据时，更是考验基础设施的性能。在这样的背景下，AlluxioEnterpriseAI在数据索引与模型分发/部署方面展示了其独特的优势，特别是在处理海量
选择Alluxio来解决AI模型训练场景数据访问的五大理由 Alluxio 人工智能 AI 分布式大数据语言模型
在AI模型训练尤其是大模型领域，存储系统的性能和稳定性直接决定了模型训练、推理、部署任务的效率和成本。随着全球AI行业的爆发带来的数据规模的快速增长，如何高效管理和利用这些数据成为AI模型训练中的一大挑战。AI模型训练场景面临的五大难题1.数据读写性能不足在AI模型训练与推理过程中，数据的高效读写是确保计算效率的关键。然而，随着数据集的急剧增长，存储系统往往无法满足对高速数据传输的需求，导致读写性
重复原则与样本量估计：临床试验的统计引擎 qq_34062333 临床试验统计学
一、重复原则的科学内涵1.1核心目的1.1.1量化随机误差通过足够样本量估计效应值的波动范围，确保结果可重现。1.1.2避免偶然性结论避免因小样本极端结果导致的偶然性结论，确保结论稳健。1.1.3提升外推性覆盖人群异质性，提升研究结果的外推性。1.2统计学本质1.2.1标准误样本量增加，标准误减小，置信区间变窄，精度提高。二、样本量估计的四大核心参数2.1显著性水平(α)2.1.1定义I类错误概率
【企业研发】ELK开发 flyair_China django python 后端
一、ElasticSearchElasticsearch作为当前最流行的全文检索引擎之一，在众多领域展现出强大的搜索和分析能力。1.1、全文检索与精准检索的差异Elasticsearch提供两种主要的查询方式：全文检索匹配检索(Full-textMatchQuery)和精准匹配检索(ExactMatchQuery)，它们在处理查询词和索引数据时有显著区别。1.精准匹配检索(ExactMatchQu
智能体综述和参考资料整理木鱼时刻大模型人工智能
目录总体介绍核心组件记忆系统工具系统计划与推理开发框架Single-AgentMulti-Agent智能体平台技术实现通信协议角色系统对话记忆MCP协议参考链接总体介绍智能体（AIAgents）是人工智能领域的重要发展方向，它们能够通过传感器感知环境并通过执行器对环境采取行动。根据罗素和诺维格在《人工智能：一种现代方法》（2016年）中的定义，AIAgent是任何可以通过传感器感知其环境并通过执行
腾讯云TSE注册中心实战：Nacos高可用集群搭建与流量治理避坑指南大熊计算机 #腾讯云腾讯云云计算
1.为什么选择腾讯云TSE托管Nacos？在微服务架构中，注册中心承担着服务发现与配置管理的核心职能。Nacos作为阿里开源的动态服务发现组件，已成为国内微服务生态的事实标准。腾讯云微服务引擎TSE（TencentCloudServiceEngine）提供的Nacos托管服务，通过全托管架构彻底解决了自建Nacos集群的运维复杂度问题。本文将从实战角度，深入剖析：TSENacos集群的高可用架构设
Windows系统部署YOLOv5 v6.1版本的训练与推理环境保姆级教程 lujx_1024 windows YOLO
文章目录一·概述二·依赖环境(`prerequisites`)2.1硬件环境2.2软件环境三·环境安装3.1创建并激活虚拟环境3.2安装`Pytorch`与`torchvision`3.3校验`Pytorch`安装3.4下载`YOLOv5``v6.1`源码3.5安装`YOLOv5`依赖3.6下载预训练模型3.7安装其他依赖3.8测试环境安装3.9测试训练流程四·参考链接一·概述本文档主要记录使用工
三七互娱GO面经及参考答案大模型大数据攻城狮 golang epoll B树原理幻读 go面试 go面经 mysql性能
MySQL有哪些存储引擎？MyISAM如何存储数字类型数据？MySQL拥有多种存储引擎，每种都有其独特的特性和适用场景。常见的存储引擎包括InnoDB、MyISAM、Memory、CSV、Archive、Federated等。InnoDB是MySQL5.5版本之后的默认存储引擎，它支持事务、外键、行级锁和崩溃恢复功能，适合处理高并发事务型应用。MyISAM是早期MySQL的默认存储引擎，不支持事务
大模型的“Tomcat”：一文读懂AI推理引擎（Inference Engine) 人工智能
本文已收录在Github，关注我，紧跟本系列专栏文章，咱们下篇再续！魔都架构师|全网30W技术追随者大厂分布式系统/数据中台实战专家主导交易系统百万级流量调优&车联网平台架构AIGC应用开发先行者|区块链落地实践者以技术驱动创新，我们的征途是改变世界！实战干货：编程严选网1推理引擎是啥？从熟悉的“服务器”说起，想象你用Java写好了一个业务应用，如订单处理服务，打成一个JAR或WAR包。这包能直接
Python编程：使用 YOLO 目标检测倔强老吕 python 开发语言
YOLO（YouOnlyLookOnce）是一种基于深度学习的实时目标检测算法，由JosephRedmon等人于2016年首次提出。与传统的两阶段目标检测方法（如R-CNN系列）不同，YOLO将目标检测任务视为一个单一的回归问题，直接在图像上进行一次推理即可预测边界框和类别概率。YOLO的核心思想单次前向传播（SingleShotDetection）：YOLO只需对输入图像进行一次神经网络推理，就
多云环境密钥硬核防护：KDPS如何实现千万级密钥生命周期管理？安当加密安全
当GitHub2023年报告显示63%的数据泄露源自测试环境时，某证券公司因测试机密钥硬编码导致量化模型被盗的教训，揭示了多云时代的安全真相：分散的密钥管理=为黑客铺就黄金路。上海安当KDPS关键数据保护系统，以国密认证的KSP密钥中台+HSM硬件加密机为核心，构建千万级密钥的“中央管控引擎”。本文从三大维度拆解其硬核能力：一、密钥管理“铁三角”：集中化、自动化、合规化能力维度传统方案痛点KDPS
【通过pip安装 Open-WebUI 快速使用入门】慕慕涵雪月光白 llama 代理模式
OpenWebUI是一个可扩展、功能丰富且用户友好的自托管AI平台，旨在完全离线操作。它支持各种LLM运行器，如Ollama和OpenAI兼容的API，内置RAG推理引擎，使其成为强大的AI部署解决方案。使用Docker快速入门如果Ollama在您的计算机上，请使用以下命令：dockerrun-d-p3000:8080--add-host=host.docker.internal:host-gat
虚幻引擎UE多语言设计与实现污领巾虚幻 java 数据库
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、启用本地化功能二、创建本地化文本使用文本本地化文件三、UI文本本地化UMG本地化：Slate本地化：四、音频和资产本地化五、运行时语言切换设置当前文化：蓝图实现切换：测试和打包前言在虚幻引擎（UnrealEngine）中实现游戏**多语言（本地化，Localization）**功能，是比较成熟的一套机制。可以通过以下几
虚幻引擎编程反射系统实现污领巾虚幻 php 游戏引擎
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言1、反射的核心实现流程1.1宏定义标记1.2UnrealHeaderTool(UHT)处理1.3生成的代码结构1.4运行时反射数据注册2、反射系统的关键数据结构2.1UClass2.2UProperty及其派生类2.3UFunction3、反射的实际应用场景3.1蓝图与C++交互3.2序列化与反序列化3.3网络同步（Rep
大模型商用格局雏形初现：Tokens用量决高下，火山引擎问鼎2024 QbitAl 火山引擎人工智能
明敏发自凹非寺量子位|公众号QbitAI大模型应用落地元年，谁家业务更值得关注？Tokens使用量，正在成为最关键的衡量指标。量子位结合市场数据观察，2024下半年国内大模型商用落地日均Tokens消耗量翻了近10倍，从1000亿级规模到10000亿规模，只用了6个月，月复合增长率达到45%。其中，10-12月增长进一步提速。其中，只有1家云厂商商用Tokens日均消耗量的月均复合增长率超过60%
浏览器的垃圾回收机制甘露寺 js 浏览器 javascript 前端
深入解析现代浏览器的垃圾回收机制：分代回收与标记清除算法本文详细探讨了Chrome、Firefox等现代浏览器中JavaScript引擎的垃圾回收（GC）原理，重点讲解分代回收策略和标记清除/整理算法的工作流程，并通过示例帮助理解内存自动管理背后的机制。为什么需要垃圾回收？JavaScript是一种自动内存管理的语言。开发者通常不需要手动分配或释放内存（如C/C++中的malloc/free）。这
✨【CosyVoice2-0.5B 实战】Segmentation fault (core dumped) 终极解决方案（保姆级教程）杨靳言先语音识别语音生成 python 人工智能
【CosyVoice2-0.5B实战】Segmentationfault(coredumped)终极解决方案|torchaudio.save崩溃全流程排查与替代方案（保姆级教程）“运行没报错就是胜利，结果没崩溃就是奇迹。”——每一位搞TTS的开发者内心独白本文聚焦使用CosyVoice2-0.5B进行TTS推理过程中，常见的torchaudio.save()崩溃问题——Segmentationfa
Bagel: 开源协作式AI数据管理平台的使用指南 llzwxh888 人工智能 python
Bagel:开源协作式AI数据管理平台的使用指南引言在人工智能和机器学习领域，高质量的数据集对于模型训练和推理至关重要。Bagel作为一个开源的协作式AI数据管理平台，为开发者和研究人员提供了一个强大的工具，用于创建、共享和管理推理数据集。本文将深入探讨Bagel的特性、安装方法以及如何使用它来处理和管理向量数据。Bagel简介Bagel（OpenInferenceplatformforAI）可以
第6篇：中间件——Gin的请求处理管道 GO兔中间件 gin
引言：被低估的Gin灵魂组件作者:GO兔博客:https://luckxgo.cn分享大家都看得懂的博客大多数Gin开发者只会用gin.Default()初始化引擎，却从未思考过这行代码背后的玄机——它悄悄为你注入了整个请求处理的"神经系统"。中间件不是可有可无的附加功能，而是Gin架构的核心骨架，决定了你的应用能走多远、飞多快。本文将带你撕开中间件的神秘面纱：从底层实现原理到20+企业级实战案例
ADIOS2 介绍与使用指南东北豆子哥 HPC/MPI HPC
文章目录ADIOS2介绍与使用指南什么是ADIOS2?ADIOS2的主要特点ADIOS2核心概念ADIOS2安装Linux系统安装Windows安装ADIOS2基本使用C++示例Python示例ADIOS2高级特性并行I/O流模式ADIOS2引擎类型性能优化建议总结ADIOS2介绍与使用指南什么是ADIOS2?ADIOS2(AdaptableInputOutputSystemversion2)是一
嵌入式环境下的C++最佳实践 is0815 c++开发语言
目标：学习嵌入式环境下的C++最佳实践内存管理优化：避免动态分配为什么避免动态分配？堆内存分配（如malloc,new）开销大，速度慢。堆内存容易导致碎片化，增加内存压力。动态分配增加内存泄漏、使用后未释放等风险。实时、高性能系统（嵌入式、游戏引擎）尤其需要优化内存管理。栈vs堆的性能对比特性栈(stack)堆(heap)分配/释放速度极快(O(1))较慢(需管理分配表，O(logn)或更慢)生命
【5步通关！】C#企业级知识库实战——从0到1打造智能知识共享平台的魔法指南！墨瑾轩一起学学C#【三】c#开发语言
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣你的团队还在用“纸质文件+Excel”管理知识？或者想让员工像“知识魔法师”一样秒速找到所需信息？今天，我们将用5个“魔法步骤”，手把手教你用C#打造企业级知识共享平台！无论你是“技术小白”还是“架构老司机”，这篇文章都将为你揭秘如何让知识库像“超级搜索引擎”
单表高效管理异构数据：点位管理引擎快速上手指南 DolphinDB智臾科技工业物联网物联网 DolphinDB 物联网点位点位管理数据处理
点位即设备上用于采集、监测和控制的各类传感器和执行器，是物联网应用场景中最重要的数据单位，通过对众多点位进行管理，企业可以实现设备监控预警、实时监测等方案。高效地存储和管理点位数据对于每一个企业和用户而言都是至关重要的。在本篇文章中，我们将详细介绍如何使用DolphinDB点位管理引擎（IOTDB引擎）来管理和存储复杂的点位数据，提升点位数据管理效率。本教程提供完整的测试代码和测试数据，初学者也可
合规型区块链RWA系统解决方案报告——机构资产数字化的终极武器 Ashlee_guweng22346 区块链需求分析架构 python eclipse c#git
（跨境金融科技解决方案白皮书）一、直击机构客户四大痛点痛点传统方案缺陷我们的破局点✖️跨境资产流动性差结算周期30+天，摩擦成本超8%▶️7×24h全球实时交易（速度提升90%）✖️合规成本飙升KYC/AML人工审核占成本35%+▶️自动化合规引擎（成本降低50%）✖️资产透明度缺失多层中介导致权属不清▶️链上全生命周期溯源（100%防篡改）✖️新型资产配置难非标资产难分割、难定价▶️碎片化代币发
设计模式介绍 tntxia 设计模式
设计模式来源于土木工程师克里斯托弗亚历山大（http://en.wikipedia.org/wiki/Christopher_Alexander）的早期作品。他经常发表一些作品，内容是总结他在解决设计问题方面的经验，以及这些知识与城市和建筑模式之间有何关联。有一天，亚历山大突然发现，重复使用这些模式可以让某些设计构造取得我们期望的最佳效果。亚历山大与萨拉-石川佳纯和穆雷西乐弗斯坦合作
android高级组件使用(一) 百合不是茶 android RatingBar Spinner
1、自动完成文本框（AutoCompleteTextView） AutoCompleteTextView从EditText派生出来，实际上也是一个文本编辑框，但它比普通编辑框多一个功能：当用户输入一个字符后，自动完成文本框会显示一个下拉菜单，供用户从中选择，当用户选择某个菜单项之后，AutoCompleteTextView按用户选择自动填写该文本框。使用AutoCompleteTex
[网络与通讯]路由器市场大有潜力可挖掘 comsci 网络
如果国内的电子厂商和计算机设备厂商觉得手机市场已经有点饱和了,那么可以考虑一下交换机和路由器市场的进入问题..... 这方面的技术和知识,目前处在一个开放型的状态,有利于各类小型电子企业进入 &nbs
自写简单Redis内存统计shell 商人shang Linux shell 统计Redis内存
#!/bin/bash address="192.168.150.128:6666,192.168.150.128:6666" hosts=(${address//,/ }) sfile="staticts.log" for hostitem in ${hosts[@]} do ipport=(${hostitem
单例模式(饿汉 vs懒汉) oloz 单例模式
package 单例模式; /* * 应用场景:保证在整个应用之中某个对象的实例只有一个 * 单例模式种的《懒汉模式》 * */ public class Singleton { //01 将构造方法私有化，外界就无法用new Singleton()的方式获得实例 private Singleton(){}; //02 申明类得唯一实例 priva
springMvc json支持杨白白 json springmvc
1.Spring mvc处理json需要使用jackson的类库，因此需要先引入jackson包 2在spring mvc中解析输入为json格式的数据:使用@RequestBody来设置输入 @RequestMapping("helloJson") public @ResponseBody JsonTest helloJson() {
android播放，掃描添加本地音頻文件小桔子
最近幾乎沒有什麽事情，繼續鼓搗我的小東西。想在項目中加入一個簡易的音樂播放器功能，就像華為p6桌面上那麼大小的音樂播放器。用過天天動聽或者QQ音樂播放器的人都知道，可已通過本地掃描添加歌曲。不知道他們是怎麼實現的，我覺得應該掃描設備上的所有文件，過濾出音頻文件，每個文件實例化為一個實體，記錄文件名、路徑、歌手、類型、大小等信息。具體算法思想，
oracle常用命令 aichenglong oracle dba 常用命令
1 创建临时表空间 create temporary tablespace user_temp tempfile 'D:\oracle\oradata\Oracle9i\user_temp.dbf' size 50m autoextend on next 50m maxsize 20480m extent management local
25个Eclipse插件 AILIKES eclipse插件
提高代码质量的插件1. FindBugsFindBugs可以帮你找到Java代码中的bug，它使用Lesser GNU Public License的自由软件许可。2. CheckstyleCheckstyle插件可以集成到Eclipse IDE中去，能确保Java代码遵循标准代码样式。3. ECLemmaECLemma是一款拥有Eclipse Public License许可的免费工具，它提供了
Spring MVC拦截器+注解方式实现防止表单重复提交 baalwolf spring mvc
原理：在新建页面中Session保存token随机码，当保存时验证，通过后删除，当再次点击保存时由于服务器端的Session中已经不存在了，所有无法验证通过。 1.新建注解： ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
《Javascript高级程序设计(第3版)》闭包理解 bijian1013 JavaScript
“闭包是指有权访问另一个函数作用域中的变量的函数。”--《Javascript高级程序设计(第3版)》看以下代码： <script type="text/javascript"> function outer() { var i = 10; return f
AngularJS Module类的方法 bijian1013 JavaScript AngularJS Module
AngularJS中的Module类负责定义应用如何启动，它还可以通过声明的方式定义应用中的各个片段。我们来看看它是如何实现这些功能的。一.Main方法在哪里如果你是从Java或者Python编程语言转过来的，那么你可能很想知道AngularJS里面的main方法在哪里？这个把所
[Maven学习笔记七]Maven插件和目标 bit1129 maven插件
插件(plugin)和目标(goal) Maven，就其本质而言，是一个插件执行框架，Maven的每个目标的执行逻辑都是由插件来完成的，一个插件可以有1个或者几个目标，比如maven-compiler-plugin插件包含compile和testCompile，即maven-compiler-plugin提供了源代码编译和测试源代码编译的两个目标使用插件和目标使得我们可以干预
【Hadoop八】Yarn的资源调度策略 bit1129 hadoop
1. Hadoop的三种调度策略 Hadoop提供了3中作业调用的策略， FIFO Scheduler Fair Scheduler Capacity Scheduler 以上三种调度算法，在Hadoop MR1中就引入了，在Yarn中对它们进行了改进和完善.Fair和Capacity Scheduler用于多用户共享的资源调度 2. 多用户资源共享的调度
Nginx使用Linux内存加速静态文件访问 ronin47
Nginx是一个非常出色的静态资源web服务器。如果你嫌它还不够快，可以把放在磁盘中的文件，映射到内存中，减少高并发下的磁盘IO。先做几个假设。nginx.conf中所配置站点的路径是/home/wwwroot/res，站点所对应文件原始存储路径：/opt/web/res shell脚本非常简单，思路就是拷贝资源文件到内存中，然后在把网站的静态文件链接指向到内存中即可。具体如下：
关于Unity3D中的Shader的知识 brotherlamp unity unity资料 unity教程 unity视频 unity自学
首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，然后我们来看下Unity3D自带的60多个S
CopyOnWriteArrayList vs ArrayList bylijinnan java
package com.ljn.base; import java.util.ArrayList; import java.util.Iterator; import java.util.List; import java.util.concurrent.CopyOnWriteArrayList; /** * 总述： * 1.ArrayListi不是线程安全的，CopyO
内存中栈和堆的区别 chicony 内存
1、内存分配方面：堆：一般由程序员分配释放，若程序员不释放，程序结束时可能由OS回收。注意它与数据结构中的堆是两回事，分配方式是类似于链表。可能用到的关键字如下：new、malloc、delete、free等等。栈：由编译器(Compiler)自动分配释放，存放函数的参数值，局部变量的值等。其操作方式类似于数据结构中
回答一位网友对Scala的提问 chenchao051 scala map
本来准备在私信里直接回复了，但是发现不太方便，就简要回答在这里。问题写道对于scala的简洁十分佩服，但又觉得比较晦涩，例如一例，Map("a" -> List(11,111)).flatMap(_._2)，可否说下最后那个函数做了什么，真正在开发的时候也会如此简洁？谢谢先回答一点，在实际使用中，Scala毫无疑问就是这么简单。
mysql 取每组前几条记录 daizj mysql 分组最大值最小值每组三条记录
一、对分组的记录取前N条记录：例如：取每组的前3条最大的记录 1.用子查询： SELECT * FROM tableName a WHERE 3> (SELECT COUNT(*) FROM tableName b WHERE b.id=a.id AND b.cnt>a. cnt) ORDER BY a.id,a.account DE
HTTP深入浅出 http请求 dcj3sjt126com http
HTTP(HyperText Transfer Protocol)是一套计算机通过网络进行通信的规则。计算机专家设计出HTTP，使HTTP客户（如Web浏览器）能够从HTTP服务器(Web服务器)请求信息和服务，HTTP目前协议的版本是1.1.HTTP是一种无状态的协议，无状态是指Web浏览器和Web服务器之间不需要建立持久的连接，这意味着当一个客户端向服务器端发出请求，然后We
判断MySQL记录是否存在方法比较 dcj3sjt126com mysql
把数据写入到数据库的时，常常会碰到先要检测要插入的记录是否存在，然后决定是否要写入。　　我这里总结了判断记录是否存在的常用方法：　　sql语句： select count ( * ) from tablename; 　　然后读取count(*)的值判断记录是否存在。对于这种方法性能上有些浪费，我们只是想判断记录记录是否存在，没有必要全部都查出来。
对HTML XML的一点认识 e200702084 html xml
感谢http://www.w3school.com.cn提供的资料 HTML 文档中的每个成分都是一个节点。节点根据 DOM，HTML 文档中的每个成分都是一个节点。 DOM 是这样规定的：整个文档是一个文档节点每个 HTML 标签是一个元素节点包含在 HTML 元素中的文本是文本节点每一个 HTML 属性是一个属性节点注释属于注释节点 Node 层次
jquery分页插件 genaiwei jquery Web 前端分页插件
//jquery页码控件// 创建一个闭包 (function($) { // 插件的定义 $.fn.pageTool = function(options) { var totalPa
Mybatis与Ibatis对照入门于学习 Josh_Persistence mybatis ibatis 区别联系
一、为什么使用IBatis/Mybatis 对于从事 Java EE 的开发人员来说，iBatis 是一个再熟悉不过的持久层框架了，在 Hibernate、JPA 这样的一站式对象 / 关系映射（O/R Mapping）解决方案盛行之前，iBaits 基本是持久层框架的不二选择。即使在持久层框架层出不穷的今天，iBatis 凭借着易学易用、
C中怎样合理决定使用那种整数类型？秋风扫落叶 c 数据类型
如果需要大数值(大于32767或小于32767), 使用long 型。否则, 如果空间很重要 (如有大数组或很多结构), 使用 short 型。除此之外, 就使用 int 型。如果严格定义的溢出特征很重要而负值无关紧要, 或者你希望在操作二进制位和字节时避免符号扩展的问题, 请使用对应的无符号类型。但是, 要注意在表达式中混用有符号和无符号值的情况。 &nbs
maven问题 zhb8015 maven问题
问题1： Eclipse 中新建maven项目无法添加src/main/java 问题 eclipse创建maevn web项目，在选择maven_archetype_web原型后，默认只有src/main/resources这个Source Floder。按照maven目录结构，添加src/main/ja
(二)androidpn-server tomcat版源码解析之--push消息处理 spjich java androdipn 推送
在 (一)androidpn-server tomcat版源码解析之--项目启动这篇中，已经描述了整个推送服务器的启动过程，并且把握到了消息的入口即XmppIoHandler这个类，今天我将继续往下分析下面的核心代码，主要分为3大块，链接创建，消息的发送，链接关闭。先贴一段XmppIoHandler的部分代码 /** * Invoked from an I/O proc
用js中的formData类型解决ajax提交表单时文件不能被serialize方法序列化的问题中华好儿孙 JavaScript Ajax Web 上传文件 FormData
var formData = new FormData($("#inputFileForm")[0]); $.ajax({ type:'post', url:webRoot+"/electronicContractUrl/webapp/uploadfile", data:formData, async: false, ca
mybatis常用jdbcType数据类型 ysj5125094 mybatis mapper jdbcType
MyBatis 通过包含的jdbcType 类型 BIT FLOAT CHAR