蒋含竹

ChunJun源码分析——任务提交

- 任务提交的参数配置解析
- ChunJun任务-SYNC
- ChunJun任务-SQL

版本 ChunJun 1.12
注：阅读过Spark任务提交、Flink任务提交源码的朋友，应该可以看出“从SHELL提交到任务，到反射执行实际的FLINK应用代码（main方法）”部分和Spark、Flink非常相似

任务提交的参数配置解析

任务提交命令样例

# 手动执行的内容-样例
sh bin/chunjun-local.sh  -job my-examples/task_script_multi_table.json

# chunjun打印的信息-样例
start command: /usr/lib/jvm/java-1.8.0-openjdk-1.8.0.292.b10-1.el7_9.x86_64/bin/java -cp /home/chunjun/chunjun-dist/../lib/* com.dtstack.chunjun.client.Launcher -job my-examples/task_script_multi_table.json -mode local -jobType sync -chunjunDistDir /home/chunjun/chunjun-dist

该命令会执行Java，运行class com.dtstack.chunjun.client.Launcher的main方法

package com.dtstack.chunjun.client;

// import ...

public class Launcher {
    // code ...

    public static void main(String[] args) throws Exception {
        OptionParser optionParser = new OptionParser(args);
        Options launcherOptions = optionParser.getOptions();

        findDefaultConfigDir(launcherOptions);

        List<String> argList = optionParser.getProgramExeArgList();

        // 将argList转化为HashMap，方便通过参数名称来获取参数值
        HashMap<String, String> temp = new HashMap<>(16);
        for (int i = 0; i < argList.size(); i += 2) {
            temp.put(argList.get(i), argList.get(i + 1));
        }

        // 清空list，填充修改后的参数值
        argList.clear();
        for (int i = 0; i < temp.size(); i++) {
            argList.add(temp.keySet().toArray()[i].toString());
            argList.add(temp.values().toArray()[i].toString());
        }

        JobDeployer jobDeployer = new JobDeployer(launcherOptions, argList);

        ClusterClientHelper clusterClientHelper;
        switch (ClusterMode.getByName(launcherOptions.getMode())) {
            case local:
                clusterClientHelper = new LocalClusterClientHelper();
                break;
            case standalone:
                clusterClientHelper = new StandaloneClusterClientHelper();
                break;
            case yarnSession:
                clusterClientHelper = new YarnSessionClusterClientHelper();
                break;
            case yarnPerJob:
                clusterClientHelper = new YarnPerJobClusterClientHelper();
                break;
            case yarnApplication:
                throw new ClusterDeploymentException(
                        "Application Mode not supported by Yarn deployments.");
            case kubernetesSession:
                clusterClientHelper = new KubernetesSessionClusterClientHelper();
                break;
            case kubernetesPerJob:
                throw new ClusterDeploymentException(
                        "Per-Job Mode not supported by Kubernetes deployments.");
            case kubernetesApplication:
                clusterClientHelper = new KubernetesApplicationClusterClientHelper();
                break;
            default:
                throw new ClusterDeploymentException(
                        launcherOptions.getMode() + " Mode not supported.");
        }

        // add ext class
        URLClassLoader urlClassLoader = (URLClassLoader) Launcher.class.getClassLoader();
        List<URL> jarUrlList = ExecuteProcessHelper.getExternalJarUrls(launcherOptions.getAddjar());
        ClassLoaderManager.loadExtraJar(jarUrlList, urlClassLoader);
        clusterClientHelper.submit(jobDeployer);
    }

    // code ...
}

当调用optionParser.getProgramExeArgList()时，会通过job参数对应的值（即文件路径）读取文件的内容（sync、sql脚本）

package com.dtstack.chunjun.options;

// import ...

public class OptionParser {

    @VisibleForTesting protected static final String OPTION_JOB = "job";

    // code ...

    public List<String> getProgramExeArgList() throws Exception {
        Map<String, Object> mapConf = MapUtil.objectToMap(properties);
        List<String> args = new ArrayList<>();
        for (Map.Entry<String, Object> one : mapConf.entrySet()) {
            String key = one.getKey();
            Object value = one.getValue();
            if (value == null) {
                continue;
            } else if (OPTION_JOB.equalsIgnoreCase(key)) {
                File file = new File(value.toString());
                try (FileInputStream in = new FileInputStream(file)) {
                    byte[] fileContent = new byte[(int) file.length()];
                    in.read(fileContent);
                    value =
                            URLEncoder.encode(
                                    new String(fileContent, StandardCharsets.UTF_8),
                                    StandardCharsets.UTF_8.name());
                }
            }
            args.add("-" + key);
            args.add(value.toString());
        }
        return args;
    }

    // code ...
}

不同类型的任务会走不同的ClusterClientHelper，例如LocalClusterClientHelper

package com.dtstack.chunjun.client.local;

// import ...

public class LocalClusterClientHelper implements ClusterClientHelper {
    @Override
    public ClusterClient submit(JobDeployer jobDeployer) throws Exception {
        String[] args = jobDeployer.getProgramArgs().toArray(new String[0]);
        Main.main(args);
        return null;
    }
}

接着LocalClusterClientHelper会执行Main中的main方法，传入参数（其他模式下也是类似的，会利用PluginInfoUtil.getMainClass()获取到要执行的class）
之前提交的args会随着调用传进main方法，经过解析、处理后，再分别按SQL、SYNC区分任务种类，将replacedJob（即我们编写的任务脚本）传入

package com.dtstack.chunjun;

// import ...

public class Main {

    public static Logger LOG = LoggerFactory.getLogger(Main.class);

    public static void main(String[] args) throws Exception {
        LOG.info("------------program params-------------------------");
        Arrays.stream(args).forEach(arg -> LOG.info("{}", arg));
        LOG.info("-------------------------------------------");

        Options options = new OptionParser(args).getOptions();
        String job = URLDecoder.decode(options.getJob(), StandardCharsets.UTF_8.name());
        String replacedJob = JobUtil.replaceJobParameter(options.getP(), job);
        Properties confProperties = PropertiesUtil.parseConf(options.getConfProp());
        StreamExecutionEnvironment env = EnvFactory.createStreamExecutionEnvironment(options);
        StreamTableEnvironment tEnv =
                EnvFactory.createStreamTableEnvironment(env, confProperties, options.getJobName());
        LOG.info(
                "Register to table configuration:{}",
                tEnv.getConfig().getConfiguration().toString());
        switch (EJobType.getByName(options.getJobType())) {
            case SQL:
                exeSqlJob(env, tEnv, replacedJob, options);
                break;
            case SYNC:
                exeSyncJob(env, tEnv, replacedJob, options);
                break;
            default:
                throw new ChunJunRuntimeException(
                        "unknown jobType: ["
                                + options.getJobType()
                                + "], jobType must in [SQL, SYNC].");
        }

        LOG.info("program {} execution success", options.getJobName());
    }

    // code ...
}

ChunJun任务-SYNC

以SYNC为例，接着会调用exeSyncJob
对于任务脚本的解析：会再依次调用parseConf和SyncConf.parseJob，最终利用Gson将任务脚本解析为com.dtstack.chunjun.conf.SyncConf对象。关键代码如下：
- exeSyncJob

package com.dtstack.chunjun;

public class Main {
    // code ...

    private static void exeSyncJob(
            StreamExecutionEnvironment env,
            StreamTableEnvironment tableEnv,
            String job,
            Options options)
            throws Exception {
        SyncConf config = parseConf(job, options);

        // code ...
    }

    // code ...
}

parseConf

package com.dtstack.chunjun;

public class Main {
    // code ...

    public static SyncConf parseConf(String job, Options options) {
        SyncConf config;
        try {
            config = SyncConf.parseJob(job);

            // code ...
        } catch (Exception e) {
            throw new ChunJunRuntimeException(e);
        }
        return config;
    }

    // code ...
}

SyncConf.parseJob

package com.dtstack.chunjun.conf;

// import ...

public class SyncConf {
    // code ...

    public static SyncConf parseJob(String jobJson) {
        SyncConf config = GsonUtil.GSON.fromJson(jobJson, SyncConf.class);
        checkJob(config);
        return config;
    }

    // code ...
}

com.dtstack.chunjun.conf.SyncConf中有成员变量JobConf job等

 package com.dtstack.chunjun.conf;

 // import ...

public class SyncConf implements Serializable {
    private static final long serialVersionUID = 1L;

    /** ChunJun job */
    private JobConf job;

    /** ChunJun提交端的插件包路径 */
    private String pluginRoot;
    /** ChunJun运行时服务器上的远程端插件包路径 */
    private String remotePluginPath;

    private String savePointPath;

    /** 本次任务所需插件jar包路径列表 */
    private List<String> syncJarList;

    // code ...
}

com.dtstack.chunjun.conf.JobConf中则有我们配置的任务脚本中的content、setting
- 可以看到content虽然在脚本中是JSONArray，但解析时目前只处理了第一条配置

package com.dtstack.chunjun.conf;

// import ...

public class JobConf implements Serializable {
    private static final long serialVersionUID = 1L;

    private LinkedList<ContentConf> content;
    private SettingConf setting = new SettingConf();

    public OperatorConf getReader() {
        return content.get(0).getReader();
    }

    public OperatorConf getWriter() {
        return content.get(0).getWriter();
    }

    public CdcConf getCdcConf() {
        return content.get(0).getRestoration();
    }

    public MappingConf getNameMapping() {
        return content.get(0).getNameMapping();
    }

    public TransformerConf getTransformer() {
        return content.get(0).getTransformer();
    }

    public LinkedList<ContentConf> getContent() {
        return content;
    }

    public void setContent(LinkedList<ContentConf> content) {
        this.content = content;
    }

    public SettingConf getSetting() {
        return setting;
    }

    public void setSetting(SettingConf setting) {
        this.setting = setting;
    }

    @Override
    public String toString() {
        return "JobConf{" + "content=" + content + ", setting=" + setting + '}';
    }
}

跳回com.dtstack.chunjun.Main，再看exeSyncJob方法

package com.dtstack.chunjun;

// import ...

public class Main {

    // code ...

    private static void exeSyncJob(
            StreamExecutionEnvironment env,
            StreamTableEnvironment tableEnv,
            String job,
            Options options)
            throws Exception {
        SyncConf config = parseConf(job, options);
        configStreamExecutionEnvironment(env, options, config);

        SourceFactory sourceFactory = DataSyncFactoryUtil.discoverSource(config, env);
        DataStream<RowData> dataStreamSource = sourceFactory.createSource();
        SpeedConf speed = config.getSpeed();
        if (speed.getReaderChannel() > 0) {
            dataStreamSource =
                    ((DataStreamSource<RowData>) dataStreamSource)
                            .setParallelism(speed.getReaderChannel());
        }

        dataStreamSource = addMappingOperator(config, dataStreamSource);

        if (null != config.getCdcConf()
                && (null != config.getCdcConf().getDdl()
                        && null != config.getCdcConf().getCache())) {
            CdcConf cdcConf = config.getCdcConf();
            DDLHandler ddlHandler = DataSyncFactoryUtil.discoverDdlHandler(cdcConf, config);

            CacheHandler cacheHandler = DataSyncFactoryUtil.discoverCacheHandler(cdcConf, config);
            dataStreamSource =
                    dataStreamSource.flatMap(
                            new RestorationFlatMap(ddlHandler, cacheHandler, cdcConf));
        }

        DataStream<RowData> dataStream;
        boolean transformer =
                config.getTransformer() != null
                        && StringUtils.isNotBlank(config.getTransformer().getTransformSql());

        if (transformer) {
            dataStream = syncStreamToTable(tableEnv, config, dataStreamSource);
        } else {
            dataStream = dataStreamSource;
        }

        if (speed.isRebalance()) {
            dataStream = dataStream.rebalance();
        }

        SinkFactory sinkFactory = DataSyncFactoryUtil.discoverSink(config);
        DataStreamSink<RowData> dataStreamSink = sinkFactory.createSink(dataStream);
        if (speed.getWriterChannel() > 0) {
            dataStreamSink.setParallelism(speed.getWriterChannel());
        }

        JobExecutionResult result = env.execute(options.getJobName());
        if (env instanceof MyLocalStreamEnvironment) {
            PrintUtil.printResult(result.getAllAccumulatorResults());
        }
    }

    // code ...
}

DataSyncFactoryUtil.discoverSource处，利用任务脚本中配置的reader名称拿到了插件的ClassName，再利用反射构建出了对应的SourceFactory
- SourceFactory对应每个connector插件，都有自己的具体实现，例如MysqlSourceFactory、KafkaSourceFactory、Elasticsearch7SourceFactory等
- DataSyncFactoryUtil下还有一个discoverSink方法，用于构建SinkFactory，原理一样

    public static SourceFactory discoverSource(SyncConf config, StreamExecutionEnvironment env) {
        try {
            String pluginName = config.getJob().getReader().getName();
            String pluginClassName = PluginUtil.getPluginClassName(pluginName, OperatorType.source);
            return ClassLoaderManager.newInstance(
                    config.getSyncJarList(),
                    cl -> {
                        Class<?> clazz = cl.loadClass(pluginClassName);
                        Constructor<?> constructor =
                                clazz.getConstructor(
                                        SyncConf.class, StreamExecutionEnvironment.class);
                        return (SourceFactory) constructor.newInstance(config, env);
                    });
        } catch (Exception e) {
            throw new ChunJunRuntimeException(e);
        }
    }

    public static SinkFactory discoverSink(SyncConf config) {
        // code ...
    }

接着exeSyncJob中调用sourceFactory.createSource()，创建了Flink的DataStream
- 查看createSource方法内部，可以发现其原理是调用了Flink的env.addSource(...)构建Source
接着exeSyncJob中根据任务脚本中的speed.readerChannel配置，对DataStreamSource的并行度进行调整
- 默认使用的是channel配置，由exeSyncJob方法中调用的configStreamExecutionEnvironment方法可以看出
接着exeSyncJob中调用了addMappingOperator，利用任务脚本中的nameMapping对表的元数据做转换
接着exeSyncJob中做了对CDC配置的处理
接着exeSyncJob中，对原始数据做了转换处理。用的转换逻辑是任务脚本中配置的transformSql，代码中主要用到了Flink的tableEnv，如下
- 将前面创建的DataStreamSource注册为Table，并创建一个视图表名（任务脚本中的reader对应的tableName）
- 调用tableEnv.sqlQuery(...)，传入transformSql，对前一步的视图表进行转换
- 最后将得到的DataStream再次创建为一个视图表名（任务脚本中的writer对应的tableName）。注：目前看起来这个逻辑没什么用，后续没用到。
接着exeSyncJob中，调用DataSyncFactoryUtil.discoverSink，生成对应的SinkFactory。再调用SinkFactory.createSink利用FlinkAPI（dataSet.addSink(..)），完成了数据输出的逻辑构建。
最终，调用env.execute(options.getJobName())，开始执行Flink任务

ChunJun任务-SQL

以SQL为例，接着会调用exeSqlJob

package com.dtstack.chunjun;

// import ...

class Main {

    // code ..

    private static void exeSqlJob(
            StreamExecutionEnvironment env,
            StreamTableEnvironment tableEnv,
            String job,
            Options options) {
        try {
            configStreamExecutionEnvironment(env, options, null);
            List<URL> jarUrlList = ExecuteProcessHelper.getExternalJarUrls(options.getAddjar());
            StatementSet statementSet = SqlParser.parseSql(job, jarUrlList, tableEnv);
            TableResult execute = statementSet.execute();
            if (env instanceof MyLocalStreamEnvironment) {
                Optional<JobClient> jobClient = execute.getJobClient();
                if (jobClient.isPresent()) {
                    PrintUtil.printResult(jobClient.get().getAccumulators().get());
                }
            }
        } catch (Exception e) {
            throw new ChunJunRuntimeException(e);
        } finally {
            FactoryUtil.getFactoryHelperThreadLocal().remove();
            TableFactoryService.getFactoryHelperThreadLocal().remove();
        }
    }

    // code ...
}

exeSqlJob方法中最关键的是调用了SqlParser.parseSql(job, jarUrlList, tableEnv)，生成Flink的StatementSet

package com.dtstack.chunjun.sql.parser;

// import ...

public class SqlParser {

    private static final char SQL_DELIMITER = ';';

    /**
     * flink support sql syntax CREATE TABLE sls_stream() with (); CREATE (TABLE|SCALA) FUNCTION
     * fcnName WITH com.dtstack.com; insert into tb1 select * from tb2;
     *
     * @param
     */
    public static StatementSet parseSql(
            String sql, List<URL> urlList, StreamTableEnvironment tableEnvironment) {

        if (StringUtils.isBlank(sql)) {
            throw new IllegalArgumentException("SQL must be not empty!");
        }

        sql = DtStringUtil.dealSqlComment(sql);
        StatementSet statement = tableEnvironment.createStatementSet();
        Splitter splitter = new Splitter(SQL_DELIMITER);
        List<String> stmts = splitter.splitEscaped(sql);
        AbstractStmtParser stmtParser = createParserChain();

        stmts.stream()
                .filter(stmt -> !Strings.isNullOrEmpty(stmt.trim()))
                .forEach(
                        stmt -> {
                            try {
                                stmtParser.handleStmt(stmt, tableEnvironment, statement, urlList);
                            } catch (Exception e) {
                                throw new ChunJunSqlParseException(
                                        PwdUtil.desensitization(stmt), e.getMessage(), e);
                            }
                        });

        return statement;
    }

    // code ...
}

parseSql中对SQL做了一系列解析
1. 调用DtStringUtil.dealSqlComment(sql)，删除注释内容
2. 调用Flink的API，创建StatementSet，后续返回，用于最后执行
3. 使用Splitter，用符号;将sql字符串进行拆分，生成了多个独立sql语句
4. 然后用责任链设计模式构建了ParserChain：UploadFileStmtParser -> CreateFunctionStmtParser -> InsertStmtParser
5. 最后用stream按顺序将每条独立的sql进行解析处理（上面的解析链）
调用createParserChain生成解析链，处理sql字符串时会依次执行：UploadFileStmtParser -> CreateFunctionStmtParser -> InsertStmtParser
1. UploadFileStmtParser
  - 字符串需符合条件：正则"(?i).*add\\s+file\\s+.+|(?i).*add\\s+jar\\s+.+"
  - 执行内容：目前是空的
2. CreateFunctionStmtParser
  - 字符串需符合条件：正则"(?i)\\s*CREATE\\s+(scalar|table|aggregate)\\s+FUNCTION\\s+(\\S+)\\s+WITH\\s+(\\S+)"
  - 执行内容：利用ClassLoader加载class，注册自定义函数UDF
3. InsertStmtParser
  - 字符串需符合条件：以insert作为起始，即INSERT语句
  - 执行内容：执行statementSet.addInsertSql(sql)，将sql添加到StatementSet中
4. 当sql字符串与前面所有的Parser都不符时，那么会调用tEnv.executeSql(stmt)，直接执行（例如CREATE语句）
当执行完对于所有sql的解析处理后，会将包含INSERT语句的StatementSet返回，最终调用statementSet.execute()
1. sql在parseSql阶段，已经先将CREATE语句执行完成
2. 在最后才将留下来的INSERT语句进行处理
3. 这样就不会出现“先INSERT表，后CREATE表”的逻辑问题

你可能感兴趣的:(BigData,#,Flink,ChunJun,flink,数据同步,大数据,源码)

【花雕学编程】Arduino FOC 之双足机器人的追踪目标移动控制驴友花雕机器人嵌入式硬件单片机 c++Arduino FOC 双足机器人的追踪目标移动控制
Arduino是一个开放源码的电子原型平台，它可以让你用简单的硬件和软件来创建各种互动的项目。Arduino的核心是一个微控制器板，它可以通过一系列的引脚来连接各种传感器、执行器、显示器等外部设备。Arduino的编程是基于C/C++语言的，你可以使用ArduinoIDE（集成开发环境）来编写、编译和上传代码到Arduino板上。Arduino还有一个丰富的库和社区，你可以利用它们来扩展Ardui
【花雕学编程】Arduino BLDC 之工业机器人关节伺服控制程序驴友花雕 Arduino BLDC 机器人嵌入式硬件单片机 c++Arduino BLDC 工业机器人关节伺服控制程序
Arduino是一个开放源码的电子原型平台，它可以让你用简单的硬件和软件来创建各种互动的项目。Arduino的核心是一个微控制器板，它可以通过一系列的引脚来连接各种传感器、执行器、显示器等外部设备。Arduino的编程是基于C/C++语言的，你可以使用ArduinoIDE（集成开发环境）来编写、编译和上传代码到Arduino板上。Arduino还有一个丰富的库和社区，你可以利用它们来扩展Ardui
【花雕学编程】Arduino BLDC 之仓储机器人抓取控制驴友花雕 Arduino BLDC 机器人嵌入式硬件单片机 c++Arduino BLDC 仓储机器人抓取控制
Arduino是一个开放源码的电子原型平台，它可以让你用简单的硬件和软件来创建各种互动的项目。Arduino的核心是一个微控制器板，它可以通过一系列的引脚来连接各种传感器、执行器、显示器等外部设备。Arduino的编程是基于C/C++语言的，你可以使用ArduinoIDE（集成开发环境）来编写、编译和上传代码到Arduino板上。Arduino还有一个丰富的库和社区，你可以利用它们来扩展Ardui
探秘 TCP TLP：从背景到实现 dog250 tcp/ip 网络网络协议
回家的路上还讨论了个关于TCPTLP的问题，闲着无事缕一缕。本文内容参考自TailLossProbe(TLP):AnAlgorithmforFastRecoveryofTailLosses以及Linux内核源码。TLP，先说缘由。自TCP引入Fastretrans机制就是为了尽力避免RTO，但如果sender发送的一系列数据包中尾包被丢弃，就没有触发dupack，sack的可能，于是就有了TLP，
Python项目之Pygame制作新年烟花！ WANGWUSAN66 pygame python 开发语言计算机经验分享源码
实现源码涉及到两个Python库：random和pygame。1.random库：randint(a,b)：返回一个在[a,b]范围内的随机整数。uniform(a,b)：返回一个在[a,b]范围内的随机浮点数。choice(sequence)：从给定的序列中随机选择一个元素。2.Pygame是一个用于制作游戏的Python模块，它包含了许多用于游戏开发和图形渲染的功能。以下是Pygame的一些主
LeetCode - 698 划分为k个相等的子集程序员阿甘华为OD算法刷题笔记 leetcode 算法 JavaScript Java Python
目录题目来源题目描述示例提示题目解析算法源码题目来源698.划分为k个相等的子集-力扣（LeetCode）题目描述给定一个整数数组nums和一个正整数k，找出是否有可能把这个数组分成k个非空子集，其总和都相等。示例输入nums=[4,3,2,3,5,2,1],k=4输出true
ESP32-S3模组上跑通esp32-camera（36）蓝天居士 ESP32-S3 ESP32-S3 camera sensor OV5640
接前一篇文章：ESP32-S3模组上跑通esp32-camera（35）一、OV5640初始化2.相机初始化及图像传感器配置上一回继续对reset函数的后一段代码进行解析。为了便于理解和回顾，再次贴出reset函数源码，在components\esp32-camera\sensors\ov5640.c中，如下：staticintreset(sensor_t*sensor){//dump_regs(
Linux 4.19内核中的内存管理：x86_64架构下的实现与源码解析 109702008 #linux系统 #linux内核编程 linux 人工智能
在现代操作系统中，内存管理是核心功能之一，它直接影响系统的性能、稳定性和多任务处理能力。Linux内核在x86_64架构下，通过复杂的机制实现了高效的内存管理，涵盖了虚拟内存、分页机制、内存分配、内存映射、内存保护、缓存管理等多个方面。本文将深入探讨这些机制，并结合Debian10所使用的Linux4.19内核源码进行解析。1.虚拟内存与分页机制在x86_64架构下，Linux内核利用虚拟地址空间
数据挖掘的常用算法北柠陌寒0207 笔记
在大数据时代,数据挖掘是最关键的工作。大数据的挖掘是从海量、不完全的、有噪声的、模糊的、随机的大型数据库中发现隐含在其中有价值的、潜在有用的信息和知识的过程,也是一种决策支持过程。其主要基于人工智能,机器学习,模式学习,统计学等。通过对大数据高度自动化地分析,做出归纳性的推理,从中挖掘出潜在的模式,可以帮助企业、商家、用户调整市场政策、减少风险、理性面对市场,并做出正确的决策。目前,在很多领域尤其
Linux内存管理：（一）物理页面分配流程及 Linux6.5源码分析（中） Albert XUU 内存管理 linux 运维服务器
《Linux6.5源码分析：内存管理系列文章》本系列文章将对内存管理相关知识进行梳理与源码分析，重点放在linux源码分析上，并结合eBPF程序对内核中内存管理机制进行数据实时拿取与分析。在进行正式介绍之前，有必要对文章引用进行提前说明。本系列文章参考了大量的博客、文章以及书籍：《深入理解Linux内核》《Linux操作系统原理与应用》《奔跑吧Linux内核》《深入理解Linux进程与内存》《基于
C/C++ 已排序的链表中删除重复项算法详解及源码猿来如此yyy C/C++算法详解及源码算法 c语言 c++计算机视觉排序算法数据结构链表
已排序的链表中删除重复项的算法可以通过遍历链表的方式实现。具体步骤如下：初始化一个指针cur，指向链表的头节点。遍历链表，如果当前节点的值和下一个节点的值相同，则删除下一个节点，并将当前节点的next指针指向下一个节点的next指针，即将当前节点与下一个节点的重复项跳过。如果当前节点的值和下一个节点的值不同，则将指针cur指向下一个节点。优点：时间复杂度为O(n)，其中n为链表的长度，算法只需要一
大数据生态的Apache RocketMQ5.0 Apache RocketMQ java 开发语言
本文作者：李伟-ApacheRocketMQCommitter，RocketMQPython客户端项目Owner，ApacheDorisContributor，腾讯云消息队列资深开发工程师，著有《RocketMQ分布式消息中间件(核心原理与最佳实践)》。一、RocketMqueue101RocketMQ拥有诸多出色的特性：比如多副本机制，RocketMQ支持存储层的多副本Dledger，它是基于R
图书销售数据大屏可视化一键难忘 python 开发语言信息可视化
你的技术旅程将在这里启航！本文选自专栏：可视化技术专栏100例可视化技术专栏100例，包括但不限于大屏可视化、图表可视化等等。订阅专栏用户在文章底部可下载对应案例源码以供大家深入的学习研究。每一个案例都会提供完整代码和详细的讲解，不论你是初学者还是资深开发者，这里都有适合你的内容。本专栏至少会发布100篇高质量的文章深入剖析案例。文章目录一.图书销售数据大屏可视化1.1生成图表和地图代码讲解1.2
第三章：实时流数据处理与分析深度学习客大数据技术进阶 linq c#数据分析
目录3.1流处理框架深入解析与实战Flink与KafkaStreams的性能对比：事件驱动架构的代码实现1.ApacheFlink：流处理的“性能怪兽”2.KafkaStreams：轻量级、低延迟的流式处理框架实时异常检测与报警系统：结合FlinkCEP（ComplexEventProcessing）进行实现3.2低延迟流处理优化数据流式计算中的状态管理与容错机制：FlinkCheckpointi
python爬虫之bs4解析和xpath解析 A.way30 python 爬虫开发语言 xpath
bs4解析原理:1.实例化一个BeautifulSoup对象，并且将页面源码数据加载到该对象中2.通过调用BeautifulSoup对象中相关的属性或者方法进行标签定位和数据提取如何实例化BeautifulSoup对象:frombs4importBeautifulSoupBeautifulSoup(参数一,参数二)参数一为文件描述符，参数二为解析器，一般为’lxml’一对象的实例化:1.将本地的h
vue源码理解——什么是依赖露露在前端 vue.js 前端 javascript typescript 学习架构
vue将数据变的可观测了以后，我们就知道了数据什么时候进行了改变，当数据改变的时候就去更新视图，但是去更新哪个视图呢，如果改变了一个数据，就去更新整个视图，明显这样是不合理的。最正确的方法就是——哪个视图用了这个变化的数据，哪个视图就进行更新。哪个视图用到了这个数据，也可以解读为哪个视图依赖了这个数据。那么，谁用了这个数据谁就是依赖。1、收集依赖在vue中，为每个数据创建了一个数组来存放依赖。谁用
ZooKeeper数据模型和节点类型代码指四方 zookeeper 分布式云原生大数据
ZooKeeper数据模型和节点类型ZooKeeper是一个开源的分布式协调服务，用于管理和协调分布式系统中的大数据。在ZooKeeper中，数据被组织成一个层次化的命名空间（Namespace），类似于一个标准的文件系统。每个节点（Node）都可以存储数据，并且可以设置监视器（Watcher）来监听节点的变化。ZooKeeper数据模型是基于树形结构的，每个节点都可以包含数据和子节点。数据存储在
ffmpeg源码分析：结构体成员管理系统-AVOption 风雨兼程8023 ffmpeg ffmpeg AVOption
AVOption用于在FFmpeg中描述结构体中的成员变量。一个AVOption可以包含名称，简短的帮助信息，取值等等。下面开始从代码的角度记录AVOption。AVOption结构体的定义如下所示。libavutil\Opt.h/** *AVOption */typedefstructAVOption{ constchar*name; /** *shortEnglishhelptext
linux lamp环境源码搭建教程,Linux_Lamp环境(源码包)搭建详细教程林文曦 linux lamp环境源码搭建教程
LinuxLamp环境源码包搭建详细教程一：软件准备篇Apache:httpd-2.4.7.tar.gzMySql:mysql-5.5.35.tar.gzPHP:php-5.5.7.tar.gzApr:apr-1.5.0.tar.gzApr-Util:apr-util-1.5.3.tar.gzPcre:pcre-8.32.tar.gz其他软件请apt-getinstall安装：autoconf、c
DeepSeek：突破传统的AI算法与下载排行分析 smart_ljh 行业搜索人工智能 AI
DeepSeek的AI算法突破DeepSeek相较于OpenAI以及其它平台的性能对比DeepSeek的下载排行分析（截止2025/1/28AI人工智能相关DeepSeek甚至一度被推上了搜索）未来发展趋势总结在人工智能技术飞速发展的当下，搜索引擎市场也迎来了新的变革。DeepSeek，作为一款基于深度学习技术和大数据算法的搜索引擎，以其独特的优势在国内外市场上引起了广泛关注。下面介绍一下针对De
Qt调用FFmpeg库实时播放UDP组播视频流 daqinzl qt ffmpeg 流媒体 qt ffmpeg udp组播流
基于以下参考链接，通过改进实现实时播放UDP组播视频流https://blog.csdn.net/u012532263/article/details/102736700源码在windows（qt-opensource-windows-x86-5.12.9.exe）、ubuntu20.04.6(x64)(qt-opensource-linux-x64-5.12.12.run)、以及针对arm64的
计算机毕业设计ssm旅游景点推荐系统02d989（附源码）新手必备毕设程序源码课程设计
项目运行环境配置：Jdk1.8+Tomcat7.0+Mysql+HBuilderX（Webstorm也行）+Eclispe（IntelliJIDEA,Eclispe,MyEclispe,Sts都支持）。项目技术：ssm+mybatis+Maven+mysql5.7或8.0等等组成，B/S模式+Maven管理等等。环境需要1.运行环境：最好是javajdk1.8，我们在这个平台上运行的。其他版本理论
【车牌识别】卷积神经网络CNN车牌识别【含 GUI Matlab源码 2638期】 Matlab仿真科研站 matlab
欢迎来到Matlab仿真科研站博客之家✅博主简介：热爱科研的Matlab仿真开发者，修心和技术同步精进，Matlab项目合作可私信。个人主页：Matlab仿真科研站博客之家代码获取方式：扫描文章底部QQ二维码⛳️座右铭：行百里者，半于九十；路漫漫其修远兮，吾将上下而求索。⛄更多Matlab图像处理（仿真科研站版）仿真内容点击Matlab图像处理（仿真科研站版）⛄一、CNN车牌识别简介1车牌定位1.
2000-2021年上市公司数字化转型数据（MD&A报告词频、文本统计） m0_71334485 数据 #上市公司上市公司数字化转型数字化转型上市公司
2000-2021年上市公司数字化转型数据（MD&A报告词频、文本统计）1、时间：2000-2021年2、来源：上市公司NB3、范围：上市公司4、指标：包括人工智能技术、大数据技术、云计算技术、区块链技术、数字技术运用和数字技术应用、互联网商业模式、智能制造、现代信息系统等9个维度175个词频类别、股票代码、股票简称、年报标题、年份、MD&A文本-文本总长度、MD&A文本仅中英文-文本总长度、人工
医学顶会 MICCAI‘24 | LKM-UNet: 大型内核视觉 Mamba UNet 用于医学图像分割小白学视觉医学图像处理论文解读 MICCAI 深度学习医学图像顶会医学图像处理论文解读
本文内容只为星球内部成员学习和学术交流，请勿用作他用本文内容只为星球内部成员学习和学术交流，请勿用作他用论文信息题目：LKM-UNet:LargeKernelVisionMambaUNetforMedicalImageSegmentationLKM-UNet:大型内核视觉MambaUNet用于医学图像分割作者：JinhongWang,JintaiChen,DannyChen,JianWu源码链接：
【高级篇】第7章 Elasticsearch 索引生命周期管理(ILM) JAVA和人工智能 elasticsearch 大数据搜索引擎
引言在大数据时代，有效地管理数据的生命周期是确保系统性能、成本控制和合规性的关键。Elasticsearch的索引生命周期管理（ILM）为此提供了强大的解决方案。本章将深入探讨ILM的概念、策略设计与实施、以及监控与维护的实践，帮助读者掌握这一重要领域的精髓。7.1ILM概念：数据管理的智慧策略索引生命周期管理（ILM）是Elasticsearch中的一项高级功能，它代表了一种前瞻性的数据管理哲学
java毕业设计校园共享单车管理系统源码+lw文档+mybatis+系统+mysql数据库+调试好好吃肉 mybatis mysql 数据库
java毕业设计校园共享单车管理系统源码+lw文档+mybatis+系统+mysql数据库+调试java毕业设计校园共享单车管理系统源码+lw文档+mybatis+系统+mysql数据库+调试本源码技术栈：项目架构：B/S架构开发语言：Java语言开发软件：ideaeclipse前端技术：Layui、HTML、CSS、JS、JQuery等技术后端技术：JAVA运行环境：Win10、JDK1.8数据
一线大厂的 MQ 组件实现思路和架构设计思路 java领域 java 开发语言程序人生单元测试 python
首先来看看一线大厂的架构图一线大厂的架构图如上图所示，中间是我们的MQ集群架构，在上层利用keepalived和HA-Proxy，最下面是两个大的MQ集群做一个高可用。当然了，在实际大厂里面可能就不止两个集群了，可以是很多个集群，然后集群之间利用federration插件进行数据同步。上面的生产端组件：这里面可能就有很多的架构设计，比如生产端怎么对一个容器进行缓存，举个例子，我们生产端发送消息，都
Elasticsearch 索引生命周期管理：优化大数据存储静谧星光c 大数据 elasticsearch jenkins
Elasticsearch索引生命周期管理：优化大数据存储在处理大规模数据时，存储和检索效率是至关重要的。Elasticsearch是一款功能强大的搜索和分析引擎，它的索引生命周期管理功能可以帮助我们优化大数据的存储和查询性能。本文将介绍Elasticsearch索引生命周期管理的概念，并提供相应的源代码示例。索引生命周期管理（IndexLifecycleManagement，简称ILM）是Ela
TwoSampleMR 报错解决：Error in r$status_code : $ operator is invalid for atomic vectors 生信碱移 r语言
运行以下代码的时候报错：library(TwoSampleMR)ao<-available_outcomes()简单看了下available_outcomes()函数的源码，不是TwoSampleMR的问题，应该是ieugwasr::gwasinfo函数的问题：去ieugwasr包github的issue看了看，发现作者5天前就解决了这个问题：好吧，解决方案就是重新安装一下ieugwasr包#删除
VMware Workstation 11 或者 VMware Player 7安装MAC OS X 10.10 Yosemite iwindyforest vmware mac os 10.10 workstation player
最近尝试了下VMware下安装MacOS 系统，安装过程中发现网上可供参考的文章都是VMware Workstation 10以下， MacOS X 10.9以下的文章，只能提供大概的思路，但是实际安装起来由于版本问题，走了不少弯路，所以我尝试写以下总结，希望能给有兴趣安装OSX的人提供一点帮助。写在前面的话：其实安装好后发现，由于我的th
关于《基于模型驱动的B/S在线开发平台》源代码开源的疑虑？ deathwknight JavaScript java 框架
本人从学习Java开发到现在已有10年整，从一个要自学 java买成javascript的小菜鸟，成长为只会java和javascript语言的老菜鸟（个人邮箱：[email protected]）一路走来，跌跌撞撞。用自己的三年多业余时间，瞎搞一个小东西（基于模型驱动的B/S在线开发平台，非MVC框架、非代码生成）。希望与大家一起分享，同时有许些疑虑，希望有人可以交流下平台
如何把maven项目转成web项目 Kai_Ge maven MyEclipse
创建Web工程，使用eclipse ee创建maven web工程 1.右键项目,选择Project Facets,点击Convert to faceted from 2.更改Dynamic Web Module的Version为2.5.(3.0为Java7的,Tomcat6不支持). 如果提示错误,可能需要在Java Compiler设置Compiler compl
主管？？？ Array_06 工作
转载：http://www.blogjava.net/fastzch/archive/2010/11/25/339054.html 很久以前跟同事参加的培训，同事整理得很详细，必须得转！前段时间，公司有组织中高阶主管及其培养干部进行了为期三天的管理训练培训。三天的课程下来，虽然内容较多，因对老师三天来的课程内容深有感触，故借着整理学习心得的机会，将三天来的培训课程做了一个
python内置函数大全 2002wmj python
最近一直在看python的document，打算在基础方面重点看一下python的keyword、Build-in Function、Build-in Constants、Build-in Types、Build-in Exception这四个方面，其实在看的时候发现整个《The Python Standard Library》章节都是很不错的，其中描述了很多不错的主题。先把Build-in Fu
JSP页面通过JQUERY合并行 357029540 JavaScript jquery
在写程序的过程中我们难免会遇到在页面上合并单元行的情况，如图所示如果对于会的同学可能很简单，但是对没有思路的同学来说还是比较麻烦的，提供一下用JQUERY实现的参考代码 function mergeCell(){ var trs = $("#table tr"); &nb
Java基础冰天百华 java基础
学习函数式编程 package base; import java.text.DecimalFormat; public class Main { public static void main(String[] args) { // Integer a = 4; // Double aa = (double)a / 100000; // Decimal
unix时间戳相互转换 adminjun 转换 unix 时间戳
如何在不同编程语言中获取现在的Unix时间戳(Unix timestamp)？ Java time JavaScript Math.round(new Date().getTime()/1000) getTime()返回数值的单位是毫秒 Microsoft .NET / C# epoch = (DateTime.Now.ToUniversalTime().Ticks - 62135
作为一个合格程序员该做的事 aijuans 程序员
作为一个合格程序员每天该做的事 1、总结自己一天任务的完成情况最好的方式是写工作日志，把自己今天完成了什么事情，遇见了什么问题都记录下来，日后翻看好处多多 2、考虑自己明天应该做的主要工作把明天要做的事情列出来，并按照优先级排列，第二天应该把自己效率最高的时间分配给最重要的工作 3、考虑自己一天工作中失误的地方，并想出避免下一次再犯的方法出错不要紧，最重
由html5视频播放引发的总结 ayaoxinchao html5 视频 video
前言项目中存在视频播放的功能，前期设计是以flash播放器播放视频的。但是现在由于需要兼容苹果的设备，必须采用html5的方式来播放视频。我就出于兴趣对html5播放视频做了简单的了解，不了解不知道，水真是很深。本文所记录的知识一些浅尝辄止的知识，说起来很惭愧。视频结构本该直接介绍html5的<video>的，但鉴于本人对视频
解决httpclient访问自签名https报javax.net.ssl.SSLHandshakeException: sun.security.validat bewithme httpclient
如果你构建了一个https协议的站点，而此站点的安全证书并不是合法的第三方证书颁发机构所签发，那么你用httpclient去访问此站点会报如下错误 javax.net.ssl.SSLHandshakeException: sun.security.validator.ValidatorException: PKIX path bu
Jedis连接池的入门级使用 bijian1013 redis redis数据库 jedis
Jedis连接池操作步骤如下： a.获取Jedis实例需要从JedisPool中获取； b.用完Jedis实例需要返还给JedisPool； c.如果Jedis在使用过程中出错，则也需要还给JedisPool； packag
变与不变 bingyingao 不变变亲情永恒
变与不变周末骑车转到了五年前租住的小区，曾经最爱吃的西北面馆、江西水饺、手工拉面早已不在，各种店铺都换了好几茬，这些是变的。三年前还很流行的一款手机在今天看起来已经落后的不像样子。三年前还运行的好好的一家公司，今天也已经不复存在。一座座高楼拔地而起，
【Scala十】Scala核心四：集合框架之List bit1129 scala
Spark的RDD作为一个分布式不可变的数据集合，它提供的转换操作，很多是借鉴于Scala的集合框架提供的一些函数，因此，有必要对Scala的集合进行详细的了解 1. 泛型集合都是协变的，对于List而言，如果B是A的子类，那么List[B]也是List[A]的子类，即可以把List[B]的实例赋值给List[A]变量 2. 给变量赋值(注意val关键字，a，b
Nested Functions in C bookjovi c closure
Nested Functions 又称closure，属于functional language中的概念，一直以为C中是不支持closure的，现在看来我错了，不过C标准中是不支持的，而GCC支持。既然GCC支持了closure，那么 lexical scoping自然也支持了，同时在C中label也是可以在nested functions中自由跳转的
Java-Collections Framework学习与总结-WeakHashMap BrokenDreams Collections
总结这个类之前，首先看一下Java引用的相关知识。Java的引用分为四种：强引用、软引用、弱引用和虚引用。强引用：就是常见的代码中的引用，如Object o = new Object();存在强引用的对象不会被垃圾收集
读《研磨设计模式》-代码笔记-解释器模式-Interpret bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 解释器（Interpreter）模式的意图是可以按照自己定义的组合规则集合来组合可执行对象 * * 代码示例实现XML里面1.读取单个元素的值 2.读取单个属性的值 * 多
After Effects操作&快捷键 cherishLC After Effects
1、快捷键官方文档中文版：https://helpx.adobe.com/cn/after-effects/using/keyboard-shortcuts-reference.html 英文版：https://helpx.adobe.com/after-effects/using/keyboard-shortcuts-reference.html 2、常用快捷键
Maven 常用命令 crabdave maven
Maven 常用命令 mvn archetype:generate mvn install mvn clean mvn clean complie mvn clean test mvn clean install mvn clean package mvn test mvn package mvn site mvn dependency:res
shell bad substitution daizj shell 脚本
#!/bin/sh /data/script/common/run_cmd.exp 192.168.13.168 "impala-shell -islave4 -q 'insert OVERWRITE table imeis.${tableName} select ${selectFields}, ds, fnv_hash(concat(cast(ds as string), im
Java SE 第二讲（原生数据类型 Primitive Data Type） dcj3sjt126com java
Java SE 第二讲： 1. Windows: notepad, editplus, ultraedit, gvim Linux: vi, vim, gedit 2. Java 中的数据类型分为两大类： 1）原生数据类型（Primitive Data Type） 2）引用类型（对象类型）（R
CGridView中实现批量删除 dcj3sjt126com PHP yii
1，CGridView中的columns添加 array( 'selectableRows' => 2, 'footer' => '<button type="button" onclick="GetCheckbox();" style=&
Java中泛型的各种使用 dyy_gusi java 泛型
Java中的泛型的使用：1.普通的泛型使用在使用类的时候后面的<>中的类型就是我们确定的类型。 public class MyClass1<T> {//此处定义的泛型是T private T var; public T getVar() { return var; } public void setVa
Web开发技术十年发展历程 gcq511120594 Web 浏览器数据挖掘
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
openSession()与getCurrentSession()区别： hetongfei java DAO Hibernate
来自 http://blog.csdn.net/dy511/article/details/6166134 1.getCurrentSession创建的session会和绑定到当前线程,而openSession不会。 2. getCurrentSession创建的线程会在事务回滚或事物提交后自动关闭,而openSession必须手动关闭。这里getCurrentSession本地事务(本地
第一章安装Nginx+Lua开发环境 jinnianshilongnian nginx lua openresty
首先我们选择使用OpenResty，其是由Nginx核心加很多第三方模块组成，其最大的亮点是默认集成了Lua开发环境，使得Nginx可以作为一个Web Server使用。借助于Nginx的事件驱动模型和非阻塞IO，可以实现高性能的Web应用程序。而且OpenResty提供了大量组件如Mysql、Redis、Memcached等等，使在Nginx上开发Web应用更方便更简单。目前在京东如实时价格、秒
HSQLDB In-Process方式访问内存数据库 liyonghui160com
HSQLDB一大特色就是能够在内存中建立数据库，当然它也能将这些内存数据库保存到文件中以便实现真正的持久化。先睹为快！下面是一个In-Process方式访问内存数据库的代码示例：下面代码需要引入hsqldb.jar包（hsqldb-2.2.8） import java.s
Java线程的5个使用技巧 pda158 java 数据结构
Java线程有哪些不太为人所知的技巧与用法？　　萝卜白菜各有所爱。像我就喜欢Java。学无止境，这也是我喜欢它的一个原因。日常工作中你所用到的工具，通常都有些你从来没有了解过的东西，比方说某个方法或者是一些有趣的用法。比如说线程。没错，就是线程。或者确切说是Thread这个类。当我们在构建高可扩展性系统的时候，通常会面临各种各样的并发编程的问题，不过我们现在所要讲的可能会略有不同。
开发资源大整合：编程语言篇——JavaScript（1） shoothao JavaScript
概述：本系列的资源整合来自于github中各个领域的大牛，来收藏你感兴趣的东西吧。程序包管理器管理javascript库并提供对这些库的快速使用与打包的服务。 Bower - 用于web的程序包管理。 component - 用于客户端的程序包管理，构建更好的web应用程序。 spm - 全新的静态的文件包管
避免使用终结函数 vahoa.ma java jvm C++
终结函数（finalizer）通常是不可预测的，常常也是很危险的，一般情况下不是必要的。使用终结函数会导致不稳定的行为、更差的性能，以及带来移植性问题。不要把终结函数当做C++中的析构函数（destructors）的对应物。我自己总结了一下这一条的综合性结论是这样的： 1）在涉及使用资源，使用完毕后要释放资源的情形下，首先要用一个显示的方