EdwardsWang丶

Flink 1.17 Flink-SQL-Gateway HiveServer2 源码分析

相关内容：Flink 1.13 源码解析目录汇总

一、研究背景

最近公司想通过JDBC的方式使用flink sql gateway，Flink官方提供了HiveServer2的flink-sql-gateway使用方式，但是Flink官方这里使用的是HiveCatalog，是在代码里写死的不可配置的，由于业务上没有使用Hive的需求，考虑到想以最轻量化的方式使用该sql-gateway，于是选择将源码中的HiveCatalog修改为公司自研的Catalog。以下为在实现上述功能过程中对源码的分析。

二、源码分析

本次使用的Flink版本为Flink 1.17.0

2.1、寻找入口

首先根据官方文档可知，flink-sql-gateway的启动方式为执行 ${FLINK_HOME}/bin/sql-gateway.sh 脚本，我们来看该脚本的主要内容：
该脚本主要做了两件事：

读取config.sh的配置
执行SQL gateway的具体启动逻辑

以下是核心内容源码：

################################################################################
# SQL gateway specific logic
################################################################################

ENTRYPOINT=sql-gateway

if [[ "$1" = *--help ]] || [[ "$1" = *-h ]]; then
usage
exit 0
fi

STARTSTOP=$1

if [ -z "$STARTSTOP" ]; then
STARTSTOP="start"
fi

if [[ $STARTSTOP != "start" ]] && [[ $STARTSTOP != "start-foreground" ]] && [[ $STARTSTOP != "stop" ]] && [[ $STARTSTOP != "stop-all" ]]; then
usage
exit 1
fi

# ./sql-gateway.sh start --help, print the message to the console
if [[ "$STARTSTOP" = start* ]] && ( [[ "$*" = *--help* ]] || [[ "$*" = *-h* ]] ); then
FLINK_TM_CLASSPATH=`constructFlinkClassPath`
SQL_GATEWAY_CLASSPATH=`findSqlGatewayJar`
"$JAVA_RUN"  -classpath "`manglePathList "$FLINK_TM_CLASSPATH:$SQL_GATEWAY_CLASSPATH:$INTERNAL_HADOOP_CLASSPATHS"`" org.apache.flink.table.gateway.SqlGateway "${@:2}"
exit 0
fi

if [[ $STARTSTOP == "start-foreground" ]]; then
exec "${FLINK_BIN_DIR}"/flink-console.sh $ENTRYPOINT "${@:2}"
else
"${FLINK_BIN_DIR}"/flink-daemon.sh $STARTSTOP $ENTRYPOINT "${@:2}"
fi

在上述源码中，可以看到运行Jar包指定的主类为：org.apache.flink.table.gateway.SqlGateway，我们直接去源码中寻找该类的main方法即可找到SQL gateway的入口

2.2、HiveServer2 SQL gateway 启动流程源码分析

我们进入org.apache.flink.table.gateway.SqlGateway的main()方法内：

static void startSqlGateway(PrintStream stream, String[] args) {
    SqlGatewayOptions cliOptions = SqlGatewayOptionsParser.parseSqlGatewayOptions(args);

    if (cliOptions.isPrintHelp()) {
        SqlGatewayOptionsParser.printHelpSqlGateway(stream);
        return;
    }

    // startup checks and logging
    EnvironmentInformation.logEnvironmentInfo(LOG, "SqlGateway", args);
    SignalHandler.register(LOG);
    JvmShutdownSafeguard.installAsShutdownHook(LOG);

    // 加载配置
    DefaultContext defaultContext =
        DefaultContext.load(
            ConfigurationUtils.createConfiguration(cliOptions.getDynamicConfigs()),
            Collections.emptyList(),
            true,
            true);

    // 初始化SQL gateway
    SqlGateway gateway =
        new SqlGateway(
            defaultContext.getFlinkConfig(), SessionManager.create(defaultContext));
    try {
        Runtime.getRuntime().addShutdownHook(new ShutdownThread(gateway));

        // 启动
        gateway.start();
        gateway.waitUntilStop();
    } catch (Throwable t) {
        // User uses ctrl + c to cancel the Gateway manually
        if (t instanceof InterruptedException) {
            LOG.info("Caught " + t.getClass().getSimpleName() + ". Shutting down.");
            return;
        }
        // make space in terminal
        stream.println();
        stream.println();

        if (t instanceof SqlGatewayException) {
            // Exception that the gateway can not handle.
            throw (SqlGatewayException) t;
        } else {
            LOG.error(
                "SqlGateway must stop. Unexpected exception. This is a bug. Please consider filing an issue.",
                t);
            throw new SqlGatewayException(
                "Unexpected exception. This is a bug. Please consider filing an issue.", t);
        }
    } finally {
        gateway.stop();
    }
}

在上述代码中，主要做了几件事：

启动日志服务
加载和检查配置项
初始化SQL gateway并启动

我们主要来看SQL gateway的初始化和启动流程，首先是初始化，我们主要关注如下代码：

// 初始化SQL gateway
SqlGateway gateway =
        new SqlGateway(
                defaultContext.getFlinkConfig(), SessionManager.create(defaultContext));

SqlGateway的构造函数需要两个参数，分别是Flink的configuration和SessionManager的实例，此处SessionManager实例的构建中Flink使用的JDK1.8的特性，通过static关键字的修饰在SessionManager的接口内直接完成了SessionManagerImpl实例的构建并返回给SqlGateway的构造方法：

public interface SessionManager {

    /** Create the {@link SessionManager} with the default configuration. */
    static SessionManager create(DefaultContext defaultContext) {
        return new SessionManagerImpl(defaultContext);
    }

    ... ...
    ... ...
}

在完成实例构建后，通过gateway.start(); 方法，开始启动SQL gateway：

// 初始化SQL gateway
SqlGateway gateway =
        new SqlGateway(
                defaultContext.getFlinkConfig(), SessionManager.create(defaultContext));
try {
    Runtime.getRuntime().addShutdownHook(new ShutdownThread(gateway));
    // 启动
    gateway.start();
    gateway.waitUntilStop();
} catch (Throwable t) {
    ... ...
} finally {
    gateway.stop();
}

我们点进start()方法内：

public void start() throws Exception {
    // 启动SessionManager
    sessionManager.start();

    // 初始化SqlGatewayService对象，实际做事的对象
    SqlGatewayService sqlGatewayService = new SqlGatewayServiceImpl(sessionManager);
    try {
        // 根据配置文件中配置的sql-gateway端点类型来选择是Rest Sql-gateway还是HiveServer2 Sql-gateway
        endpoints.addAll(
                SqlGatewayEndpointFactoryUtils.createSqlGatewayEndpoint(
                        sqlGatewayService, defaultConfig));
        for (SqlGatewayEndpoint endpoint : endpoints) {
            // 启动
            endpoint.start();
        }
    } catch (Throwable t) {
        LOG.error("Failed to start the endpoints.", t);
        throw new SqlGatewayException("Failed to start the endpoints.", t);
    }
}

在这里做了几件事：

启动sessionManager
初始化SqlGatewayService对象
加载配置文件中配置的SQL-gateway类型，并根据对应的配置创建对应的端点
启动端点

首先我们来看SessionManager的启动过程，点进sessionManager.start()方法：

@Override
public void start() {
    // 构建超时检查任务
    if (checkInterval > 0 && idleTimeout > 0) {
        cleanupService = Executors.newSingleThreadScheduledExecutor();
        timeoutCheckerFuture =
                cleanupService.scheduleAtFixedRate(
                        () -> {
                            LOG.debug(
                                    "Start to cleanup expired sessions, current session count: {}",
                                    sessions.size());
                            for (Map.Entry<SessionHandle, Session> entry :
                                    sessions.entrySet()) {
                                SessionHandle sessionId = entry.getKey();
                                Session session = entry.getValue();
                                if (isSessionExpired(session)) {
                                    LOG.info("Session {} is expired, closing it...", sessionId);
                                    closeSession(session);
                                }
                            }
                            LOG.debug(
                                    "Removing expired session finished, current session count: {}",
                                    sessions.size());
                        },
                        checkInterval,
                        checkInterval,
                        TimeUnit.MILLISECONDS);
    }

    ReadableConfig conf = defaultContext.getFlinkConfig();
    
    // 构建算子任务线程池，该线程池主要用于执行实际sql-gateway的操作
    operationExecutorService =
            ThreadUtils.newThreadPool(
                    conf.get(SQL_GATEWAY_WORKER_THREADS_MIN),
                    conf.get(SQL_GATEWAY_WORKER_THREADS_MAX),
                    conf.get(SQL_GATEWAY_WORKER_KEEPALIVE_TIME).toMillis(),
                    OPERATION_POOL_NAME);
}

在SessionManager内部，Flink启动了一个超时检查任务，并构建了一个算子任务线程池，该线程池主要用于接受并提交sql-gateway的操作。

接下来看SqlGatewayEndpointFactoryUtils.createSqlGatewayEndpoint()方法：

public static List<SqlGatewayEndpoint> createSqlGatewayEndpoint(
        SqlGatewayService service, Configuration configuration) {
    // 加载 sql-gateway.endpoint.type 配置
    List<String> identifiers = configuration.get(SQL_GATEWAY_ENDPOINT_TYPE);
    
    if (identifiers == null || identifiers.isEmpty()) {
        throw new ValidationException(
                String.format(
                        "Endpoint options do not contain an option key '%s' for discovering an endpoint.",
                        SQL_GATEWAY_ENDPOINT_TYPE.key()));
    }
    // 验证参数
    validateSpecifiedEndpointsAreUnique(identifiers);
    
    List<SqlGatewayEndpoint> endpoints = new ArrayList<>();
    for (String identifier : identifiers) {
        // 根据字符串匹配对应的工厂类表示，Factory.factoryIdentifier() 获取字符标识
        // 例如 HiveServer2EndpointFactory 的标识 IDENTIFIER 为 hiveserver2
        final SqlGatewayEndpointFactory factory =
                FactoryUtil.discoverFactory(
                        Thread.currentThread().getContextClassLoader(),
                        SqlGatewayEndpointFactory.class,
                        identifier);
        
        endpoints.add(
                factory.createSqlGatewayEndpoint(
                        new DefaultEndpointFactoryContext(
                                service,
                                configuration,
                                getEndpointConfig(configuration, identifier))));
    }
    return endpoints;
}

在方法里主要是通过配置文件获取sql-gateway.endpoint.type配置项内容来获取endpoint类型，并根据该配置项内容的字符串与各个工厂类的标识进行遍历对比，来获取指定的工厂类，并创建出对应的实例。
例如我们在sql-gateway.endpoint.type中配置的为hiveServer2，则此处加载的工厂类为HiveServer2EndpointFactory，该工厂类创造出的实例为HiveServer2Endpoint。

最后Flink通过SqlGatewayEndpoint.start()方法启动对应的endpoint，此处我们调用的为HiveServer2Endpoint的start方法。
我们点进org.apache.flink.table.endpoint.hive.HiveServer2Endpoint.start()方法内部：

@Override
public void start() throws Exception {
    buildTThreadPoolServer();
    serverThread.start();
}

首先，HiveServer2Endpoint实现了Runnable接口，这是一个线程，我们点开buildTThreadPoolServer方法：

private void buildTThreadPoolServer() {
    executor =
            ThreadUtils.newThreadPool(
                    minWorkerThreads,
                    maxWorkerThreads,
                    workerKeepAliveTime.toMillis(),
                    "hiveserver2-endpoint-thread-pool");
    try {
        server =
                new TThreadPoolServer(
                        new TThreadPoolServer.Args(new TServerSocket(socketAddress))
                                .processorFactory(
                                        new TProcessorFactory(
                                                new TCLIService.Processor<>(this)))
                                .transportFactory(new TTransportFactory())
                                // Currently, only support binary mode.
                                .protocolFactory(new TBinaryProtocol.Factory())
                                .inputProtocolFactory(
                                        new TBinaryProtocol.Factory(
                                                true, true, maxMessageSize, maxMessageSize))
                                .requestTimeout(requestTimeoutMs)
                                .requestTimeoutUnit(TimeUnit.MILLISECONDS)
                                .beBackoffSlotLength(backOffSlotLengthMs)
                                .beBackoffSlotLengthUnit(TimeUnit.MILLISECONDS)
                                .executorService(executor));
    } catch (Exception e) {
        throw new SqlGatewayException("Failed to build the server.", e);
    }
}

在这里，Flink构建了一个Hive thrift服务端，准备监听端口并准备建立session，没有太多可说的，我们返回上一级，继续看HiveServer2Endpoint.start()方法中的现场启动方法。
我们来看HiveServer2Endpoint的run方法：

@Override
public void run() {
    try {
        LOG.info("HiveServer2 Endpoint begins to listen on {}.", socketAddress.toString());
        server.serve();
    } catch (Throwable t) {
        LOG.error("Exception caught by " + getClass().getSimpleName() + ". Exiting.", t);
        System.exit(-1);
    }
}

在这里，启动我们刚才构建好的服务端，开始监听我们hive-site里配置的url。

2.3、HiveServer2 SQL gateway任务执行流程

因为使用了Hive 的 thrift，所以流程上和Hive thrift的调用回调流程差不多。
举个栗子，首先我们执行一段demo代码如下：

import java.sql.Connection;
import java.sql.DriverManager;
import java.sql.ResultSet;
import java.sql.Statement;

public class JDBCConnect {
    public static void main(String[] args) throws Exception{
        try (
            // Please replace the JDBC URI with your actual host, port and database.
            Connection connection = DriverManager.getConnection("jdbc:hive2://localhost:10000/default;auth=noSasl");
            Statement statement = connection.createStatement()) {
            statement.execute("CREATE TABLE testTable4 (name STRING, age INT)");

            statement.execute("SHOW TABLES");
            ResultSet resultSet = statement.getResultSet();
            while (resultSet.next()) {
                System.out.println(resultSet.getString(1));
            }
        }
    }
}

代码执行后会以JDBC的方式通过thrift建立连接，此时会触发thrift中Server的OpenSession方法，我们进入HiveServer2Endpoint中，点进OpenSession方法：

@Override
public TOpenSessionResp OpenSession(TOpenSessionReq tOpenSessionReq) throws TException {
    LOG.debug("Client protocol version: {}.", tOpenSessionReq.getClient_protocol());
    TOpenSessionResp resp = new TOpenSessionResp();
    try {
        // negotiate connection protocol
        TProtocolVersion clientProtocol = tOpenSessionReq.getClient_protocol();
        // the session version is not larger than the server version because of the
        // min(server_version, ...)
        HiveServer2EndpointVersion sessionVersion =
                HiveServer2EndpointVersion.valueOf(
                        TProtocolVersion.findByValue(
                                Math.min(
                                        clientProtocol.getValue(),
                                        SERVER_VERSION.getVersion().getValue())));
        // prepare session environment
        Map<String, String> originSessionConf =
                tOpenSessionReq.getConfiguration() == null
                        ? Collections.emptyMap()
                        : tOpenSessionReq.getConfiguration();
        HiveConf conf = new HiveConf(hiveConf);
        Catalog hiveCatalog =
                new HiveCatalog(
                        catalogName,
                        getUsedDefaultDatabase(originSessionConf).orElse(defaultDatabase),
                        conf,
                        HiveShimLoader.getHiveVersion(),
                        allowEmbedded);
        // Trigger the creation of the HiveMetaStoreClient to use the same HiveConf. If the
        // initial HiveConf is different, it will trigger the PersistenceManagerFactory to close
        // all the alive PersistenceManager in the ObjectStore, which may get error like
        // "Persistence Manager has been closed" in the later connection.
        hiveCatalog.open();
        // create hive module lazily
        SessionEnvironment.ModuleCreator hiveModuleCreator =
                (readableConfig, classLoader) ->
                        FactoryUtil.createModule(
                                moduleName,
                                Collections.emptyMap(),
                                readableConfig,
                                classLoader);
        // set variables to HiveConf and Session's conf
        Map<String, String> sessionConfig = new HashMap<>();
        sessionConfig.put(TABLE_SQL_DIALECT.key(), SqlDialect.HIVE.name());
        sessionConfig.put(RUNTIME_MODE.key(), RuntimeExecutionMode.BATCH.name());
        sessionConfig.put(TABLE_DML_SYNC.key(), "true");
        setVariables(conf, sessionConfig, originSessionConf);
        SessionHandle sessionHandle =
                service.openSession(
                        SessionEnvironment.newBuilder()
                                .setSessionEndpointVersion(sessionVersion)
                                .registerCatalogCreator(
                                        catalogName,
                                        (readableConfig, classLoader) -> hiveCatalog)
                                .registerModuleCreatorAtHead(moduleName, hiveModuleCreator)
                                .setDefaultCatalog(catalogName)
                                .addSessionConfig(sessionConfig)
                                .build());
        // response
        resp.setStatus(OK_STATUS);
        resp.setServerProtocolVersion(sessionVersion.getVersion());
        resp.setSessionHandle(toTSessionHandle(sessionHandle));
        resp.setConfiguration(service.getSessionConfig(sessionHandle));
    } catch (Throwable t) {
        LOG.error("Failed to OpenSession.", t);
        resp.setStatus(toTStatus(t));
    }
    return resp;
}

代码比较长，但是可以清晰的看到，里面完成了几项核心工作：

加载Hive-site.xml文件内容，并构建HiveCatalog。
构建SessionHandle，SessionHandle只是作为Session的凭证信息身份信息，SqlGatewayService会根据SessionHandle来确认当前的session是谁，有哪些信息。
构建Session，将catalog信息、Hive配置信息等一些信息构建为SessionEnvironment，并封装进Session中

下面以一个表级操作为例串一遍流程：
当我们执行到代码中的“SHOW TABLES”语句时，会触发HiveServer2Endpoint的GetTables方法，我们点进该方法：

@Override
public TGetTablesResp GetTables(TGetTablesReq tGetTablesReq) throws TException {
    TGetTablesResp resp = new TGetTablesResp();
    try {
        SessionHandle sessionHandle = toSessionHandle(tGetTablesReq.getSessionHandle());
        Set<TableKind> tableKinds = toFlinkTableKinds(tGetTablesReq.getTableTypes());
        OperationHandle operationHandle =
                service.submitOperation(
                        sessionHandle,
                        createGetTablesExecutor(
                                service,
                                sessionHandle,
                                tGetTablesReq.getCatalogName(),
                                tGetTablesReq.getSchemaName(),
                                tGetTablesReq.getTableName(),
                                tableKinds));
        resp.setStatus(OK_STATUS);
        resp.setOperationHandle(
                toTOperationHandle(sessionHandle, operationHandle, TOperationType.GET_TABLES));
    } catch (Throwable t) {
        LOG.error("Failed to GetTables.", t);
        resp.setStatus(toTStatus(t));
    }
    return resp;
}

在这段代码里完成了以下工作：

拿到SessionHandle信息
将createGetTablesExecutor方法和SessionHandle构建为一个Callable executor提交给SqlGatewayService.submitOperation()来执行

在createGetTablesExecutor方法中，Flink会去调用我们在openSession中配置的Catalog的listTables方法，源码中使用的是HiveCatalog，所以此处会去找HiveCatalog的listTables方法。此处没有太多需要注意的点，就不再赘述。
我们点进SqlGatewayService.submitOperation()方法：

    @Override
    public OperationHandle submitOperation(
            SessionHandle sessionHandle, Callable<ResultSet> executor) throws SqlGatewayException {
        try {
            return getSession(sessionHandle).getOperationManager().submitOperation(executor);
        } catch (Throwable e) {
            LOG.error("Failed to submitOperation.", e);
            throw new SqlGatewayException("Failed to submitOperation.", e);
        }
    }

可以看到，Flink首先根据SessionHandle获取当前的Session，再将任务提交给这个Session的OperationManager来执行。我们点进submitOperation(executor)方法：

public OperationHandle submitOperation(Callable<ResultSet> executor) {
    OperationHandle handle = OperationHandle.create();
    Operation operation =
            new Operation(
                    handle,
                    () -> {
                        ResultSet resultSet = executor.call();
                        return ResultFetcher.fromResults(
                                handle, resultSet.getResultSchema(), resultSet.getData());
                    });
    
    submitOperationInternal(handle, operation);
    return handle;
}

再点进submitOperationInternal方法：

    private void submitOperationInternal(OperationHandle handle, Operation operation) {
        writeLock(() -> submittedOperations.put(handle, operation));
        operation.run();
    }

再点进operation.run();方法，在283行的位置有如下代码：

 FutureTask<Void> copiedTask =
        new FutureTask<Void>(work, null) {
            @Override
            protected void done() {
                LOG.debug(
                        String.format(
                                "Release the operation lock: %s when task completes.",
                                operationHandle));
                operationLock.release();
            }
        };
service.submit(copiedTask);

此处的service.submit(copiedTask); 就是将我们的任务提交到了SessionManager初始化是构建的算子线程池中执行。

到此本文的主要内容就结束了，更换Catalog只需要修改OpenSession()方法中的对应内容就可。

更多Flink源码相关内容，相关内容：Flink 1.13 源码解析目录汇总

SpringBoot集成Flink-CDC，实现对数据库数据的监听 rkmhr_sef 面试学习路线阿里巴巴 spring boot flink 数据库
一、什么是CDC？CDC是ChangeDataCapture（变更数据获取）的简称。核心思想是，监测并捕获数据库的变动（包括数据或数据表的插入、更新以及删除等），将这些变更按发生的顺序完整记录下来，写入到消息中间件中以供其他服务进行订阅及消费。二、Flink-CDC是什么？CDCConnectorsforApacheFlink是一组用于ApacheFlink的源连接器，使用变更数据捕获(CDC)从
深入解析Flink Kafka Connector的分布式流数据采集架构与底层实现数据与算法架构提升之路 #Flink flink kafka conector 源码
目录1.FlinkKafka连接器的分布式流采集架构1.1架构组成1.2分布式流模型2.数据分区分配策略3.为什么重写序列化和偏移量管理3.1与Flink分布式架构集成3.2与Flink检查点机制集成同时承接多级并行架构3.3OffsetsInitializer与细粒度偏移量控制3.4与Flink的Source接口统一4.版本兼容性管理5.有界流处理支持5.1实现原理5.2API使用示例5.3多种
7种数据结构就很对数据结构 windows
7种数据结构顺序表sqlite.hseqlite.c单链表linklist.clinklist.h双链表doulinklist.cdoulinklist.h链式栈linkstack.clinkstack.h队列SeqQueue.cSeqQueue.h树tree.c哈希表hash.c顺序表sqlite.h#ifndef__SEQLIST_H__#define__SEQLIST_H__typedefs
NVIDIA Dynamo源码编译 Luchang-Li 大模型推理引擎大模型推理引擎 dynamo
Refhttps://github.com/PyO3/maturinRust程序设计语言代码库：https://github.com/ai-dynamo/dynamohttps://github.com/ai-dynamo/nixldynamo/container/Dockerfile.vllm相关whl包官方提供了4个whl包ai_dynamo#这个包ubuntu22.04也可以用，ubuntu
Android Compose 框架按钮与交互组件模块源码深度剖析(二) &有梦想的咸鱼& Androiod Compose原理 Android开发大全 android
一、引言在现代Android应用开发中，用户交互体验至关重要。AndroidCompose作为Google推出的声明式UI工具包，为开发者提供了简洁、高效且灵活的方式来构建用户界面。其中，按钮与交互组件模块是用户与应用进行交互的重要组成部分。本文将深入剖析AndroidCompose框架中按钮与交互组件模块的源码，从基础概念到具体实现，逐步揭示其工作原理和设计思路。二、AndroidCompose
docker 内容器访问另一个容器中的服务 docker容器网络
docker中有两个容器，分别名为mq和hyperf，想在hyperf中访问mq可以使用下面的方法1.创建网络dockernetworkcreatemynetwork2.将使用到的容器(如业务容器，mysql，redis，mq等容器)都加入到网络中dockernetworkconnectmynetworkhyperfdockernetworkconnectmynetworkmqdockernetw
使用Docker部署MySQL8.0.29 九思x docker
第一步：拉取镜像dockerpullmysql:8.0.29作用：从DockerHub拉取MySQL8.0.29官方镜像。第二步：启动容器dockerrun--nameshare_mysql\--restart=always\-vmysql-data:/var/lib/mysql\-p3306:3306\-eMYSQL_ROOT_PASSWORD=root\-dmysql:8.0.29参数说明：-
宝塔安装mayfly-go mayans005 数据库
mayfly-go:web版linux(终端文件脚本进程)、数据库(mysqlpgsql)、redis(单机哨兵集群)、mongo统一管理操作平台。1、终端执行命令下载程序包wgethttps://gitee.com/objs/mayfly-go/releases/download/v1.3.0/mayfly-go-linux-amd64.zip2、在宝塔新建一个MySQL数据库，将下载程序包中的
开源项目推荐：Mayfly-go 周风队
开源项目推荐：Mayfly-gomayfly-goweb版linux(终端文件脚本进程)、数据库(mysqlpgsql高斯达梦)、redis(单机哨兵集群)、mongo统一管理操作平台。项目地址:https://gitcode.com/gh_mirrors/ma/mayfly-goMayfly-go是一个基于浏览器的统一管理操作平台，它支持多种数据库和系统管理功能。该项目主要使用Go语言和前端框架
推荐项目：Mayfly-Go - 高性能的时间序列数据库齐游菊Rosemary
推荐项目：Mayfly-Go-高性能的时间序列数据库mayfly-goweb版linux(终端文件脚本进程)、数据库(mysqlpgsql高斯达梦)、redis(单机哨兵集群)、mongo统一管理操作平台。项目地址:https://gitcode.com/gh_mirrors/ma/mayfly-go项目简介是一款由Dromara团队开发的高性能、轻量级时间序列数据库（TimeSeriesData
Mayfly-Go 开源项目教程方蕾嫒Falcon
Mayfly-Go开源项目教程mayfly-goweb版linux(终端文件脚本进程)、数据库(mysqlpgsql高斯达梦)、redis(单机哨兵集群)、mongo统一管理操作平台。项目地址:https://gitcode.com/gh_mirrors/ma/mayfly-go项目介绍Mayfly-Go是一个基于Go语言开发的开源项目，旨在提供一个轻量级、高性能的微服务框架。该项目由Dromar
记录一次truncate导致MySQL夯住的故障猿小喵 MySQL #故障诊断与恢复 #备份恢复 mysql 数据库
目录环境信息：故障描述：处理过程：原理分析：showprocesslist结果中的systemlock含义：truncate原理：1.TRUNCATE的执行流程2、TRUNCATE表导致数据库夯住的原因3、TRUNCATE表导致数据库夯住的解决方案4、killTRUNCATE语句失败后，主从数据不一致的原因：5、为什么TRUNCATETABLEusers会影响其他表的SQL6、为什么KILL语句无
《MySQL 入门教程》第 30 篇数据库索引不剪发的Tony老师 MySQL入门教程 mysql 索引 create index drop index
文章目录30.1创建索引30.2查看索引30.3修改索引30.4删除索引数据库索引（Index）就像书籍后面的关键字索引，按照关键字进行排序，并且提供了指向具体内容的页码。索引可以用于提高数据库的查询性能；但是索引需要占用额外的磁盘空间，修改数据时也需要进行索引的维护。了解并适当利用索引对于数据库的优化至关重要，本篇我们介绍MySQL索引的管理。关于B-树索引的原理以及利用索引优化SQL语句的详细
Apache大数据旭哥优选大数据选题 Apache大数据旭大数据定制选题 java hadoop spark 开发语言 idea hive 数据库架构
定制旭哥服务，一对一，无中介包安装+答疑+售后态度和技术都很重要定制按需求做要求不高就实惠一点定制需提前沟通好怎么做，这样才能避免不必要的麻烦python、flask、Django、mapreduce、mysqljava、springboot、vue、echarts、hadoop、spark、hive、hbase、flink、SparkStreaming、kafka、flume、sqoop分析+推
青少年编程与数学 02-011 MySQL数据库应用 10课题、记录的操作明月看潮生编程与数学第02阶段数据库青少年编程 mysql 编程与数学
青少年编程与数学02-011MySQL数据库应用10课题、记录的操作一、表的记录表的记录的组成示例插入记录查看记录记录的操作1.插入记录（INSERT）2.更新记录（UPDATE）3.删除记录（DELETE）4.查询记录（SELECT）记录的约束示例：带约束的表总结二、添加记录1.插入单条记录插入单条记录2.插入多条记录插入多条记录3.插入部分字段插入部分字段4.插入查询结果插入查询结果5.插入时
hive相关命令 Wang·Br bigdata 笔记 hive
hive相关命令1.hive-helphive-e:不进入hive交互窗口，执行sql语句hive-e"select*users"hive-f:执行脚本中sql语句#创建文件hqlfile1.sql，内容：select*fromusers#执行文件中的SQL语句hive-fhqlfile1.sql#执行文件中的SQL语句，将结果写入文件hive-fhqlfile1.sql>>result1.log
使用Python连接SqlServer 带带琪宝工作日记 python sqlserver 开发语言
目录cursor()execute('sqlstr')fetchall()、fetchone()cursor.description属性close()转化为dataframe进行分析使用的是pymssql库，这个库的详细用法参照博客（博客里也有官方文档，英语好的可以直接看）：pythonpymssql—pymssql模块使用指南_夏日白云的博客-CSDN博客我目前的需求只是使用Python连接数据
Python连接SQL SEVER数据库全流程 m0_74823131 数据库 python sql
背景介绍在数据分析领域，经常需要从数据库中获取数据进行分析和处理。而SQLServer是一种常用的关系型数据库管理系统，因此学习如何使用Python连接SQLServer数据库并获取数据是非常有用的。以下是Python使用pymssql连接SQLServer数据库的全流程：安装pymssql库本地账号设置脚本连接数据导入函数实现一、安装pymssqlpymssql是Python连接SQLServe
【Hive】-- hive 3.1.3 伪分布式部署（单节点） oo寻梦in记 Apache Paimon 大数据服务部署 hive 分布式 hadoop
1、环境准备1.1、版本选择apachehive3.1.3apachehadoop3.1.0oraclejdk1.8mysql8.0.15操作系统：Macos10.151.2、软件下载https://archive.apache.org/dist/hive/https://archive.apache.org/dist/hadoop/1.3、解压tar-zxvfapache-hive-4.0.0-
短视频矩阵系统源码新发布技术方案有那几种？ Yxh18137784554 短视频矩阵开发矩阵算法架构
短视频矩阵系统从21年发展到现在经历了历史性的发展高潮经过各平台的反复变化政策，短视频矩阵系统目前做的为数不多的同梯队的筷子科技、云罗抖去推、超级编导都选用的是什么方式的代发解决方案呢？今天小编就来给我的技术粉们分享下一下几种常见的开发方案#短视频矩阵系统##短视频矩阵系统还能用吗？##短视频矩阵系统源码##短视频矩阵系统代发/托管发都有什么解决方案?短视频矩阵系统源码新发布的技术方案通常有以下几
Spring Boot 项目 90% 存在这 15 个致命漏洞，你的代码在裸奔吗？风象南原创随笔 java spring boot 后端 web安全系统安全
文章首发公众号【风象南】SpringBoot作为一款广泛使用的Java开发框架，虽然为开发者提供了诸多便利，但也并非无懈可击，其安全漏洞问题不容忽视。本文将深入探讨SpringBoot常见的安全漏洞类型、产生原因以及相应的解决方案，帮助开发者更好地保障应用程序的安全。1.SQL注入漏洞漏洞描述：当应用程序使用用户输入的数据来构建SQL查询时，如果没有进行适当的过滤或转义，攻击者就可以通过构造恶意的
「MySQL」日期时间格式化函数 DATE_FORMAT() 的使用详解 m0_74823827 mysql adb android
目录一、DATE_FORMAT()语法二、格式化字符串详解三、常见日期时间格式组合四、业务场景五、总结一、DATE_FORMAT()语法DATE_FORMAT()是MySQL中用于格式化日期时间的函数：语法：DATE_FORMAT(date,format_string)date：需要格式化的日期化时间值，一般是需要被格式化的日期时间类型(datetime类)，但也可以是日期时间形式的字符串form
SQL-触发器(trigger)的详解以及代码演示 m0_74823827 面试学习路线阿里巴巴 sql 数据库服务器
一、触发器的概念触发器是一种特殊的存储过程，但是触发器不存在输入和输出参数，所以不能被显式的去调用，而是与特定的表相关联，当表中的数据发生变化时，触发器被激活并执行其定义的SQL代码。触发器可以是行级触发器（针对每一行数据变化）或语句级触发器（针对整个SQL语句的变化），行级触发器允许对每一行单独处理，而语句级触发器则在整个操作完成后执行一次。触发器的功能强化约束：触发器能够实现比CHECK语句更
Linux动静态库遥逖 Linux linux 运维服务器
Linux动静态库静态库动态库库的链接静态库核心特性：链接时机：在编译时将库代码直接嵌入到可执行文件中。文件格式：.a（Linux）、.lib（Windows）。内存占用：每个使用该库的可执行文件都会包含一份完整的库代码副本。创建静态库（.a文件）编写源代码：首先，编写你需要的库函数的源代码文件，例如mylib.c编译为目标文件：使用gcc/g++编译源码为目标文件（.o文件）g++-cmylib
后端安全可靠性 Small踢倒coffee_氕氘氚 python自学笔记经验分享
第一步应该提到参数化查询，也就是预编译语句。这是最有效的方法，比如用PDO或者预处理语句来分离数据和指令。然后，ORM框架也是一个好办法，因为它们通常自动处理参数化，减少手写SQL的机会。接下来，输入验证和过滤很重要。虽然不能完全依赖，但白名单验证比如只允许特定字符，或者转义特殊字符，比如MySQL的mysqli_real_escape_string。不过要注意转义不是绝对安全，尤其是不同数据库有
MySQL 中 int (1) 和 int (10) 的区别详解阿贾克斯的黎明游戏开发 mysql 数据库
目录MySQL中int(1)和int(10)的区别详解在MySQL数据库的使用过程中，我们创建数据表时经常会用到整数类型，比如int。而细心的开发者可能会注意到，int后面可以跟一个数字，像int(1)和int(10)，这两者到底有什么区别呢？今天我们就来深入探讨一下。在MySQL中，int类型后面括号里的数字M，代表的是显示宽度，最大取值为255。需要明确的是，这个显示宽度和该类型可以存储的范围
springboot基于bs 架构的母婴用户商城全程服务管理系统(源码+lw+部署文档+讲解等) 源码哆哆V+ymhydo Java毕设优质源码 spring boot 架构后端
具体实现截图技术栈后端框架SpringBoot采用springboot作为后台的框架，java框架具有简化配置和开发的效率。Spring框架目前是很多java开发者的首选框架，Spring主要有两大功能，控制反转和面向切面的编程。控制反转（IOC）可以实现代码的依赖注入，减少代码的耦合性，大大提高了软件质量，面向切面编程（AOP）主要是应用动态代理的技术对代码逻辑进行分离，可以实现对代码的重用，适
事务回滚核心技术 KBkongbaiKB java
一、事务回滚的数学本质与核心挑战1.1事务状态机模型操作执行持久化完成系统故障事务回滚ActivePartiallyCommittedCommittedFailedAborted1.2核心技术挑战矩阵问题维度单机事务分布式事务原子性保证存储引擎WAL日志二阶段提交协议隔离性实现MVCC多版本控制全局锁调度机制可见性管理事务ID版本链向量时钟同步回滚触发条件SQL执行异常/死锁网络分区/节点故障二、
前端开发：这就是终点吗？前端javascript
ReactHook深入浅出CSS技巧与案例详解vue2与vue3技巧合集VueUse源码解读让我们重新回到2021年后远程办公风潮兴起的日子，那时候，程序员岗位炙手可热。机会遍地都是，你甚至只需参加少量培训，通过面试后便能轻松收获年薪超15万的工作，还有余暇拍摄一段《程序员的一天》上传网络。经过短短一年左右的培训，你便踏上了年薪六位数的职业道路——那时候，当程序员似乎是一个人人羡慕的理想职业。然而
mysql8 本地安装my.ini 文件求生之路程序人生 mysql8 my.ini
[mysql]#设置mysql客户端默认字符集default-character-set=utf8[mysqld]default_authentication_plugin=mysql_native_password#设置3306端口port=3306#设置mysql的安装目录basedir=C:\ProgramFiles\mysql#设置mysql数据库的数据的存放目录，MySQL8+不需要以下
Hadoop(一) 朱辉辉33 hadoop linux
今天在诺基亚第一天开始培训大数据，因为之前没接触过Linux，所以这次一起学了，任务量还是蛮大的。首先下载安装了Xshell软件，然后公司给了账号密码连接上了河南郑州那边的服务器，接下来开始按照给的资料学习，全英文的，头也不讲解，说锻炼我们的学习能力，然后就开始跌跌撞撞的自学。这里写部分已经运行成功的代码吧. 在hdfs下，运行hadoop fs -mkdir /u
maven An error occurred while filtering resources blackproof maven 报错
转：http://stackoverflow.com/questions/18145774/eclipse-an-error-occurred-while-filtering-resources maven报错： maven An error occurred while filtering resources Maven -> Update Proje
jdk常用故障排查命令 daysinsun jvm
linux下常见定位命令： 1、jps 输出Java进程 -q 只输出进程ID的名称，省略主类的名称； -m 输出进程启动时传递给main函数的参数； &nb
java 位移运算与乘法运算周凡杨 java 位移运算乘法
对于 JAVA 编程中，适当的采用位移运算，会减少代码的运行时间，提高项目的运行效率。这个可以从一道面试题说起：问题：用最有效率的方法算出2 乘以8 等於几?” 答案：2 << 3 由此就引发了我的思考，为什么位移运算会比乘法运算更快呢？其实简单的想想，计算机的内存是用由 0 和 1 组成的二
java中的枚举(enmu) g21121 java
从jdk1.5开始，java增加了enum(枚举)这个类型，但是大家在平时运用中还是比较少用到枚举的，而且很多人和我一样对枚举一知半解，下面就跟大家一起学习下enmu枚举。先看一个最简单的枚举类型，一个返回类型的枚举： public enum ResultType { /** * 成功 */ SUCCESS, /** * 失败 */ FAIL,
MQ初级学习 510888780 activemq
1.下载ActiveMQ 去官方网站下载：http://activemq.apache.org/ 2.运行ActiveMQ 解压缩apache-activemq-5.9.0-bin.zip到C盘，然后双击apache-activemq-5.9.0-\bin\activemq-admin.bat运行ActiveMQ程序。启动ActiveMQ以后，登陆：http://localhos
Spring_Transactional_Propagation 布衣凌宇 spring transactional
//事务传播属性 @Transactional(propagation=Propagation.REQUIRED)//如果有事务，那么加入事务，没有的话新创建一个 @Transactional(propagation=Propagation.NOT_SUPPORTED)//这个方法不开启事务 @Transactional(propagation=Propagation.REQUIREDS_N
我的spring学习笔记12-idref与ref的区别 aijuans spring
idref用来将容器内其他bean的id传给<constructor-arg>/<property>元素，同时提供错误验证功能。例如： <bean id ="theTargetBean" class="..." /> <bean id ="theClientBean" class=&quo
Jqplot之折线图 antlove js jquery Web timeseries jqplot
timeseriesChart.html <script type="text/javascript" src="jslib/jquery.min.js"></script> <script type="text/javascript" src="jslib/excanvas.min.js&
JDBC中事务处理应用百合不是茶 java JDBC编程事务控制语句
解释事务的概念; 事务控制是sql语句中的核心之一;事务控制的作用就是保证数据的正常执行与异常之后可以恢复事务常用命令: Commit提交
[转]ConcurrentHashMap Collections.synchronizedMap和Hashtable讨论 bijian1013 java 多线程线程安全 HashMap
在Java类库中出现的第一个关联的集合类是Hashtable，它是JDK1.0的一部分。 Hashtable提供了一种易于使用的、线程安全的、关联的map功能，这当然也是方便的。然而，线程安全性是凭代价换来的――Hashtable的所有方法都是同步的。此时，无竞争的同步会导致可观的性能代价。Hashtable的后继者HashMap是作为JDK1.2中的集合框架的一部分出现的，它通过提供一个不同步的
ng-if与ng-show、ng-hide指令的区别和注意事项 bijian1013 JavaScript AngularJS
angularJS中的ng-show、ng-hide、ng-if指令都可以用来控制dom元素的显示或隐藏。ng-show和ng-hide根据所给表达式的值来显示或隐藏HTML元素。当赋值给ng-show指令的值为false时元素会被隐藏，值为true时元素会显示。ng-hide功能类似，使用方式相反。元素的显示或
【持久化框架MyBatis3七】MyBatis3定义typeHandler bit1129 TypeHandler
什么是typeHandler? typeHandler用于将某个类型的数据映射到表的某一列上，以完成MyBatis列跟某个属性的映射内置typeHandler MyBatis内置了很多typeHandler，这写typeHandler通过org.apache.ibatis.type.TypeHandlerRegistry进行注册，比如对于日期型数据的typeHandler，
上传下载文件rz,sz命令 bitcarter linux命令rz
刚开始使用rz上传和sz下载命令：因为我们是通过secureCRT终端工具进行使用的所以会有上传下载这样的需求：我遇到的问题： sz下载A文件10M左右，没有问题但是将这个文件A再传到另一天服务器上时就出现传不上去，甚至出现乱码，死掉现象，具体问题解决方法：上传命令改为;rz -ybe 下载命令改为：sz -be filename 如果还是有问题：那就是文
通过ngx-lua来统计nginx上的虚拟主机性能数据 ronin47 ngx-lua　统计解禁ip
介绍以前我们为nginx做统计,都是通过对日志的分析来完成.比较麻烦,现在基于ngx_lua插件,开发了实时统计站点状态的脚本,解放生产力.项目主页: https://github.com/skyeydemon/ngx-lua-stats 功能支持分不同虚拟主机统计, 同一个虚拟主机下可以分不同的location统计. 可以统计与query-times request-time
java-68-把数组排成最小的数。一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的。例如输入数组{32, 321}，则输出32132 bylijinnan java
import java.util.Arrays; import java.util.Comparator; public class MinNumFromIntArray { /** * Q68输入一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的一个。 * 例如输入数组{32, 321}，则输出这两个能排成的最小数字32132。请给出解决问题
Oracle基本操作 ccii Oracle SQL总结 Oracle SQL语法 Oracle基本操作 Oracle SQL
一、表操作 1. 常用数据类型 NUMBER(p,s)：可变长度的数字。p表示整数加小数的最大位数，s为最大小数位数。支持最大精度为38位 NVARCHAR2(size)：变长字符串，最大长度为4000字节（以字符数为单位） VARCHAR2(size)：变长字符串，最大长度为4000字节（以字节数为单位） CHAR(size)：定长字符串，最大长度为2000字节，最小为1字节，默认
[强人工智能]实现强人工智能的路线图 comsci 人工智能
1：创建一个用于记录拓扑网络连接的矩阵数据表 2:自动构造或者人工复制一个包含10万个连接(1000*1000)的流程图 3：将这个流程图导入到矩阵数据表中 4：在矩阵的每个有意义的节点中嵌入一段简单的
给Tomcat，Apache配置gzip压缩(HTTP压缩)功能 cwqcwqmax9 apache
背景： HTTP 压缩可以大大提高浏览网站的速度，它的原理是，在客户端请求网页后，从服务器端将网页文件压缩，再下载到客户端，由客户端的浏览器负责解压缩并浏览。相对于普通的浏览过程HTML ,CSS,Javascript , Text ，它可以节省40%左右的流量。更为重要的是，它可以对动态生成的，包括CGI、PHP , JSP , ASP , Servlet,SHTML等输出的网页也能进行压缩，
SpringMVC and Struts2 dashuaifu struts2 springMVC
SpringMVC VS Struts2 1: spring3开发效率高于struts 2: spring3 mvc可以认为已经100%零配置 3: struts2是类级别的拦截，一个类对应一个request上下文， springmvc是方法级别的拦截，一个方法对应一个request上下文，而方法同时又跟一个url对应所以说从架构本身上 spring3 mvc就容易实现r
windows常用命令行命令 dcj3sjt126com windows cmd command
在windows系统中，点击开始－运行，可以直接输入命令行，快速打开一些原本需要多次点击图标才能打开的界面，如常用的输入cmd打开dos命令行，输入taskmgr打开任务管理器。此处列出了网上搜集到的一些常用命令。winver 检查windows版本 wmimgmt.msc 打开windows管理体系结构(wmi) wupdmgr windows更新程序 wscrip
再看知名应用背后的第三方开源项目 dcj3sjt126com ios
知名应用程序的设计和技术一直都是开发者需要学习的，同样这些应用所使用的开源框架也是不可忽视的一部分。此前《 iOS第三方开源库的吐槽和备忘》中作者ibireme列举了国内多款知名应用所使用的开源框架，并对其中一些框架进行了分析，同样国外开发者 @iOSCowboy也在博客中给我们列出了国外多款知名应用使用的开源框架。另外txx's blog中详细介绍了 Facebook Paper使用的第三
Objective-c单例模式的正确写法 jsntghf 单例 ios iPhone
一般情况下，可能我们写的单例模式是这样的： #import <Foundation/Foundation.h> @interface Downloader : NSObject + (instancetype)sharedDownloader; @end #import "Downloader.h" @implementation
jquery easyui datagrid 加载成功，选中某一行 hae jquery easyui datagrid 数据加载
1.首先你需要设置datagrid的onLoadSuccess $( '#dg' ).datagrid({onLoadSuccess : function (data){ $( '#dg' ).datagrid( 'selectRow' ,3); }}); 2.onL
jQuery用户数字打分评价效果 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/5.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery用户数字打分评分代码 - HoverTree</
mybatis的paramType kerryg DAO sql
MyBatis传多个参数： 1、采用#{0},#{1}获得参数： Dao层函数方法： public User selectUser(String name,String area); 对应的Mapper.xml <select id="selectUser" result
centos 7安装mysql5.5 MrLee23 centos
首先centos7 已经不支持mysql，因为收费了你懂得，所以内部集成了mariadb，而安装mysql的话会和mariadb的文件冲突，所以需要先卸载掉mariadb，以下为卸载mariadb，安装mysql的步骤。 #列出所有被安装的rpm package rpm -qa | grep mariadb #卸载 rpm -e mariadb-libs-5.
利用thrift来实现消息群发 qifeifei thrift
Thrift项目一般用来做内部项目接偶用的，还有能跨不同语言的功能，非常方便，一般前端系统和后台server线上都是3个节点，然后前端通过获取client来访问后台server，那么如果是多太server，就是有一个负载均衡的方法，然后最后访问其中一个节点。那么换个思路，能不能发送给所有节点的server呢，如果能就
实现一个sizeof获取Java对象大小 teasp java HotSpot 内存对象大小 sizeof
由于Java的设计者不想让程序员管理和了解内存的使用，我们想要知道一个对象在内存中的大小变得比较困难了。本文提供了可以获取对象的大小的方法，但是由于各个虚拟机在内存使用上可能存在不同，因此该方法不能在各虚拟机上都适用，而是仅在hotspot 32位虚拟机上，或者其它内存管理方式与hotspot 32位虚拟机相同的虚拟机上适用。
SVN错误及处理 xiangqian0505 SVN提交文件时服务器强行关闭
在SVN服务控制台打开资源库“SVN无法读取current” ---摘自网络写道 SVN无法读取current修复方法 Can't read file : End of file found 文件：repository/db/txn_current、repository/db/current 其中current记录当前最新版本号，txn_current记录版本库中版本