半岛铁子_

Flink-CDC实践（含实操步骤与截图）

文章目录

前言
Flink CDC
- 1. CDC简介
- - 1.1 什么是 CDC
  - 1.2 CDC 的种类
  - 1.3 Flink-CDC
- 2. Flink CDC 案例实操
- - 2.1 DataStream 方式的应用
  - - 2.1.1 导入依赖
    - 2.1.2 编写代码
    - 2.2.3 提交到集群运行
    - 2.1.4 断点续传savepoint
  - 2.2 FlinkSQL 方式的应用
  - - 2.2.1 代码实现
    - 2.2.2 测试
  - 2.3 自定义反序列化器
  - - 2.4 DataStream 和 FlinkSQL 方式的对比
总结
参考资料

前言

本文主要对B站的Flink视频进行学习并实操，将相关重点进行记录，当做自己的学习笔记，以便快速上手进行开发。

Flink CDC

1. CDC简介

1.1 什么是 CDC

CDC 是 Change Data Capture（变更数据获取）的简称。核心思想是，监测并捕获数据库的变动（包括数据或数据表的插入、更新以及删除等），将这些变更按发生的顺序完整记录下来，写入到消息中间件中以供其他服务进行订阅及消费。

1.2 CDC 的种类

CDC 主要分为基于查询和基于 Binlog 两种方式。

1.3 Flink-CDC

Flink 社区开发了 flink-cdc-connectors 组件，这是一个可以直接从 MySQL、PostgreSQL 等数据库直接读取全量数据和增量变更数据的 source 组件。

开源地址：https://github.com/ververica/flink-cdc-connectors

2. Flink CDC 案例实操

2.1 DataStream 方式的应用

2.1.1 导入依赖

<dependencies>
    <dependency>
        <groupId>org.apache.flinkgroupId>
        <artifactId>flink-javaartifactId>
        <version>1.12.0version>
    dependency>
    <dependency>
        <groupId>org.apache.flinkgroupId>
        <artifactId>flink-streaming-java_2.12artifactId>
        <version>1.12.0version>
    dependency>
    <dependency>
        <groupId>org.apache.flinkgroupId>
        <artifactId>flink-clients_2.12artifactId>
        <version>1.12.0version>
    dependency>
    <dependency>
        <groupId>org.apache.hadoopgroupId>
        <artifactId>hadoop-clientartifactId>
        <version>3.1.3version>
    dependency>
    <dependency>
        <groupId>mysqlgroupId>
        <artifactId>mysql-connector-javaartifactId>
        <version>5.1.49version>
    dependency>
    <dependency>
        <groupId>org.apache.flinkgroupId>
        <artifactId>flink-table-planner-blink_2.12artifactId>
        <version>1.12.0version>
    dependency>
    <dependency>
        <groupId>com.ververicagroupId>
        <artifactId>flink-connector-mysql-cdcartifactId>
        <version>2.0.0version>
    dependency>
    <dependency>
        <groupId>com.alibabagroupId>
        <artifactId>fastjsonartifactId>
        <version>1.2.75version>
    dependency>
dependencies>

<build>
    <plugins>
        <plugin>
            <groupId>org.apache.maven.pluginsgroupId>
              
            <artifactId>maven-assembly-pluginartifactId>
            <version>3.0.0version>
            <configuration>
                <descriptorRefs>
                    <descriptorRef>jar-with-dependenciesdescriptorRef>
                descriptorRefs>
            configuration>
            <executions>
                <execution>
                    <id>make-assemblyid>
                    <phase>packagephase>
                    <goals>
                        <goal>singlegoal>
                    goals>
                execution>
            executions>
        plugin>
    plugins>
build>

2.1.2 编写代码

import com.ververica.cdc.connectors.mysql.MySqlSource;
import com.ververica.cdc.connectors.mysql.table.StartupOptions;
import com.ververica.cdc.debezium.DebeziumSourceFunction;
import com.ververica.cdc.debezium.StringDebeziumDeserializationSchema;
import org.apache.flink.streaming.api.datastream.DataStreamSource;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;

/**
 * FlinkCDC
 *
 * @author hutianyi
 * @date 2022/5/30
 **/
public class FlinkCDC {
    public static void main(String[] args) throws Exception {

        //1.获取Flink执行环境
        StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
        env.setParallelism(1);

        //通过FlinkCDC构建SourceFunction
        DebeziumSourceFunction<String> sourceFunction = MySqlSource.<String>builder()
                .hostname("hadoop102")
                .port(3306)
                .username("root")
                .password("123456")
                .databaseList("cdc_test")	//监控的数据库
                .tableList("cdc_test.user_info")	//监控的数据库下的表
                .deserializer(new StringDebeziumDeserializationSchema())//反序列化
                .startupOptions(StartupOptions.initial())
                .build();
        DataStreamSource<String> dataStreamSource = env.addSource(sourceFunction);

        //3.数据打印
        dataStreamSource.print();

        //4.启动任务
        env.execute("FlinkCDC");
    }
}

开启MysqlBinlog：

sudo vim /etc/my.cnf

log-bin=mysql-bin
binlog_format=row
binlog-do-db=cdc_test

重启mysql：

sudo systemctl restart mysqld

切换至root用户，检查是否成功开启：

cd /var/lib/mysql

新建数据库和表，并写入数据：

重新查看binlog文件：

已经由154变成了926，说明binlog开启没有问题。

启动项目：

新增一条数据：

可以看到控制台已经捕获到新增的数据：

修改第二条数据：

在控制台可以看到捕获到变化的数据：

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-AGsAXj2R-1653917022942)(C:\Users\Husheng\Desktop\大数据框架学习\image-20220530170038793.png)]$

删除第二条数据：

只有before的数据。
$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-fngPkuaA-1653917022942)(C:\Users\Husheng\Desktop\大数据框架学习\image-20220530170609441.png)]$

注意到op有不同的值：

r：查询读取 c：新增 u：更新 d：删除

2.2.3 提交到集群运行

代码中开启checkpoint：

//1.1开启checkpoint
env.enableCheckpointing(5000);//5秒钟
env.getCheckpointConfig().setCheckpointTimeout(10000);
env.getCheckpointConfig().setCheckpointingMode(CheckpointingMode.EXACTLY_ONCE);
env.getCheckpointConfig().setMaxConcurrentCheckpoints(1);

env.setStateBackend(new FsStateBackend("hdfs://hadoop102:8020/cdc-test/ck"));

打包：

启动flink集群：

./start-cluster.sh

将打好的jar包上传至集群：

启动：

bin/flink run -m hadoop102:8081 -c com.tianyi.FlinkCDC ./flink-cdc-1.0-SNAPSHOT-jar-with-dependencies.jar

在Flink webui进行查看：8081端口

查看日志：

2.1.4 断点续传savepoint

给当前的 Flink 程序创建 Savepoint：

bin/flink savepoint JobId hdfs://hadoop102:8020/flink/save

关闭程序以后从 Savepoint 重启程序：

bin/flink run -s hdfs://hadoop102:8020/flink/save/... -c 全类名 flink-1.0-SNAPSHOT-jar-with-dependencies.jar

2.2 FlinkSQL 方式的应用

2.2.1 代码实现

import org.apache.flink.api.java.tuple.Tuple2;
import org.apache.flink.streaming.api.datastream.DataStream;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
import org.apache.flink.table.api.Table;
import org.apache.flink.table.api.bridge.java.StreamTableEnvironment;
import org.apache.flink.types.Row;

public class FlinkSQLCDC {
    public static void main(String[] args) throws Exception {
        //1.创建执行环境
        StreamExecutionEnvironment env =
            StreamExecutionEnvironment.getExecutionEnvironment();
        env.setParallelism(1);
        StreamTableEnvironment tableEnv = StreamTableEnvironment.create(env);
        //2.创建 Flink-MySQL-CDC 的 Source
        tableEnv.executeSql("CREATE TABLE user_info (" +
                            " id STRING primary key," +
                            " name STRING," +
                            " sex STRING" +
                            ") WITH (" +
                            " 'connector' = 'mysql-cdc'," +
                            " 'scan.startup.mode' = 'latest-offset'," +
                            " 'hostname' = 'hadoop102'," +
                            " 'port' = '3306'," +
                            " 'username' = 'root'," +
                            " 'password' = '123456'," +
                            " 'database-name' = 'cdc_test'," +
                            " 'table-name' = 'user_info'" +
                            ")");
        //3. 查询数据并转换为流输出
        Table table = tableEnv.sqlQuery("select * from user_info");
        DataStream<Tuple2<Boolean, Row>> retractStream = tableEnv.toRetractStream(table, Row.class);
        retractStream.print();
        //4. 启动
        env.execute("FlinkSQLCDC");
    }
}

启动项目：

2.2.2 测试

增添数据：

控制台捕获到变更：

2.3 自定义反序列化器

代码实现：

import com.alibaba.fastjson.JSONObject;
import com.ververica.cdc.debezium.DebeziumDeserializationSchema;
import io.debezium.data.Envelope;
import org.apache.flink.api.common.typeinfo.BasicTypeInfo;
import org.apache.flink.api.common.typeinfo.TypeInformation;
import org.apache.flink.util.Collector;
import org.apache.kafka.connect.data.Field;
import org.apache.kafka.connect.data.Schema;
import org.apache.kafka.connect.data.Struct;
import org.apache.kafka.connect.source.SourceRecord;

import java.util.List;

public class CustomerDeserializationSchema implements DebeziumDeserializationSchema<String> {


    /**
     * {
     * "db":"",
     * "tableName":"",
     * "before":{"id":"1001","name":""...},
     * "after":{"id":"1001","name":""...},
     * "op":""
     * }
     */
    @Override
    public void deserialize(SourceRecord sourceRecord, Collector<String> collector) throws Exception {

        //创建JSON对象用于封装结果数据
        JSONObject result = new JSONObject();

        //获取库名&表名
        String topic = sourceRecord.topic();
        String[] fields = topic.split("\\.");
        result.put("db", fields[1]);
        result.put("tableName", fields[2]);

        //获取before数据
        Struct value = (Struct) sourceRecord.value();
        Struct before = value.getStruct("before");
        JSONObject beforeJson = new JSONObject();
        if (before != null) {
            //获取列信息
            Schema schema = before.schema();
            List<Field> fieldList = schema.fields();

            for (Field field : fieldList) {
                beforeJson.put(field.name(), before.get(field));
            }
        }
        result.put("before", beforeJson);

        //获取after数据
        Struct after = value.getStruct("after");
        JSONObject afterJson = new JSONObject();
        if (after != null) {
            //获取列信息
            Schema schema = after.schema();
            List<Field> fieldList = schema.fields();

            for (Field field : fieldList) {
                afterJson.put(field.name(), after.get(field));
            }
        }
        result.put("after", afterJson);

        //获取操作类型
        Envelope.Operation operation = Envelope.operationFor(sourceRecord);
        result.put("op", operation);

        //输出数据
        collector.collect(result.toJSONString());

    }

    @Override
    public TypeInformation<String> getProducedType() {
        return BasicTypeInfo.STRING_TYPE_INFO;
    }
}

创建自定义序列化对象处理：

import com.tianyi.func.CustomerDeserializationSchema;
import com.ververica.cdc.connectors.mysql.MySqlSource;
import com.ververica.cdc.connectors.mysql.table.StartupOptions;
import com.ververica.cdc.debezium.DebeziumSourceFunction;
import org.apache.flink.streaming.api.datastream.DataStreamSource;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;

public class FlinkCDC2 {

    public static void main(String[] args) throws Exception {

        //1.获取Flink 执行环境
        StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
        env.setParallelism(1);

        //1.1 开启CK
//        env.enableCheckpointing(5000);
//        env.getCheckpointConfig().setCheckpointTimeout(10000);
//        env.getCheckpointConfig().setCheckpointingMode(CheckpointingMode.EXACTLY_ONCE);
//        env.getCheckpointConfig().setMaxConcurrentCheckpoints(1);
//
//        env.setStateBackend(new FsStateBackend("hdfs://hadoop102:8020/cdc-test/ck"));

        //2.通过FlinkCDC构建SourceFunction
        DebeziumSourceFunction<String> sourceFunction = MySqlSource.<String>builder()
                .hostname("hadoop102")
                .port(3306)
                .username("root")
                .password("123456")
                .databaseList("cdc_test")
//                .tableList("cdc_test.user_info")
				//使用自定义的反序列化器
                .deserializer(new CustomerDeserializationSchema())
                .startupOptions(StartupOptions.initial())
                .build();
        DataStreamSource<String> dataStreamSource = env.addSource(sourceFunction);

        //3.数据打印
        dataStreamSource.print();

        //4.启动任务
        env.execute("FlinkCDC");
    }
}

2.4 DataStream 和 FlinkSQL 方式的对比

DataStream 在 Flink1.12 和 1.13 都可以用，而 FlinkSQL 只能在 Flink1.13 使用。

DataStream 可以同时监控多库多表，而 FlinkSQL 只能监控单表。

总结

本文主要介绍了Flink CDC的概念，以及对于DataStream 和 FlinkSQL两种方式进行实操，可以直观得感受FlinkCDC的强大功能，并对两种方式进行了对比。

参考资料

https://www.bilibili.com/video/BV1wL4y1Y7Xu?p=13

oracle综合性能测试,oracle性能测试 kyle shi oracle综合性能测试
今天说一下oracle的性能测试。oracle的性能测试主要是模拟大量的sql语句操作，来对数据库服务器进行加压。在测试前，需要准备以下要模拟的sql语句，测试脚本，并将测试控制机、测试加压机、被测数据库服务器准备妥当。脚本协议选择oracle(2-Tier)，将所有要模拟的sql语句放在一个sql文件内，使用sql-plus来操作数据库载入，使用loadrunner来录制。录制好之后就是修改脚本
oracle性能测试 techcrunch oracle 数据库服务器脚本测试 loadrunner sql
今天说一下oracle的性能测试。oracle的性能测试主要是模拟大量的sql语句操作，来对数据库服务器进行加压。在测试前，需要准备以下要模拟的sql语句，测试脚本，并将测试控制机、测试加压机、被测数据库服务器准备妥当。脚本协议选择oracle（2-Tier），将所有要模拟的sql语句放在一个sql文件内，使用sql-plus来操作数据库载入，使用loadrunner来录制。录制好之后就是修改脚本
windows系统备份mysql数据库文件和备份neo4j数据库文件今天也想快点毕业数据库 mysql neo4j
1.备份mysql数据库文件mysql-u[用户名]-p[目标数据库名]<[导入文件路径].sql参数说明：[用户名]：连接MySQL数据库时使用的用户名。一般默认是root[目标数据库名]：要备份的数据库名称[导入文件路径]：保存SQL文件的路径。2.备份neo4j图数据库文件1.在备份前需要停止Neo4j服务neo4jstop2.执行备份命令neo4j-admindatabasedumpneo
windows安装mysql 今天也想快点毕业 windows mysql adb
下载MySQLInstallermysql下载地址运行安装程序双击下载好的安装程序文件（.msi格式），若弹出用户账户控制提示框，点击“是”以允许程序进行更改。在安装类型选择界面，有多种选项：DeveloperDefault（开发默认）：推荐初次安装或开发人员选择，它包含了MySQL服务器、MySQLWorkbench（可视化管理工具）、MySQLShell等常用组件，能满足大多数开发和测试需求。
Python 用 Selenium & DataFrame 提取网页内表格数据 solosoft python selenium
提取的数据导入DataFrame，方便后期处理frompandas.core.frameimportDataFramefromseleniumimportwebdriverdriver=webdriver.Edge();driver.get("http://data.eastmoney.com/hsgt/index.html")table_content=driver.find_element_b
【安装教程】Windows环境下Neo4j的安装与配置慢热型网友. 机器学习作业报告 windows neo4j
【安装教程】Windows环境下Neo4j的安装与配置Neo4j的概念一、安装前准备——JDK二、Neo4j的安装三、Neo4j的环境配置四、安装验证Neo4j的概念Neo4j是一个高性能的图形数据库管理系统，它使用图形模型来存储和处理数据。Neo4j的图形模型由节点和边组成，节点代表实体或对象，边表示它们之间的关系。节点和边都可以拥有属性，这些属性可以是任何类型的数据。Neo4j的图形模型可以轻
传参的几种形式 weixin_45776308 vue 前端原创 vue
1.form-data//登录以form-data形式传参（username，password是后端需要的参数）constformData=newFormData();formData.set("username",username);formData.set("password",password);//上传文件时也以form-data形式传参（file和id是后端需要的参数）constform
FromData传参形式： It 小白努力中… html 前端 vue.js
前端传参有很多形式下面介绍一下FromData传参！！首先模拟的是获取列表的形式向后端传递参数：1、第一要在发请求函数里new一个新的对象通过append方式向这个对象中添加参数：//获取列表getLists(){letformdata=newFormData();//new出来的对象formdata.append("pageNum",this.queryParams.page);//所传递参数f
AttributeError: module ‘sipbuild.api‘ has no attribute ‘prepare_metadata_for_build_wheel‘ 东木月六年编程Bug大总结 ubuntu python linux
在Ubuntu中安装pyqt5时报这个错误错误如下：Collectingpyqt5DownloadingPyQt5-5.15.6.tar.gz(3.2MB)━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━3.2/3.2MB44.6kB/seta0:00:00Installingbuilddependencies...doneGettingrequirementsto
Weditor安装遇到了问题:Preparing metadata (pyproject.toml) did not run successfully. BullSmall 自动化 python android
问题现象uiautomator2环境部署的时候，在安装Weditor的时候并不顺利，安装过程遇到的问题如下定位过程尼玛，耗费我2小时，借助度娘，总结下网友描述这个问题的原因：weditor不支持python3.1以上版本，要降低python版本-setup包版本太低，使用pipinstall--upgradepipsetuptools==45.2.0升级setup包先gitclonehttps:/
安装paddlex报错 Pjj_755 python paddlepaddle
CollectingpaddlexUsingcachedpaddlex-2.1.0-py3-none-any.whl.metadata(907bytes)Collectingpycocotools(frompaddlex)Usingcachedpycocotools-2.0.8-cp312-cp312-win_amd64.whl.metadata(1.1kB)Requirementalreadys
Java 连接 Redis 的两种方式码有余悸 java redis bootstrap
今天带来一期：Java通过两种方式连接Redis，如果大家对于除本内容外的疑问无法解答，可以私信找我，我来帮大家解决。前言Redis是一种高性能的键值存储数据库，广泛应用于缓存、消息队列、会话存储等场景。Java作为一门广泛使用的编程语言，提供了多种方式来连接和操作Redis。本文将介绍两种常用的Java连接Redis的方式：Jedis和Lettuce，并详细说明它们的使用方法。一、JedisJe
什么是组态软件万维组态物联网大数据前端流程图低代码
组态软件，又称监控组态软件，译自英文SCADA,即upervision,ControlandDataAcquisition(数据采集与监视控制),组态软件的应用领域很广，它可以应用于电力系统、给水系统、石油、化工等领域的数据采集与监视控制以及过程控制等诸多领域。在电力系统以及电气化铁道上又称远动系统(RTUSystem,RemoteTerminalUnit)。简单的讲，组态就是用应用软件中提供的工
django model生成docx数据库设计文档徒余途 django python 后端
django项目数据库设计文档生成直接上代码使用说明按照步骤TODO1、TODO2、TODO3之后运行文件，数据库设计文档生成在当前目录下#Desc:django项目生成doc文档#TODO注：model的Meta属性和字段属性记得添加verbose_name属性，apps.py需要添加verbose_name#TODO1.复制项目DJANGO_SETTINGS_MODULE的值#TODO2.在项
Spring 源码硬核解析系列专题（扩展篇）：Spring Batch 的恢复机制源码解析 yinlongfei_love spring batch java
在第九期中，我们深入探讨了SpringBatch的批处理流程，剖析了Job和Step的执行机制。在企业级应用中，批处理任务可能因异常（如数据库故障、网络中断）失败，如何从失败点恢复并继续执行，是SpringBatch的关键特性之一。本篇将聚焦SpringBatch的恢复机制，深入源码分析其实现原理，并补充相关图示。1.恢复机制的核心概念SpringBatch的恢复机制依赖以下组件：JobRepos
Python实战笔记-删除数据5 MMGNFT K总编程笔记
importpymysqldb=pymysql.connect(host=“127.0.0.1”,user=‘root’,password=‘11111111’,database=“pymysql_test”,port=3306)cursor=db.cursor()sql=“deletefromarticlewhereid=2”cursor.execute(sql)db.commit()db.cl
能懂！基于Springboot的用户增删查改（三层设计模式） web13688565871 面试学习路线阿里巴巴 spring boot 设计模式后端
MadebyTianlanghttps://github.com/Tianlang-create背景左家垅大学安排计算机专业的学生在期末前进行了JavaWeb的实训，Tianlang对此很疑惑：1>什么是数据库？怎么使用2>怎么在IDEA连接数据库3>怎么搭建应用DSC框架特别地，Dao层（或Repository）怎么和数据库搭上关系？Service层又怎么实现调用Dao接口？Controller
【综合项目】api系统——基于Node.js、express、mysql等技术 USER_A001 Node.js node.js express mysql api
目录0前言1初始化2注册登录2.1注册2.1.1功能：密码加密（2.3.3）2.1.1.1操作2.1.1.2bcryptjs详解2.1.2插入新用户（2.3.4）2.1.3优化：表单数据验证（2.5）2.1.3.1过时代码修正2.1.3.2关键操作2.2登录2.2.1判断密码是否正确（2.6.3）2.2.2生成JWT的Token字符串的注意点（2.6.4）3个人中心3.1更新用户基本信息3.1.1
探索Node.js全栈开发新境界：Express后端API实践项目黎玫洵Errol
探索Node.js全栈开发新境界：Express后端API实践项目todo-nodejs-apiNodeJS全栈开发之后端接口技术栈基于Node.js+Express+Mysql实现RESTFULAPI项目地址:https://gitcode.com/gh_mirrors/to/todo-nodejs-api在现代Web开发中，Node.js以其异步非阻塞I/O模型和高效的性能备受青睐。而当它邂逅
【技术随笔】Mysql数据库亿级数据表的快速迁移，详细教程及避坑指南 QTEASY量化交易随笔笔记 mysql 数据库 mysql android
迁移mysql大量数据的详细教程及避坑指南问题说明操作思路操作方法生成数据库文件批量创建空数据表批量导入数据单个导入数据暂时关闭auto_commit和数据检查：效果对比恢复mysql设置避坑指南无法dump数据到文件：报错mysqlimport命令不存在无法读取本地文件，提示Local-infile被禁用问题说明做量化交易需要大量的金融数据，通常保存在mysql数据库中，有时候我们需要将这些金融
【随笔笔记】将mysql数据迁移到群晖NAS QTEASY量化交易随笔笔记笔记 mysql 数据库
将mysql数据迁移到群晖NAS情况和问题前提条件方法1，使用管道方式传递数据方法2，导出数据为文件，复制到NAS上再导入情况和问题原本大量的金融数据保存在电脑本地硬盘的mysql数据库中，随着数据量越来越大，电脑的硬盘吃紧，正好把我的群晖NAS升级到了DS923+并且增加了4T的存储空间，可以使用Docker安装mysql并且存储空间不再是个问题，因此打算将电脑中的数据全部迁移到群晖NAS中。这
2024年linux——环境基础开发工具使用_gcc test file(4)，2024年最新程序设计+Linux运维+Web+数据库+框架+分布式 2401_83740189 程序员运维 linux 前端
最全的Linux教程，Linux从入门到精通======================linux从入门到精通(第2版)Linux系统移植Linux驱动开发入门与实战LINUX系统移植第2版Linux开源网络全栈详解从DPDK到OpenFlow第一份《Linux从入门到精通》466页====================内容简介====本书是获得了很多读者好评的Linux经典畅销书**《Linu
Python博客搭建入门教程带你玩遍北海道
本文还有配套的精品资源，点击获取简介：本项目可能是关于创建个人博客的教程，使用Python语言并可能结合Django或Flask框架。博客创建涉及到Web开发的多个重要概念和步骤，比如HTTP协议、数据库操作和用户认证等。适合初学者通过实践提升编程和Web开发技能，并逐步扩展项目功能。1.PythonWeb开发简介Python凭借其简洁的语法、强大的库支持和广泛的社区资源，已成为Web开发领域中备
后端-优秀文章 weixin_33985507 javascript 后端前端 ViewUI
理解事务-MySQL事务处理机制作者从概念到实践队MySQL的食物处理机制讲得特别详细。一个人搞定APP前后端开发使用react-native开发app，使用express开发后端。五大常见的MySQL高可用方案我们在考虑MySQL数据库的高可用的架构时，主要要考虑如下几方面：如果数据库发生了宕机或者意外中断等故障，能尽快恢复数据库的可用性，尽可能的减少停机时间，保证业务不会因为数据库的故障而中断
MySQL 索引介绍 Su米苏 mysql
MySQL中的索引类型多样，主要根据数据结构和应用场景进行分类。以下是详细的分类和说明：一、按数据结构分类B-Tree索引（实际为B+Tree）特点：适用于全值匹配、范围查询（>、20可使用(a,b)的组合索引。哈希索引特点：仅支持精确等值查询（=、IN()），查询速度极快，但不支持范围查询。支持引擎：Memory引擎显式支持，InnoDB通过自适应哈希索引（内部自动管理）隐式支持。局限性：哈希冲
大数据经典技术解析：Hadoop+Spark大数据分析原理与实践 AI天才研究院 Python实战自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术1.简介大数据时代已经来临。随着互联网、移动互联网、物联网等新兴技术的出现，海量数据开始涌现。而在这些海量数据的基础上进行有效的处理，成为迫切需要解决的问题之一。ApacheHadoop和ApacheSpark是目前主流开源大数据框架。由于其易于部署、高容错性、并行计算能力强、适应数据量大、可编程、社区支持广泛等特点，大大提升了大数据应用的效率和效果。本文通过对Hado
tidb和mysql性能优化有哪些区别大0马浓 tidb mysql
TiDB和MySQL在性能优化上的区别主要体现在架构设计、扩展方式、优化手段和适用场景等方面。以下是主要区别的总结：1.架构设计差异MySQL：单机架构（或主从复制架构），存储和计算耦合。-依赖本地磁盘或集中式存储（如SAN/NAS）。-优化集中在单机资源（CPU、内存、磁盘I/O）的合理利用。TiDB：-分布式架构，存储（TiKV）、计算（TiDBServer）、调度（PD）分离。-数据自动分片
【说说redis的缓存穿透、缓存击穿、缓存雪崩以及解决方案】冷风扇666 #NoSQL #搞懂数据库缓存 redis 数据库
Redis是一种常用的缓存技术，但在实际应用中，可能会遇到一些缓存问题，包括缓存穿透、缓存击穿和缓存雪崩等。下面是对这些问题的解释及解决方案：缓存穿透缓存穿透指的是当查询一个不存在的key时，由于缓存中不存在该数据，每次查询都需要去数据库中查找，从而导致频繁的数据库查询操作，甚至可能导致数据库宕机。解决方案包括：布隆过滤器：使用布隆过滤器对请求进行过滤，如果发现请求中的key不存在，则直接返回，避
Hive的内置函数不爱学习的小枫大数据 hive 数据仓库大数据
HIVE除了提供了类似mysql的sql的语法外，还提供了大量内置的函数，方便开发者来调用，编写功能丰富的处理程序。使用如下命令查看当前hive版本支持的所有内置函数。showfunctions;显示函数的描述信息：DESCFUNCTIONconcat;显示函数的扩展描述信息：DESCFUNCTIONEXTENDEDconcat;下面我们对其中重要的，使用频率高的函数使用进行详细讲解。1字符串函数
全面指南：使用JMeter进行性能压测与性能优化（中间件压测、数据库压测、分布式集群压测、调优） m0_74822999 面试学习路线阿里巴巴 jmeter 性能优化中间件
目录一、性能测试的指标1、并发量2、响应时间3、错误率4、吞吐量5、资源使用率二、压测全流程三、其他注意点1、并发和吞吐量的关系2、并发和线程的关系四、调优及分布式集群压测（待仔细学习）1.线程数量超过单机承载能力时的解决方案2.如何搭建分布式集群3.实施集群压测及监控4.处理集群中单台施压机报错的情况5.长时间压测（10小时）的注意事项6.处理混合场景：用户思考时间及多个服务同时压测7.开发压测
矩阵求逆（JAVA）初等行变换 qiuwanchi 矩阵求逆（JAVA）
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(初等行变换) * @author 邱万迟 *
JDK timer antlove java jdk schedule code timer
1.java.util.Timer.schedule(TimerTask task, long delay)：多长时间（毫秒）后执行任务 2.java.util.Timer.schedule(TimerTask task, Date time)：设定某个时间执行任务 3.java.util.Timer.schedule(TimerTask task, long delay,longperiod
JVM调优总结 -Xms -Xmx -Xmn -Xss coder_xpf jvm 应用服务器
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx
JDBC连接数据库 Array_06 jdbc
package Util; import java.sql.Connection; import java.sql.DriverManager; import java.sql.ResultSet; import java.sql.SQLException; import java.sql.Statement; public class JDBCUtil { //完
Unsupported major.minor version 51.0（jdk版本错误） oloz java
java.lang.UnsupportedClassVersionError: cn/support/cache/CacheType : Unsupported major.minor version 51.0 (unable to load class cn.support.cache.CacheType) at org.apache.catalina.loader.WebappClassL
用多个线程处理1个List集合 362217990 多线程 thread list 集合
昨天发了一个提问，启动5个线程将一个List中的内容，然后将5个线程的内容拼接起来，由于时间比较急迫，自己就写了一个Demo，希望对菜鸟有参考意义。。 import java.util.ArrayList; import java.util.List; import java.util.concurrent.CountDownLatch; public c
JSP简单访问数据库香水浓 sql mysql jsp
学习使用javaBean，代码很烂，仅为留个脚印 public class DBHelper { private String driverName; private String url; private String user; private String password; private Connection connection; privat
Flex4中使用组件添加柱状图、饼状图等图表 AdyZhang Flex
1.添加一个最简单的柱状图 ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 <?xml version= "1.0"&n
Android 5.0 - ProgressBar 进度条无法展示到按钮的前面 aijuans android
在低于SDK < 21 的版本中，ProgressBar 可以展示到按钮前面，并且为之在按钮的中间，但是切换到android 5.0后进度条ProgressBar 展示顺序变化了，按钮再前面，ProgressBar 在后面了我的xml配置文件如下： [html] view plain copy <RelativeLa
查询汇总的sql baalwolf sql
select list.listname, list.createtime,listcount from dream_list as list , (select listid,count(listid) as listcount from dream_list_user group by listid order by count(
Linux du命令和df命令区别 BigBird2012 linux
1，两者区别 du，disk usage,是通过搜索文件来计算每个文件的大小然后累加，du能看到的文件只是一些当前存在的，没有被删除的。他计算的大小就是当前他认为存在的所有文件大小的累加和。
AngularJS中的$apply，用还是不用？ bijian1013 JavaScript AngularJS $apply
在AngularJS开发中，何时应该调用$scope.$apply()，何时不应该调用。下面我们透彻地解释这个问题。但是首先，让我们把$apply转换成一种简化的形式。 scope.$apply就像一个懒惰的工人。它需要按照命
[Zookeeper学习笔记十]Zookeeper源代码分析之ClientCnxn数据序列化和反序列化 bit1129 zookeeper
ClientCnxn是Zookeeper客户端和Zookeeper服务器端进行通信和事件通知处理的主要类，它内部包含两个类，1. SendThread 2. EventThread， SendThread负责客户端和服务器端的数据通信，也包括事件信息的传输，EventThread主要在客户端回调注册的Watchers进行通知处理 ClientCnxn构造方法 &
【Java命令一】jmap bit1129 Java命令
jmap命令的用法： [hadoop@hadoop sbin]$ jmap Usage: jmap [option] <pid> (to connect to running process) jmap [option] <executable <core> (to connect to a
Apache 服务器安全防护及实战 ronin47
此文转自IBM. Apache 服务简介 Web 服务器也称为 WWW 服务器或 HTTP 服务器 (HTTP Server)，它是 Internet 上最常见也是使用最频繁的服务器之一，Web 服务器能够为用户提供网页浏览、论坛访问等等服务。由于用户在通过 Web 浏览器访问信息资源的过程中，无须再关心一些技术性的细节，而且界面非常友好，因而 Web 在 Internet 上一推出就得到
unity 3d实例化位置出现布置？ brotherlamp unity教程 unity unity资料 unity视频 unity自学
问：unity 3d实例化位置出现布置？答：实例化的同时就可以指定被实例化的物体的位置,即 position Instantiate (original : Object, position : Vector3, rotation : Quaternion) : Object 这样你不需要再用Transform.Position了, 如果你省略了第二个参数(
《重构，改善现有代码的设计》第八章 Duplicate Observed Data bylijinnan java 重构
import java.awt.Color; import java.awt.Container; import java.awt.FlowLayout; import java.awt.Label; import java.awt.TextField; import java.awt.event.FocusAdapter; import java.awt.event.FocusE
struts2更改struts.xml配置目录 chiangfai struts.xml
struts2默认是读取classes目录下的配置文件，要更改配置文件目录，比如放在WEB-INF下，路径应该写成../struts.xml(非/WEB-INF/struts.xml) web.xml文件修改如下： <filter> <filter-name>struts2</filter-name> <filter-class&g
redis做缓存时的一点优化 chenchao051 redis hadoop pipeline
最近集群上有个job，其中需要短时间内频繁访问缓存，大概7亿多次。我这边的缓存是使用redis来做的，问题就来了。首先，redis中存的是普通kv，没有考虑使用hash等解结构，那么以为着这个job需要访问7亿多次redis，导致效率低，且出现很多redi
mysql导出数据不输出标题行 daizj mysql 数据导出去掉第一行去掉标题
当想使用数据库中的某些数据，想将其导入到文件中，而想去掉第一行的标题是可以加上-N参数如通过下面命令导出数据： mysql -uuserName -ppasswd -hhost -Pport -Ddatabase -e " select * from tableName" > exportResult.txt 结果为： studentid
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
先下载PHPEXCEL类文件，放在class目录下面，然后新建一个index.php文件，内容如下 <?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('
爱情格言 dcj3sjt126com 格言
1) I love you not because of who you are, but because of who I am when I am with you. 　　我爱你，不是因为你是一个怎样的人，而是因为我喜欢与你在一起时的感觉。 　　2) No man or woman is worth your tears, and the one who is, won‘t
转 Activity 详解——Activity文档翻译 e200702084 android UI sqlite 配置管理网络应用
activity 展现在用户面前的经常是全屏窗口，你也可以将 activity 作为浮动窗口来使用（使用设置了 windowIsFloating 的主题），或者嵌入到其他的 activity （使用 ActivityGroup ）中。当用户离开 activity 时你可以在 onPause() 进行相应的操作。更重要的是，用户做的任何改变都应该在该点上提交 ( 经常提交到 ContentPro
win7安装MongoDB服务 geeksun mongodb
1. 下载MongoDB的windows版本：mongodb-win32-x86_64-2008plus-ssl-3.0.4.zip，Linux版本也在这里下载，下载地址： http://www.mongodb.org/downloads 2. 解压MongoDB在D:\server\mongodb, 在D:\server\mongodb下创建d
Javascript魔法方法:__defineGetter__,__defineSetter__ hongtoushizi js
转载自： http://www.blackglory.me/javascript-magic-method-definegetter-definesetter/ 在javascript的类中,可以用defineGetter和defineSetter_控制成员变量的Get和Set行为例如,在一个图书类中,我们自动为Book加上书名符号: function Book(name){
错误的日期格式可能导致走nginx proxy cache时不能进行304响应 jinnianshilongnian cache
昨天在整合某些系统的nginx配置时，出现了当使用nginx cache时无法返回304响应的情况，出问题的响应头： Content-Type:text/html; charset=gb2312 Date:Mon, 05 Jan 2015 01:58:05 GMT Expires:Mon , 05 Jan 15 02:03:00 GMT Last-Modified:Mon, 05
数据源架构模式之行数据入口 home198979 PHP 架构行数据入口
注：看不懂的请勿踩，此文章非针对java，java爱好者可直接略过。一、概念行数据入口（Row Data Gateway）：充当数据源中单条记录入口的对象，每行一个实例。二、简单实现行数据入口为了方便理解，还是先简单实现： <?php /** * 行数据入口类 */ class OrderGateway { /*定义元数
Linux各个目录的作用及内容 pda158 linux 脚本
1）根目录“/” 　　根目录位于目录结构的最顶层，用斜线（/）表示，类似于 Windows 操作系统的“C:\“，包含Fedora操作系统中所有的目录和文件。　　2）/bin 　　/bin 　　目录又称为二进制目录，包含了那些供系统管理员和普通用户使用的重要 linux命令的二进制映像。该目录存放的内容包括各种可执行文件，还有某些可执行文件的符号连接。常用的命令有：cp、d
ubuntu12.04上编译openjdk7 ol_beta HotSpot jvm jdk OpenJDK
获取源码从openjdk代码仓库获取(比较慢) 安装mercurial Mercurial是一个版本管理工具。 sudo apt-get install mercurial 将以下内容添加到$HOME/.hgrc文件中，如果没有则自己创建一个： [extensions] forest=/home/lichengwu/hgforest-crew/forest.py fe
将数据库字段转换成设计文档所需的字段 vipbooks 设计模式工作正则表达式
哈哈，出差这么久终于回来了，回家的感觉真好！ PowerDesigner的物理数据库一出来，设计文档中要改的字段就多得不计其数，如果要把PowerDesigner中的字段一个个Copy到设计文档中，那将会是一件非常痛苦的事情。