weixin_42412601

canal1.1.5 同步mysql数据到ES7.X

安装：canal.deployer服务端

版本：1.1.5
下载：https://github.com/alibaba/canal/releases
注意：canal1.1.5开始才支持同步数据到ES7,哭唧唧，忙活半天，才发现

自己编译:

git clone git@github.com:alibaba/canal.git
git co canal-$version #切换到对应的版本上
mvn clean install -Denv=release -Dmaven.test.skip=true --settings G:\.m2\settings-sxw.xml

执行完成后，会在canal工程根目录下生成一个target目录，里面会包含一个 canal.deployer-$verion.tar.gz

配置mysql

[mysqld]
#开启binlog
log-bin=mysql-bin
#选择ROW模式
binlog-format=ROW
# 配置 MySQL replaction 需要定义，不要和 canal 的 slaveId 重复
server_id=1

重启mysql服务
如果mysql没有配置远程连接需要配置一下：https://blog.csdn.net/qq_38257857/article/details/103700314

授权canal链接 MySQL 账号具有作为 MySQL slave的权限

如果已有账户可直接grant,如果使用root就可以省略这一步。

CREATE USER canal IDENTIFIED BY 'canal';  
GRANT SELECT, REPLICATION SLAVE, REPLICATION CLIENT ON *.* TO 'canal'@'%';
-- GRANT ALL PRIVILEGES ON *.* TO 'canal'@'%' ;
FLUSH PRIVILEGES;

跑example

解压canal.deployer-1.1.5-SNAPSHOT.tar.gz，deployer/conf/example目录下：vi instance.properties
需要修改的配置：

#canal示例的slaveId
canal.instance.mysql.slaveId=1234
#mysql地址
canal.instance.master.address= ip:3306
#用户名
canal.instance.dbUsername=root
#密码
canal.instance.dbPassword=123456
#指定需要同步的数据库
canal.instance.defaultDatabaseName =item
#指定编码方式
canal.instance.connectionCharset = UTF-8
#监控的是所有数据库，所有的表改动都会监控到，这样可能会浪费不少性能，可能我只想监控的是某一个数据库下的表。
#  .*\\..*表示监控所有数据库，canal\\..*表示监控canal数据库
#如果要在官方给例子中看到效果，connector.subscribe("canal\\..*"); 和这里要一致
canal.instance.filter.regex=item\\..*

启动

bin下： ./startup.sh

如果执行sh文件出现：没有那个文件或目录的问题
解决：http://blog.sina.com.cn/s/blog_70a150570102ys0o.html
或出现-bash: ./startup.sh: /bin/bash^M: 坏的解释器: 没有那个文件或目录
解决：[root@localhost bin]# sed -i ‘s/\r$//’ startup.sh

查看 server 日志：
deployer/logs/canal目录下：tail -50f canal.log

2020-06-11 02:35:03.785 [main] INFO  com.alibaba.otter.canal.deployer.CanalLauncher - ## set default uncaught exception handler
2020-06-11 02:35:03.829 [main] INFO  com.alibaba.otter.canal.deployer.CanalLauncher - ## load canal configurations
2020-06-11 02:35:03.839 [main] INFO  com.alibaba.otter.canal.deployer.CanalStarter - ## start the canal server.
2020-06-11 02:35:03.874 [main] INFO  com.alibaba.otter.canal.deployer.CanalController - ## start the canal server[192.168.63.129(192.168.63.129):11111]
2020-06-11 02:35:04.984 [main] INFO  com.alibaba.otter.canal.deployer.CanalStarter - ## the canal server is running now ...... ......

查看 instance 的日志：
deployer/logs/example目录下：tail -550f example.log

2020-06-11 03:03:50.299 [main] INFO  c.a.o.c.i.spring.support.PropertyPlaceholderConfigurer - Loading properties file from class path resource [example/instance.properties]
2020-06-11 03:03:50.790 [main] INFO  c.a.otter.canal.instance.spring.CanalInstanceWithSpring - start CannalInstance for 1-example 
2020-06-11 03:03:50.806 [main] WARN  c.a.o.canal.parse.inbound.mysql.dbsync.LogEventConvert - --> init table filter : ^item\..*$
2020-06-11 03:03:50.806 [main] WARN  c.a.o.canal.parse.inbound.mysql.dbsync.LogEventConvert - --> init table black filter : 
2020-06-11 03:03:50.816 [main] INFO  c.a.otter.canal.instance.core.AbstractCanalInstance - start successful....

客户端

创建一个maven工程。

依赖

<!--canal-->
<dependency>
    <groupId>com.alibaba.otter</groupId>
    <artifactId>canal.client</artifactId>
    <version>1.1.0</version>
</dependency>

客户端测试代码

import java.net.InetSocketAddress;
import java.util.List;
import com.alibaba.otter.canal.client.CanalConnectors;
import com.alibaba.otter.canal.client.CanalConnector;
import com.alibaba.otter.canal.common.utils.AddressUtils;
import com.alibaba.otter.canal.protocol.Message;
import com.alibaba.otter.canal.protocol.CanalEntry.Column;
import com.alibaba.otter.canal.protocol.CanalEntry.Entry;
import com.alibaba.otter.canal.protocol.CanalEntry.EntryType;
import com.alibaba.otter.canal.protocol.CanalEntry.EventType;
import com.alibaba.otter.canal.protocol.CanalEntry.RowChange;
import com.alibaba.otter.canal.protocol.CanalEntry.RowData;
public class SimpleCanalClientExample {
    public static void main(String args[]) {
        // 创建链接
        CanalConnector connector = CanalConnectors.newSingleConnector(
                new InetSocketAddress("canal服务器ip", 11111), "example", "", "");
        int batchSize = 1000;
        int emptyCount = 0;
        try {
            connector.connect();
            connector.subscribe(".*\\..*");
            connector.rollback();
            int totalEmptyCount = 120;
            while (emptyCount < totalEmptyCount) {
                Message message = connector.getWithoutAck(batchSize); // 获取指定数量的数据
                long batchId = message.getId();
                int size = message.getEntries().size();
                if (batchId == -1 || size == 0) {
                    emptyCount++;
                    System.out.println("empty count : " + emptyCount);
                    try {
                        Thread.sleep(1000);
                    } catch (InterruptedException e) {
                    }
                } else {
                    emptyCount = 0;
                    // System.out.printf("message[batchId=%s,size=%s] \n", batchId, size);
                    printEntry(message.getEntries());
                }

                connector.ack(batchId); // 提交确认
                // connector.rollback(batchId); // 处理失败, 回滚数据
            }
            System.out.println("empty too many times, exit");
        } finally {
            connector.disconnect();
        }
    }
    private static void printEntry(List<Entry> entrys) {
        for (Entry entry : entrys) {
            if (entry.getEntryType() == EntryType.TRANSACTIONBEGIN || entry.getEntryType() == EntryType.TRANSACTIONEND) {
                continue;
            }
            RowChange rowChage = null;
            try {
                rowChage = RowChange.parseFrom(entry.getStoreValue());
            } catch (Exception e) {
                throw new RuntimeException("ERROR ## parser of eromanga-event has an error , data:" + entry.toString(),
                        e);
            }
            EventType eventType = rowChage.getEventType();
            System.out.println(String.format("================> binlog[%s:%s] , name[%s,%s] , eventType : %s",
                    entry.getHeader().getLogfileName(), entry.getHeader().getLogfileOffset(),
                    entry.getHeader().getSchemaName(), entry.getHeader().getTableName(),
                    eventType));
            for (RowData rowData : rowChage.getRowDatasList()) {
                if (eventType == EventType.DELETE) {
                    printColumn(rowData.getBeforeColumnsList());
                } else if (eventType == EventType.INSERT) {
                    printColumn(rowData.getAfterColumnsList());
                } else {
                    System.out.println("-------> before");
                    printColumn(rowData.getBeforeColumnsList());
                    System.out.println("-------> after");
                    printColumn(rowData.getAfterColumnsList());
                }
            }
        }
    }
    private static void printColumn(List<Column> columns) {
        for (Column column : columns) {
            System.out.println(column.getName() + " : " + column.getValue() + "    update=" + column.getUpdated());
        }
    }
}

测试

启动canal服务端deployer，启动Canal Client后，可以从控制台从看到类似消息：

empty count : 1
empty count : 2
empty count : 3
empty count : 4

修改库里数据：

注意：这个客户端会有一个问题，之前在配置服务端的时候，指定了只监控canal.instance.filter.regex=item\\..*，item这个数据库，但是测试的时候，修改别的库，也会被监听到。
只需要修改客户端代码：之所以会出现配置不生效的原因，是因为代码配的把配置文件里配的给覆盖了。

connector.subscribe("item\\..*");

使用`canal.adapter`客户端适配器同步数据到`ES`:

解压canal.adapter-1.1.5-SNAPSHOT.tar.gz；
adapter/conf目录下，修改配置文件application.yml同时启动zookeeper。

zookeeperHosts: ip:2181
canal.tcp.zookeeper.hosts: ip:2181
srcDataSources:
  defaultDS:
    url: jdbc:mysql://ip:3306/item?useUnicode=true
    username: root
    password: 123456
canalAdapters:
- instance: example # canal instance Name or mq topic name
  groups:
  - groupId: g1
    outerAdapters:
    - name: es7
      key: exampleKey
      hosts: ip:9200 # 127.0.0.1:9200 for rest mode
      properties:
        mode: rest # or rest
        # security.auth: test:123456 #  only used for rest mode
        cluster.name: test

es7目录下：
vi item.yml item是我的索引的名字，注意：我这里，同步之前，索引已经事先在ES里创建好了

dataSourceKey: defaultDS
outerAdapterKey: exampleKey     # 对应application.yml中es配置的key
destination: example
groupId: g1
esMapping:
  _index: item
  _id: _id
  upsert: true
  sql: "select id as _id,title,brand,category,images,price from item"
  commitBatch: 3000

这里还有一个小小的问题：因为这里是使用id as _id作为es文档的主键，数据同步过去后，就会发现id字段没了，因为id字段拿去充当文档主键_id了。
解决：

select id as _id,id,title,brand,category,images,price from item

启动：bin目录下启动

20-06-12 16:37:42.964 [main] INFO  c.a.o.canal.adapter.launcher.loader.CanalAdapterService - ## the canal client adapters are running now ......
2020-06-12 16:37:42.970 [main] INFO  org.apache.coyote.http11.Http11NioProtocol - Starting ProtocolHandler ["http-nio-8081"]
2020-06-12 16:37:42.985 [Thread-4] INFO  c.a.otter.canal.adapter.launcher.loader.AdapterProcessor - =============> Start to connect destination: example <=============
2020-06-12 16:37:43.189 [main] INFO  org.apache.tomcat.util.net.NioSelectorPool - Using a shared selector for servlet write/read
2020-06-12 16:37:44.006 [main] INFO  o.s.boot.web.embedded.tomcat.TomcatWebServer - Tomcat started on port(s): 8081 (http) with context path ''
2020-06-12 16:37:44.036 [main] INFO  c.a.otter.canal.adapter.launcher.CanalAdapterApplication - Started CanalAdapterApplication in 8.485 seconds (JVM running for 9.213)
2020-06-12 16:37:44.096 [Thread-4] INFO  c.a.otter.canal.adapter.launcher.loader.AdapterProcessor - =============> Subscribe destination: example succeed <=============

测试：
1.全量导入数据

//端口是`adapter`的端口，有key加上key,没有就不用
curl http://127.0.0.1:9182/etl/es7/item.yml -X POST
curl http://127.0.0.1:8081/etl/es7/exampleKey/item.yml -X POST

[root@localhost ~]# curl http://127.0.0.1:8081/etl/es7/exampleKey/item.yml -X POST
{"succeeded":true,"resultMessage":"导入ES 数据：6 条"}[root@localhost ~]#

2.数据库修改数据，然后到ES查看，有没有同时修改过来。

如果测试通过的话，就大功告成啦！

下面这些不用看。这些是我自己备份的东西以及踩过的一些坑…

数组：

正确的方式：先用子查询把数组字段聚合，再left join
select  a.catalog_id as _id,a.catalog_name as catalogName,a.catalog_status as catalogStatus,a.page_views as pageViews,a.data_provide as dataProvide,a.update_time as updateTime,b.dicValList 
from kf_data_catalog a left JOIN 
(SELECT catalog_id,group_concat(dic_val  order by catalog_id desc separator ';') as dicValList 
from kf_catalog_tag GROUP BY catalog_id) b on a.catalog_id=b.catalog_id;

尝试把数组拼接操作放到前面：查询结果错误
SELECT  a.catalog_id,a.catalog_name,a.catalog_status,a.page_views,a.data_provide,a.update_time,
group_concat(b.dic_val  order by a.catalog_id desc separator ';')
from kf_data_catalog a LEFT JOIN kf_catalog_tag b on a.catalog_id=b.catalog_id;

子查询把数组字段聚合
SELECT catalog_id,group_concat(dic_val  order by catalog_id desc separator ';') as dicValList 
from kf_catalog_tag GROUP BY catalog_id

写sql一定要注意：

[search@yunqi002 es]$ curl http://127.0.0.1:8081/etl/es/exampleKey/datainterface.yml -X POST
{"succeeded":true,"resultMessage":"导入ES 数据：9032 条"}[search@yunqi002 es]$ curl http://127.0.0.1:8081/etl/es/exampleKey/datainterface.yml -X POST^C
[search@yunqi002 es]$ curl http://127.0.0.1:8081/etl/es/exampleKey/datacatalog.yml -X POST
{"succeeded":true,"resultMessage":"导入ES 数据：20002 条"}[search@yunqi002 es]$ curl http://127.0.0.1:8081/etl/es/exampleKey/datacatalog.yml -X POST^C
[search@yunqi002 es]$ curl http://127.0.0.1:8081/etl/es/exampleKey/dataset.yml -X POST
{"succeeded":true,"resultMessage":"导入ES 数据：14028 条"}[search@yunqi002 es]$

多`instance`:

https://blog.csdn.net/javaee_sunny/article/details/91349907

实例：

我的配置文件:canal.adapter-1.1.4 的
application.yml：

server:
  port: 8081
spring:
  jackson:
    date-format: yyyy-MM-dd HH:mm:ss
    time-zone: GMT+8
    default-property-inclusion: non_null
canal.conf:
  mode: tcp # kafka rocketMQ
  canalServerHost: 127.0.0.1:11111
#  zookeeperHosts: slave1:2181
#  mqServers: 127.0.0.1:9092 #or rocketmq
#  flatMessage: true
  batchSize: 500
  syncBatchSize: 1000
  retries: 0
  timeout:
  accessKey:
  secretKey:
  srcDataSources:
   defaultDS:
      url: jdbc:mysql://ip:3306/kf_data_open?useUnicode=true
      username: canal
      password: canal
  canalAdapters:
  - instance: example # canal instance Name or mq topic name
    groups:
    - groupId: g1
      outerAdapters:
      - name: es
        key: exampleKey
        hosts: ip:9200 # 127.0.0.1:9200 for rest mode
        properties:
          mode: rest # transport or rest
          # security.auth: test:123456 #  only used for rest mode
          cluster.name: dataopendev

es目录下的yml：
dataset.yml：

dataSourceKey: defaultDS
destination: example
outerAdapterKey: exampleKey #对应上文中的key 这个key很重要 再强调一次
groupId: g1
esMapping:
  _index: dataset
  _type: doc
  _id: _id
  #pk: catalog_id
  upsert: true
  sql: "SELECT  a.set_id as _id,a.set_id as setId,a.page_views as pageViews,a.downloads,a.data_num as dataNum,a.average_score as averageScore,a.collect_num as collectNum,a.update_time as updateTime,b.fileFormatList,b.fileName,c.catalog_id as catalogId,c.keywords,c.catalog_code as catalogCode,c.data_provide as dataProvide,c.catalog_status as catalogStatus,d.dicValList,c.catalog_name as catalogName from kf_data_set a left JOIN (SELECT set_id,group_concat( file_name order by set_id desc separator ';' ) as fileName ,group_concat( file_format order by set_id desc separator ';' ) as fileFormatList from kf_files_info GROUP BY set_id)b  on a.set_id=b.set_id left JOIN kf_data_catalog c on a.catalog_id=c.catalog_id left JOIN (select catalog_id,group_concat( dic_val order by catalog_id desc separator ';' ) as dicValList from kf_catalog_tag group by catalog_id ) d on a.catalog_id=d.catalog_id"
  objFields:
    dicValList: array:;
    fileFormatList: array:;
    fileName: array:;
  # etlCondition: "where a.c_time>={}"
  commitBatch: 3000

这里第一个a.set_id as _id 用来映射文档主键_id，a.set_id as setId 用来映射文档的setId 字段。

Cannl 数据同步-ES篇小Ti客栈中间件中间件
Cannl数据同步目录Cannl数据同步一、概述1、简介2、原理3、模块二、配置MySQL1、使用版本使用版本2、环境要求1）操作系统2）MySQL要求三、配置Canal-server1、下载安装2、**修改配置****单机配置****集群配置****分库分表配置**四、配置canal-adapter1.同步ES配置1修改启动配置2配置映射文件3启动ES数据同步查询所有订阅同步启动4.验证2.注意
CAPL的程序结构正当少年 CAPL 开发语言
CAPL（CommunicationAccessProgrammingLanguage）是Vector公司开发的一种用于汽车网络仿真、测试和开发的脚本语言，主要用于CANoe、CANalyzer等工具中。CAPL程序的结构相对简单，通常由事件驱动的方式组织。以下是CAPL程序的基本结构：1.变量声明CAPL程序通常以变量声明开始。变量可以是全局变量或局部变量。全局变量在整个程序中可见，局部变量只在
数据实时增量同步之CDC工具—Canal、mysql_stream、go-mysql-transfer、Maxwell caihuayuan4 面试题汇总与解析 spring sql java 大数据课程设计
@TOC[Mysql数据实时增量同步之CDC工具—Canal、mysql_stream、go-mysql-transfer、Maxwell：https://blog.csdn.net/weixin_42526326/article/details/121148721什么是CDC？CDC(ChangeDataCapture)是变更数据获取的简称。可以基于增量日志，以极低的侵入性来完成增量数据捕获的工
Canal+MySQL+Kafka+Zookeeper 正大光明瑞士卷 mysql kafka java-zookeeper
目录一、CanalⅠ、下载安装Ⅱ、配置主要配置文件（1）conf/canal.properties（2）conf/example/instance.propertiesⅢ、开启canal二、MySQLⅠ、搭建与基础使用Ⅱ、开启二进制日志三、Kafka+Zookeeper集群Ⅰ、搭建与基础使用Ⅱ、创建topic四、测试Ⅰ、数据库操作Ⅱ、kafka消费一、Canal阿里巴巴B2B公司，因为业务的特性，
SpringBoot集成Flink-CDC whiteBrocade spring flink mysql java-activemq kafka elasticsearch
FlinkCDCCDC相关介绍CDC是什么?CDC是ChangeDataCapture(变更数据获取)的简称。核心思想是，监测并捕获数据库的变动（包括数据或数据表的插入、更新以及删除等），将这些变更按发生的顺序完整记录下来，写入到MQ以供其他服务进行订阅及消费CDC分类CDC主要分为基于查询和基于Binlog基于查询基于Binlog开源产品Sqoop、DataXCanal、Maxwell、Debe
EMET8002 Case Studies in Applied Economic 后端
EMET8002CaseStudiesinAppliedEconomicAnalysisandEconometricsSemester12025ComputerLabinWeek3Question1:SimpleLinearRegressionDownloadthe“states”datafromWattleandopenitinStata.Aspartofthisquestionweexplor
手把手教你使用CloudCanal数据同步工具高阳很捷迅数据分析数据库大数据数据库开发数据结构
本文向大家介绍的是CloudCanal数据迁移同步工具，能够实现多种数据源之间的数据同步，并且提供可视化操作界面，帮助我们提升开发效率，让我们一起快速了解CloudCanal并掌握数据同步操作吧～CloudCanal数据同步工具官网：CloudCanal-企业级数据实时同步工具，可视化操作，高效进行多源异构数据源间的数据互通与融合，助力企业构建丰富的数据应用场景社区：主页|Clougence问答社
rabbitmq 同步策略_数据同步解决方案-canal与rabbitmq weixin_39996739 rabbitmq 同步策略
学习目标能够完成canal环境的搭建与数据监控微服务的开发能够完成首页广告缓存更新的功能，掌握OkHttpClient的基本使用方法能够完成商品上架索引库导入数据功能，能够画出流程图和说出实现思路能够完成商品下架索引库删除数据功能，能够画出流程图和说出实现思路该工程使用lua+nginx+rabbitmq+redis等技术的第一个主要目的是实现轮播图的读取，具体图解：其中nginx的作用包括了从数
【算法 | Python】高斯消元法 weixin_43964993 算法 python 算法 python numpy
程序来源：GaussianEliminationArithmeticAnalysis原理说明源代码代码说明原理说明高斯消元法(GaussElimination)【超详解&模板】高斯消元法-百度百科源代码"""Gaussianeliminationmethodforsolvingasystemoflinearequations.Gaussianelimination-https://en.wikip
使用 Canal 实时从 MySql 向其它库同步数据 m0_74823239 面试学习路线阿里巴巴 mysql 数据库
目前绝大多数项目还是采用mysql作为数据存储，对于用户访问量较高的网站来说，mysql读写性能有限，我们通常会把mysql中的数据实时同步到Redis、mongodb、elasticsearch等中间件中，应对高并发访问场景，减轻mysql压力，防止数据库宕机。在项目开发中，为了不会原有代码进行侵入，采用canal中间件实现mysql向其它库的实时同步，是一种很不错的方案。canal译意为水道/
iPhone 在华销量大幅下挫 CIb0la 生活程序人生
iPhone在乔布斯时代缔造的神话在中国正逐渐走向没落，挤牙膏式的升级方式类似于诺基亚的N70系列，毫无新意的创新能力，求稳着陆的经营理念，工艺和美学不再独领风骚，甚至拍照领域和AI增强计算，折叠屏等技术领域久无建树，手机设备更新迭代周期变长等等因素无不动摇着苹果手机的品牌力。Canalys上月公布的2024年中国智能手机出货量数据显示，苹果iPhone出货量比上年减少17%，降至4290万部。苹
车载工具报错分析：CANoe、CANalyzer问题：Stuff Error 车载诊断技术漫谈UDS诊断协议系列开发语言 ECU故障诊断指南人工智能汽车 CAPL
我是穿拖鞋的汉子，魔都中坚持长期主义的汽车电子工程师。老规矩，分享一段喜欢的文字，避免自己成为高知识低文化的工程师：简单，单纯，喜欢独处，独来独往，不易合同频过着接地气的生活，除了生存温饱问题之外，没有什么过多的欲望，表面看起来很高冷，内心热情，如果你身边有这样灵性的人，一定要好好珍惜他们眼中有神有光，干净，给人感觉很舒服，有超强的感知能力有形的无形的感知力很强，能感知人的内心变化喜欢独处，好静，
AD电路仿真逼子歌硬件工程师笔试面试题目汇总硬件电路学习及仿真实验硬件工程师硬件工程师学习电器元件符号 AD仿真电路图嵌入式硬件电路仿真
目录0前言仿真类型仿真步骤仿真功能及参数设置仿真模型应用优势1新建原理图2放置元器件及布线3放置探头4实验结果OperatingPoint分析的作用DCSweep的主要功能TransientAnalysis的主要功能ACAnalysis的功能5总结1.直流工作点分析（OperatingPointAnalysis）2.直流扫描分析（DCSweepAnalysis）3.瞬态分析（TransientAn
单细胞数据h5ad格式转换成seurat 探序基因单细胞分析 python
探序基因肿瘤研究院整理比如宫颈癌单细胞文章：Multiomicanalysisofcervicalsquamouscellcarcinomaidentifiescellularecosystemswithbiologicalandclinicalrelevance，原文地址为：https://www.nature.com/articles/s41588-023-01570-0，查看方法部分：Pro
自然语言处理-词嵌入 (Word Embeddings) 纠结哥_Shrek 自然语言处理人工智能
词嵌入（WordEmbedding）是一种将单词或短语映射到高维向量空间的技术，使其能够以数学方式表示单词之间的关系。词嵌入能够捕捉语义信息，使得相似的词在向量空间中具有相近的表示。常见词嵌入方法基于矩阵分解的方法LatentSemanticAnalysis(LSA)LatentDirichletAllocation(LDA)非负矩阵分解(NMF)基于神经网络的方法Word2Vec（Google提
2024 年，CloudCanal 做了 3 件事... ClouGence CloudCanal 数据库 elasticsearch oracle postgresql
CloudCanal的2024，稳扎稳打，开拓创新。这一年里，CloudCanal依旧保持稳定的更新频率，共发布13个版本，CloudCanal本年度累计开发170+项新特性，完成120+处功能优化，修复大大小共220+个bug，在功能完备性和稳定性方面有了质的飞跃。每一次版本更新，都是产品精益求精的见证，也是吸引用户长期使用的基础。总结起来，CloudCanal一共做了3件事。P.S文后有彩蛋丰
分表数据通过canal同步数据 javacanal数据同步
项目使用的canal版本：1.1.4，使用rocketMQ进行消费之前项目中一直是单库单表进行数据同步，后面遇到分表数据也需要进行同步，数据表是用户登录数据：user_login_info_0、user_login_info_1...共分了10张表，但不想配置多个表与topic，想有一种正则的写法只配置一个就行，需要重点关注canal.instance.filter.regex与canal.mq.
MySQL 到 ClickHouse 数据同步优化（三）
简述本文主要介绍CloudCanal如何将关系型数据库中数据同步到ClickHouse，默认使用ReplacingMergeTree作为ClickHouse表引擎，链路特点包括：新增_version、_sign字段，以便ClickHouse准确合并。DML操作均以INSERT写入，同步性能良好。支持DDL同步。技术点结构迁移以ClickHouse为对端的结构迁移，默认选择ReplacingMerg
接口 V2 完善：基于责任链模式、Canal 监听 Binlog 实现数据库、缓存的库存最终一致性 Hello Dam Java开发 #Java功能开发实战 #场快订 SaaS 平台责任链模式数据库缓存数据一致性 Canal Binlog
本文介绍了一种使用Canal监听MySQLBinlog实现数据库与缓存最终一致性的方案。文章首先讲解了如何修改Canal配置以适应订单表和时间段表的变化，然后详细描述了通过责任链模式优化消息处理逻辑的方法，确保能够灵活应对不同数据表的更新需求。最后，展示了如何利用RocketMQ消费Canal消息并通过责任链处理器同步更新缓存，从而保证数据的一致性。此方法有效提升了系统的可扩展性和维护效率。️He
电商项目-数据同步解决方案（三）商品上架同步更新ES索引库 kong7906928 项目功能 Java框架 elasticsearch 搜索引擎数据同步
一、需求分析和业务逻辑主要应用技术有：Feign远程调用，消息队列-RabbitMQ，分布式搜索引擎-ElasticSearch，Eureka，Canal商品上架将商品的sku列表导入或者更新索引库。数据监控微服务需要定义canal监听器，监听商品表的改变，一旦发现商品表内容改变，需要将商品的SPUID发送到消息队列中。实现思路：（1）在数据监控微服务中监控tb_spu表的数据，当tb_spu发生
Oracle 到 Elasticsearch 数据迁移同步
简述Elasticsearch是一个分布式的实时搜索与数据分析引擎，具有强大的可扩展性和高度的灵活性。CloudCanal对于Elasticsearch的支持经过了多轮迭代，支持版本从6.x和7.x一路扩展到8.x，并适配了其丰富多样的API。同时CloudCanal对Oracle源端同步技术进行了多处优化，大幅提升了数据同步的稳定性和可靠性。本文主要介绍如何使用CloudCanal快速构建一条O
Kafka 到 Kafka 数据同步
简述Kafka为处理实时数据提供了一个统一、高吞吐、低延迟的平台，其持久化层本质上是一个“按照分布式事务日志架构的大规模发布/订阅消息队列”，这使它作为企业级基础设施来处理流式数据非常有价值。因此实现Kafka到Kafka的数据同步也成了一项重要工作。本篇文章主要介绍如何使用CloudCanal构建一条Kafka到Kafka的数据同步链路。技术点消费者消息推送在任务创建后，CloudCanal会自
Hana 到 PostgreSQL 数据迁移同步
简述SAPHana与PostgreSQL已成为许多企业常用的两款重要数据库，实现这两者之间高效稳定的数据传输也是许多企业的诉求之一。本文将介绍如何使用国产数据迁移同步工具CloudCanal构建一条Hana到PostgreSQL的数据同步链路。技术点表级别CDC表CloudCanal在实现Hana源端增量同步时，最初采用的是单CDC表的模式，即所有订阅表的增量数据（插入、更新、删除）通过触发器统一
电商项目-基于ElasticSearch实现商品搜索功能(三) kong7906928 项目功能 Java框架 elasticsearch 电商项目商品搜索
本系列文章主要介绍基于SpringDataElasticsearch实现商品搜索的后端代码，介绍代码逻辑和代码实现。主要实现功能：根据搜索关键字查询、条件筛选、规格过滤、价格区间搜索、搜索查询分页、搜索查询排序、高亮查询。主要应用技术:canal，Eureka，微服务架构（MicroservicesArchitecture），SpringDataElasticsearch一、搜索分页1分页分析基于
智谱回应被美国商务部列入实体清单；荣耀否认CEO赵明离职；Arm计划涨价300% | 极客头条极客日报 arm开发
「极客头条」——技术人员的新闻圈！CSDN的读者朋友们好，「极客头条」来啦，快来看今天都有哪些值得我们技术人关注的重要新闻吧。整理|郑丽媛出品|CSDN（ID：CSDNnews）一分钟速览新闻点！智谱回应被美国商务部列入实体清单：强烈反对，这一决定缺乏事实依据荣耀否认CEO赵明离职Canalys：2024年中国智能手机市场增长4%vivo、华为领跑小米正式进军韩国市场库克谈苹果与生活：AppleW
Mall4j商城实战 - 部署 canal 数据库增量日志解析 yueerba126 Mall4j商城实战数据库 spring cloud 微服务架构
Canal简介Canal是基于MySQL数据库增量日志解析的工具，主要用于增量数据的订阅和消费。Canal主要用途基于MySQL数据库增量日志解析详细功能：实时解析MySQL的二进制日志（Binlog）。捕获数据库中的所有增量变更，如插入、更新和删除操作。使用场景：适用于实时监控数据库变化的应用，比如数据复制、数据备份或实时数据分析等。提供增量数据订阅和消费服务
单节点canal的介绍和搭建（对接mysql和rocketMQ）汀风中间件阿里云 mysql java
单节点canal-server+canal-admin的介绍和搭建（对接mysql和rocketMQ）一、简介1、Canal1、工作原理2、MySQL主从复制实现3、canal架构4、binarylog1、新增binlog2、更新binglog3、增加字段bin-log4、删除字段bin-log5、修改字段bin-log二、使用2.1安装1、本地安装2、docker安装canal-admincan
vue3 + vite + js 配置Eslint + prettier 菜鸡的崛起 vue javascript vue
第一步安装ESlintnpmieslint@latest-D或pnpmaddeslint@latest-D/pnpminstalleslint@latest-D或yarnaddeslint@latest-D第二步初始化Eslintnpxeslint--init执行npxeslint--init控制台会出现以下步骤1）你想如何使用ESLint（选择最后一个）Youcanalsorunthiscomm
“疯”眼看美国19：普林斯顿小径观弈路人
20180715特拉华州和拉里坦运河州立公园小径简称“普林斯顿小径”DelawareandRaritanCanalStateParkTrail普林斯顿大学原来的名字是“新泽西学院”，与罗格斯大学毗邻。不过三十公里左右。今天准备看2018世界杯法国对克罗地亚决赛之前，陪女儿到普林斯顿小径跑步，一直可以跑到普林斯顿，才发现这个神奇的小径。普林斯顿小径大概是俗称，全名是特拉华州和拉里坦运河州立公园，会不
语音识别学习笔记2024 AI算法网奇深度学习基础音视频人工智能
目录dragonfly阿里达摩院FunASR：一款高效的端到端语音识别工具包不错的功能介绍librosa安装语音识别dragonfly阿里达摩院FunASR：一款高效的端到端语音识别工具包不错的功能介绍librosa，一个很有趣的Python库！-简书音频转特征向量GitHub-librosa/librosa:Pythonlibraryforaudioandmusicanalysislibrosa
JAVA基础灵静志远位运算加载 Date 字符串池覆盖
一、类的初始化顺序 1 （静态变量，静态代码块）-->（变量，初始化块）--> 构造器同一括号里的，根据它们在程序中的顺序来决定。上面所述是同一类中。如果是继承的情况，那就在父类到子类交替初始化。二、String 1 String a = "abc"; JAVA虚拟机首先在字符串池中查找是否已经存在了值为"abc"的对象，根
keepalived实现redis主从高可用 bylijinnan redis
方案说明两台机器（称为A和B），以统一的VIP对外提供服务 1.正常情况下，A和B都启动，B会把A的数据同步过来（B is slave of A） 2.当A挂了后，VIP漂移到B；B的keepalived 通知redis 执行：slaveof no one，由B提供服务 3.当A起来后，VIP不切换，仍在B上面；而A的keepalived 通知redis 执行slaveof B，开始
java文件操作大全 0624chenhong java
最近在博客园看到一篇比较全面的文件操作文章，转过来留着。 http://www.cnblogs.com/zhuocheng/archive/2011/12/12/2285290.html 转自http://blog.sina.com.cn/s/blog_4a9f789a0100ik3p.html 一.获得控制台用户输入的信息 &nbs
android学习任务不懂事的小屁孩工作
任务完成情况搞清楚带箭头的pupupwindows和不带的使用已完成熟练使用pupupwindows和alertdialog，并搞清楚两者的区别已完成熟练使用android的线程handler,并敲示例代码进行中了解游戏2048的流程，并完成其代码工作进行中-差几个actionbar 研究一下android的动画效果，写一个实例已完成复习fragem
zoom.js 换个号韩国红果果 oom
它的基于bootstrap 的 https://raw.github.com/twbs/bootstrap/master/js/transition.js transition.js模块引用顺序 <link rel="stylesheet" href="style/zoom.css"> <script src=&q
详解Oracle云操作系统Solaris 11.2 蓝儿唯美 Solaris
当Oracle发布Solaris 11时，它将自己的操作系统称为第一个面向云的操作系统。Oracle在发布Solaris 11.2时继续它以云为中心的基调。但是，这些说法没有告诉我们为什么Solaris是配得上云的。幸好，我们不需要等太久。Solaris11.2有4个重要的技术可以在一个有效的云实现中发挥重要作用：OpenStack、内核域、统一存档（UA）和弹性虚拟交换（EVS）。
spring学习——springmvc（一） a-john springMVC
Spring MVC基于模型-视图-控制器（Model-View-Controller，MVC）实现，能够帮助我们构建像Spring框架那样灵活和松耦合的Web应用程序。 1，跟踪Spring MVC的请求请求的第一站是Spring的DispatcherServlet。与大多数基于Java的Web框架一样，Spring MVC所有的请求都会通过一个前端控制器Servlet。前
hdu4342 History repeat itself-------多校联合五 aijuans 数论
水题就不多说什么了。 #include<iostream>#include<cstdlib>#include<stdio.h>#define ll __int64using namespace std;int main(){ int t; ll n; scanf("%d",&t); while(t--)
EJB和javabean的区别 asia007 bean ejb
EJB不是一般的JavaBean,EJB是企业级JavaBean,EJB一共分为3种,实体Bean,消息Bean,会话Bean,书写EJB是需要遵循一定的规范的,具体规范你可以参考相关的资料.另外,要运行EJB,你需要相应的EJB容器,比如Weblogic,Jboss等,而JavaBean不需要,只需要安装Tomcat就可以了 1.EJB用于服务端应用开发, 而JavaBeans
Struts的action和Result总结百合不是茶 struts Action配置 Result配置
一:Action的配置详解: 下面是一个Struts中一个空的Struts.xml的配置文件 <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE struts PUBLIC &quo
如何带好自已的团队 bijian1013 项目管理团队管理团队
在网上看到博客" 怎么才能让团队成员好好干活"的评论，觉得写的比较好。原文如下：我做团队管理有几年了吧，我和你分享一下我认为带好团队的几点： 1.诚信对团队内成员，无论是技术研究、交流、问题探讨，要尽可能的保持一种诚信的态度，用心去做好，你的团队会感觉得到。 2.努力提
Java代码混淆工具 sunjing ProGuard
Open Source Obfuscators ProGuard http://java-source.net/open-source/obfuscators/proguardProGuard is a free Java class file shrinker and obfuscator. It can detect and remove unused classes, fields, m
【Redis三】基于Redis sentinel的自动failover主从复制 bit1129 redis
在第二篇中使用2.8.17搭建了主从复制，但是它存在Master单点问题，为了解决这个问题，Redis从2.6开始引入sentinel，用于监控和管理Redis的主从复制环境，进行自动failover，即Master挂了后，sentinel自动从从服务器选出一个Master使主从复制集群仍然可以工作，如果Master醒来再次加入集群，只能以从服务器的形式工作。什么是Sentine
使用代理实现Hibernate Dao层自动事务白糖_ DAO spring AOP 框架 Hibernate
都说spring利用AOP实现自动事务处理机制非常好，但在只有hibernate这个框架情况下，我们开启session、管理事务就往往很麻烦。 public void save(Object obj){ Session session = this.getSession(); Transaction tran = session.beginTransaction(); try
maven3实战读书笔记 braveCS maven3
Maven简介是什么？ Is a software project management and comprehension tool.项目管理工具是基于POM概念(工程对象模型) [设计重复、编码重复、文档重复、构建重复，maven最大化消除了构建的重复] [与XP：简单、交流与反馈；测试驱动开发、十分钟构建、持续集成、富有信息的工作区] 功能：
编程之美-子数组的最大乘积 bylijinnan 编程之美
public class MaxProduct { /** * 编程之美子数组的最大乘积 * 题目: 给定一个长度为N的整数数组，只允许使用乘法，不能用除法，计算任意N-1个数的组合中乘积中最大的一组，并写出算法的时间复杂度。 * 以下程序对应书上两种方法，求得“乘积中最大的一组”的乘积——都是有溢出的可能的。 * 但按题目的意思，是要求得这个子数组，而不
读书笔记-2 chengxuyuancsdn 读书笔记
1、反射 2、oracle年-月-日时-分-秒 3、oracle创建有参、无参函数 4、oracle行转列 5、Struts2拦截器 6、Filter过滤器(web.xml) 1、反射 (1)检查类的结构在java.lang.reflect包里有3个类Field,Method,Constructor分别用于描述类的域、方法和构造器。 2、oracle年月日时分秒 s
[求学与房地产]慎重选择IT培训学校 comsci it
关于培训学校的教学和教师的问题,我们就不讨论了,我主要关心的是这个问题培训学校的教学楼和宿舍的环境和稳定性问题我们大家都知道，房子是一个比较昂贵的东西，特别是那种能够当教室的房子... &nb
RMAN配置中通道(CHANNEL)相关参数 PARALLELISM 、FILESPERSET的关系 daizj oracle rman filesperset PARALLELISM
RMAN配置中通道(CHANNEL)相关参数 PARALLELISM 、FILESPERSET的关系转 PARALLELISM --- 我们还可以通过parallelism参数来指定同时"自动"创建多少个通道： RMAN > configure device type disk parallelism 3 ; 表示启动三个通道，可以加快备份恢复的速度。
简单排序:冒泡排序 dieslrae 冒泡排序
public void bubbleSort(int[] array){ for(int i=1;i<array.length;i++){ for(int k=0;k<array.length-i;k++){ if(array[k] > array[k+1]){
初二上学期难记单词三 dcj3sjt126com sciet
concert 音乐会 tonight 今晚 famous 有名的；著名的 song 歌曲 thousand 千 accident 事故；灾难 careless 粗心的，大意的 break 折断；断裂；破碎 heart 心（脏） happen 偶尔发生，碰巧 tourist 旅游者；观光者 science （自然）科学 marry 结婚 subject 题目；
I.安装Memcahce 1. 安装依赖包libevent Memcache需要安装libevent,所以安装前可能需要执行 Shell代码收藏代码 dcj3sjt126com redis
wget http://download.redis.io/redis-stable.tar.gz tar xvzf redis-stable.tar.gz cd redis-stable make 前面3步应该没有问题，主要的问题是执行make的时候，出现了异常。异常一： make[2]: cc: Command not found 异常原因：没有安装g
并发容器 shuizhaosi888 并发容器
通过并发容器来改善同步容器的性能，同步容器将所有对容器状态的访问都串行化，来实现线程安全，这种方式严重降低并发性，当多个线程访问时，吞吐量严重降低。并发容器ConcurrentHashMap 替代同步基于散列的Map，通过Lock控制。 &nb
Spring Security（12）——Remember-Me功能 234390216 Spring Security Remember Me 记住我
Remember-Me功能目录 1.1 概述 1.2 基于简单加密token的方法 1.3 基于持久化token的方法 1.4 Remember-Me相关接口和实现
位运算焦志广位运算
一、位运算符Ｃ语言提供了六种位运算符： & 按位与 | 按位或 ^ 按位异或 ~ 取反 << 左移 >> 右移 1. 按位与运算按位与运算符"&"是双目运算符。其功能是参与运算的两数各对应的二进位相与。只有对应的两个二进位均为1时，结果位才为1 ，否则为0。参与运算的数以补码方式出现。例如：9&am
nodejs 数据库连接 mongodb mysql liguangsong mongodb mysql node 数据库连接
1.mysql 连接 package.json中dependencies加入 "mysql":"~2.7.0" 执行 npm install 在config 下创建文件 database.js
java动态编译 olive6615 java HotSpot jvm 动态编译
在HotSpot虚拟机中，有两个技术是至关重要的，即动态编译(Dynamic compilation)和Profiling。 HotSpot是如何动态编译Javad的bytecode呢？Java bytecode是以解释方式被load到虚拟机的。HotSpot里有一个运行监视器，即Profile Monitor,专门监视
Storm0.9.5的集群部署配置优化 roadrunners 优化 storm.yaml
nimbus结点配置（storm.yaml）信息： # Licensed to the Apache Software Foundation (ASF) under one # or more contributor license agreements. See the NOTICE file # distributed with this work for additional inf
101个MySQL 的调节和优化的提示 tomcat_oracle mysql
　1. 拥有足够的物理内存来把整个InnoDB文件加载到内存中——在内存中访问文件时的速度要比在硬盘中访问时快的多。　　2. 不惜一切代价避免使用Swap交换分区 – 交换时是从硬盘读取的，它的速度很慢。　　3. 使用电池供电的RAM（注：RAM即随机存储器）。　　4. 使用高级的RAID（注：Redundant Arrays of Inexpensive Disks，即磁盘阵列
zoj 3829 Known Notation(贪心) 阿尔萨斯 ZOJ
题目链接：zoj 3829 Known Notation 题目大意：给定一个不完整的后缀表达式，要求有2种不同操作，用尽量少的操作使得表达式完整。解题思路：贪心，数字的个数要要保证比∗的个数多1，不够的话优先补在开头是最优的。然后遍历一遍字符串，碰到数字+1，碰到∗-1,保证数字的个数大于等1，如果不够减的话，可以和最后面的一个数字交换位置（用栈维护十分方便），因为添加和交换代价都是1