weixin_30408165

canal同步MySQL数据到ES6.X-基本配置

背景：

　　最近一段时间公司做一个技术架构的更改，由于之前使用的solr和目前的业务不太匹配，具体原因不多说啦。所以要把数据放到Elasticsearch中进行快速的搜索，这是便产生了一个数据迁移的需求，把MySQL数据库中的部分库表放到ES一份，便于快速搜索。明确需求：MySQL数据迁移到ES中。

具体要求：

　　订单表作为主表，商品表和物流表作为附表，数据迁移到ES的同一个索引中。

　　方案：利用ES的父子文档类型、canal-server和canal-adapter

环境介绍：

　　内存很紧张，经费有限，但是不影响记录。

[root@aliyun ~]# cat /etc/redhat-release
CentOS Linux release 7.6.1810 (Core)
[root@aliyun ~]# uname  -r
3.10.0-957.21.3.el7.x86_64
[root@aliyun ~]# free -h
              total        used        free      shared  buff/cache   available
Mem:           1.8G        1.3G         65M        528K        440M        345M
Swap:            0B          0B          0B

MySQL版本5.6.45

mysql> select version();

+-----------+
| version() |
+-----------+
| 5.6.45 |
+-----------+
1 row in set (0.03 sec)

elasticsearch版本6.7.0

[root@aliyun ~]# curl localhost:9200
{
"name" : "node-1",
"cluster_name" : "my-application",
"cluster_uuid" : "M5i8CoTJTOepn1GwdXgfxg",
"version" : {
"number" : "6.7.0",
"build_flavor" : "default",
"build_type" : "rpm",
"build_hash" : "8453f77",
"build_date" : "2019-03-21T15:32:29.844721Z",
"build_snapshot" : false,
"lucene_version" : "7.7.0",
"minimum_wire_compatibility_version" : "5.6.0",
"minimum_index_compatibility_version" : "5.0.0"
},
"tagline" : "You Know, for Search"
}

jdk版本：1.8.0

[root@aliyun ~]# java -version
openjdk version "1.8.0_212"
OpenJDK Runtime Environment (build 1.8.0_212-b04)
OpenJDK 64-Bit Server VM (build 25.212-b04, mixed mode)

canal-server/canal-adapter版本：1.1.3

数据流的逻辑图如下：

　　canal-server伪装成mysql数据库的一个slave从库，获取mysql数据库的binlog日志数据，解析。canal-server自身配置实例来获取binlog数据，canap-adapter程序连接canal-server中配置的实例，获取binlog信息，消费binlog数据，通过ES适配器同步到ES对应的索引中。大致的一个数据流程就是这样的，具体配置请往下看。

具体配置实现：

1、开启MySQL数据的binlog日志记录并且为ROW模式

[root@aliyun ~]# vim /etc/my.cnf

......

[mysqld]
log-bin=mysql-bin # 开启 binlog
binlog-format=ROW # 选择 ROW 模式
server_id = 1

......

　　重启MySQL，登陆MySQL检测配置是否生效。

mysql> show variables like 'log_bin%';
+---------------------------------+----------------------------------+
| Variable_name                   | Value                            |
+---------------------------------+----------------------------------+
| log_bin                         | ON                               |
| log_bin_basename                | /data/mysql/data/mysql-bin       |
| log_bin_index                   | /data/mysql/data/mysql-bin.index |
| log_bin_trust_function_creators | OFF                              |
| log_bin_use_v1_row_events       | OFF                              |
+---------------------------------+----------------------------------+
5 rows in set (0.00 sec)

mysql> show variables like 'binlog_format%';
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| binlog_format | ROW   |
+---------------+-------+
1 row in set (0.00 sec)

　　创建canal-server连接MySQL的用户并授予读取binlog的权限。

mysql> grant all on *.* to canal@'%' identified by 'canal';
Query OK, 0 rows affected (0.01 sec)

mysql> flush privileges;
Query OK, 0 rows affected (0.00 sec)

2、部署canal-server

canal程序的各个组件的下载地址为：https://github.com/alibaba/canal/releases

　　下载程序包：

[root@aliyun ~]# wget https://github.com/alibaba/canal/releases/download/canal-1.1.3/canal.deployer-1.1.3.tar.gz

　　解压程序包：

[root@aliyun ~]# mkdir /usr/local/canal-server
[root@aliyun ~]# tar xf canal.deployer-1.1.3.tar.gz -C /usr/local/canal-server/
[root@aliyun ~]# ll /usr/local/canal-server/
total 16
drwxr-xr-x 2 root root 4096 Jul 30 22:50 bin
drwxr-xr-x 5 root root 4096 Jul 30 22:50 conf
drwxr-xr-x 2 root root 4096 Jul 30 22:50 lib
drwxrwxrwx 2 root root 4096 Apr  4 10:39 logs

　　上去修改配置文件：

　　需要我们重点关注的一些参数同时也是我们平常修改最多的参数如下：

canal.destinations = example     #canal-server创建的实例，其他参数没有特殊需求的话不用改动

　　完整的根配置文件及简单参数的介绍如下：

[root@aliyun conf]# cd /usr/local/canal-server/conf/
[root@aliyun conf]# cat canal.properties
#################################################
#########         common argument        #############
#################################################
#canal.manager.jdbc.url=jdbc:mysql://127.0.0.1:3306/canal_manager?useUnicode=true&characterEncoding=UTF-8
#canal.manager.jdbc.username=root
#canal.manager.jdbc.password=121212
canal.id = 1　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　#无意义的值
canal.ip =　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　  #运行canal-server服务的主机IP，可以不用配置，他会自动绑定一个本机的IP
canal.port = 11111　　　　　　　　　　　　　　　　　　　　　　　　　　　　　  #canal-server监听的端口（TCP模式下，非TCP模式不监听1111端口）
canal.metrics.pull.port = 11112　　　　　　　　　　　　　　　　　　　　　　 #canal-server metrics.pull监听的端口
canal.zkServers =　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　#集群模式下要配置zookeeper进行协调配置，单机模式可以不用配置
# flush data to zk　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　#下面的两个参数是刷新数据到ZK的配置
canal.zookeeper.flush.period = 1000
canal.withoutNetty = false
# tcp, kafka, RocketMQ
canal.serverMode = tcp　　　　　　　　　　　　　　　　　　　　　　　　　　　　#canal-server运行的模式，TCP模式就是直连客户端，不经过中间件。kafka和mq是消息队列的模式
# flush meta cursor/parse position to file
canal.file.data.dir = ${canal.conf.dir}　　　　　　　　　　　　　　　　　　#存放数据的路径
canal.file.flush.period = 1000　　　　　　　　　　　　　　　　　　　　　　　　
## memory store RingBuffer size, should be Math.pow(2,n)　　　　　　　　#下面是一些系统参数的配置，包括内存、网络等
canal.instance.memory.buffer.size = 16384
## memory store RingBuffer used memory unit size , default 1kb
canal.instance.memory.buffer.memunit = 1024
## meory store gets mode used MEMSIZE or ITEMSIZE
canal.instance.memory.batch.mode = MEMSIZE
canal.instance.memory.rawEntry = true

## detecing config　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　#这里是心跳检查的配置，做HA时会用到
canal.instance.detecting.enable = false
#canal.instance.detecting.sql = insert into retl.xdual values(1,now()) on duplicate key update x=now()
canal.instance.detecting.sql = select 1
canal.instance.detecting.interval.time = 3
canal.instance.detecting.retry.threshold = 3
canal.instance.detecting.heartbeatHaEnable = false

# support maximum transaction size, more than the size of the transaction will be cut into multiple transactions delivery
canal.instance.transaction.size =  1024
# mysql fallback connected to new master should fallback times
canal.instance.fallbackIntervalInSeconds = 60

# network config
canal.instance.network.receiveBufferSize = 16384
canal.instance.network.sendBufferSize = 16384
canal.instance.network.soTimeout = 30

# binlog filter config　　　　　　　　　　　　　　　　　　　　　　　　　　　　#binlog过滤的配置，指定过滤那些SQL
canal.instance.filter.druid.ddl = true
canal.instance.filter.query.dcl = false
canal.instance.filter.query.dml = false
canal.instance.filter.query.ddl = false
canal.instance.filter.table.error = false
canal.instance.filter.rows = false
canal.instance.filter.transaction.entry = false

# binlog format/image check　　　　　　　　　　　　　　　　　　　　　　　　　#binlog格式检测，使用ROW模式，非ROW模式也不会报错，但是同步不到数据，具体原因百度binlog格式的区别
canal.instance.binlog.format = ROW,STATEMENT,MIXED
canal.instance.binlog.image = FULL,MINIMAL,NOBLOB

# binlog ddl isolation
canal.instance.get.ddl.isolation = false

# parallel parser config　　　　　　　　　　　　　　　　　　　　　　　　　　　#并行解析配置，如果是单个CPU就把下面这个true改为false
canal.instance.parser.parallel = true
## concurrent thread number, default 60% available processors, suggest not to exceed Runtime.getRuntime().availableProcessors()
#canal.instance.parser.parallelThreadSize = 16
## disruptor ringbuffer size, must be power of 2
canal.instance.parser.parallelBufferSize = 256

# table meta tsdb info　　　　　　　　　　　　　　　　　　　　　　　　　　#tsdb没搞明白他是干嘛的
canal.instance.tsdb.enable = true
canal.instance.tsdb.dir = ${canal.file.data.dir:../conf}/${canal.instance.destination:}
canal.instance.tsdb.url = jdbc:h2:${canal.instance.tsdb.dir}/h2;CACHE_SIZE=1000;MODE=MYSQL;
canal.instance.tsdb.dbUsername = canal　　　　　　　　　　　　　　　　　#连接数据的用户名和密码
canal.instance.tsdb.dbPassword = canal
# dump snapshot interval, default 24 hour
canal.instance.tsdb.snapshot.interval = 24
# purge snapshot expire , default 360 hour(15 days)
canal.instance.tsdb.snapshot.expire = 360

# aliyun ak/sk , support rds/mq
canal.aliyun.accessKey =
canal.aliyun.secretKey =

#################################################
#########         destinations        #############
#################################################
canal.destinations = example　　　　　　　　　　　　　　　　　　　　　　　　　　　　#这个是很重要的参数，在这里指定你要创建的实例的名字，比如test1，test2等，逗号隔开
# conf root dir
canal.conf.dir = ../conf
# auto scan instance dir add/remove and start/stop instance
canal.auto.scan = true　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　#自动扫描加载配置
canal.auto.scan.interval = 5

canal.instance.tsdb.spring.xml = classpath:spring/tsdb/h2-tsdb.xml
#canal.instance.tsdb.spring.xml = classpath:spring/tsdb/mysql-tsdb.xml

canal.instance.global.mode = spring
canal.instance.global.lazy = false
#canal.instance.global.manager.address = 127.0.0.1:1099
#canal.instance.global.spring.xml = classpath:spring/memory-instance.xml
canal.instance.global.spring.xml = classpath:spring/file-instance.xml
#canal.instance.global.spring.xml = classpath:spring/default-instance.xml

##################################################
#########              MQ              #############　　　　　　　　　　#MQ的配置参数，这篇不讲消息队列，只写单机canal-server直连的TCP模式
##################################################
canal.mq.servers = 127.0.0.1:6667
canal.mq.retries = 0
canal.mq.batchSize = 16384
canal.mq.maxRequestSize = 1048576
canal.mq.lingerMs = 100
canal.mq.bufferMemory = 33554432
canal.mq.canalBatchSize = 50
canal.mq.canalGetTimeout = 100
canal.mq.flatMessage = true
canal.mq.compressionType = none
canal.mq.acks = all
# use transaction for kafka flatMessage batch produce
canal.mq.transaction = false
#canal.mq.properties. =

实例配置：

　　在根配置文件中创建了实例名称之后，需要在根配置的同级目录下创建该实例目录，canal-server为我们提供了一个示例的实例配置，因此我们可以直接复制该示例，举个例子吧：根配置配置了如下实例：

[root@aliyun conf]# vim canal.properties
...
canal.destinations = user_order,delivery_info
...

我们需要在根配置的同级目录下创建这两个实例
[root@aliyun conf]# pwd
/usr/local/canal-server/conf
[root@aliyun conf]# cp -a example/ user_order
[root@aliyun conf]# cp -a example/ delivery_info

　　下面是每个实例的配置参数：配置文件为 example/instance.properties

　　在这个配置里我们需要注意的参数有下面几个：

[root@aliyun example]# vim instance.properties
canal.instance.master.address=127.0.0.1:3306　　　　　　　　　　#指定要读取binlog的MySQL的IP地址和端口
canal.instance.master.journal.name=　　　　　　　　　　　　　　　 #从指定的binlog文件开始读取数据
canal.instance.master.position=　　　　　　　　　　　　　　　　　　#指定偏移量，做过主从复制的应该都理解这两个参数。
　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　 #tips：binlog和偏移量也可以不指定，则canal-server会从当前的位置开始读取。我建议不设置
canal.instance.dbUsername=canal　　　　　　　　　　　　　　　　   #指定连接mysql的用户密码
canal.instance.dbPassword=canal
canal.instance.connectionCharset = UTF-8　　　　　　　　　　　　 #字符集

canal.instance.filter.regex=.*\\..*　　　　　　　　　　　　　　　　#这个是比较重要的参数，匹配库表白名单，比如我只要test库的user表的增量数据，则这样写 test.user
# table black regex
canal.instance.filter.black.regex=　　　　　　　　　　　　　　　　#这个是黑名单，规则和白名单一样。具体匹配规则可以参见wiki：https://github.com/alibaba/canal/wiki/AdminGuide

　　完整配置和参数解释如下：

[root@aliyun conf]# cd example/
[root@aliyun example]# cat instance.properties
#################################################
## mysql serverId , v1.0.26+ will autoGen
# canal.instance.mysql.slaveId=0

# enable gtid use true/false
canal.instance.gtidon=false　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　#启用GTID，默认不启用

# position info　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　#同步的位置点信息，包括binlog和偏移量等
canal.instance.master.address=127.0.0.1:3306
canal.instance.master.journal.name=
canal.instance.master.position=
canal.instance.master.timestamp=
canal.instance.master.gtid=

# rds oss binlog　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　#rds oss的同步
canal.instance.rds.accesskey=
canal.instance.rds.secretkey=
canal.instance.rds.instanceId=

# table meta tsdb info
canal.instance.tsdb.enable=true　　　　　　　　　　　　　　　　　　　　　　　　　　#启用tsdb，他应该是记录数据用的
#canal.instance.tsdb.url=jdbc:mysql://127.0.0.1:3306/canal_tsdb
#canal.instance.tsdb.dbUsername=canal
#canal.instance.tsdb.dbPassword=canal

#canal.instance.standby.address =　　　　　　　　　　　　　　　　　　　　　　　　#这几个参数是设置高可用配置的，可以配置mysql从库的信息
#canal.instance.standby.journal.name =
#canal.instance.standby.position =
#canal.instance.standby.timestamp =
#canal.instance.standby.gtid=

# username/password　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　#用户名密码
canal.instance.dbUsername=canal
canal.instance.dbPassword=canal
canal.instance.connectionCharset = UTF-8
# enable druid Decrypt database password
canal.instance.enableDruid=false
#canal.instance.pwdPublicKey=MFwwDQYJKoZIhvcNAQEBBQADSwAwSAJBALK4BUxdDltRRE5/zXpVEVPUgunvscYFtEip3pmLlhrWpacX7y7GCMo2/JM6LeHmiiNdH1FWgGCpUfircSwlWKUCAwEAAQ==

# table regex　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　#过滤规则
canal.instance.filter.regex=.*\\..*
# table black regex
canal.instance.filter.black.regex=

# mq config　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　#MQ的相关配置，本篇不涉及
canal.mq.topic=example
# dynamic topic route by schema or table regex
#canal.mq.dynamicTopic=mytest1.user,mytest2\\..*,.*\\..*
canal.mq.partition=0
# hash partition config
#canal.mq.partitionsNum=3
#canal.mq.partitionHash=test.table:id^name,.*\\..*
#################################################

　　当你配置好你所需要的所有实例之后，就可以启动canal-server了

[root@aliyun example]# cd /usr/local/canal-server/bin/
[root@aliyun bin]# sh startup.sh　　　　　　　　　　　　　　　　　　　　　　　　#启动命令
[root@aliyun bin]# tailf ../logs/canal/canal.log　　　　　　　　　　　　　　#查看日志信息
OpenJDK 64-Bit Server VM warning: ignoring option PermSize=96m; support was removed in 8.0
OpenJDK 64-Bit Server VM warning: ignoring option MaxPermSize=256m; support was removed in 8.0
OpenJDK 64-Bit Server VM warning: UseCMSCompactAtFullCollection is deprecated and will likely be removed in a future release.
OpenJDK 64-Bit Server VM warning: If the number of processors is expected to increase from one, then you should configure the number of parallel GC threads appropriately using -XX:ParallelGCThreads=N
OpenJDK 64-Bit Server VM warning: INFO: os::commit_memory(0x0000000700000000, 1073741824, 0) failed; error='Cannot allocate memory' (errno=12)
#
# There is insufficient memory for the Java Runtime Environment to continue.
# Native memory allocation (mmap) failed to map 1073741824 bytes for committing reserved memory.
# An error report file with more information is saved as:
# /usr/local/canal-server/bin/hs_err_pid2261.log

　　不能分配内存，导致启动失败。把堆内存调小一点。

[root@aliyun bin]# vim startup.sh   #把启动设置的内存改小点，最后结果可以像我这样，注意，测试才这样用的，实际使用时注意给大点内存，多大自己把握。
[root@aliyun bin]# grep 512m startup.sh
    JAVA_OPTS="-server -Xms512m -Xmx512m -Xmn512m -XX:SurvivorRatio=2 -XX:PermSize=96m -XX:MaxPermSize=256m -Xss256k -XX:-UseAdaptiveSizePolicy -XX:MaxTenuringThreshold=15 -XX:+DisableExplicitGC -XX:+UseConcMarkSweepGC -XX:+CMSParallelRemarkEnabled -XX:+UseCMSCompactAtFullCollection -XX:+UseFastAccessorMethods -XX:+UseCMSInitiatingOccupancyOnly -XX:+HeapDumpOnOutOfMemoryError"

　　重新启动：

[root@aliyun bin]# sh restart.sh ;tailf ../logs/canal/canal.log
2019-07-31 17:43:14.107 [main] INFO  com.alibaba.otter.canal.deployer.CanalLauncher - ## set default uncaught exception handler
2019-07-31 17:43:14.170 [main] INFO  com.alibaba.otter.canal.deployer.CanalLauncher - ## load canal configurations
2019-07-31 17:43:14.203 [main] INFO  c.a.o.c.d.monitor.remote.RemoteConfigLoaderFactory - ## load local canal configurations
2019-07-31 17:43:14.210 [main] INFO  com.alibaba.otter.canal.deployer.CanalStater - ## start the canal server.
2019-07-31 17:43:14.277 [main] INFO  com.alibaba.otter.canal.deployer.CanalController - ## start the canal server[172.19.184.55:11111]
2019-07-31 17:43:15.307 [main] WARN  o.s.beans.GenericTypeAwarePropertyDescriptor - Invalid JavaBean property 'connectionCharset' being accessed! Ambiguous write methods found next to actually used [public void com.alibaba.otter.canal.parse.inbound.mysql.AbstractMysqlEventParser.setConnectionCharset(java.nio.charset.Charset)]: [public void com.alibaba.otter.canal.parse.inbound.mysql.AbstractMysqlEventParser.setConnectionCharset(java.lang.String)]
2019-07-31 17:43:15.800 [main] ERROR com.alibaba.druid.pool.DruidDataSource - testWhileIdle is true, validationQuery not set
2019-07-31 17:43:16.230 [main] WARN  c.a.o.canal.parse.inbound.mysql.dbsync.LogEventConvert - --> init table filter : ^.*\..*$
2019-07-31 17:43:16.230 [main] WARN  c.a.o.canal.parse.inbound.mysql.dbsync.LogEventConvert - --> init table black filter :
2019-07-31 17:43:16.476 [main] INFO  com.alibaba.otter.canal.deployer.CanalStater - ## the canal server is running now ......
2019-07-31 17:43:16.602 [destination = example , address = /127.0.0.1:3306 , EventParser] WARN  c.a.o.c.p.inbound.mysql.rds.RdsBinlogEventParserProxy - ---> begin to find start position, it will be long time for reset or first position
2019-07-31 17:43:16.602 [destination = example , address = /127.0.0.1:3306 , EventParser] WARN  c.a.o.c.p.inbound.mysql.rds.RdsBinlogEventParserProxy - prepare to find start position just show master status
2019-07-31 17:43:16.637 [canal-instance-scan-0] ERROR com.alibaba.druid.pool.DruidDataSource - testWhileIdle is true, validationQuery not set
2019-07-31 17:43:16.791 [canal-instance-scan-0] WARN  c.a.o.canal.parse.inbound.mysql.dbsync.LogEventConvert - --> init table filter : ^.*\..*$
2019-07-31 17:43:16.791 [canal-instance-scan-0] WARN  c.a.o.canal.parse.inbound.mysql.dbsync.LogEventConvert - --> init table black filter :
2019-07-31 17:43:16.798 [canal-instance-scan-0] INFO  c.a.o.canal.deployer.monitor.SpringInstanceConfigMonitor - auto notify start user_order successful.
2019-07-31 17:43:16.879 [destination = user_order , address = /127.0.0.1:3306 , EventParser] WARN  c.a.o.c.p.inbound.mysql.rds.RdsBinlogEventParserProxy - ---> begin to find start position, it will be long time for reset or first position
2019-07-31 17:43:16.880 [destination = user_order , address = /127.0.0.1:3306 , EventParser] WARN  c.a.o.c.p.inbound.mysql.rds.RdsBinlogEventParserProxy - prepare to find start position just show master status
2019-07-31 17:43:17.125 [canal-instance-scan-0] ERROR com.alibaba.druid.pool.DruidDataSource - testWhileIdle is true, validationQuery not set
2019-07-31 17:43:17.289 [canal-instance-scan-0] WARN  c.a.o.canal.parse.inbound.mysql.dbsync.LogEventConvert - --> init table filter : ^.*\..*$
2019-07-31 17:43:17.290 [canal-instance-scan-0] WARN  c.a.o.canal.parse.inbound.mysql.dbsync.LogEventConvert - --> init table black filter :
2019-07-31 17:43:17.303 [canal-instance-scan-0] INFO  c.a.o.canal.deployer.monitor.SpringInstanceConfigMonitor - auto notify start delivery_info successful.
2019-07-31 17:43:17.390 [destination = delivery_info , address = /127.0.0.1:3306 , EventParser] WARN  c.a.o.c.p.inbound.mysql.rds.RdsBinlogEventParserProxy - ---> begin to find start position, it will be long time for reset or first position
2019-07-31 17:43:17.391 [destination = delivery_info , address = /127.0.0.1:3306 , EventParser] WARN  c.a.o.c.p.inbound.mysql.rds.RdsBinlogEventParserProxy - prepare to find start position just show master status
2019-07-31 17:43:17.985 [destination = delivery_info , address = /127.0.0.1:3306 , EventParser] WARN  c.a.o.c.p.inbound.mysql.rds.RdsBinlogEventParserProxy - ---> find start position successfully, EntryPosition[included=false,journalName=mysql-bin.000001,position=4,serverId=1,gtid=<null>,timestamp=1564497896000] cost : 533ms , the next step is binlog dump
2019-07-31 17:43:17.986 [destination = example , address = /127.0.0.1:3306 , EventParser] WARN  c.a.o.c.p.inbound.mysql.rds.RdsBinlogEventParserProxy - ---> find start position successfully, EntryPosition[included=false,journalName=mysql-bin.000001,position=4,serverId=1,gtid=<null>,timestamp=1564497896000] cost : 1365ms , the next step is binlog dump
2019-07-31 17:43:17.987 [destination = user_order , address = /127.0.0.1:3306 , EventParser] WARN  c.a.o.c.p.inbound.mysql.rds.RdsBinlogEventParserProxy - ---> find start position successfully, EntryPosition[included=false,journalName=mysql-bin.000001,position=4,serverId=1,gtid=<null>,timestamp=1564497896000] cost : 1087ms , the next step is binlog dump

　　启动成功。至此呢canal-server端就启动完成了。下面配置canal-adapter适配器，同步数据到ES。

3、配置canal-adapter

　　下载地址：https://github.com/alibaba/canal/releases　

[root@aliyun ~]# wget https://github.com/alibaba/canal/releases/download/canal-1.1.3/canal.adapter-1.1.3.tar.gz

　　解压：

[root@aliyun ~]# mkdir /usr/local/canal-adapter
[root@aliyun ~]# tar xf canal.adapter-1.1.3.tar.gz -C /usr/local/canal-adapter/
[root@aliyun ~]# ll /usr/local/canal-adapter/
total 20
drwxr-xr-x 2 root root 4096 Jul 31 18:07 bin
drwxrwxrwx 6 root root 4096 Apr  4 10:27 conf
drwxr-xr-x 2 root root 4096 Jul 31 18:07 lib
drwxrwxrwx 2 root root 4096 Apr  4 10:39 logs
drwxrwxrwx 2 root root 4096 Apr  4 10:39 plugin

　　配置文件介绍：

[root@aliyun ~]# cd /usr/local/canal-adapter/conf/
[root@aliyun conf]# ll
total 28
-rwxrwxrwx 1 root root 1782 Apr  4 10:27 application.yml　　　　#adapter的主配置文件
-rwxrwxrwx 1 root root  170 Apr  4 10:27 bootstrap.yml　　　　　 #启动引导文件
drwxr-xr-x 2 root root 4096 Jul 31 18:07 es　　　　　　　　　　　　#和es对接的配置文件目录，
drwxr-xr-x 2 root root 4096 Jul 31 18:07 hbase　　　　　　　　　　#和hbase对接的配置文件目录
-rwxrwxrwx 1 root root 2172 Apr  4 10:27 logback.xml　　　　　　#日志配置
drwxrwxrwx 2 root root 4096 Jul 31 18:07 META-INF
drwxrwxrwx 2 root root 4096 Apr  4 10:27 rdb

　　主配置文件我们需要重点关心的参数如下：

[root@aliyun conf]# grep -v "^#" application.yml
server:
  port: 8081
spring:
  jackson:
    date-format: yyyy-MM-dd HH:mm:ss
    time-zone: GMT+8
    default-property-inclusion: non_null

canal.conf:
  mode: tcp # kafka rocketMQ　　　　　　　　　　　　　　#模式
  canalServerHost: 127.0.0.1:11111　　　　　　　　　　 #指定canal-server的地址和端口
  batchSize: 500
  syncBatchSize: 1000
  retries: 0
  timeout:
  accessKey:
  secretKey:

　　srcDataSources:　　　　　　　　　　　　　　　　　　　　#数据源配置，从哪里获取数据
　　 defaultDS:　　　　　　　　　　　　　　　　　　　　　　#指定一个名字，在ES的配置中会用到，唯一
　　 url: jdbc:mysql://127.0.0.1:3306/mytest?useUnicode=true　　　　#连接的数据库地址和一个库
　　 username: root　　　　　　　　　　　　　　　　　　　　　　　　　　　　　#数据库的用户和密码
　　 password: 121212

  canalAdapters:　　　　　　　　　　　　　　　　　　　　#适配器配置
  - instance: example # canal instance Name or mq topic name　　　　#指定在canal-server配置的实例
    groups:
    - groupId: g1　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　#默认就好，组标示
      outerAdapters:　　　　　　　　　　　　　　　　　　　　　　　　　　　　#输出
      - name: es　　　　　　　　　　　　　　　　　　　　　　　　　　　　　  #输出到哪里？指定es
　　    hosts: 127.0.0.1:9300　　　　　　　　　　　　　　　　　　　　　　　#指定es的地址，注意端口为es的传输端口9300
　　    properties:　　　　　　　　　　　　　　　　　　
　　      cluster.name: est　　　　　　　　　　　　　　　　　　　　　　　　　#指定es的集群名称

　　然后配置es的部分：

[root@aliyun es]# pwd
/usr/local/canal-adapter/conf/es
[root@aliyun es]# ll
total 12
-rwxrwxrwx 1 root root 466 Apr  4 10:27 biz_order.yml　　　　　　　　　　#这三个配置文件是自带的，可以删除，不过最好不要删除，因为可以参考他的格式
-rwxrwxrwx 1 root root 855 Apr  4 10:27 customer.yml
-rwxrwxrwx 1 root root 416 Apr  4 10:27 mytest_user.yml

　　这里我们先配置一个简单的单表映射到es，后面在配置一个复杂点的父子文档映射（一父两子）。

　　单表映射配置文件取名为test.yml，要同步的数据库表结构如下：

mysql> desc order_item;
+----------------------+--------------+------+-----+-------------------+----------------+
| Field                | Type         | Null | Key | Default           | Extra          |
+----------------------+--------------+------+-----+-------------------+----------------+
| id                   | bigint(20)   | NO   | PRI | NULL              | auto_increment |
| biz_code             | varchar(32)  | NO   |     | NULL              |                |
| user_id              | bigint(20)   | NO   | MUL | NULL              |                |
| user_name            | varchar(64)  | YES  |     |                   |                |
| order_id             | bigint(20)   | NO   | MUL | NULL              |                |
| payment_amount       | bigint(20)   | YES  |     | 0                 |                |
| item_id              | bigint(20)   | NO   | MUL | NULL              |                |
| discount_amount      | bigint(20)   | NO   |     | 0                 |                |
| point                | bigint(20)   | YES  |     | 0                 |                |
| refund_amount        | bigint(11)   | YES  |     | 0                 |                |
| point_amount         | bigint(20)   | NO   |     | 0                 |                |
| refund_reason_id     | tinyint(4)   | YES  |     | NULL              |                |
| refund_status        | tinyint(4)   | NO   | MUL | 0                 |                |
| refund_type          | tinyint(11)  | YES  | MUL | NULL              |                |
| refund_batch_no      | varchar(32)  | YES  |     | NULL              |                |
| refund_time          | datetime     | YES  | MUL | NULL              |                |
| refund_response_time | datetime     | YES  |     | NULL              |                |
| item_sku_id          | bigint(20)   | NO   |     | NULL              |                |
| item_sku_desc        | varchar(256) | NO   |     | NULL              |                |
| item_name            | varchar(256) | NO   |     | NULL              |                |
| delivery_mark        | int(11)      | YES  |     | 0                 |                |
| item_type            | tinyint(4)   | YES  |     | NULL              |                |
| original_sku_id      | bigint(20)   | YES  |     | NULL              |                |
| item_image_url       | varchar(256) | NO   |     | NULL              |                |
| unit_price           | bigint(20)   | NO   |     | NULL              |                |
| category_id          | bigint(20)   | YES  |     | NULL              |                |
| item_brand_id        | bigint(20)   | YES  |     | NULL              |                |
| number               | int(11)      | NO   |     | NULL              |                |
| delivery_type        | tinyint(4)   | NO   |     | NULL              |                |
| delivery_info_id     | bigint(20)   | YES  |     | NULL              |                |
| activity_id          | bigint(20)   | YES  |     | NULL              |                |
| seller_id            | bigint(20)   | NO   | MUL | NULL              |                |
| higo_mark            | tinyint(4)   | YES  |     | 0                 |                |
| higo_extra_info      | varchar(256) | YES  |     | NULL              |                |
| virtual_mark         | bigint(11)   | YES  |     | 0                 |                |
| supplier_id          | bigint(20)   | YES  |     | 0                 |                |
| delivery_print_mark  | tinyint(4)   | YES  |     | 0                 |                |
| print_info_id        | bigint(20)   | YES  |     | 0                 |                |
| cost_price           | bigint(20)   | YES  |     | NULL              |                |
| bar_code             | varchar(256) | YES  |     | NULL              |                |
| delivery_fee         | bigint(20)   | YES  |     | NULL              |                |
| tax_fee              | bigint(20)   | YES  |     | NULL              |                |
| real_point_amount    | bigint(20)   | YES  |     | NULL              |                |
| real_discount_amount | bigint(20)   | YES  |     | NULL              |                |
| real_payment_amount  | bigint(20)   | YES  |     | NULL              |                |
| supplier_biz_code    | varchar(32)  | NO   |     |                   |                |
| supplier_seller_id   | bigint(20)   | NO   |     | 0                 |                |
| supplier_item_id     | bigint(20)   | NO   |     | 0                 |                |
| supplier_sku_id      | bigint(20)   | NO   |     | 0                 |                |
| parent_order_id      | bigint(20)   | NO   |     | 0                 |                |
| league_amount        | bigint(20)   | NO   |     | 0                 |                |
| supplier_amount      | bigint(20)   | NO   |     | 0                 |                |
| proxy_mark           | tinyint(4)   | NO   |     | 0                 |                |
| proxy_profit         | bigint(20)   | NO   |     | 0                 |                |
| delete_mark          | tinyint(2)   | NO   |     | 0                 |                |
| delete_timestamp     | bigint(20)   | YES  |     | 0                 |                |
| gmt_created          | datetime     | NO   |     | CURRENT_TIMESTAMP |                |
| gmt_modified         | datetime     | NO   |     | CURRENT_TIMESTAMP |                |
| goods_status         | tinyint(20)  | YES  |     | 0                 |                |
| video_id             | bigint(20)   | YES  |     | NULL              |                |
| star_bonus_fee       | bigint(20)   | YES  |     | NULL              |                |
| service_fee          | bigint(20)   | YES  |     | NULL              |                |
| limit_type           | tinyint(4)   | NO   |     | 0                 |                |
+----------------------+--------------+------+-----+-------------------+----------------+
63 rows in set (0.00 sec)

　　对应的映射[root@aliyun ~]# cat test.yml

dataSourceKey: defaultDS　　　　　　　　　　　　　　　#指定数据源，这个值和adapter的application.yml文件中配置的srcDataSources值对应。
destination: example　　　　　　　　　　　　　　　　  #指定canal-server中配置的某个实例的名字，注意：我们可能配置多个实例，你要清楚的知道每个实例收集的是那些数据，不要瞎搞。
groupId: g1　　　　　　　　　　　　　　　　　　　　　　 #组ID，默认就好
esMapping:　　　　　　　　　　　　　　　　　　　　　　  #ES的mapping（映射）
  _index: user_order　　　　　　　　　　　　　　　　  #要同步到的ES的索引名称（自定义），需要自己在ES上创建哦！
  _type: user_order　　　　　　　　　　　　         # ES索引的类型名称（自定义） 
  _id: _id　　　　　　　　　　　　　　　　　　　　　　  #ES标示文档的唯一标示，通常对应数据表中的主键ID字段，注意我这里写成的是"_id"，有个下划线哦！
  sql: "select concat('item_',t.id)  as _id,　　　　#这里就是数据表中的每个字段到ES索引中叫什么名字的sql映射，注意映射到es中的每个字段都要是唯一的，不能重复。
        t.biz_code as item_biz_code,　　　　　　　   #可以全表映射到ES中，也可以部分字段映射到ES中，只要把不要的字段不写在这个sql映射中就OK啦
        t.user_id as item_user_id,　　　　　　　　　  # t.user_id 是数据表中的字段，当他到es中后叫做item_user_name，as后面是自定义的名字。
        t.user_name as item_user_name,
        t.order_id,　　　　　　　　　　　　　　　　　　　#当然也可以不取别名，像这样，到ES中后就叫order_id
        t.id as item_primary_id,
        t.payment_amount as item_payment_amount,
        t.item_id  as item_id,
        t.discount_amount as item_discount_amount,
        t.refund_amount as item_refund_amount,
        t.refund_reason_id as item_refund_reason_id,
        t.order_id as item_order_id,
        t.refund_status as item_refund_status,
        t.refund_type as item_refund_type,
        t.refund_batch_no as item_refund_batch_no,
        t.refund_time as item_refund_time,
        t.refund_response_time as item_refund_response_time,
        t.item_sku_id as item_sku_id,
        t.item_sku_desc as item_sku_desc,
        t.item_name as item_item_name,
        t.delivery_mark as item_delivery_mark,
        t.item_type as item_type,
        t.item_image_url as item_image_url,
        t.unit_price as item_unit_price,
        t.category_id as item_category_id,
        t.number as item_number,
        t.delivery_type as item_delivery_type,
        t.delivery_info_id as item_delivery_info_id,
        t.activity_id as item_activity_id,
        t.seller_id as item_seller_id,
        t.cost_price as item_cost_price,
        t.bar_code as item_bar_code,
        t.delivery_fee as item_delivery_fee,
        t.parent_order_id as item_parent_order_id,
        t.proxy_mark as item_proxy_mark,
        t.proxy_profit as item_proxy_profit,
        t.delete_mark as item_delete_mark,
        t.delete_timestamp as item_delete_timestamp,
        t.gmt_created as item_gmt_created,
        t.gmt_modified as item_gmt_modified,
        t.star_bonus_fee as item_star_bonus_fee,
        t.service_fee as item_service_fee,
        t.limit_type as item_limit_type from order_item t"
etlCondition: "where t.c_time>='{0}'"　　　　　　　　　　　　　　#ETL同步的条件，ETL是什么自行百度
  commitBatch: 3000　　　　　　　　　　　　　　　　　　　　　　　　　　#每次同步提交的大小

　　　sql映射文件写完之后，要去ES上面创建对应的索引和映射，映射要求要和sql文件的映射保持一致，即sql映射中有的字段在ES的索引映射中必须要有，否则同步会报字段错误，导致失败。

　　上面对应的索引映射如下：

　　可以使用head插件创建索引映射：如图：

{
    "mappings": {
        "user_order": {
            "properties": {
                "item_user_id": {
                    "type": "long"
                },
                "item_user_name": {
                    "type": "text",
                    "analyzer": "ik_max_word",
                    "search_analyzer": "ik_smart"
                },
                "item_biz_code": {
                    "type": "text"
                },
                "order_user_name": {
                    "type": "text"
                },
                "item_payment_amount": {
                    "type": "long"
                },
                "item_id": {
                    "type": "long"
                },
                "item_discount_amount": {
                    "type": "long"
                },
                "item_refund_amount": {
                    "type": "long"
                },
                "item_refund_reason_id": {
                    "type": "long"
                },
                "item_refund_status": {
                    "type": "long"
                },
                "item_refund_type": {
                    "type": "long"
                },
                "item_refund_batch_no": {
                    "type": "text"
                },
                "item_refund_time": {
                    "type": "date"
                },
                "item_refund_response_time": {
                    "type": "date"
                },
                "item_sku_id": {
                    "type": "long"
                },
                "item_sku_desc": {
                    "type": "text"
                },
                "item_item_name": {
                    "type": "text"
                },
                "item_delivery_mark": {
                    "type": "long"
                },
                "item_type": {
                    "type": "long"
                },
                "item_image_url": {
                    "type": "text"
                },
                "item_unit_price": {
                    "type": "long"
                },
                "item_category_id": {
                    "type": "long"
                },
                "item_number": {
                    "type": "long"
                },
                "item_delivery_type": {
                    "type": "long"
                },
                "item_delivery_info_id": {
                    "type": "long"
                },
                "item_activity_id": {
                    "type": "long"
                },
                "item_seller_id": {
                    "type": "long"
                },
                "item_cost_price": {
                    "type": "long"
                },
                "item_bar_code": {
                    "type": "text"
                },
                "item_order_id": {
                    "type": "long"
                },
                "item_delivery_fee": {
                    "type": "long"
                },
                "item_parent_order_id": {
                    "type": "long"
                },
                "item_proxy_mark": {
                    "type": "long"
                },
                "item_proxy_profit": {
                    "type": "long"
                },
                "item_delete_mark": {
                    "type": "long"
                },
                "item_delete_timestamp": {
                    "type": "long"
                },
                "item_gmt_created": {
                    "type": "date"
                },
                "item_gmt_modified": {
                    "type": "date"
                },
                "item_star_bonus_fee": {
                    "type": "long"
                },
                "item_service_fee": {
                    "type": "long"
                },
                "item_limit_type": {
                    "type": "long"
                }
            }
        }
    }
}

　　可能我的sql映射和es的索引映射可能会有字段丢失，因为太多了大晚上的我也不想一个一个对照了，反正方法就是这样的。完成之后，启动canal-adapter，开始同步数据。

启动canal-adapter：

[root@aliyun bin]# pwd
/usr/local/canal-adapter/bin
[root@aliyun bin]# ./startup.sh

查看日志：

[root@aliyun bin]# tailf ../logs/adapter/adapter.log
2019-07-31 22:07:41.608 [main] INFO  c.a.o.canal.adapter.launcher.loader.CanalAdapterService - ## the canal client adapters are running now ......
2019-07-31 22:07:41.617 [main] INFO  org.apache.coyote.http11.Http11NioProtocol - Starting ProtocolHandler ["http-nio-8081"]
2019-07-31 22:07:41.625 [main] INFO  org.apache.tomcat.util.net.NioSelectorPool - Using a shared selector for servlet write/read
2019-07-31 22:07:41.633 [Thread-3] INFO  c.a.o.canal.adapter.launcher.loader.CanalAdapterWorker - =============> Start to connect destination: example <=============
2019-07-31 22:07:41.794 [main] INFO  o.s.boot.web.embedded.tomcat.TomcatWebServer - Tomcat started on port(s): 8081 (http) with context path ''
2019-07-31 22:07:41.797 [main] INFO  c.a.otter.canal.adapter.launcher.CanalAdapterApplication - Started CanalAdapterApplication in 8.123 seconds (JVM running for 9.181)
2019-07-31 22:07:42.276 [Thread-3] INFO  c.a.o.canal.adapter.launcher.loader.CanalAdapterWorker - =============> Start to subscribe destination: example <=============
2019-07-31 22:07:42.406 [Thread-3] INFO  c.a.o.canal.adapter.launcher.loader.CanalAdapterWorker - =============> Subscribe destination: example succeed <=============

配置好通路之后，先做一次全量数据同步：

curl http://127.0.0.1:8081/etl/es/test.yml -X POST

现在可以在数据库中插入一条或者更改一条数据，查看日志看es中的数据是否同步，如果启动过程没有什么错误的话就成功啦，不过不可能那么顺利的，遇到问题解决问题才是进步成长的过程不要放弃！

鉴于篇幅原因，父子文档下篇在写。

转载于:https://www.cnblogs.com/chai-/p/11273229.html

你可能感兴趣的:(canal同步MySQL数据到ES6.X-基本配置)

【mysql】mysql之主从部署以及介绍向往风的男子 DBA mysql 数据库
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》从问题中去学习k8s《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》
mysql5.6主从_MySQL5.6主从复制最佳实践来B mysql5.6主从
MySQL5.6主从复制的配置环境操作系统：CentOS-6.6-x86_64MySQL版本：mysql-5.6.26.tar.gz主节点IP：192.168.31.57主机名：edu-mysql-01从节点IP：192.168.31.59主机名：edu-mysql-02MySQL主从复制官方文档MySQL主从复制(也称A/B复制)的原理Master将数据改变记录到二进制日志(binarylog)
MySQL5.6主从复制最佳实践 weixin_34252090 数据库操作系统 python
2019独角兽企业重金招聘Python工程师标准>>>MySQL5.6主从复制最佳实践MySQL5.6主从复制的配置环境操作系统：CentOS-6.6-x86_64MySQL版本：mysql-5.6.26.tar.gz主节点IP：192.168.31.57主机名：edu-mysql-01从节点IP：192.168.31.59主机名：edu-mysql-02MySQL主从复制官方文档http://d
使用LangSmith Chat Datasets微调模型 scaFHIO python 人工智能机器学习
在这篇文章中，我们将探讨如何通过LangSmithChatDatasets轻松微调模型。这一过程分为三个简单的步骤：创建聊天数据集。使用LangSmithDatasetChatLoader加载示例。微调你的模型。微调后，您可以在LangChain应用中使用微调过的模型。在深入探讨之前，我们需要安装一些前置条件。前置条件确保您已经安装了langchain>=0.0.311并准备好LangSmithA
从0到1，带你快速上手Scala语言 qq_23519469 scala 开发语言后端
什么是ScalaScala，读作“skah-lah”，是“ScalableLanguage”的缩写，是一门多范式编程语言。它就像是编程世界里的“变形金刚”，融合了面向对象编程（OOP）和函数式编程（FP）的特性，这意味着开发者能在同一语言中，把面向对象的设计和函数式编程的抽象结合起来使用，超级灵活！它运行在Java虚拟机（JVM）上，能与现有的Java代码无缝集成。这就好比Scala是Java的“
一文搞懂大数据神器Spark，真的太牛了！ qq_23519469 大数据 spark 分布式
Spark是什么在如今这个大数据时代，数据量呈爆炸式增长，传统的数据处理方式已经难以满足需求。就拿电商平台来说，每天产生的交易数据、用户浏览数据、评论数据等，数量巨大且种类繁多。假如要对这些数据进行分析，比如分析用户的购买行为，找出最受欢迎的商品，预测未来的销售趋势等，用普通的单机处理方式，可能需要花费很长时间，甚至根本无法完成。这时，Spark就应运而生了。Spark是一个开源的、基于内存计算的
Angular Material 17版本升级指南 t0_54manong 编程问题解决手册 angular.js 前端 javascript 个人开发
最近，我在将项目从AngularMaterial的15.0.3版本升级到17.0.4版本时，遇到了一个有趣的错误。错误发生在主题设置过程中，尤其是在尝试使用background值时。在旧版本中，主题设置一切正常，但升级后出现了如下错误信息：(status-bar:#e0e0e0,app-bar:#f5f5f5,background:#fafafa,hover:rgba
决策树算法全解析：从零基础到Titanic实战，一文搞定机器学习经典模型吴师兄大模型 0基础实现机器学习入门到精通算法机器学习决策树人工智能深度学习编程开发语言
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
Java数组（基础） NaclarbCSDN 算法排序算法 java
数组声明和创建 packagecom.arbedu.array; publicclassArrayDemo01{ //变量类型变量名字=变量的值 //数组类型数组是相同数据类型的有序集合 publicstaticvoidmain(String[]args){ int[]arr; //1.声明一个数组 arr=newint[10]; //2.创建一个数组这里面可以存放
MySQL 8主从复制配置最佳实践随风九天匠心数据库部署运维 mysql 主从复制
1.引言1.1主从复制的意义与应用场景主从复制是MySQL中用于提高数据冗余性和可用性的技术。通过将主库的数据复制到一个或多个从库，可以在主库故障时快速切换到从库，保证服务的连续性。此外，主从复制还可以用于负载均衡，将读操作分发到从库，减轻主库的压力。1.2MySQL8主从复制的新特性概述MySQL8引入了多项改进，包括：GTID（全局事务标识符）：简化复制配置和管理。半同步复制：提高数据一致性。
Redis客户端jedis与lettuce的区别风雨无阻1203 Redis Java 研发文档 redis 缓存 Lettuce Jedis
什么是Lettuce与JedisLettuce是一个高级Redis客户端，用于线程安全的同步、异步和反应式访问。它支持高级的Redis特性，如Sentinel、集群、流水线、自动重新连接和redis数据模型等。Lettuce是完全非阻塞的，基于Netty事件驱动的通信层，其方法将返回具有可观察的类型，可在流或异步编程环境中使用。Jedis是基于Java语言的Redis的客户端，Jedis=Java
基于Docker 搭建Redis三主三从分布式集群 DBA学习之路 docker redis 容器
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、分布式系统规划二、准备配置文件1.创建redis集群目录三、启动Redis容器四、创建分布式系统1.创建集群2.查看节点信息总结前言提示：这里可以添加本文要记录的大概内容：本次搭建的为”三主三从“的分布式系统，分布式系统中节点存放的数据可以是不同的。当有数据写入请求到达分布式系统后，系统会采用虚拟槽分区算法将数据写入相
Redis两种客户端：lettuce和Jedis的区别 Darren i redis spring
springboot2的spring-boot-starter-data-redis中，默认使用的是lettuce作为redis客户端，它与jedis的主要区别如下：Jedis是同步的，不支持异步，Jedis客户端实例不是线程安全的，需要每个线程一个Jedis实例，所以一般通过连接池来使用JedisJedis常用APILettuce是基于Netty框架的事件驱动的Redis客户端，其方法调用是异步
自定义Retriever的实现方法 vaidfl windows linux microsoft python
技术背景介绍在许多大语言模型（LLM）应用中，检索器（Retriever）用于从外部数据源获取信息。检索器的任务是根据用户查询检索相关的文档，这些文档通常被格式化为提示，供LLM使用，从而生成适当的响应，例如，根据知识库回答用户问题。核心原理解析要实现自定义的检索器，需要继承BaseRetriever类，并实现以下方法：_get_relevant_documents：获取与查询相关的文档，必需实现
005 Redis 都有哪些数据类型？分别在哪些场景下使用比较合适？专注_每天进步一点点 08Redis Redis String list hash set
读读Redis的官网，学第一手的资料：Redid官方文档地址Redis中国-文档网址：Redis中国-文档地址或者看看书《Redis深度历险：核心原理和应用实践》1、Redis官网中介绍各种数据类型官方地址：RedisdatatypesRedisisnotaplainkey-valuestore,itisactuallyadatastructuresserver,supportingdiffere
Angular 18：从模块化到独立组件的转变 t0_54coder 编程问题解决手册 angular.js 前端 javascript 个人开发
随着Angular17的发布，Angular18继续推动开发者走向更简化的架构模式——独立组件（StandaloneComponents）。在这篇博客中，我们将探讨如何将一个使用模块化（NgModule）的Angular应用转变为使用独立组件的架构，并以一个具体的案例来说明这个过程。为什么选择独立组件？Angular18鼓励使用独立组件，主要有以下几个原因：减少冗余代码：不再需要为每个组件创建独立
ros smach 教程——（二）白云千载尽自动驾驶 ros python smach 状态机
ROSSMACH中级教程一、SMACH容器1.1状态机容器1.1.1创建状态机容器首先引入状态机容器fromsmachimportStateMachine由于SMACH状态机还提供状态接口，因此必须在构造时指定其结果和用户数据交互。sm=StateMachine(outcomes=['outcome1','outcome2'],input_keys=['input1','input2'],outp
TikTokenizer 开源项目教程邱纳巧Gillian
TikTokenizer开源项目教程tiktokenizerOnlineplaygroundforOpenAPItokenizers项目地址:https://gitcode.com/gh_mirrors/ti/tiktokenizer项目介绍TikTokenizer是一个基于Python的开源项目，旨在提供一个高效、灵活的文本分词工具。该项目利用先进的算法和数据结构，能够快速准确地对文本进行分词处
redis中jedis和lettuce pool的区别，那个更好，使用范围更广青春不流名 redis bootstrap 前端
在Redis的Java客户端中，Jedis和Lettuce是两种最常用的客户端库，它们都支持连接池（JedisPool和LettuceConnectionPool），但在设计和特性上有显著差异。下面我将详细对比它们的特点，帮助你更好地选择适合的库。1.同步vs异步Jedis：是一个同步的Redis客户端库。每次操作都会阻塞当前线程，直到Redis响应完成。这使得它易于理解和使用，但如果Redis响
Docker DRUN_K docker 容器
DockerDocker架构的工作流程构建镜像：通过编写dockerfile来进行构建推送镜像到仓库：将镜像上传到DockerHub或私有注册表中拉取镜像：通过dockerpull从从仓库中拉取镜像运行容器：使用镜像创建并启动容器管理容器：使用Docker客户端命令管理正在运行的容器，如查看日志、停止容器、查看资源使用情况等网络与存储：容器之间通过Docker网络连接，数据通过Docker卷或绑定
AI人工智能代理工作流AI Agent WorkFlow：设计智能任务处理流程 AI天才研究院计算 AI大模型企业级应用开发实战 DeepSeek R1 &大数据AI人工智能大模型计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
AI人工智能代理工作流AIAgentWorkFlow：设计智能任务处理流程作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来在当今的数字化时代，随着数据量的爆炸式增长和复杂性的提升，传统的手动任务处理方式已经无法满足高效、准确的需求。人工智能技术的发展为自动化任务处理提供了新的可能性。AI人工智能代理（AIAgent）作为一
蓝桥杯练习-3.17 梨绘小棠蓝桥杯贪心算法 c++
蓝桥杯练习-3.17代码练习•旅行家的预算-贪心问题描述一个旅行家想驾驶汽车以最少的费用从一个城市到另一个城市（假设出发时油箱是空的）。给定两个城市之间的距离D1、汽车油箱的容量C（以升为单位）、每升汽油能行驶的距离D2、出发点每升汽油价格P和沿途油站数N（N可以为零），油站i离出发点的距离Di、每升汽油价格Pi（i=1，2，……N）。计算结果四舍五入至小数点后两位。如果无法到达目的地，则输出“N
《Linux运维总结：基于银河麒麟V10+ARM64架构部署多机elasticsearch7.17.21分布式集群+单机kibana7.17.21二进制版ssl集群》东城绝神《Linux运维实战总结》运维 linux elasticsearch ssl
总结：整理不易，如果对你有帮助，可否点赞关注一下？更多详细内容请参考：Linux运维实战总结一、背景elasticsearch是一个分布式、实时、高性能的搜索和分析引擎，它广泛应用于企业级搜索、日志分析、实时数据处理等领域。随着elasticsearch的广泛应用，安全性变得越来越重要。这里将从安全策略和访问控制两方面来部署elasticsearch集群安全策略涉及到数据安全、访问安全和操作安全等
SQL优化之MySQL执行计划（Explain）及索引失效详解一未道 #性能优化大数据 sql mysql 数据库
1、执行计划基础1.1、执行计划（Explain）定义在MySQL中可以通过explain关键字模拟优化器执行SQL语句，从而解析MySQL是如何处理SQL语句的。1.2、MySQL查询过程客户端向MySQL服务器发送一条查询请求服务器首先检查查询缓存，如果命中缓存，则立刻返回存储在缓存中的结果。否则进入下一阶段服务器进行SQL解析、预处理、之后由优化器生成对应的执行计划MySQL根据执行计划，调
HAProxy的ACL Hurry6 网络服务器运维
访问控制列表（ACL，AccessControlLists）是一种基于包过滤的访问控制技术，它可以根据设定的条件对经过服务器传输的数据包进行过滤(条件匹配)，即对接收到的报文进行匹配和过滤，基于请求报文头部中的源地址、源端口、目标地址、目标端口、请求方法、URL、文件后缀等信息内容进行匹配并执行进一步操作，比如允许其通过或丢弃。定义ACL匹配规范，即：判断条件hdrstring，提取在一个HTTP
Rocky Linux安装部署Elasticsearch（ELK日志服务器）_rockylinux elk 2401_83739411 程序员服务器 linux elasticsearch
一、Elasticsearch的简介Elasticsearch是一个强大的开源搜索和分析引擎，可用于实时处理和查询大量数据。它具有高性能、可扩展性和分布式特性，支持全文搜索、聚合分析、地理空间搜索等功能，是构建实时应用和大规模数据分析平台的首选工具。二、RockyLinux系统安装链接：VMwareWorkstation下载安装（含秘钥）链接：VMwareWorkstation创建虚拟机链接：Ro
Mysql相关知识：存储引擎、sql执行流程、索引失效 Cachel wood sql语言 sql server +mysql mysql sql android ab测试算法人工智能前端框架
文章目录MySQL存储引擎一、MySQL存储引擎概述二、常见存储引擎对比三、核心引擎详解1.InnoDB2.MyISAM四、如何选择存储引擎？五、引擎操作命令1.查看表的存储引擎2.修改表的存储引擎3.引擎与性能优化六、示例对比场景：频繁更新的订单表vs只读的产品分类表七、总结索引失效1.索引列使用函数或表达式2.隐式类型转换3.范围查询右侧的索引列失效4.模糊查询以通配符开头5.OR条件导致索引
【图论】并查集的学习和使用猪猪成 C++学习算法图论
目录并查集是什么？举个例子组成父亲数组：find函数：union函数：代码实现：fa[]初始化code:findcode：递归实现:非递归实现:unioncode:画图模拟：路径压缩：路径压缩Code：并查集是什么？是一种树形的数据结构，一般用来处理集合的合并，查询操作。举个例子告诉你1的父节点是22的父节点是34的父节点是56没有父节点那么可以画出三个集合，或者说是树。然后我们一般用并查集判断：
施磊老师c++(八) Zhuai-行淮施磊老师cpp c++开发语言
语法是很不重要的,基本的回会了就行了cpp面经文章目录cpp面经1.程序的内存布局?--可以详看施磊老师第一节课2.堆栈区别3.函数调用参数是怎么传递的?4.为什么函数调用从右往左压栈5.函数题6.类和结构体的内存对齐----空结构体1.程序的内存布局?–可以详看施磊老师第一节课布局大概.text(代码段,放指令),.rodata(只读数据段,比如:常量字符串)—只读,不写.data(数据段:存放
ffmpeg+ubuntu16.04编译ffmpeg库小gpt& QT+FFMPEG实战 ffmpeg linux
个人使用环境：ubuntudesktop16.04+ffmpeg4.2.1以下的库进行完整编译ffmpeg介绍FFmpeg是一个开源的多媒体框架，广泛用于处理音频、视频、字幕等多媒体数据。它包含了丰富的工具和库，能够进行音视频的编解码、转码、流媒体处理、滤镜应用等操作。FFmpeg是许多多媒体应用程序和工具的核心引擎，功能强大且灵活，支持几乎所有常见的音视频格式。FFmpeg的主要组成部分ffmp
Enum 枚举 120153216 enum 枚举
原文地址：http://www.cnblogs.com/Kavlez/p/4268601.html Enumeration 于Java 1.5增加的enum type...enum type是由一组固定的常量组成的类型，比如四个季节、扑克花色。在出现enum type之前，通常用一组int常量表示枚举类型。比如这样： public static final int APPLE_FUJI = 0
Java8简明教程 bijian1013 java jdk1.8
Java 8已于2014年3月18日正式发布了，新版本带来了诸多改进，包括Lambda表达式、Streams、日期时间API等等。本文就带你领略Java 8的全新特性。一.允许在接口中有默认方法实现 Java 8 允许我们使用default关键字，为接口声明添
Oracle表维护快速备份删除数据 cuisuqiang oracle 索引快速备份删除
我知道oracle表分区，不过那是数据库设计阶段的事情，目前是远水解不了近渴。当前的数据库表，要求保留一个月数据，且表存在大量录入更新，不存在程序删除。为了解决频繁查询和更新的瓶颈，我在oracle内根据需要创建了索引。但是随着数据量的增加，一个半月数据就要超千万，此时就算有索引，对高并发的查询和更新来说，让然有所拖累。为了解决这个问题，我一般一个月会进行一次数据库维护，主要工作就是备
java多态内存分析麦田的设计者 java 内存分析多态原理接口和抽象类
“ 时针如果可以回头，熟悉那张脸，重温嬉戏这乐园，墙壁的松脱涂鸦已经褪色才明白存在的价值归于记忆。街角小店尚存在吗？这大时代会不会牵挂，过去现在花开怎么会等待。但有种意外不管痛不痛都有伤害，光阴远远离开，那笑声徘徊与脑海。但这一秒可笑不再可爱，当天心
Xshell实现Windows上传文件到Linux主机被触发 windows
经常有这样的需求，我们在Windows下载的软件包，如何上传到远程Linux主机上？还有如何从Linux主机下载软件包到Windows下；之前我的做法现在看来好笨好繁琐，不过也达到了目的，笨人有本方法嘛；我是怎么操作的： 1、打开一台本地Linux虚拟机，使用mount 挂载Windows的共享文件夹到Linux上，然后拷贝数据到Linux虚拟机里面；（经常第一步都不顺利，无法挂载Windo
类的加载ClassLoader 肆无忌惮_ ClassLoader
类加载器ClassLoader是用来将java的类加载到虚拟机中，类加载器负责读取class字节文件到内存中，并将它转为Class的对象（类对象），通过此实例的 newInstance()方法就可以创建出该类的一个对象。其中重要的方法为findClass(String name)。如何写一个自己的类加载器呢？首先写一个便于测试的类Student
html5写的玫瑰花知了ing html5
<html> <head> <title>I Love You!</title> <meta charset="utf-8" /> </head> <body> <canvas id="c"></canvas>
google的ConcurrentLinkedHashmap源代码解析矮蛋蛋 LRU
原文地址： http://janeky.iteye.com/blog/1534352 简述 ConcurrentLinkedHashMap 是google团队提供的一个容器。它有什么用呢？其实它本身是对 ConcurrentHashMap的封装，可以用来实现一个基于LRU策略的缓存。详细介绍可以参见 http://code.google.com/p/concurrentlinke
webservice获取访问服务的ip地址 alleni123 webservice
1. 首先注入javax.xml.ws.WebServiceContext, @Resource private WebServiceContext context; 2. 在方法中获取交换请求的对象。 javax.xml.ws.handler.MessageContext mc=context.getMessageContext(); com.sun.net.http
菜鸟的java基础提升之道——————>是否值得拥有百合不是茶
1，c++，java是面向对象编程的语言，将万事万物都看成是对象；java做一件事情关注的是人物，java是c++继承过来的，java没有直接更改地址的权限但是可以通过引用来传值操作地址，java也没有c++中繁琐的操作，java以其优越的可移植型，平台的安全型，高效性赢得了广泛的认同，全世界越来越多的人去学习java，我也是其中的一员 java组成：
通过修改Linux服务自动启动指定应用程序 bijian1013 linux
Linux中修改系统服务的命令是chkconfig (check config)，命令的详细解释如下: chkconfig 功能说明：检查，设置系统的各种服务。语　　法：chkconfig [ -- add][ -- del][ -- list][系统服务] 或 chkconfig [ -- level <</SPAN>
spring拦截器的一个简单实例 bijian1013 java spring 拦截器 Interceptor
Purview接口 package aop; public interface Purview { void checkLogin(); } Purview接口的实现类PurviesImpl.java package aop; public class PurviewImpl implements Purview { public void check
[Velocity二]自定义Velocity指令 bit1129 velocity
什么是Velocity指令在Velocity中，#set,#if, #foreach, #elseif, #parse等，以#开头的称之为指令，Velocity内置的这些指令可以用来做赋值，条件判断，循环控制等脚本语言必备的逻辑控制等语句，Velocity的指令是可扩展的，即用户可以根据实际的需要自定义Velocity指令自定义指令(Directive)的一般步骤 &nbs
【Hive十】Programming Hive学习笔记 bit1129 programming
第二章 Getting Started 1.Hive最大的局限性是什么？一是不支持行级别的增删改(insert, delete, update)二是查询性能非常差(基于Hadoop MapReduce）,不适合延迟小的交互式任务三是不支持事务2. Hive MetaStore是干什么的？Hive persists table schemas and other system metadata.
nginx有选择性进行限制 ronin47 nginx 动静　限制
http { limit_conn_zone $binary_remote_addr zone=addr:10m; limit_req_zone $binary_remote_addr zone=one:10m rate=5r/s;... server {... location ~.*\.(gif|png|css|js|icon)$ {
java-4.-在二元树中找出和为某一值的所有路径 . bylijinnan java
/* * 0.use a TwoWayLinkedList to store the path.when the node can't be path,you should/can delete it. * 1.curSum==exceptedSum:if the lastNode is TreeNode,printPath();delete the node otherwise
Netty学习笔记 bylijinnan java netty
本文是阅读以下两篇文章时： http://seeallhearall.blogspot.com/2012/05/netty-tutorial-part-1-introduction-to.html http://seeallhearall.blogspot.com/2012/06/netty-tutorial-part-15-on-channel.html 我的一些笔记 ===
js获取项目路径 cngolon js
//js获取项目根路径，如： http://localhost:8083/uimcardprj function getRootPath(){ //获取当前网址，如： http://localhost:8083/uimcardprj/share/meun.jsp var curWwwPath=window.document.locati
oracle 的性能优化 cuishikuan oracle SQL Server
在网上搜索了一些Oracle性能优化的文章，为了更加深层次的巩固[边写边记]，也为了可以随时查看，所以发表这篇文章。 1.ORACLE采用自下而上的顺序解析WHERE子句，根据这个原理，表之间的连接必须写在其他WHERE条件之前，那些可以过滤掉最大数量记录的条件必须写在WHERE子句的末尾。（这点本人曾经做过实例验证过，的确如此哦！
Shell变量和数组使用详解 daizj linux shell 变量数组
Shell 变量定义变量时，变量名不加美元符号（$，PHP语言中变量需要），如： your_name="w3cschool.cc" 注意，变量名和等号之间不能有空格，这可能和你熟悉的所有编程语言都不一样。同时，变量名的命名须遵循如下规则：首个字符必须为字母（a-z，A-Z）。中间不能有空格，可以使用下划线（_）。不能使用标点符号。不能使用ba
编程中的一些概念，KISS、DRY、MVC、OOP、REST dcj3sjt126com REST
KISS、DRY、MVC、OOP、REST （1）KISS是指Keep It Simple,Stupid（摘自wikipedia），指设计时要坚持简约原则，避免不必要的复杂化。（2）DRY是指Don't Repeat Yourself（摘自wikipedia），特指在程序设计以及计算中避免重复代码，因为这样会降低灵活性、简洁性，并且可能导致代码之间的矛盾。（3）OOP 即Object-Orie
[Android]设置Activity为全屏显示的两种方法 dcj3sjt126com Activity
1. 方法1：AndroidManifest.xml 里，Activity的 android:theme 指定为" @android:style/Theme.NoTitleBar.Fullscreen" 示例: <application
solrcloud 部署方式比较 eksliang solrCloud
solrcloud 的部署其实有两种方式可选，那么我们在实践开发中应该怎样选择呢？第一种：当启动solr服务器时，内嵌的启动一个Zookeeper服务器，然后将这些内嵌的Zookeeper服务器组成一个集群。第二种：将Zookeeper服务器独立的配置一个集群，然后将solr交给Zookeeper进行管理谈谈第一种：每启动一个solr服务器就内嵌的启动一个Zoo
Java synchronized关键字详解 gqdy365 synchronized
转载自：http://www.cnblogs.com/mengdd/archive/2013/02/16/2913806.html 多线程的同步机制对资源进行加锁，使得在同一个时间，只有一个线程可以进行操作，同步用以解决多个线程同时访问时可能出现的问题。同步机制可以使用synchronized关键字实现。当synchronized关键字修饰一个方法的时候，该方法叫做同步方法。当s
js实现登录时记住用户名 hw1287789687 记住我记住密码 cookie 记住用户名记住账号
在页面中如何获取cookie值呢? 如果是JSP的话,可以通过servlet的对象request 获取cookie,可以参考:http://hw1287789687.iteye.com/blog/2050040 如果要求登录页面是html呢?html页面中如何获取cookie呢? 直接上代码了页面:loginInput.html 代码: <!DOCTYPE html PUB
开发者必备的 Chrome 扩展 justjavac chrome
Firebug：不用多介绍了吧https://chrome.google.com/webstore/detail/bmagokdooijbeehmkpknfglimnifench ChromeSnifferPlus：Chrome 探测器，可以探测正在使用的开源软件或者 js 类库https://chrome.google.com/webstore/detail/chrome-sniffer-pl
算法机试题李亚飞 java 算法机试题
在面试机试时，遇到一个算法题，当时没能写出来，最后是同学帮忙解决的。这道题大致意思是：输入一个数，比如4,。这时会输出： &n
正确配置Linux系统ulimit值字符串 ulimit
在Linux下面部署应用的时候，有时候会遇上Socket/File: Can’t open so many files的问题；这个值也会影响服务器的最大并发数，其实Linux是有文件句柄限制的，而且Linux默认不是很高，一般都是1024，生产服务器用其实很容易就达到这个数量。下面说的是，如何通过正解配置来改正这个系统默认值。因为这个问题是我配置Nginx+php5时遇到了，所以我将这篇归纳进
hibernate调用返回游标的存储过程 Supanccy2013 java DAO oracle Hibernate jdbc
注：原创作品，转载请注明出处。上篇博文介绍的是hibernate调用返回单值的存储过程，本片博文说的是hibernate调用返回游标的存储过程。此此扁博文的存储过程的功能相当于是jdbc调用select 的作用。 1，创建oracle中的包，并在该包中创建的游标类型。 ---创建oracle的程
Spring 4.2新特性-更简单的Application Event wiselyman application
1.1 Application Event Spring 4.1的写法请参考10点睛Spring4.1-Application Event 请对比10点睛Spring4.1-Application Event 使用一个@EventListener取代了实现ApplicationListener接口,使耦合度降低; 1.2 示例包依赖 <p