u011663641

基于OGG 实现Oracle到Kafka增量数据实时同步

背景

在大数据时代，存在大量基于数据的业务。数据需要在不同的系统之间流动、整合。通常，核心业务系统的数据存在OLTP数据库系统中，其它业务系统需要获取OLTP系统中的数据。传统的数仓通过批量数据同步的方式，定期从OLTP系统中抽取数据。但是随着业务需求的升级，批量同步无论从实时性，还是对在线OLTP系统的抽取压力，都无法满足要求。需要实时从OLTP系统中获取数据变更，实时同步到下游业务系统。

本文基于Oracle OGG，介绍一种将Oracle数据库的数据实时同步到Kafka消息队列的方法。

Kafka是一种高效的消息队列实现，通过订阅kafka的消息队列，下游系统可以实时获取在线Oracle系统的数据变更情况，实现业务系统。

环境介绍

组件版本

本案例中使用到的组件和版本

组件	版本	描述
源端Oracle	Oracle 12.2.0.1.0 Linux x64	源端Oracle
源端OGG	Oracle GoldenGate 12.3.0.1.4 for Oracle Linux x64	源端OGG，用于抽取源端Oracle的数据变更，并将变更日志发送到目标端
目标端OGG	OGG_BigData_Linux_x64_12.3.2.1.1	目标端OGG，接受源端发送的Oracle事物变更日志，并将变更推送到kafka消息队列。
目标端kafka	kafka_2.12-2.2.0	消息队列，接收目标端OGG推送过来的数据。

整体架构图

名词解释

1.OGG Manager

OGG Manager用于配置和管理其它OGG组件，配置数据抽取、数据推送、数据复制，启动和停止相关组件，查看相关组件的运行情况。

2.数据抽取（Extract）

抽取源端数据库的变更（DML, DDL）。数据抽取主要分如下几种类型：

本地抽取

从本地数据库捕获增量变更数据，写入到本地Trail文件

数据推送（Data Pump）

从本地Trail文件读取数据，推送到目标端。

初始数据抽取

从数据库表中导出全量数据，用于初次数据加载

3.数据推送（Data Pump）

Data Pump是一种特殊的数据抽取（Extract）类型，从本地Trail文件中读取数据，并通过网络将数据发送到目标端OGG

4.Trail文件

数据抽取从源端数据库抓取到的事物变更信息会写入到Trail文件。

5.数据接收（Collector）

数据接收程序运行在目标端机器，用于接收Data Pump发送过来的Trail日志，并将数据写入到本地Trail文件。

6.数据复制（Replicat）

数据复制运行在目标端机器，从Trail文件读取数据变更，并将变更数据应用到目标端数据存储系统。本案例中，数据复制将数据推送到kafka消息队列。

7.检查点（Checkpoint）

检查点用于记录数据库事物变更。

操作步骤

源端Oracle配置

1.检查归档

使用OGG，需要在源端开启归档日志

SQL> archive log list;

    Database log mode              Archive Mode

    Automatic archival             Enabled

    Archive destination            /u01/app/oracle/product/12.2.0/db_1/dbs/arch

    Oldest online log sequence     2576

    Next log sequence to archive   2577

    Current log sequence           2577

2.检查数据库配置

SQL> select force_logging, supplemental_log_data_min from v$database;



FORCE_LOGG SUPPLEMENTAL_LOG_DATA_MI

---------- ------------------------

YES        YES



如果没有开启辅助日志，需要开启：



SQL> alter database force logging;

SQL> alter database add supplemental log data;

3.开启goldengate复制参数

SQL> alter system set enable_goldengate_replication = true;

4.创建源端Oracle账号

 SQL> create tablespace tbs_ogg datafile '/oradata/dtstack/tbs_ogg.dbf' size 1024M autoextend on;

    SQL> create user ggsadmin identified by oracle default tablespace tbs_ogg;

    SQL> grant dba to ggsadmin;

5.创建测试表

SQL> create table baiyang.ora_to_kfk as select OWNER, OBJECT_NAME, SUBOBJECT_NAME, OBJECT_ID, DATA_OBJECT_ID, OBJECT_TYPE from all_objects where object_id < 500;

    SQL> alter table baiyang.ora_to_kfk add constraint pk_kfk_obj primary key(object_id);

SQL> select count(*) from baiyang.ora_to_kfk;



    COUNT(*)

    ----------

        436

源端OGG配置

1.检查源端OGG环境

    cd /oradata/oggorcl/ogg

    ./ggsci

   

    GGSCI (dtproxy) 1> info all



    Program     Status      Group       Lag at Chkpt  Time Since Chkpt



    MANAGER     STOPPED

2.创建相关文件夹

GGSCI (dtproxy) 2> create subdirs



    Creating subdirectories under current directory /oradata/oggorcl/ogg



    Parameter file                 /oradata/oggorcl/ogg/dirprm: created.

    Report file                    /oradata/oggorcl/ogg/dirrpt: created.

    Checkpoint file                /oradata/oggorcl/ogg/dirchk: created.

    Process status files           /oradata/oggorcl/ogg/dirpcs: created.

    SQL script files               /oradata/oggorcl/ogg/dirsql: created.

    Database definitions files     /oradata/oggorcl/ogg/dirdef: created.

    Extract data files             /oradata/oggorcl/ogg/dirdat: created.

    Temporary files                /oradata/oggorcl/ogg/dirtmp: created.

    Credential store files         /oradata/oggorcl/ogg/dircrd: created.

    Masterkey wallet files         /oradata/oggorcl/ogg/dirwlt: created.

    Dump files                     /oradata/oggorcl/ogg/dirdmp: created.

3.配置源端Manager

  GGSCI (dtproxy) 4> dblogin userid ggsadmin password oracle

    Successfully logged into database.



    GGSCI (dtproxy as ggsadmin@dtstack) 5> edit param ./globals

        -- 添加

        oggschema ggsadmin



    GGSCI (dtproxy as ggsadmin@dtstack) 6> edit param mgr

        -- 添加

        PORT 7810 --默认监听端口

        DYNAMICPORTLIST  7811-7820 --动态端口列表

        AUTORESTART EXTRACT *,RETRIES 5,WAITMINUTES 3 --进程有问题，每3分钟重启一次，一共重启五次

        PURGEOLDEXTRACTS ./dirdat/*, USECHECKPOINTS, MINKEEPDAYS 7  --*/

        LAGREPORTHOURS 1 --每隔一小时检查一次传输延迟情况

        LAGINFOMINUTES 30 --传输延时超过30分钟将写入错误日志

        LAGCRITICALMINUTES 45 --传输延时超过45分钟将写入警告日志

        PURGEMARKERHISTORY MINKEEPDAYS 3, MAXKEEPDAYS 7 --定期清理trail文件

        ACCESSRULE, PROG *, IPADDR 172.*.*.*, ALLOW --设定172网段可连接

      

    -- 添加同步的表

    GGSCI (dtproxy as ggsadmin@dtstack) 9> add trandata baiyang.ora_to_kfk

    -- Oracle Goldengate marked following column as key columns on table BAIYANG.ORA_TO_KFK: OBJECT_ID.

    GGSCI (dtproxy as ggsadmin@dtstack) 10> info trandata baiyang.ora_to_kfk

    -- Prepared CSN for table BAIYANG.ORA_TO_KFK: 192881239

目标端OGG配置

1.目标端检查环境

 GGSCI (172-16-101-242) 1> info all

    Program     Status      Group       Lag at Chkpt  Time Since Chkpt

    MANAGER     STOPPED

2.创建目录

GGSCI (172-16-101-242) 2> create subdirs



    Creating subdirectories under current directory /app/ogg



    Parameter file                 /app/ogg/dirprm: created.

    Report file                    /app/ogg/dirrpt: created.

    Checkpoint file                /app/ogg/dirchk: created.

    Process status files           /app/ogg/dirpcs: created.

    SQL script files               /app/ogg/dirsql: created.

    Database definitions files     /app/ogg/dirdef: created.

    Extract data files             /app/ogg/dirdat: created.

    Temporary files                /app/ogg/dirtmp: created.

    Credential store files         /app/ogg/dircrd: created.

    Masterkey wallet files         /app/ogg/dirwlt: created.

Dump files                     /app/ogg/dirdmp: created.

3.目标端Manager配置

GGSCI (172-16-101-242) 3> edit params mgr

    -- 添加

    PORT 7810

    DYNAMICPORTLIST 7811-7820

    AUTORESTART EXTRACT *,RETRIES 5,WAITMINUTES 3

    PURGEOLDEXTRACTS ./dirdat/*,usecheckpoints, minkeepdays 3

    

    GGSCI (172-16-101-242) 4> edit  param  ./GLOBALS

CHECKPOINTTABLE ggsadmin.checkpoint

全量数据同步

1.配置源端数据初始化

 -- 配置源端初始化进程

    GGSCI (dtproxy as ggsadmin@dtstack) 15> add extract initkfk,sourceistable

    

    -- 配置源端初始化参数

    GGSCI (dtproxy as ggsadmin@dtstack) 16> edit params initkfk

        -- 添加

    EXTRACT initkfk

    SETENV (NLS_LANG=AMERICAN_AMERICA.AL32UTF8)

    USERID ggsadmin,PASSWORD oracle

    RMTHOST 172.16.101.242, MGRPORT 7810

    RMTFILE ./dirdat/ekfk,maxfiles 999, megabytes 500

table baiyang.ora_to_kfk;

2.源端生成表结构define文件

 GGSCI (dtproxy as ggsadmin@dtstack) 17> edit param define_kfk

        -- 添加

    defsfile /oradata/oggorcl/ogg/dirdef/define_kfk.txt

    userid ggsadmin,password oracle

    table baiyang.ora_to_kfk;

  

    -- 执行

    $./defgen paramfile dirprm/define_kfk.prm

    -- Definitions generated for 1 table in /oradata/oggorcl/ogg/dirdef/define_kfk.txt

    

    -- 将此文件传输到目标段dirdef文件夹

    scp /oradata/oggorcl/ogg/dirdef/define_kfk.txt 172.16.101.242:/app/ogg/dirdef/define_kfk.txt

3.配置目标端数据初始化进程

  -- 配置目标端初始化进程

    GGSCI (172-16-101-242) 3> ADD replicat initkfk,specialrun

    

    GGSCI (172-16-101-242) 6> edit params initkfk

        -- 添加

    SPECIALRUN

    end runtime

    setenv(NLS_LANG="AMERICAN_AMERICA.AL32UTF8")

    targetdb libfile libggjava.so set property=./dirprm/kafka.props

    SOURCEDEFS ./dirdef/define_kfk.txt

    EXTFILE ./dirdat/ekfk000000

    reportcount every 1 minutes, rate

    grouptransops 10000

map baiyang.ora_to_kfk,target baiyang.ora_to_kfk;

4.配置kafka相关参数

 -- 配置kafka 相关参数

    vi ./dirprm/kafka.props

    -- 添加

    gg.handlerlist=kafkahandler

    gg.handler.kafkahandler.type=kafka

    gg.handler.kafkahandler.KafkaProducerConfigFile=custom_kafka_producer.properties

    gg.handler.kafkahandler.topicMappingTemplate=test_ogg

    gg.handler.kafkahandler.format=json

    gg.handler.kafkahandler.mode=op

    gg.classpath=dirprm/:/data/kafka_2.12-2.2.0/libs/*:/app/ogg/:/app/ogg/lib/*  --*/

    

    vi custom_kafka_producer.properties

    -- 添加

    bootstrap.servers=172.16.101.242:9092

    acks=1

    compression.type=gzip

    reconnect.backoff.ms=1000

    value.serializer=org.apache.kafka.common.serialization.ByteArraySerializer

    key.serializer=org.apache.kafka.common.serialization.ByteArraySerializer

    batch.size=102400

    linger.ms=10000

5.源端开启全量数据抽取

-- 源端

GGSCI (dtproxy) 20>  start mgr

GGSCI (dtproxy) 21>  start initkfk

6.目标端全量数据应用

GGSCI (172-16-101-242) 13> start mgr

./replicat paramfile ./dirprm/initkfk.prm reportfile ./dirrpt/init01.rpt -p INITIALDATALOAD

7.kafka数据验证

使用kafka客户端工具查看topic的数据

bin/kafka-console-consumer.sh --bootstrap-server localhost:9092 --topic test_ogg --from-beginning

{"table":"BAIYANG.ORA_TO_KFK","op_type":"I","op_ts":"2019-11-11 20:23:19.703779","current_ts":"2019-11-11T20:48:55.946000","pos":"-0000000000000000001","after":{"OWNER":"SYS","OBJECT_NAME":"C_OBJ#","SUBOBJECT_NAME":null,"OBJECT_ID":2,"DATA_OBJECT_ID":2,"OBJECT_TYPE":"CLUSTER"}}

{"table":"BAIYANG.ORA_TO_KFK","op_type":"I","op_ts":"2019-11-11 20:23:19.703779","current_ts":"2019-11-11T20:48:56.289000","pos":"-0000000000000000001","after":{"OWNER":"SYS","OBJECT_NAME":"I_OBJ#","SUBOBJECT_NAME":null,"OBJECT_ID":3,"DATA_OBJECT_ID":3,"OBJECT_TYPE":"INDEX"}}



全量数据已经同步到目标kafka topic

增量数据同步

1.源端抽取进程配置

GGSCI (dtproxy) 9> edit param extkfk

-- 添加

dynamicresolution

SETENV (ORACLE_SID = "dtstack")

SETENV (NLS_LANG = "american_america.AL32UTF8")

userid ggsadmin,password oracle

exttrail ./dirdat/to

table baiyang.ora_to_kfk;

-- 添加extract进程

GGSCI (dtproxy) 10> add extract extkfk,tranlog,begin now

-- 添加trail文件的定义与extract进程绑定

GGSCI (dtproxy) 11> add exttrail ./dirdat/to,extract extkfk

2.源端数据推送进程配置

-- 配置源端推送进程

GGSCI (dtproxy) 12> edit param pupkfk

-- 添加

extract pupkfk

passthru

dynamicresolution

userid ggsadmin,password oracle

rmthost 172.16.101.242 mgrport 7810

rmttrail ./dirdat/to

table baiyang.ora_to_kfk;



-- 添加extract进程

GGSCI (dtproxy) 13>  add extract pupkfk,exttrailsource /oradata/oggorcl/ogg/dirdat/to

-- 添加trail文件的定义与extract进程绑定

GGSCI (dtproxy) 14>  add rmttrail ./dirdat/to,extract pupkfk

3.配置目标端恢复进程

-- 配置目标端恢复进程

edit param repkfk

-- 添加

REPLICAT repkfk

SOURCEDEFS ./dirdef/define_kfk.txt

targetdb libfile libggjava.so set property=./dirprm/kafka.props

REPORTCOUNT EVERY 1 MINUTES, RATE

GROUPTRANSOPS 10000

MAP baiyang.ora_to_kfk, TARGET baiyang.ora_to_kfk;



--添加trail文件到replicate进程

add replicat repkfk exttrail ./dirdat/to,checkpointtable ggsadmin.checkpoint

4.源端开启实时数据抓取

./ggsci

GGSCI (dtproxy) 5> start extkfk



Sending START request to MANAGER ...

EXTRACT EXTKFK starting





GGSCI (dtproxy) 6> start pupkfk



Sending START request to MANAGER ...

EXTRACT PUPKFK starting





GGSCI (dtproxy) 7> status all



Program     Status      Group       Lag at Chkpt  Time Since Chkpt



MANAGER     RUNNING

EXTRACT     RUNNING     EXTKFK      00:00:00      00:00:10

EXTRACT     RUNNING     PUPKFK      00:00:00      00:00:00

5.目标端开启实时数据同步

./ggsci

GGSCI (172-16-101-242) 7> start replicat repkfk



Sending START request to MANAGER ...

REPLICAT REPKFK starting





GGSCI (172-16-101-242) 8> info all



Program     Status      Group       Lag at Chkpt  Time Since Chkpt



MANAGER     RUNNING

REPLICAT    RUNNING     REPKFK      00:00:00      00:00:00

6.测试增量数据同步

Oracle插入增量数据

SQL> insert into baiyang.ora_to_kfk  select OWNER, OBJECT_NAME, SUBOBJECT_NAME, OBJECT_ID, DATA_OBJECT_ID, OBJECT_TYPE from all_objects where object_id >500 and  object_id < 1000;

SQL> commit;

SQL> select count(*) from baiyang.ora_to_kfk;



COUNT(*)

----------

    905

查看Kafka消息队列消费数据

{"table":"BAIYANG.ORA_TO_KFK","op_type":"I","op_ts":"2019-11-11 21:04:11.158786","current_ts":"2019-11-11T21:10:54.042000","pos":"00000000000000075298","after":{"OWNER":"SYS","OBJECT_NAME":"APPLY$_READER_STATS","SUBOBJECT_NAME":null,"OBJECT_ID":998,"DATA_OBJECT_ID":998,"OBJECT_TYPE":"TABLE"}}

{"table":"BAIYANG.ORA_TO_KFK","op_type":"I","op_ts":"2019-11-11 21:04:11.158786","current_ts":"2019-11-11T21:10:54.042001","pos":"00000000000000075459","after":{"OWNER":"SYS","OBJECT_NAME":"APPLY$_READER_STATS_I","SUBOBJECT_NAME":null,"OBJECT_ID":999,"DATA_OBJECT_ID":999,"OBJECT_TYPE":"INDEX"}}

源端Oracle删除数据

SQL> delete from baiyang.ora_to_kfk ;

906 rows deleted.

SQL> commit;

查看kafka消息队列消费数据

{"table":"BAIYANG.ORA_TO_KFK","op_type":"D","op_ts":"2019-11-11 21:13:11.166184","current_ts":"2019-11-11T21:13:17.449007","pos":"00000000000000216645","before":{"OWNER":"x1","OBJECT_NAME":"SSSSS","SUBOBJECT_NAME":"z1","OBJECT_ID":111000,"DATA_OBJECT_ID":2000,"OBJECT_TYPE":"x1"}}

源端插入数据

SQL> insert into  baiyang.ora_to_kfk values('汉字', 'y1', 'z1', 111000,2000,'x1');

1 row created.

SQL> commit;

查看kafka消息队列消费数据

{"table":"BAIYANG.ORA_TO_KFK","op_type":"I","op_ts":"2019-11-11 21:14:21.167454","current_ts":"2019-11-11T21:14:26.497000","pos":"00000000000000216794","after":{"OWNER":"汉字","OBJECT_NAME":"y1","SUBOBJECT_NAME":"z1","OBJECT_ID":111000,"DATA_OBJECT_ID":2000,"OBJECT_TYPE":"x1"}}

总结

使用OGG可以方便地将Oracle的数据变更情况实时同步到Kafka消息队列。下游业务系统通过订阅kafka的消息队列，能方便地实现各类实时数据的应用。

如何建设数据中台（五）——数据汇集—打破企业数据孤岛 weixin_47088026 学习记录和总结中台数据中台程序人生经验分享
数据汇集——打破企业数据孤岛要构建企业级数据中台，第一步就是将企业内部各个业务系统的数据实现互通互联，打破数据孤岛，主要通过数据汇聚和交换来实现。企业采集的数据可以是线上采集、线下数据采集、互联网数据采集、内部数据采集等。线上数据采集主要载体分为互联网和移动互联网两种，对应有系统平台、网页、H5、小程序、App等，可以采用前端或后端埋点方式采集数据。线下数据采集主要是通过硬件来采集，例如：WiFi
数据中台-建设思路：从理论到实践，打造企业数据驱动引擎赛博不良人大数据数据仓库
数据中台-建设思路：从理论到实践，打造企业数据驱动引擎摘要：在数字化时代，数据已成为企业的核心资产。如何有效地管理和利用数据，是企业数字化转型的关键。数据中台作为一种新型的数据管理架构，应运而生。本文将从数据中台的建设方向、目标、策略、步骤、成熟度评估、应用场景等方面，为企业构建数据中台提供全面的指导。关键词：数据中台，数字化转型，数据管理，数据分析，业务中台一、引言随着企业数字化转型的不断深入，
从零到一建设数据中台 - 架构概览我码玄黄从零到一建设数据中台架构数据中台中台架构
数据中台功能架构概览数据中台相关名词解释1.数据仓库：数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合，用于支持管理决策。因此，其重点在于数据的集合。数据仓库可使用维度建模方法论从业务过程中抽象出通用维度与度量，组成数据模型，为决策分析提供通用的数据分析能力。数据仓库重在建数据，而数据中台则将建、治、管、服放到同样的高度，数据仓库只是数据中台的一个子集。用一个蔬菜储存的例子来简
大数据平台（数据中台、数据中枢、数据湖、数据要素）建设方案数字化建设方案数字化转型数据治理主数据数据仓库大数据
大数据平台（数据中台、数据中枢、数据湖、数据要素）建设方案大数据平台（数据中台、数据中枢、数据湖、数据要素）建设方案项目背景和目标项目背景项目目标建设原则与策略数据中台架构设计整体架构设计思路数据采集层数据存储层数据计算层数据服务层数据中枢功能实现数据治理功能数据资产管理功能数据安全管控功能数据服务总线功能数据湖存储与计算方案数据湖存储架构设计数据湖计算框架选择数据湖应用场景分析数据湖安全与合规性
数据中台建设方案-基于大数据平台(下) FRDATA1550333 大数据数据库架构数据库开发数据库
数据中台建设方案-基于大数据平台(下)1数据中台建设方案1.1总体建设方案1.2大数据集成平台1.3大数据计算平台1.3.1数据计算层建设计算层技术含量最高，最为活跃，发展也最为迅速。计算层主要实现各类数据的加工、处理和计算，为上层应用提供良好和充分的数据支持。大数据基础平台技术能力的高低，主要依赖于该层组件的发展。本建设方案满足甲方对于数据计算层建设的基本要求：利用了MapReduce、Spar
详解神策数据银行对公业务数字化运营解决方案汪功校大数据
4.0时代，数字银行的转变主要体现在系统支持、数据管理、客户感知三个维度，希望通过改善业务体系、整合业务数据，从而为客户提供更好的服务。当前，多数银行已经拥有了较好的数据基础，但却并没有形成数据全生命周期的闭环，导致价值化数据占比较低，无法作为关键生产要素为企业注入新动能。在此背景下，数据全生命周期的闭环体系成为银行数字化运营的引擎，发挥数据中台和业务中台相辅相成、相互支撑的作用，构建以客户数据为
CDC 数据实时同步入湖的技术、架构和方案汇总 Laurence　 CDC数据入湖方案 •合集大数据专题 CDC 实时同步数据湖方案架构技术
博主历时三年精心创作的《大数据平台架构与原型实现：数据中台建设实战》一书现已由知名IT图书品牌电子工业出版社博文视点出版发行，点击《重磅推荐：建大数据平台太难了！给我发个工程原型吧！》了解图书详情，京东购书链接：https://item.jd.com/12677623.html，扫描左侧二维码进入京东手机购书页面。近期，对“实时摄取CDC数据同步到数据湖”这一技术主题作了一系列深入的研究和验证，目
数据中台：企业数字化转型的核心驱动力我就是全世界 AI 大数据
一、数据中台的定义与核心思想1.1数据中台的概念与愿景数据中台，作为企业数字化转型的核心驱动力，其概念源于对传统数据管理模式的深刻反思与创新。数据中台不仅仅是一个技术平台，更是一种全新的数据管理理念和战略布局。它旨在通过整合、治理、服务和创新，将企业的数据资源转化为有价值的数据资产，从而支持企业的业务创新和持续发展。数据中台的愿景是构建一个统一、共享、高效的数据服务平台，使得企业内部各个业务部门能
医疗数字化转型数据中台架构方案（一）智汇优库数字化转型产业数字化数字化建设大数据人工智能产业数字化政务数字化建设
为推进医疗数字化转型，我们提出构建数据中台架构方案：通过集成医院内外多个数据源，利用大数据、人工智能等技术对数据进行清洗、整合、标准化处理，形成高质量的数据资产；再基于云原生技术构建湖仓一体化大数据平台，实现数据的统一存储、管理和应用，为临床决策、运营管理提供智能数据支持，助力医院提升服务质量、效率和运营水平。
异构数据源间数据同步及迁移神器dbSwitch免费推荐！！开源数据中台数据库数据仓库数据库开发
图1.开源多组件数据中台架构图书接上回，下面分析数据采集层中DBswitch异构数据同步工具的使用及安装： 3.DBswitch异构数据同步工具DBswitch是一种异构数据同步工具，它能够将不同类型的数据进行转换，从而实现数据同步。DBswitch的开发目的是为了解决不同数据库之间的数据同步问题，以及不同数据格式之间的转换问题。首先，DBswitch支持多种数据库类型，包括MySQL、O
六、SpringCloud Alibaba + Spring Boot + mybatis +数据中台+多租户saas+前后端分离之Spring Cloud Alibaba基于Nacos分布式配置中心不会写代码的女程序猿分布式 spring boot spring cloud
1.前言在上一篇文章，我们实现了基于nacos做分布式配置中心，实施的存储、更新我们的配置文件数据，在使用以往的一些配置中心时，服务重启或者注册中心重启后，配置文件数据将会丢失，这种情况是因为将数据储存在JVM的内存当中，当JVM不再提供运行时，数据也会相应的丢失，一些开源框架默认将数据存储在JVM内存中的还挺多的，那么nacos又是存储在哪里呢？架构技术选型核心框架SpringBootSOASp
从零到一建设数据中台 - 关键技术汇总我码玄黄数据中台数据挖掘数据分析大数据
一、数据中台关键技术汇总语言框架：Java、Maven、SpringBoot数据分布式采集：Flume、Sqoop、kettle数据分布式存储：HadoopHDFS离线批处理计算：MapReduce、Spark、Flink实时流式计算：Storm/SparkStreaming、Flink批处理消息队列：Kafka查询分析：Hbase、Hive、ClickHouse、Presto搜索引擎：Elast
数字（智）化采购系统优点_亮点_应用场景 xinyuan_123456 软件工程云原生微服务
郑州信源数字化采购系统研发商，系统融合云原生、微服务、大数据、人工智能、物联网等先进技术，构建业务中台、数据中台、AI中台三大核心基座，以采购为切入点，结合供应链管理理念，为招采供应链提供交易、监管、数据、服务、运营为一体的全流程数智化解决方案。数字化采购系统优点1、提高效率：系统通过自动化和标准化的流程，显著提高了采购效率，缩短了采购周期。2、降低成本：系统减少了纸质文档的使用和人工操作的时间消
让数据用起来：数据中台建设的评估与选择（第4章）小阳阳兄读书笔记产品经理数据分析大数据
4.1企业数据应用的成熟度评估企业数据应用能力成熟度可以总结为4个阶段：第一个阶段：统计分析。只有业务系统的数据库，以手工报表为主。第二个阶段：决策支持。开始构建企业级数据仓库，使用BI工具、大屏等。第三个阶段：数据驱动。加强业务与数据融合，利用大数据、机器学习、深度学习等技术进行精准营销、信用风险控制等。第四个阶段：运营优化。开始建设数据中台，快速生产定制化数据服务。企业数据应用能力成熟度可以从
透彻理解实时数仓的支撑技术：Upsert Kafka 和 Flink 动态表（Dynamic Table）　Laurence 大数据专题 upsert-kafka flink 动态表原理解释更新
博主历时三年精心创作的《大数据平台架构与原型实现：数据中台建设实战》一书现已由知名IT图书品牌电子工业出版社博文视点出版发行，点击《重磅推荐：建大数据平台太难了！给我发个工程原型吧！》了解图书详情，京东购书链接：https://item.jd.com/12677623.html，扫描左侧二维码进入京东手机购书页面。动态表本质上是一条流（stream），upsert-kafka映射的数据表底层存储的
Flink Catalog 解读与同步 Hudi 表元数据的最佳实践　Laurence 大数据专题 flink catalog hudi metastore hive 共用表元数据
博主历时三年精心创作的《大数据平台架构与原型实现：数据中台建设实战》一书现已由知名IT图书品牌电子工业出版社博文视点出版发行，点击《重磅推荐：建大数据平台太难了！给我发个工程原型吧！》了解图书详情，京东购书链接：https://item.jd.com/12677623.html，扫描左侧二维码进入京东手机购书页面。在当前的大数据格局中，Spark/Hive/Flink是最为主流的ETL或Strea
数据仓库、大数据平台、数据中台的区别 000X000 数据中台
问题导读：1、如何理解数据中台？2、数据仓库、大数据平台、数据中台都是什么？3、大数据平台硬件架构如何设计？4、数据仓库、大数据平台、数据中台架构如何理解？一、层出不穷的新名词现在各种新名词层出不穷：顶层的有数字城市、智慧地球、智慧城市、城市大脑；企业层面的有数字化转型、互联网经济，数字经济、数字平台；平台层面的有物联网，云计算，大数据，5G，人工智能，机器智能，深度学习，知识图谱；技术层面的有数
我该建数仓、大数据平台还是数据中台？看完脑子终于清醒了 zl1zl2zl3 大数据中台大数据中台
一、层出不穷的新名词现在各种新名词层出不穷：顶层的有数字城市、智慧地球、智慧城市、城市大脑；企业层面的有数字化转型、互联网经济，数字经济、数字平台；平台层面的有物联网，云计算，大数据，5G，人工智能，机器智能，深度学习，知识图谱；技术层面的有数据仓库、数据集市、大数据平台、数据湖、数据中台、业务中台、技术中台等等。总之是你方唱罢他登场，各种概念满天飞…在比拼新经济的过程中，其实比拼的是流量也就是用
【30秒看懂大数据】数据中台风姑娘数据说生活中的数据学大数据大数据
知幽科技是一家专注企业数字/智化，围绕数据价值应用的一站式数智化解决方案的咨询公司，也包括了为企业提供定制化数据培训，力求做企业最好的数智化决策伙伴。点击上方「蓝字」关注我们30秒看懂大数据专栏让您在有限的碎片化时间，快速看懂最火热的大数据简单说：描述性分析中台是相对于前台和后台而言，数据中台就是对于数据进行加工、整理、分析、应用的一个中间平台，较于数据中台而言，后台指系统数据后台，前台针对业务应
大厂的供应链采购系统设计后端
关注我，紧跟本系列专栏文章，咱们下篇再续！作者简介：魔都技术专家兼架构，多家大厂后端一线研发经验，各大技术社区头部专家博主，编程严选网创始人。具有丰富的引领团队经验，深厚业务架构和解决方案的积累。负责：中央/分销预订系统性能优化活动&优惠券等营销中台建设交易平台及数据中台等架构和开发设计目前主攻降低软件复杂性设计、构建高可用系统方向。参考：编程严选网0前言公司发展面临商业环境变化，如流量模式、竞争
基于 Webpack5 Module Federation 的业务解耦实践
我们是袋鼠云数栈UED团队，致力于打造优秀的一站式数据中台产品。我们始终保持工匠精神，探索前端道路，为社区积累并传播经验价值。本文作者：贝儿前言本文中会提到很多目前数栈中使用的特定名词，统一做下解释描述dt-common：每个子产品都会引入的公共包(类似NPM包)AppMenus：在子产品中快速进入到其他子产品的导航栏，统一维护在dt-common中，子产品从dt-common中引入Portal：
中金易云：为出版社找到下一本《解忧杂货店》猫耳呀
摘要：以供给侧结构性改革的角度来看，出版社即是最直接的供给侧，出版高质量、畅销度高的图书，建立出产高质量图书及图书IP的体系，即是提高供给体系质量。中金易云出版发行大数据平台正是以数字化转型为核心思路，以大数据中台与智能算法为基础的出版业供给侧结构性改革的成果。2016年，全国出版、印刷和发行服务实现营业收入23595.8亿元，较2015年增长9.0%，利润总额1792.0亿元，增长7.8%，在图
一份简单的产品经理转正工作总结一个数据人的自留地
是新朋友吗？记得先点蓝字关注我哦～关注微信公众号：一个数据人的自留地1、回复“数据中台”，获取2、回复“数据产品”，获取3、回复“商业分析”，获取4、回复“交个朋友”，进入引言今天下大雨，小诺打着伞去公司上班，路上他小心翼翼的避开水坑，心想自己可是个产品经理，避坑这不是职业技能吗？他继续往前走。突然，前面有个小子一脚踩进了水坑，鞋湿了一半。小诺一看，这不大拿吗。于是叫了声“大拿”，说“兄弟今天又踩
供应链领域数据中台架构建设（上） JavaEdge. 架构
点击下方“JavaEdge”，选择“设为星标”第一时间关注技术干货！关注我，紧跟本系列专栏文章，咱们下篇再续！作者简介：魔都国企技术专家兼架构，多家大厂后端一线研发经验，各大技术社区头部专家博主，编程严选网创始人。具有丰富的引领团队经验，深厚业务架构和解决方案的积累。负责：中央/分销预订系统性能优化；活动&优惠券等营销中台建设；交易平台及数据中台等架构和开发设计目前主攻降低软件复杂性设计、构建高可
字节跳动官方出品AI，白嫖使用GPT4！ JavaEdge. java
关注我，紧跟本系列专栏文章，咱们下篇再续！作者简介：魔都技术专家兼架构，多家大厂后端一线研发经验，各大技术社区头部专家博主，编程严选网创始人。具有丰富的引领团队经验，深厚业务架构和解决方案的积累。负责：中央/分销预订系统性能优化活动&优惠券等营销中台建设交易平台及数据中台等架构和开发设计目前主攻降低软件复杂性设计、构建高可用系统方向。参考：编程严选网1简介字节跳动在海外推出的AI聊天机器人和应用程
大厂的供应链域数据中台设计后端
关注我，紧跟本系列专栏文章，咱们下篇再续！作者简介：魔都技术专家兼架构，多家大厂后端一线研发经验，各大技术社区头部专家博主，编程严选网创始人。具有丰富的引领团队经验，深厚业务架构和解决方案的积累。负责：中央/分销预订系统性能优化活动&优惠券等营销中台建设交易平台及数据中台等架构和开发设计目前主攻降低软件复杂性设计、构建高可用系统方向。参考：编程严选网1前言受限于对业务掌握度及对应数据特性的了解，大
深入浅出 testing-library 前端单元测试单测
我们是袋鼠云数栈UED团队，致力于打造优秀的一站式数据中台产品。我们始终保持工匠精神，探索前端道路，为社区积累并传播经验价值。本文作者：佳岚Themoreyourtestsresemblethewayyoursoftwareisused,themoreconfidencetheycangiveyou.您的测试越接近软件的使用方式，它们就越能给您带来信心。什么是testing-library?在了解
基于 Webpack5 Module Federation 的业务解耦实践
我们是袋鼠云数栈UED团队，致力于打造优秀的一站式数据中台产品。我们始终保持工匠精神，探索前端道路，为社区积累并传播经验价值。本文作者：贝儿前言本文中会提到很多目前数栈中使用的特定名词，统一做下解释描述dt-common：每个子产品都会引入的公共包(类似NPM包)AppMenus：在子产品中快速进入到其他子产品的导航栏，统一维护在dt-common中，子产品从dt-common中引入Portal：
供应链域数据中台设计后端
关注我，紧跟本系列专栏文章，咱们下篇再续！作者简介：魔都技术专家兼架构，多家大厂后端一线研发经验，各大技术社区头部专家博主，编程严选网创始人。具有丰富的引领团队经验，深厚业务架构和解决方案的积累。负责：中央/分销预订系统性能优化活动&优惠券等营销中台建设交易平台及数据中台等架构和开发设计目前主攻降低软件复杂性设计、构建高可用系统方向。参考：编程严选网1前言受限于对业务掌握度及对应数据特性的了解，大
大厂的供应链域数据中台设计后端
关注我，紧跟本系列专栏文章，咱们下篇再续！作者简介：魔都技术专家兼架构，多家大厂后端一线研发经验，各大技术社区头部专家博主，编程严选网创始人。具有丰富的引领团队经验，深厚业务架构和解决方案的积累。负责：中央/分销预订系统性能优化活动&优惠券等营销中台建设交易平台及数据中台等架构和开发设计目前主攻降低软件复杂性设计、构建高可用系统方向。参考：编程严选网1前言受限于对业务掌握度及对应数据特性的了解，大
设计模式介绍 tntxia 设计模式
设计模式来源于土木工程师克里斯托弗亚历山大（http://en.wikipedia.org/wiki/Christopher_Alexander）的早期作品。他经常发表一些作品，内容是总结他在解决设计问题方面的经验，以及这些知识与城市和建筑模式之间有何关联。有一天，亚历山大突然发现，重复使用这些模式可以让某些设计构造取得我们期望的最佳效果。亚历山大与萨拉-石川佳纯和穆雷西乐弗斯坦合作
android高级组件使用(一) 百合不是茶 android RatingBar Spinner
1、自动完成文本框（AutoCompleteTextView） AutoCompleteTextView从EditText派生出来，实际上也是一个文本编辑框，但它比普通编辑框多一个功能：当用户输入一个字符后，自动完成文本框会显示一个下拉菜单，供用户从中选择，当用户选择某个菜单项之后，AutoCompleteTextView按用户选择自动填写该文本框。使用AutoCompleteTex
[网络与通讯]路由器市场大有潜力可挖掘 comsci 网络
如果国内的电子厂商和计算机设备厂商觉得手机市场已经有点饱和了,那么可以考虑一下交换机和路由器市场的进入问题..... 这方面的技术和知识,目前处在一个开放型的状态,有利于各类小型电子企业进入 &nbs
自写简单Redis内存统计shell 商人shang Linux shell 统计Redis内存
#!/bin/bash address="192.168.150.128:6666,192.168.150.128:6666" hosts=(${address//,/ }) sfile="staticts.log" for hostitem in ${hosts[@]} do ipport=(${hostitem
单例模式(饿汉 vs懒汉) oloz 单例模式
package 单例模式; /* * 应用场景:保证在整个应用之中某个对象的实例只有一个 * 单例模式种的《懒汉模式》 * */ public class Singleton { //01 将构造方法私有化，外界就无法用new Singleton()的方式获得实例 private Singleton(){}; //02 申明类得唯一实例 priva
springMvc json支持杨白白 json springmvc
1.Spring mvc处理json需要使用jackson的类库，因此需要先引入jackson包 2在spring mvc中解析输入为json格式的数据:使用@RequestBody来设置输入 @RequestMapping("helloJson") public @ResponseBody JsonTest helloJson() {
android播放，掃描添加本地音頻文件小桔子
最近幾乎沒有什麽事情，繼續鼓搗我的小東西。想在項目中加入一個簡易的音樂播放器功能，就像華為p6桌面上那麼大小的音樂播放器。用過天天動聽或者QQ音樂播放器的人都知道，可已通過本地掃描添加歌曲。不知道他們是怎麼實現的，我覺得應該掃描設備上的所有文件，過濾出音頻文件，每個文件實例化為一個實體，記錄文件名、路徑、歌手、類型、大小等信息。具體算法思想，
oracle常用命令 aichenglong oracle dba 常用命令
1 创建临时表空间 create temporary tablespace user_temp tempfile 'D:\oracle\oradata\Oracle9i\user_temp.dbf' size 50m autoextend on next 50m maxsize 20480m extent management local
25个Eclipse插件 AILIKES eclipse插件
提高代码质量的插件1. FindBugsFindBugs可以帮你找到Java代码中的bug，它使用Lesser GNU Public License的自由软件许可。2. CheckstyleCheckstyle插件可以集成到Eclipse IDE中去，能确保Java代码遵循标准代码样式。3. ECLemmaECLemma是一款拥有Eclipse Public License许可的免费工具，它提供了
Spring MVC拦截器+注解方式实现防止表单重复提交 baalwolf spring mvc
原理：在新建页面中Session保存token随机码，当保存时验证，通过后删除，当再次点击保存时由于服务器端的Session中已经不存在了，所有无法验证通过。 1.新建注解： ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
《Javascript高级程序设计(第3版)》闭包理解 bijian1013 JavaScript
“闭包是指有权访问另一个函数作用域中的变量的函数。”--《Javascript高级程序设计(第3版)》看以下代码： <script type="text/javascript"> function outer() { var i = 10; return f
AngularJS Module类的方法 bijian1013 JavaScript AngularJS Module
AngularJS中的Module类负责定义应用如何启动，它还可以通过声明的方式定义应用中的各个片段。我们来看看它是如何实现这些功能的。一.Main方法在哪里如果你是从Java或者Python编程语言转过来的，那么你可能很想知道AngularJS里面的main方法在哪里？这个把所
[Maven学习笔记七]Maven插件和目标 bit1129 maven插件
插件(plugin)和目标(goal) Maven，就其本质而言，是一个插件执行框架，Maven的每个目标的执行逻辑都是由插件来完成的，一个插件可以有1个或者几个目标，比如maven-compiler-plugin插件包含compile和testCompile，即maven-compiler-plugin提供了源代码编译和测试源代码编译的两个目标使用插件和目标使得我们可以干预
【Hadoop八】Yarn的资源调度策略 bit1129 hadoop
1. Hadoop的三种调度策略 Hadoop提供了3中作业调用的策略， FIFO Scheduler Fair Scheduler Capacity Scheduler 以上三种调度算法，在Hadoop MR1中就引入了，在Yarn中对它们进行了改进和完善.Fair和Capacity Scheduler用于多用户共享的资源调度 2. 多用户资源共享的调度
Nginx使用Linux内存加速静态文件访问 ronin47
Nginx是一个非常出色的静态资源web服务器。如果你嫌它还不够快，可以把放在磁盘中的文件，映射到内存中，减少高并发下的磁盘IO。先做几个假设。nginx.conf中所配置站点的路径是/home/wwwroot/res，站点所对应文件原始存储路径：/opt/web/res shell脚本非常简单，思路就是拷贝资源文件到内存中，然后在把网站的静态文件链接指向到内存中即可。具体如下：
关于Unity3D中的Shader的知识 brotherlamp unity unity资料 unity教程 unity视频 unity自学
首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，然后我们来看下Unity3D自带的60多个S
CopyOnWriteArrayList vs ArrayList bylijinnan java
package com.ljn.base; import java.util.ArrayList; import java.util.Iterator; import java.util.List; import java.util.concurrent.CopyOnWriteArrayList; /** * 总述： * 1.ArrayListi不是线程安全的，CopyO
内存中栈和堆的区别 chicony 内存
1、内存分配方面：堆：一般由程序员分配释放，若程序员不释放，程序结束时可能由OS回收。注意它与数据结构中的堆是两回事，分配方式是类似于链表。可能用到的关键字如下：new、malloc、delete、free等等。栈：由编译器(Compiler)自动分配释放，存放函数的参数值，局部变量的值等。其操作方式类似于数据结构中
回答一位网友对Scala的提问 chenchao051 scala map
本来准备在私信里直接回复了，但是发现不太方便，就简要回答在这里。问题写道对于scala的简洁十分佩服，但又觉得比较晦涩，例如一例，Map("a" -> List(11,111)).flatMap(_._2)，可否说下最后那个函数做了什么，真正在开发的时候也会如此简洁？谢谢先回答一点，在实际使用中，Scala毫无疑问就是这么简单。
mysql 取每组前几条记录 daizj mysql 分组最大值最小值每组三条记录
一、对分组的记录取前N条记录：例如：取每组的前3条最大的记录 1.用子查询： SELECT * FROM tableName a WHERE 3> (SELECT COUNT(*) FROM tableName b WHERE b.id=a.id AND b.cnt>a. cnt) ORDER BY a.id,a.account DE
HTTP深入浅出 http请求 dcj3sjt126com http
HTTP(HyperText Transfer Protocol)是一套计算机通过网络进行通信的规则。计算机专家设计出HTTP，使HTTP客户（如Web浏览器）能够从HTTP服务器(Web服务器)请求信息和服务，HTTP目前协议的版本是1.1.HTTP是一种无状态的协议，无状态是指Web浏览器和Web服务器之间不需要建立持久的连接，这意味着当一个客户端向服务器端发出请求，然后We
判断MySQL记录是否存在方法比较 dcj3sjt126com mysql
把数据写入到数据库的时，常常会碰到先要检测要插入的记录是否存在，然后决定是否要写入。　　我这里总结了判断记录是否存在的常用方法：　　sql语句： select count ( * ) from tablename; 　　然后读取count(*)的值判断记录是否存在。对于这种方法性能上有些浪费，我们只是想判断记录记录是否存在，没有必要全部都查出来。
对HTML XML的一点认识 e200702084 html xml
感谢http://www.w3school.com.cn提供的资料 HTML 文档中的每个成分都是一个节点。节点根据 DOM，HTML 文档中的每个成分都是一个节点。 DOM 是这样规定的：整个文档是一个文档节点每个 HTML 标签是一个元素节点包含在 HTML 元素中的文本是文本节点每一个 HTML 属性是一个属性节点注释属于注释节点 Node 层次
jquery分页插件 genaiwei jquery Web 前端分页插件
//jquery页码控件// 创建一个闭包 (function($) { // 插件的定义 $.fn.pageTool = function(options) { var totalPa
Mybatis与Ibatis对照入门于学习 Josh_Persistence mybatis ibatis 区别联系
一、为什么使用IBatis/Mybatis 对于从事 Java EE 的开发人员来说，iBatis 是一个再熟悉不过的持久层框架了，在 Hibernate、JPA 这样的一站式对象 / 关系映射（O/R Mapping）解决方案盛行之前，iBaits 基本是持久层框架的不二选择。即使在持久层框架层出不穷的今天，iBatis 凭借着易学易用、
C中怎样合理决定使用那种整数类型？秋风扫落叶 c 数据类型
如果需要大数值(大于32767或小于32767), 使用long 型。否则, 如果空间很重要 (如有大数组或很多结构), 使用 short 型。除此之外, 就使用 int 型。如果严格定义的溢出特征很重要而负值无关紧要, 或者你希望在操作二进制位和字节时避免符号扩展的问题, 请使用对应的无符号类型。但是, 要注意在表达式中混用有符号和无符号值的情况。 &nbs
maven问题 zhb8015 maven问题
问题1： Eclipse 中新建maven项目无法添加src/main/java 问题 eclipse创建maevn web项目，在选择maven_archetype_web原型后，默认只有src/main/resources这个Source Floder。按照maven目录结构，添加src/main/ja
(二)androidpn-server tomcat版源码解析之--push消息处理 spjich java androdipn 推送
在 (一)androidpn-server tomcat版源码解析之--项目启动这篇中，已经描述了整个推送服务器的启动过程，并且把握到了消息的入口即XmppIoHandler这个类，今天我将继续往下分析下面的核心代码，主要分为3大块，链接创建，消息的发送，链接关闭。先贴一段XmppIoHandler的部分代码 /** * Invoked from an I/O proc
用js中的formData类型解决ajax提交表单时文件不能被serialize方法序列化的问题中华好儿孙 JavaScript Ajax Web 上传文件 FormData
var formData = new FormData($("#inputFileForm")[0]); $.ajax({ type:'post', url:webRoot+"/electronicContractUrl/webapp/uploadfile", data:formData, async: false, ca
mybatis常用jdbcType数据类型 ysj5125094 mybatis mapper jdbcType
MyBatis 通过包含的jdbcType 类型 BIT FLOAT CHAR