Databus for Oracle

Databus组成

Relay :数据抓取端

  • 读取数据源变更行(ROW),并将变更行数据序列化到内存缓冲区。
  • 监听客户端请求并传输缓冲区的数据。

Client:数据客户端

  • 检查Relay端的数据变更,并同步数据。
  • 如果与Relay之间数据变更相差太大、会执行追溯功能。

注:单个客户端既可以处理全部Databus数据流,也可以作为集群的一部分处理一小部分数据流。

bootstrap-producer:追溯数据生产端

  1. 这是一个特殊客户端,用于将Relay上的变更数据存储到Mysql数据库。
  2. Mysql数据库用于追溯数据。

bootstrap-server:追溯数据服务端

  1. 监听Client端执行追溯的功能请求。

databus-example for Oracle

这里记录运行databus自带的person的example的过程。

  1. 首先准备Oracle环境,这里我安装的oracle-xe 11g 。管理员密码orale,sid:XE,端口1521。
  2. databus是用gradle构建的java应用,所以本地首先需要安装gradle环境和java环境。gradle版本>=1.8即可。java版本>=1.6即可。
  3. 在github上下载databus源代码,解压解压好目录是databus-master。
  4. 在oracle官网下载ojdbc6.jar重命名放到如下目录:
databus-master/sandbox-repo/com/oracle/ojdbc6/11.2.0.2.0/ojdbc6-11.2.0.2.0.jar

其实做好如上操作即可开始编译了,databus wiki是这么介绍了,不过看有人编译会指定utf-8编码,其实不需要,因为这里不涉及中文。

  1. 关于gradle版本,如果本地的gradle环境是5以前的,那么无所谓,如果是gradle5需要更改build.gradle文件。
task wrapper(type: Wrapper) {
    gradleVersion = '1.8'
}

改为如下,否则编译的时候会报错:Cannot add task ‘wrapper’ as a task with that name already exists

wrapper {
    gradleVersion = '1.8'
}

我本次编译使用版本是gradle5.1(试了最新的5.4.1编译太慢直接放弃了)

  1. com.linkedin.databus2.core.container.netty.ServerContainer的initializeContainerJmx()方法中添加如下内容。这里如果不更改在运行relay的时候会产生Cannot bind to URL rmi://localhost:1099 ServiceUnavailableException错误。
LocateRegistry.createRegistry(_containerStaticConfig.getJmx().getRmiRegistryPort());

最后完整结果:

  protected void initializeContainerJmx()
  {
    if (_containerStaticConfig.getJmx().isRmiEnabled())
    {
      try
      {
        JMXServiceURL jmxServiceUrl =
            new JMXServiceURL("service:jmx:rmi://" +
                              _containerStaticConfig.getJmx().getJmxServiceHost() + ":" +
                              _containerStaticConfig.getJmx().getJmxServicePort() +"/jndi/rmi://" +
                              _containerStaticConfig.getJmx().getRmiRegistryHost() + ":" +
                              _containerStaticConfig.getJmx().getRmiRegistryPort() + "/jmxrmi" +
                              _containerStaticConfig.getJmx().getJmxServicePort());
        LocateRegistry.createRegistry(_containerStaticConfig.getJmx().getRmiRegistryPort())
        _jmxConnServer = JMXConnectorServerFactory.newJMXConnectorServer(jmxServiceUrl, null,
                                                                         getMbeanServer());
      }
      catch (Exception e)
      {
        LOG.warn("Unable to instantiate JMX server", e);
      }
    }
  }

注意首行导包:import java.rmi.registry.LocateRegistry;

  1. 修改reateUser在第51行
 sqlplus sys/oracle\@${DBNAME} as sysdba << __EOF__

这里我改为sys/oracle ,这是我的Oracle数据源的sysdba用户名密码。

  1. 修改sources-person.json,更改第4行,改为我们要连接的数据源信息。这里如果写错了那么运行clien的时候会报数据库连接错误。
{
    "name" : "person",
    "id"  : 1,
    "uri" : "jdbc:oracle:thin:person/person@localhost:1521:XE",
        "slowSourceQueryThreshold" : 2000,
        "sources" :
        [
                {"id" : 101,
                 "name" : "com.linkedin.events.example.person.Person",
                 "uri": "person.person",
                 "partitionFunction" : "constant:1"
                }
        ]
}

以上都操作好了即可编译了:

gradle -Dopen_source=true assemble

Databus for Oracle_第1张图片

java是向下兼容的,我用的jdk8,编译的时候只是会警告有些方法过期而已,是可以成功编译的。
编译好了会在build文件夹下生成很多编译后的文件。

在运行实例之前先要执行数据库脚本以及生成avro序列化文件

  1. 运行createUser
 sh ./db/oracle/bin/createUser.sh person person xe tbs_person /u01/app/oracle/oradata/XE/person/
  1. 运行createSchema
cd ./db/oracle/fwk
sh /home/databus-master/db/oracle/bin/createSchema.sh person/person@xe /home/databus-master/databus2-example/database/person/
  1. 生成avro序列化文件
cd /home/databus-master/build/databus2-cmdline-tools-pkg/distributions
tar -zxvf databus2-cmdline-tools-pkg-2.0.0.tar.gz
cd bin
sh dbus2-avro-schema-gen.sh -namespace com.linkedin.events.example.person -recordName Person -viewName "sy\$person" -avroOutDir /home/databus-master/myperson-avro/avroOut -avroOutVersion 1 -javaOutDir /home/databus-master/myperson-avro/javaOut -userName person -password person -database jdbc:oracle:thin:@localhost:1521:xe

接下即可运行测试了。

  1. 运行relay
tar -zxvf build/databus2-example-relay-pkg/distributions/databus2-example-relay-pkg-2.0.0.tar.gz
sh start-example-relay.sh person
  1. 运行client
tar -zxvf build/databus2-example-client-pkg/distributions/databus2-example-client-pkg-2.0.0.tar.gz
sh start-example-client.sh person 
  1. 开始测试,登录Oracle的person用户执行插入或者更新语句:
INSERT INTO person(id,first_name, last_name,birth_date) VALUES(1,'Trump', 'Donald',sysdate);
update person p set  p.BIRTH_DATE = sysdate -100 where p.ID = 1;
  1. 可以在clien.log看到捕获的信息
    Databus for Oracle_第2张图片
    但是我发现执行delete语句是无法捕获的,查看数据库脚本发现,databus-example在建立触发器的时候,只建立了inser/update的触发器,没有delete相关的触发器。
    继续查文档,看到这个文档Databus-2.0-Client-Event-Model-and-Consumer-API.
    其中Data Change Events章节中有提到可以捕获update(包含insert)和delete两个操作应该也是可以捕获的。

到此为止,我们能够捕获Oracle数据库变更的行信息。但需要针对每个表新加字段txn,对每个表建立触发器。但捕获到了的数据不像ogg一样可以直接同步到目标库,目前来看这部分需要写代码单独处理。

网络上关于databus的文章资料比较少,我整理了一下有价值的资料地址,我的实验也参考了下面的文章:

  1. databus/wiki
  2. inkedin 的 databus 部署
  3. databus bootstrap 部署
  4. Databus架构分析与初步实践(for mysql)(上篇)
  5. Databus架构分析与初步实践(for mysql)(下篇)
  6. Databus部分翻译

你可能感兴趣的:(Oracle)