GoldenGate for Java Adapter介绍一(原理篇)

前言

Oracle Goldengate在很早前就推出了一个for java的版本，主要目的是方便把关系型数据实时写入到不支持的目标端，如JMS或Redis等key value数据库。在Hadoop刚出来的时候，也可以使用ogg for java adapter将数据实时投递到HDFS等平台，只是后来专门推出了一个ogg for bigdata版本，可以不用二次开发，即可将数据实时投递到hbase ,hive, kafka, mongodb等。所以，针对不支持的目标端，还是需要使用ogg for java adapter进行二次开发和投递。

官网上的OGG for java adapter介质：

官网上ogg for bigdata介质：

架构

针对ogg for java adapter，常用的架构如下：

OGG for java adapter可用于将增量数据实时写入到flatfile，通过ETL的Load，加载到DW中，实现实时数据仓库的加载和分析。如下架构：

配置

针对ogg for java adapter，还是需要配置传统的source extract，目标端也需要配置replicat，但此时，是调用自己开发的java投递程序。而OGG提供有一套框架接口，开发人员只需要实现对应的接口和重载部分函数，即可完成获取增量数据，获取表结构定义，数据变更类型（Insert/update/delete等），事务控制等操作，从而实现自定义的数据投递。

源端抽取配置

1、oracle goldengate要求数据库日志为存档模式

CMD> set ORACLE_SID=jxk

CMD> sqlplus / as sysdba

SQL> archive log list;（查看数据库日志模式）

（1）如数据库模式为禁用存档模式，且数据库正在运行，需要先将数据库先关闭，再启动，并修改配置

SQL> shutdown immediate;

注：shutdown immediate可以强行结束或回滚正在执行的事务、进程就可以close DB

SQL> startup mount;

SQL> alter database archivelog;

SQL> alter database open;

SQL> alter database force logging;

SQL> alter database add supplemental log data(primary key,unique) columns;

SQL> alter system archive log current;

2、oracle推荐新建专用同步用户，执行ogg操作，与业务用户做区分。

SQL> create user ogg identified by ogg;

SQL>grant dba to ogg;

3、对需要同步的表生成对应的表结构信息（针对OGG12.2以下的版本）

编辑 $OGG_HOME/def.prm

defsfile busiuser.def --文件名

USERID ogg, PASSWORD ogg --ogg数据库同步用户

table busiuser.iy01; --需要同步的表

table newuser.*;

cd E:/ogg

Cmd > defgen paramfile def.prm

将生成的busiuser.def文件拷贝至目标端的$OGG_HOME/dirdef目录下

注意：如果busiuser.def文件已存在，则需要手动删除，再执行生成命令，否则报错。原因是oracle此处不会自动删除已存在的文件。另外 table busiuser.iy01后面必须跟分号”;”，否则执行defgen的时候会报 command ‘TABLE’ not terminate ……错误。

--抽取

add extract ex2, tranlog, begin now

add exttrail ./dirdat/e2, extract ex2, megabytes 100

--传输

add extract pu2, exttrailSource ./dirdat/e2

add rmttrail ./dirdat/e3, extract pu2, megabytes 200

--投递

add replicat re2, exttrail ./dirdat/e3, nodbcheckpoint

4、配置ogg进程

cd E:/ogg

ggsci

> create subdirs

> edit param mgr （创建管理进程）输入端口

port 7809

> edit param ex1

extract ex1

oracle_home

setenv(oracle_sid="jxk") --设置oracle_sid

nls_lang

userid ogg, password ogg --设置操作ogg的用户

rmthost 192.168.0.44, mgrport 7809 --目标端ogg的ip和端口

rmttrail ./dirdat/ea --目标端的队列文件保存目录，相对与安装ogg目录的路径

table busiuser.*; --需要执行同步的表，可单表配置，也支持通配用户名.表名

注：ex1文件发生改变，需要重启mgr和ex1进程；ex1名称自定义

默认只支持DML，如果要支持DDL需要执行一些单独的配置。

> add extract ex1(此名称需要与配置prm文件名一致), tranlog, begin now

--TRANLOG 表示使用事务日志的方式

--BEGIN NOW 表示从现在开始,你也可以指定一个具体的开始时间

> add rmttrail ./dirdat/ea, extract ex1

> start mgr

> start ex1

> info 进程名(查看进程状态)

> info all(查看所有进程状态)

> view report ex1(查看进程ex1运行日志)

完成上述操作后，还需要对需要同步的表做trandata操作，否则没有主键的表同步会报错，异常信息如下：

OGG-00730 No minimum supplemental logging is enabled. This may cause extract process to handle key update incorrectly if key column is not in first row piece.

Cmd > set oracle_sid=orcl

Cmd > ggsci

> dblogin userid ogg, password ogg

> add trandata business.iy01

> start ex1(重启进程)

如遇到错误：ERROR OGG-00717 Found unsupported in-memory undo record in sequence 38978, at RBA 4562448, with SCN 0.2055451476 (2055451476) ... Minimum supplemental logging must be enabled to prevent data loss. 执行如下操作

> alter ex1, tranlog, begin now

> start ex1

> stats ex1(查看当前正在队列中的数据)

目标端JDBC连接方式配置

1、下载ogg application adapters for linux

2、解压配置环境变量

export JAVA_HOME=/home/gbase/jdk1.8.0_45

export PATH=$JAVA_HOME/bin:$PATH

export LD_LIBRARY_PATH=${JAVA_HOME}/jre/lib/amd64/server:/home/oracle/ogg:${LD_LIBRARY_PATH}

注意：LD_LIBRARY_PATH这个配置是因为ogg中的库文件需要依赖

3、进入安装目录执行命令

$>./ggsci

> create subdirs

> edit param mgr

Port 7809

> start mgr

>info all

4、目标端启动mgr后，源端启动抽取进程才会成功，下面执行目标端进程配置

(以下使用传统的extract模式进行投递，在ogg12.2及以后版本，可使用replicat模式)

1）拷贝redis-jdbc驱动包和二次开发的jar包到 $OGG_HOME/ggjava目录下

2）>edit param rejava

Extract rejava

-- Sample extract prm file for the Oracle GoldenGate for Java user-exit. A properties

-- file configures the user-exit; by default named "dirprm/{extract_name}.properties"

-- e.g., javaue.prm loads javaue.properties. The user-exit runs in a data pump extract:

-- ggsci> add extract javaue, extTrailSource dirdat/tc

-- ggsci> info javaue

-- the source-def's must match the trail data

SourceDefs ./dirdef/busiuser.def

getEnv (JAVA_HOME)

getEnv (PATH)

getEnv (LD_LIBRARY_PATH)

-- windows:

--CUserExit ggjava_ue.dll CUSEREXIT PassThru IncludeUpdateBefores

-- unix/linux:

CUserExit libggjava_ue.so CUSEREXIT PassThru IncludeUpdateBefores

GetUpdateBefores

-- tables to be processed; as of 11.2 data may be filtered, tables/operations skipped

Table busiuser.*;

> edit rejava.properties

gg.handlerlist=use_redis --随意，但下面配置必须和此名称一致

gg.classpath=./ggjava/ogg_gbase_1.0.jar,./ggjava/gbase-connector-java-8.3.81.53-build52.8-bin.jar --引入jar包到classpath

gg.handler.use_redis.type=sample.handler.jdbc.SimpleJDBCHandler --二次开发程序入口

gg.handler.use_redis.driver= redis jdbc driver信息

gg.handler.use_redis.url=redis jdbc url

gg.handler.use_redis.user=

gg.handler.use_redis.password=

gg.handler.use_redis.mode=op

gg.handler.use_redis.maxBatchSize=100

gg.handler.use_redis.reportCount=10000

gg.handler.use_redis.dateFormat=yyyy-MM-dd:HH:mm:ss

配置完成后，需要关闭mgr，重启mgr

5、增加extract进程

> ADD EXTRACT rejava, EXTTRAILSOURCE ./dirdat/ea, BEGIN now

> ADD RMTTRAIL ./dirdat/ea, EXTRACT rejava

> start rejava

> info all

6、测试：

在源端insert 数据，使用stats可以在源端和目标端看到数据增变量，和执行的标识语句，在目标数据库中查询数据

总结

1、源端和目标端部署完成后，需要两端都将mgr进程启动，然后再启动extract进程。

2、远端和目标端的配置文件发生改变时，需要重启mgr和extract进程。

3、如碰上目标端投递数据有问题，可先使用单独的java程序尝试手工写入数据，确保目标端是可用的，再进行ogg for java extract/replicat进程的调试。

4、使用ogg for java adapter，可以很容易实现将关系型数据库的增量数据（其实也可以抽取存量数据），实时写入到任意目标存储平台，包括非官方直接配置支持的redis, 各种key-value db, memory db（如gemfire），mariadb, sqlite，JSON等，适合于各种场景应用。

下一期会基于代码介绍OGG for java adapter的部分接口和函数。

相关阅读:
JDK源代码学习-基础类
 六、Java多人博客系统-2.0版本-代码实现
 JDK源代码学习-ArrayList、LinkedList、HashMap
Java拓展接口-default关键词
 七、Java多人博客系统-2.0版本-docker部署
 五、Java多人博客系统-2.0版本-数据库设计
 四、Java多人博客系统-2.0版本
 max file descriptors [10240] for elasticsearch process is too low, increase to at least [65535]
system call filters failed to install; check the logs and fix your configuration or disable system call filters at your own risk
which: no java in (/sbin:/usr/sbin:/bin:/usr/bin) Could not find any executable java binary. Please install java in your PATH or set JAVA_HOME
原文地址：https://www.cnblogs.com/margiex/p/8646996.html