• 警示:强制关闭OGG进程触发bug致abended,详述处理过程


    导读:Oracle Golden Gate(OGG)是一种基于日志的结构化数据复制备份软件,是一种较为常用且很成熟的数据复制手段。但是当OGG版本为10.0.0.0 - 11.2.0.0.0时,如果强制关闭OGG 进程时,可能会触发Bug – 14552560- For data pump导致进程状态变为abended。在此我们分享一个近期的客户故障案例,供大家参考。

    关注“数据和云”公众号的读者们都知道,每月我们都会整理数据库行业热点问题,分享行业经验,警示异常故障,以其帮助更多的用户,维护数据库系统安全稳定运行。

    本文选自《云和恩墨技术通讯》(11月刊),下载地址:https://www.modb.pro/topic/5927(复制到浏览器中打开或者扫描下方二维码)

     

    问题描述


    某天早上5点左右,OGG源端所在服务器发生异常重启(已确认是存储损坏导致),服务器主机及ORACLE数据库恢复正常后,无法正常启动OGG。查看OGG进程,发现抽取和应用进程正常,但部分投递进程状态变为abended。

    问题分析


    查看异常进程报错如下:

    投递进程DPxxx、DPyyy、DPzzz等异常终止,进程报告提示读检查点的位置大于trail文件里记录的最大地址。

    ERROR OGG-01705 Input checkpoint position 321693396 for input trail  file '/xxx/xxxx/xxxx/dirdat/xxxxx' is greater than the size of the file (321052167).  Please consult Oracle Knowledge Management Doc ID 1138409.1. for  instructions.

    查看进程报告中提及到的MOS文档:OGG Extract / ReplicatCheckpoint RBA Is Larger than Local Trail Size (文档 ID1138409.1),文档里对此异常有明确的说明,属于OGG Bug – 14552560:Datadump Extract进程通常会读取磁盘缓存中的数据,而不是直接读取trail文件,如果主机突然重启,会导致缓存中的部分数据来不及写入到trail文件中,但是read checkpoint会把这部分数据记录为属于当前trail文件。而在下一次Datadump Extract启动时,会把主机重启前未写入trail文件的数据改写到下一个trail文件中,这就造成read checkpoint和实际数据所在trail文件产生出入。

    问题解决


    为保证OGG进程检查点的一致性,应尽量避免强制关闭OGG进程。

    针对此问题,可采用如下2种方式:

    1)进程重建

    源端重建后,应用进程参数文件需添加参数handlecollisions和reperror default,discard

    2)修改datadump extract检查点信息

    可参考MOS文档:OGGData Pump Extract Abend With GGS ERROR 190 and ZZ-0SD "Input CheckpointPosition <m> for Input Trail File <file> is Greater Than the Sizeof the File <n>" (文档 ID 1389086.1)

  • 相关阅读:
    23种设计模式之单例模式
    6大设计原则之里氏替换原则
    6大设计原则之依赖倒置原则
    6大设计原则之接口隔离原则
    6大设计原则之迪米特法则
    Java日志第14天 2020.7.19
    Java日志第15天 2020.7.20
    Java日志第13天 2020.7.18
    Python 语音识别字幕生成器
    python list,tuple,str有序问题
  • 原文地址:https://www.cnblogs.com/hzcya1995/p/13311833.html
Copyright © 2020-2023  润新知