Oracle CRS/GI 进程介绍

Oracle CRS/GI 进程介绍

在10g和11.1，Oracle的集群称为CRS(Oracle Cluster Ready Service)，在11.2，Oracle的集群称为GI(Grid Infrastructure)。对于CRS/GI，他们的一些核心进程的功能基本类似，但是在11.2，新增了很多新的Deamon进程。

10.2 CRS：
$ ps -ef|grep crs/bin
root      4373 3605 0 Feb25 ?        00:02:49 /u01/app/crs/bin/crsd.bin reboot
oracle    4380 4379 0 Feb25 ?        00:00:03 /u01/app/crs/bin/evmd.bin
oracle    4925 4888 0 Feb25 ?        00:00:00 /u01/app/crs/bin/oclsomon.bin
root      4928 4483 0 Feb25 ?        00:00:00 /u01/app/crs/bin/oprocd.bin run -t 1000 -m 10000 -
hsi 5:10:50:75:90 -f
oracle    5065 4512 0 Feb25 ?        00:00:54 /u01/app/crs/bin/ocssd.bin
oracle    6825 4380 0 Feb25 ?        00:00:00 /u01/app/crs/bin/evmlogger.bin -o

11.2 GI：
$ ps -ef|grep grid/bin
root      6656     1 0 Feb25 ?        00:09:20 /u01/app/11.2.0/grid/bin/ohasd.bin reboot
grid      7960     1 0 Feb25 ?        00:16:54 /u01/app/11.2.0/grid/bin/oraagent.bin
grid      7972     1 0 Feb25 ?        00:00:05 /u01/app/11.2.0/grid/bin/mdnsd.bin
grid      7982     1 0 Feb25 ?        00:03:45 /u01/app/11.2.0/grid/bin/gpnpd.bin
grid      7993     1 0 Feb25 ?        00:14:19 /u01/app/11.2.0/grid/bin/gipcd.bin
root      7995     1 1 Feb25 ?        00:41:42 /u01/app/11.2.0/grid/bin/orarootagent.bin
root      8010     1 0 Feb25 ?        00:28:03 /u01/app/11.2.0/grid/bin/osysmond.bin
root      8026     1 0 Feb25 ?        00:01:31 /u01/app/11.2.0/grid/bin/cssdmonitor
root      8040     1 0 Feb25 ?        00:02:22 /u01/app/11.2.0/grid/bin/cssdagent
grid      8057     1 1 Feb25 ?        00:48:04 /u01/app/11.2.0/grid/bin/ocssd.bin
root      8136     1 0 Feb25 ?        00:02:49 /u01/app/11.2.0/grid/bin/octssd.bin reboot
grid      8158     1 0 Feb25 ?        00:02:24 /u01/app/11.2.0/grid/bin/evmd.bin
root      8278     1 0 Feb25 ?        00:04:18 /u01/app/11.2.0/grid/bin/crsd.bin reboot
grid      8357 8158 0 Feb25 ?        00:00:00 /u01/app/11.2.0/grid/bin/evmlogger.bin -o
/u01/app/11.2.0/grid/evm/log/evmlogger.info -l /u01/app/11.2.0/grid/evm/log/evmlogger.log
grid      8406     1 0 Feb25 ?        00:11:22 /u01/app/11.2.0/grid/bin/oraagent.bin
root      8414     1 1 Feb25 ?        00:36:22 /u01/app/11.2.0/grid/bin/orarootagent.bin

我们对这些常见的集群进程做一些解释：

各个版本共有的：
1. ocssd.bin：这是一个很核心的进程，如果它异常终止会导致这个节点的集群或者主机重启。这个进程主要用于检查表决盘能否正常访问，节点私网间的通信是否正常。数据库实例上的LMON进程也会注册到CSSD上，这样CSSD会通过LMON来了解数据库实例的健康情况。
如果节点发生了主机自动重启，需要查看ocssd的日志，位于： <CRS_HOME>/log/<host>/cssd。

可以参考下面的文档来了解节点重启：
如何诊断节点重启问题
 11gR2 如何诊断节点重启问题

2. crsd.bin：这个进程主要用于管理集群中的资源。用来启动、停止检查一些资源，比如数据库实例、ASM、监听、磁盘组、VIP等。在11.2，这些具体的操作由对应的agent执行。另外，OCR的维护也是由CRSD完成的。
   当发现某些资源异常终止后，首先需要查看crsd的日志：<CRS_HOME>/log/<host>/crsd。

3. evmd.bin：事件监控(event monitor)进程，由它来发布集群事件，比如实例启动、停止等事件。

4. ons进程：Oracle Notification Service daemon，它用于接收evmd发来的集群事件，然后将这些事件发送给应用预订者或者本地的监听，这样就可以实现FAN(Fast Application Notification)，应用能够接收到这些事件并进行处理。

5. gsd：只有当CRS或者GI上需要管理9i的数据库时才需要。在11.2, gsd 默认就是offline的。
可以参考My Oracle Support 文档： GSD Is Used Only if 9i RAC Database is Present (Doc ID 429966.1)

10g和 11.1特有的：
1. oprocd.bin：Oracle Clusterware Process Monitor Daemon，用来监控主机hang，如果发现主机hang后会发起主机重启。只有未使用第三方的集群软件时才运行，Linux上从10.2.0.4开始使用。
   oprocd的日志会在：/etc/oracle/oprocd/*.log.* 或者 /var/opt/oracle/oprocd/*.log.*。

2. oclsomon.bin：用来监控ocssd进程是否hang，如果发现hang，会发起reboot.

11.2特有的：
1. cssdagent(11.2)：这个进程由ohasd启动，然后由它来启动、停止、检查ocssd进程，以root身份运行。
   它的日志位于：<GRID_HOME>/log/<host>/agent/ohasd/oracssdagent_root

2. cssdmonitor(11.2)：监控cssdagent，并且检查节点hang（类似于oprocd），监控ocssd进程是否hang（类似于oclsomon）,监控vendor clusterware（类似于vmon），以root身份运行。
   它的日志位于：<GRID_HOME>/log/<host>/agent/ohasd/oracssdmonitor_root

3. ohasd.bin: 在GI启动时，最先启动的就是ohasd,然后由它启动agent(orarootagent,oraagent, cssdagnet 和 cssdmonitor) ，各个agent再启动对应的进程。
    如果GI启动过程有问题，可以查看一下ohasd的日志：<GRID_HOME>/log/<host>/agent/ohasd

4. mdnsd.bin：这个进程通过多播（Multicast）发现集群中的节点和所有的网卡信息。一定要确定集群中的网卡支持多播，而且节点间的通信正常。
   它的日志位于：<GRID_HOME>/log/<host>/mdnsd

5. gpnpd.bin：发布构建集群所需要的bootstrap 信息，并且在集群的所有节点之间同步gpnp profile。
   它的日志位于：<GRID_HOME>/log/<host>/gpnpd

6. gipcd.bin：这个进程负责管理集群中所有的私网（cluster interconnect）网卡。私网信息是通过gpnpd获得的。
   它的日志位于：<GRID_HOME>/log/<host>/gipcd

7. gnsd(可选): Grid Naming Service. 相当于子DNS，功能和DNS类似，会取代使用/etc/hosts进行主机的解析。
   它的日志位于：<GRID_HOME>/log/<host>/gnsd

8. octssd.bin: The Cluster Time Sync Service(CTSS) 用于各个节点间的时钟同步，集群中的一个节点的时钟会作为参照节点，其它节点和这个节点进行时钟同步。注意：当第三方时间同步软件（例如：NTP）存在时，CTSS会以‘观察者’的方式运行，并不修改节点时间，但是，如果CTSS没有发现第三方时间同步软件，它会开始修改节点时间以便和参考节点同步。
   它的日志位于：<GRID_HOME>/log/<host>/ctssd.

9. osysmond.bin ：这是Oracle Cluster Health Monitor(CHM)的主要进程，这个进程在所有节点都会运行，sysmond会将每个节点的资源使用情况发送给cluster logger service，后者将会把所有节点的信息都接收并保存到CHM的资料库。
   它的日志位于：<GRID_HOME>/log/<host>/crfmond/crfmond.log

10. ologgerd：这是Oracle Cluster Health Monitor(CHM)的另一个主要进程，在一个集群中的，ologgerd 会有一个主机点(master)，还有一个备节点(standby)。当ologgerd在当前的节点遇到问题无法启动后，它会在备用节点启用。
   它的日志位于：<GRID_HOME>/log/<host>/crflogd/crflogd.log

关于CHM，请参考：
11gR2 新特性：Oracle Cluster Health Monitor(CHM)简介

11. <XXX>agent.bin：在11.2，各个资源的启动、停止和检查都是由agent来执行的。ohasd 会把这些agent启动。

Agent包括两种，一种是ohasd的：
oraagent_grid：启动/停止/检查/清除ora.asm, ora.evmd, ora.gipcd, ora.gpnpd, ora.mdnsd等资源。
orarootagent_root：启动/停止 /检查/清除 ora.crsd, ora.ctssd, ora.diskmon, ora.drivers.acfs, ora.crf (11.2.0.2)等资源。
oracssdagent_root: 启动/停止/检查 ocssd进程。
oracssdmonitor_root：监控cssdagent进程。

它们的日志位于：<GRID_HOME>/log/<host>/agent/ohasd

另一种是crsd的：
oraagent_grid: 启动/停止/检查/清除 asm, ora.eons, ora.LISTENER.lsnr, SCAN listeners, ora.ons, diskgroup 等资源
oraagent_oracle: 启动/停止/检查/清除 service, database 等资源
orarootagent_root : 启动/停止/检查/清除 GNS, VIP, SCAN VIP and network 等资源.
scriptagent_grid: 应用服务定制的服务。

它们的日志位于：<GRID_HOME>/log/<host>/agent/crsd

关于agent的更多信息，请参考文章 "11gR2 Agent 简介"
相关阅读:
设圆半径r=1.5,圆柱高h=3,求圆周长、圆面积、圆球表面积、圆球体积、圆柱体积。用scanf输人数据，输出计算结果，输出时要求有文字说明,取小数点后2位数字。请编程序
 请编程序将“China"译成密码，密码规律是:用原来的字母后面第4个字母代替原来的字母。例如,字母“A”后面第4个字母是“E”,用“E”代替“A”。因此,“China"应译为“Glmre”。请编一程序
 用下面的scanf 函数输人数据,使a=3,b=7,x=8.5,y=71. 82,cl='A',c2='a'。在键盘上应如何输入?
分析下面的程序:
购房从银行贷了一笔款d,准备每月还款额为p,月利率为r,计算多少月能还清。设d为300 000元,p为6000元,r为1%。对求得的月份取小数点后一位,对第2位按四舍五人处理
 存款利息的计算。有1000元，想存5年，可按以下5种办法存（1）一次存5年期（2）先存2年期，到期后将本息再存3年期（3）先存3年期，到期后将本息再存2年期（4）存1年期，到期后将本息再存1年期，连续存5次（5）存活期存款，活期利息每一季度结算一次
 假如我国国民生产总值的年增长率为7%，计算10年后我国国民生产总值与现在相比增长多少百分比。计算公式为$p = (1+r)^n$ ,其中r为年增长率，n为年数，p为与现在相比的倍数
 用自顶向下、逐步细化的方法进行以下算法的设计：输出1900---2000年中是软黏的年份，符合下面两个条件之一的年份是闰年
 什么叫结构化程序设计？它的主要内容是什么？
windows命名管道
原文地址：https://www.cnblogs.com/miracle2020/p/14031663.html