这周轮到我值班,要凌晨4点爬起来,做一些EDW日常抽数的监控,处理下错误。今天一切正常,有点无聊,就码点字吧。
BW进入运维阶段之后,日常的数据抽取监控便成了运维中一个很重要的工作。
关于自动抽数
通常,生产系统的数据都是通过Process Chain 进行自动抽取的。高级一点的,会用event去触发PC,然后用job去触发event. 这样的好处是:
1. job的管理比较灵活
2. 可以用ABAP代码去触发event,这样就可以解决比较复杂的schedule的需求。同时,我们也用来开发一些t-code让用户自己控制抽数。
再 高级一点的,会利用IBM的Tivoli来管理后台Job. 因为实际运行中,一些抽数的timing是很复杂的,例如:要在每个月的前3个工作日和最后3个工作日的2:00 am抽数,或者是每个月的第10-12天抽数,但是遇到周末和节假日就顺延等变态的需求,这个时候,光靠SAP的工具,做起来很麻烦,第三方工具则方便很 多。
关于抽数监控
1. 通常,我们还会在PC中加入错误自动通知程序,这样一来,某个Process失败了,可以自动发email通知。关于如何在PC中加入一个ABAP程序来自动发送email,SDN上有相关资料。
http://www.sdn.sap.com/irj/scn/index?rid=/library/uuid/a04fe870-ad77-2d10-719a-f1bdcde14e41
2. RSPCM是用来监控全部process chain的地方,可以对所有PC的运行状态一目了然,可以很方便的调研某一个PC的log。
3. 0TCTPRCSCHN这个InfoObject记录了所有的process chain的信息。我们也通过这个IO做一些报表让用户对系统的数据情况一目了然。
4. PC的Log提供了处理抽数错误最常用的信息,包括可以调用Monitor等。同时,我们是根据log或monitor的错误信息来处理错误的。
常见问题的处理方法
这个需要说的东西比较多,有空再慢慢写....