做了很多年Oracle,转行到MySQL了,算是借鉴
Oracle日常维护管理指标
一、 基本硬件环境
1、 主机硬件环境
品牌
型号
数量
物理CPU核数及逻辑CPU数
内存大小
本地硬盘大小
光驱
双网卡绑定
HBA卡
冗余电源
IPMI
机房机架位置
维保时间
厂商联系人
IP列表
2、 存储硬件环境
品牌
型号
机柜总量
存储大小
对外提供服务情况
多路径软件版本
机房机架位置
维保时间
厂商联系人
3、 网络硬件环境
品牌
型号
数量
网络标签
网络拓扑图
功能
双机热备
机房机架位置
维保时间
厂商联系人
万兆网络
光纤交换机
二、 基本软件环境
1、 主机软件环境
操作系统版本及补丁情况
数据库版本以及集群件版本及补丁情况
是否安装其他软件
2、 存储软件环境
存储后端管理软件
3、 系统使用情况
CPU使用情况
内存使用情况
本地硬盘使用情况
IO使用情况
三、 数据库详细情况
1、 数据库产品安装选项
2、 查看listener状态、文件位置及日志
查看sqlnet文件位置及日志
查看tnsnames位置及相应配置
检查 SCAN 的状态及配置scan listener
客户端连接数据库的方式
3、 RAC ASM存储设备名问题
ASMLIB,UDEV还是其他
4、 系统中数据库进程是否正常,是否有僵死进程
集群件状态是否正常,所有实例状态是否正常
5、 实例Memory Management, SGA和PGA管理方式,及各个内存组件的分配状况
6、 初始化参数及非默认参数,隐藏参数是否修改,系统级和session级别
7、 RDBMS运行日志和跟踪文件数量是否正常,定期备份和清理产生的日志文件和跟踪文件
8、 CRS运行日志和跟踪文件数量是否正常,定期备份和清理产生的日志文件和跟踪文件
9、ASM运行日志和跟中文件数据是否正常,定期备份和清理产生的日志文件和跟踪文件
10、控制文件位置、大小以及多路复用情况
11、Redo log文件位置、大小以及多路复用情况
切换时间,每小时产生的日志量,最近日期的日志生成统计
12、Archivelog文件位置,所在磁盘组可用空间大小 ,保留时间
13、表空间大小及管理方式,数据文件位置大小,是否自动添加数据文件,每天产生的数据量,表空间碎片情况
14、UNDO表空间,TEMP表空间的大小位置及管理方式
15、所有数据文件所占总空间,数据量实际占用空间
16、查看asm磁盘组及磁盘情况
17、查看数据文件的冗余策略
18、查看orc voedisk的存储位置及备份策略
19、查看数据库的service资源
20、系统crontab情况,包括root,grid,oracle用户的
21、系统session情况
22、数据库中用户及角色情况,简单风险评估,安全性管理
23、数据库的设计是否符合性能要求。查找无效的数据库对象,并重新编译
24、查看数据库的存在的对象类型及作其用。如序列 ,存储过程,函数,触发器
25、主要业务用户下,表大小,监控数据量的增长情况,数据波动情况,各segment(表,索引)的数据碎片、热点块、chained row/migrate row等问题。表分区情况,以及与表分区相关的ddl操作,全局索引与分区索引情况以及相互转换。表的索引相关情况及表索引键值相关情况。检查每个索引该不该rebuild
26、监控主要业务用户和事务,每个session正在执行的sql,死锁的检测和处理
27、统计信息收集情况,自动还是手动,比率,是否需要额外分析表和索引
28、数据库的逻辑备份情况
29、数据库备份策略评估,恢复窗口,基本配置,对备份的监控,是普通增量备份还是镜像增量备份,验证备份集以及归档的可用性
30、数据库恢复策略评估,对恢复时间的要求,对恢复过程的监控
31、数据库灾备情况评估,对使用ADG、使用OGG还是使用Streams的监控及故障处理
32、部署自动的Statspack/AWR报告的生成机制
33、查看ADDM报告
34、查看ASH报告
35、历史遗留问题
36、将来要解决的问题
四、 高级分析
1、 全面深入的了解应用架构
不了解应用的DBA是没有前途的DBA,对应用了解不深入的DBA算不上expert,所以一定要深入了解应用。检查应用系统,是否存在应用拆分,是否存在应用优化。
2、 撰写系统架构、现状、调整备忘录
根据对数据库的研究和了解,不断记录数据库的状况,撰写数据库架构、现状及调整备忘录,不放过任何可能的优化与改进的机会。