• Failure Groups in ASM


    Oracle Database 10g中出现的ASM(Automatic Storage Management,自动存储管理)技术提供了一种镜像冗余的方法,用以保护可能出现的磁盘故障而导致的数据丢失。要知道,以前也许我们需要RAID来达到这样的目的,但是现在Oracle数据库本身就提供给你这样的选项了,Oracle的意思是,把所有的鸡蛋都放到Oracle这个篮子里面吧,我们是Unbreakable的。

    ASM提供了3种冗余方法。

    external redundancy表示Oracle不帮你管理镜像,功能由外部存储系统实现,比如通过RAID技术。
    normal redundancy(默认方式)表示Oracle提供2路镜像来保护数据。
    high redundancy表示Oracle提供3路镜像来保护数据。

    先预告一下,有时间再写吧,相信我,有内部资料的(本文用词很多来自某些metalink internal资料的翻译,因为inernal所以就不做link了),呵呵。

    什么是 ASM failure group?
    Oracle通过failure group来提供数据的高可用性。ASM使用的镜像算法并不是镜像整个disk,而是作extent级的镜像。所以很明显如果为各个failure group使用不同容量的disk是不明智的,因为这样在Oracle分配下一个extent的时候可能就会出现问题。在normal redundancy模式下,ASM环境中每分配一个extent都会有一个primary copy和一个second copy,ASM的算法保证了second copy和primary copy一定是在不同的failure group中,这就是failure group的意义。通过这个算法,ASM保证了即使一个failure group中的所有disk都损坏了,数据也是毫发无伤的。

    Oracle在分配extent的时候,所有failure group中的这个将拥有相同数据的extent称为一个extent set,当Oracle将数据写入文件的时候,primary copy可能在任何一个failure group中,而second copy则在另外的failure group中,当Oracle读取数据的时候,除非是primary copy不可用,否则将优先从primary copy中读取数据,通过这种写入无序,读取有序的算法,Oracle保证了数据读取尽量分布在多个disk中。

    因为公用一个硬件模块的磁盘很可能会同时损坏或者失效,所以通常我们在设计failure group时,应该把一个大的盘阵中在一个tray中的磁盘放在一个failure group中,这样我们就可以拿走一个tray,失效这个failure group,然后换上新的tray和磁盘,这跟RAID的思想是一样的。

    ASM的冗余方式一经设定就无法更改,如果我们想把normal redundancy改为high redundancy就只能是创建一个新的failure group,然后把旧failure group中的文件通过RMAN或者DBMS_FILE_TRANSFER的方法移动到新failure group中去。

    如果在ASM环境中没有创建failure groups情况会怎样?
    即使没有显式指定,failure groups也是始终会创建的。在这种情况下,每个disk都属于一个failure group,在创建磁盘组的时候,failure group也会默认创建,名称就是disk的名字。

    应该创建多少failure groups?

    什么时候该用external redundancy什么时候该用normal或者high redundancy?

    如果failure group出现故障怎样恢复?
    - 如何使用kfed实用程序来查看ASM Disk header

    我们测试的数据库是Oracle10.2.0.2,首先需要编译生成kfed程序,在其它版本的Oracle中生成kfed的方法会略有不同。
    cd $ORACLE_HOME/rdbms/lib
    make -f ins_rdbms.mk ikfed
    此时$ORACLE_HOME/bin目录中将会产生kfed程序。

    使用kfed的语法是:kfed read *devicename* text=*filename*
    假设我们要读取/dev/raw/raw1的文件头,那么使用下面的语句
    kfed read /dev/raw/raw1 text=raw1.out
    这样raw1的文件头信息将会被dump到raw1.out文件中,大家有兴趣可以去看一下文件内容,基本上通过名字和值还是能猜测出都是些什么内容的,包括了这个ASM Disk创建时间是什么,每个block多大,Disk名字是什么,属于哪个Disk Group,Header Status是怎么样的。虽然大部分内容都可以从ASM实例的数据字典中获得,但是在我们碰到ASM磁盘故障的时候,kfed提供的信息往往更容易让我们判断问题点。

    - 如何清理ASM Disk

    有时候一个ASM Disk由于故障,导致我们删也删不掉,加也加不进去,通常现象是磁盘的header status状态不正确但是disk header中仍然保留了部分磁盘组的信息。此时我们就需要clear这个磁盘,然后再将它重新加入磁盘组中。
    dd if=/dev/zero of= *diskname* bs= *blocksize* count=10000

     

     原文地址 http://www.dbform.com/archives/218
  • 相关阅读:
    美食
    java
    java-包装类
    SVN查看项目修改记录及修改内容
    常用图片素材
    jquery正则表达式验证【是否带有小数、是否中文名称组成、是否全由8位数字组成、电话码格式、邮件地址】
    HttpContext.Current.Request.Url 地址:获取域名
    jQuery常用验证
    Jquery取值方法汇总
    MVC之三个单选按钮的切换选择
  • 原文地址:https://www.cnblogs.com/sopost/p/2190158.html
Copyright © 2020-2023  润新知