• [Oracle] Lock&Latch梳理


    Oracle lock&latch

    1. 概述

    4种锁机制

    • lock
    • latch
    • pin
    • mutex

    保证资源在并发访问和修改时不被破坏

    锁类型 行为 持有时间 级别 保护类型
    lock 队列(先到先服务) Enqueues: 多个, 复杂(KGL锁: 共享/独占) 对象
    pin 队列(先到先服务) 共享/独占
    latch 随机抢占 共享/独占 共享内存
    mutex 随机抢占 长(某些mutex) 共享/独占

    2. 几种内存结构

    • 数组

      相同形状和大小的对象列表.

      x$ksuse: 用户会话的结构体, v$session视图的基表.

    • 指针

      内存地址.

    • 链表

      相对少量的相关项.

      undo段头事务表(事务控制)

      index叶子块

      • 双向链表

      • 单向链表

    数组适合处理定长结构, 链表非常适合处理相对少量的相关项, 这2种情况下需要遍历整个数组或者链表来查找某项, 如果项数少的话是可以的. 如何处理大量持续出现和消失的项, 并且每次都需要快速定位其中一项?

    • 散列表

      hash cluster: 散列聚簇.

      图1: hash cluster管理

      每个latch管理多个hash bucket, 每个hash bucket管理一条hash chain(双向链表), 指向具体的block地址.

      图2: 双向链表操作

      hash chain对象会有LRU算法维护大小. 并且会维护hash chain的原子操作.

    3. Latch

    根据latch的类型分为:

    • 独占
    • 共享

    根据latch的活动分为:

    • willing to wait

    • immediate get

    本质上, latch是一块内存位置和一个用于检查更新内存位置的CPU原子操作.

    • 独占latch

      获取伪操作:

      • 设置寄存器X, 指向latch内存地址A
      • 如果内存地址A的值是0, 那么将它设置为0xff <= CPU原子操作
      • 如果内存地址A的值设为0xff, 那么就"持有"latch
      • 如果不是, 就回到最上一步重试, 持续尝试N次

      CPU原子操作, "Test and Set"CPU指令

      持续尝试是spin的过程:

      图3: spin过程

    • 共享latch

      实现要复杂很多, 应用在一些最繁忙的代码区.

      CPU架构中更精细的比较(compare)和交换(swap)操作, 简称CAS

      CAS涉及3个操作数:

      • 内存值V
      • 旧的预期值A
      • 要修改的新值B

      "我认为V的值应该是A, 如果是, 那么将V的值更新为B; 如果不是, 不修改并告诉我V的实际值是多少." 当且仅当预期值A和内存值V相同时, 将内存值V修改为B, 否则什么都不做.

        int compare_and_swap (int* reg, int oldval, int newval)
        {
        	ATOMIC();
        	int old_reg_val = *reg;
        	if (old_reg_val == oldval)
        		*reg = newval;
        	END_ATOMIC();
        	return old_reg_val;
        }
      

      典型的操作伪码:

      • 设置标志F为0
      • 设置寄存器X指向latch的地址L
      • 设置寄存器Y的值为L目前的值
      • 设置寄存器Z的值为你想要在L上设置的新值
      • 如果Y的值等于L的值, 那么设置"L的值"为"Z的值", 并设置标志F为1 <= CPU原子操作
      • 如果标志F的值为1, 那么你已经成功地修改了latch的值

      图4: CAS逻辑图

      设置Flag的优点在于可以允许多个读者"获取和释放latch时进行增减计数", 同时也允许"写者"设置"独占写"位来阻塞新的读者(和其他写者).

      读者请求:

      • 循环(自旋)N次
      • 如果设置了写标志位, 那么回到循环的开头
      • 尝试将latch值加1(以获得读权限)
      • 如果标志位已设置, 退出循环

      当读进程完成了读操作, 使用类似循环把latch的标志位减小1

      写者请求(独占):

      • 循环(自旋)N次
      • 如果写标志位已经设置, 那么回到循环的开头
      • 尝试将latch值设为"写标志位+当前值" (获取写标志)
      • 如果标志已经设置, 那么推出循环
      • 等待读标记减小为0

      允许写进程在读进程正在使用资源时抢占"独占"位, 然后等待读进程对标志位减少至0. 同时新的读进程在写进程持有写位时不能够增加标志位, 并且同一时刻只有一个写进程持有写标志位, 这样对读进程来说, 最大化了读共享, 同时最小化了写进程延迟.

      latch值 解释
      0x00000005 当前有5个进程以共享方式持有latch
      0x40000003 当前有3个进程以共享方式持有latch, 但有一个独占写进程(无法得知是谁)已经设置了阻塞位来禁止新的读进程
      0x20000014 进程0x14(v$process.pid)正以独占方式持有latch
    • latch统计

      v$latch, v$latch_parent, v$latch_children

      统计项 解释
      gets willing to wait方式获取latch的次数. 最终成功得到latch的次数累积.
      misses willing to wait方式获取latch, 并在首次test and set/compare and swap失败时的次数.
      spin_gets willing to wait方式获取latch, 首次test and set/compare and swap失败后spin的次数.
      sleeps willing to wait方式获取latch, 在自旋(spin)后仍然失败的次数.
      sleep1... sleep11 willing to wait方式获取latch, 休眠的次数.
      immediate_gets 立即模式获取latch的次数, 最终成功得到latch的次数累计.
      immedaite_misses 理解模式获取latch, 并在首次test and set/compare and swap失败时的次数.
      wait_time session等待该latch的总等待时间, 仅是willing to wait的latch, 单位是微妙.

      首次尝试未得到latch时的活动汇总:

      需要的latch访问 使用方式
      获取独占latch 尝试立即获取, 进入spin自旋循环一次. 附加到等待列表, 尝试理解获取, 进入休眠.
      以独占模式获取其他进程正以某种模式(共享/独占/处于阻塞)持有的可共享latch 进入spin循环, 附加至等待列表, 重复spin循环, 如果不成功则进入休眠.
      以共享模式获取其他进程以独占/阻塞模式持有的可共享latch 不进入spin状态, 直接附加到等待列表.
      以共享模式获取其他进程以共享模式持有的可共享latch 休眠前仅spin循环cpu_count +2次

      关键: 当前进程无法得到latch时, 会附加到一个列表中, 然后等待被唤醒.

      post/wait机制: 当前持有latch的进程, 在它释放latch时, 会通知(post)位于列表顶端的进程.

      _enable_reliable_latch_waits参数控制

      图5: post/wait机制


      Mutex

      Mutex的实现和使用和latch很类似. 在library cache处理中用以替代pin.

      Mutex本质上是一个"私有的小型latch", 作为library cache对象的一部分. Mutex替代了少量latch保护大量对象的方式 - 会引起latch竞争.

      每个library cache的hash bucket都有单独的Mutex.

    4. Lock

    回忆一下library cache的局部hash cluster结构.

    图6: 局部library hash cluster

    在这里, latch作为一项查找(或修改)内存对象的保护机制. 应该避免持有任意时间长度的latch. 当找到所需的内存对象时, 并做一些时间消耗的工作时, 需要一种不同的机制来保护这些内存对象, 以便能及时释放latch. 这就是下面要总结的库缓存锁(和pin).

    • 一些基础

      x$ksqrs: 排队资源

      x$ksqeq: 排队

      x$ktqdm: 表/DML锁

      x$ktcxb: 事务

      v$lock视图

      col_name type col describle
      ADDR RAW (4, 8) Address of lock state object
      KADDR RAW (4, 8) Address of lock
      SID NUMBER 会话的sid
      TYPE VARCHAR2(2) 该lock保护的对象类型:TM(DML enqueue), TX(Transaction enqueue), UL(User supplied)
      ID1/ID2 NUMBER 对于TM锁:ID1表示被锁定表的object_id, ID2为0. 对于TX锁:ID1是十进制值表示的改事务所占用的回滚段号和事务槽slot number号, ID2是十进制值表示的环绕wrap的次数, 即事务槽被重用的次数.
      LMODE NUMBER 0-none, 1-null(NULL), 2-row-S(SS), 3-row-X(SX), 4-share(S), 5-S/Row-X(SSX), 6-exclusive(X)
      REQUEST NUMBER 同LMODE, 大于0时, 表示当前会话被阻塞, 其他会话占有该锁的模式.
      CTIME NUMBER 已持有或者等待锁的时间
      BLOCK NUMBER 是否阻塞其他会话申请, 1:阻塞, 0:不阻塞

      锁模式

      模式 描述 解释 SQL操作
      0 none
      1 Null select
      2 SS(Row-S) 行级共享锁, 其他对象只能查询这些数据行 select for update, lock for update, lock row share
      3 SX(Row-X) 行级排他锁, 在提交前不允许做DML操作 insert/update/delete, lock row share
      4 S(Share) 共享锁 create index, lock share
      5 SSX(S/Row-X) 共享级排他锁 lock share row exclusive
      6 X(Exclusive) 排他锁 alter table, drop table, drop index, truncate table, lock exclusive

      Null: This lock mode doesn.t implement any restrictions for other session to acquire a lock but has the very important function of invalidating the session.s (holding the null lock) private cached information upon invalidation of the resource structure.

      Sub-Shared: To provide shared access to a part of the shared resource rather than the whole object, sub-shared lock mode is used so that exclusive access to other parts of an object can be provided.

      Sub-Exclusive: This mode is inline with Sub-Shared. This mode is held to provide exclusive access to a part of a shared resource, while other parts of the resource are being concurrently accessed.

      Shared: Sessions hold shared mode of a lock on a resource when it simply wants to inspect the resource and does not want to allow another session to modify this resource while providing concurrent access to that shared resource.

      Shared-Sub-Exclusive: This mode is a combination of Sub-Shared and Sub-Exclusive modes. This mode provides shared access to a part of a resource as well shared access to the whole resource.

      Exclusive: As it is exclusive, it prevents any concurrent access. This means when a session holds an exclusive lock on an object, no other session can have concurrent access to that shared resource.

      锁兼容性

      Gets/Held(->) N SS SX S SSX X
      N Yes Yes Yes Yes Yes Yes
      SS Yes Yes Yes Yes Yes No
      SX Yes Yes Yes No No No
      S Yes Yes No No No No
      SSX Yes Yes No No No No
      X Yes No No No No No
    • 锁实现

      Oracle Kernel Enqueue Service layer (KSQ)负责管理所有队列.

      当一个session需要访问一个资源时, 该session需要持有该资源结构的锁. 在持有资源结构锁之前, 需要连接到资源结构的相应队列上.

      每个资源结构都有3种队列(enqueue):

      • Owner Linked List
      • Waiter Linked List
      • Convertor Linked List

      转换队列优先级比等待队列高

      图7: 资源锁队列

      锁请求过程同样是Hash cluster模型:

      图8: 锁资源分配


      分析这样一个场景:

      有4个session处理一个有父/子(外键)关联的子表, 并且子表的外键约束上没有索引

      • session 37: del父记录1的唯一子记录

      • session 36: del父记录2的唯一子记录

      • session 39: 试图以独占模式锁住子表(begin waiting...)

      • session 37: 试图del父记录1(由于无FK索引, begin waiting...)

      • session 35: 试图del父记录3的唯一子记录(begin waiting...)

          select
          	sid, type, id1, id2, lmode, request, ctime, block
          from
          	type = 'TM'
          and
          	id1 = 82772
          ;
        
      SID TY ID1 ID2 LMODE REQUEST CTIME BLOCK
      37 TM 82772 0 3 5 66 1
      36 TM 82772 0 3 0 42 1
      39 TM 82772 0 0 6 27 0
      35 TM 82772 0 0 3 3 0

      LMODE:3 - SX

      LMODE:5 - SSX

      LMODE:6 - X

      如下图等待图形

      图9: TM资源锁等待

      分析:

      • SID 35处于等待队列的末尾, 因为SID 39卡在前面.
      • SID 39必须等待转换队列中的SID 37.
      • 而SID 37卡在了转换队列, 因为它想从锁模式3转换到锁模式5, 同时SID 36在拥有者队列中正以锁模式3持有(3和5模式不兼容)

      随着进程提交(回滚), 队列将以如下步骤向前移动:

      • 当SID 36 commit, 拥有者队列会变空, 此时SID 37会从转换者队列转移到拥有者队列, 获取锁模式5并把ctime列重置为0. SID 39和35仍然会卡在等待者队列.
      • 当SID 37 commit, 拥有者队列再次变空, 然后SID 39将会转移到拥有者队列, 获取锁模式6并把ctime列设置为0. SID 35处于等待者头部, 但无法加入到拥有者队列, 因为锁模式6已被持有, 与锁模式3不兼容.
      • 当SID 39 commit, 拥有者队列再一次变空, 然后SID 35会移动到拥有者队列, 得到锁模式3并把ctime设置为0.

    参考: http://www.oraxperts.com/node/103

  • 相关阅读:
    01 Windows编程——Hello World
    图像处理基础知识
    集成IDE anaconda
    Python中的正则表达式
    Introduction of Machine Learning
    Linux命令——diff、patch
    sed & awk 概述
    Linux行编辑器——ed
    Linux命令——w、who、whoami、lastlog、last
    【问题】统计系统上有多少个用户
  • 原文地址:https://www.cnblogs.com/renolei/p/4510088.html
Copyright © 2020-2023  润新知