• Redis源码阅读二:跳跃表skiplist


    简介

    跳跃表是一种有序数据结构。和链表相比,跳跃表的结点通过增加层,每一层指向不同跨度的后继结点,来解决链表查找需要O(N)复杂度的问题。跳跃表支持平均O(logN),最坏O(N)复杂度的查询。
    Redis中跳跃表用在2处:有序集合键、集群节点用做内部数据结构

    例如zset的定义(本文源码基于redis 3.0)

    // redis.h
    typedef struct zset {
    
        // 字典,键为成员,值为分值
        // 用于支持 O(1) 复杂度的按成员取分值操作
        dict *dict;
    
        // 跳跃表,按分值排序成员
        // 用于支持平均复杂度为 O(log N) 的按分值定位成员操作
        // 以及范围操作
        zskiplist *zsl;
    
    } zset;
    

    跳跃表结构

    redis.h

    /*
     * 跳跃表
     */
    typedef struct zskiplist {
    
        // 表头节点和表尾节点
        struct zskiplistNode *header, *tail;
    
        // 表中节点的数量
        unsigned long length;
    
        // 表中层数最大的节点的层数
        int level;
    
    } zskiplist;
    
    /*
     * 跳跃表节点
     */
    typedef struct zskiplistNode {
    
        // 成员对象
        robj *obj;
    
        // 分值
        double score;
    
        // 后退指针
        struct zskiplistNode *backward;
    
        // 层
        struct zskiplistLevel {
    
            // 前进指针
            struct zskiplistNode *forward;
    
            // 跨度
            unsigned int span;
    
        } level[];
    
    } zskiplistNode;
    

    插入

    /*
     * 创建一个成员为 obj ,分值为 score 的新节点,
     * 并将这个新节点插入到跳跃表 zsl 中。
     * 
     * 函数的返回值为新节点。
     *
     * T_wrost = O(N^2), T_avg = O(N log N)
     */
    zskiplistNode *zslInsert(zskiplist *zsl, double score, robj *obj) {
        zskiplistNode *update[ZSKIPLIST_MAXLEVEL], *x;
        unsigned int rank[ZSKIPLIST_MAXLEVEL];
        int i, level;
    
        redisAssert(!isnan(score));
    
        // 在各个层查找节点的插入位置
        // T_wrost = O(N^2), T_avg = O(N log N)
        x = zsl->header;
        for (i = zsl->level-1; i >= 0; i--) {
    
            /* store rank that is crossed to reach the insert position */
            // 如果 i 不是 zsl->level-1 层
            // 那么 i 层的起始 rank 值为 i+1 层的 rank 值
            // 各个层的 rank 值一层层累积
            // 最终 rank[0] 的值加一就是新节点的前置节点的排位
            // rank[0] 会在后面成为计算 span 值和 rank 值的基础
            rank[i] = i == (zsl->level-1) ? 0 : rank[i+1];
    
            // 沿着前进指针遍历跳跃表
            // T_wrost = O(N^2), T_avg = O(N log N)
            while (x->level[i].forward &&
                (x->level[i].forward->score < score ||
                    // 比对分值
                    (x->level[i].forward->score == score &&
                    // 比对成员, T = O(N)
                    compareStringObjects(x->level[i].forward->obj,obj) < 0))) {
    
                // 记录沿途跨越了多少个节点
                rank[i] += x->level[i].span;
    
                // 移动至下一指针
                x = x->level[i].forward;
            }
            // 记录将要和新节点相连接的节点
            update[i] = x;
        }
    
        /* we assume the key is not already inside, since we allow duplicated
         * scores, and the re-insertion of score and redis object should never
         * happen since the caller of zslInsert() should test in the hash table
         * if the element is already inside or not. 
         *
         * zslInsert() 的调用者会确保同分值且同成员的元素不会出现,
         * 所以这里不需要进一步进行检查,可以直接创建新元素。
         */
    
        // 获取一个随机值作为新节点的层数
        // T = O(N)
        level = zslRandomLevel();
    
        // 如果新节点的层数比表中其他节点的层数都要大
        // 那么初始化表头节点中未使用的层,并将它们记录到 update 数组中
        // 将来也指向新节点
        if (level > zsl->level) {
    
            // 初始化未使用层
            // T = O(1)
            for (i = zsl->level; i < level; i++) {
                rank[i] = 0;
                update[i] = zsl->header;
                update[i]->level[i].span = zsl->length;
            }
    
            // 更新表中节点最大层数
            zsl->level = level;
        }
    
        // 创建新节点
        x = zslCreateNode(level,score,obj);
    
        // 将前面记录的指针指向新节点,并做相应的设置
        // T = O(1)
        for (i = 0; i < level; i++) {
            
            // 设置新节点的 forward 指针
            x->level[i].forward = update[i]->level[i].forward;
            
            // 将沿途记录的各个节点的 forward 指针指向新节点
            update[i]->level[i].forward = x;
    
            /* update span covered by update[i] as x is inserted here */
            // 计算新节点跨越的节点数量
            x->level[i].span = update[i]->level[i].span - (rank[0] - rank[i]);
    
            // 更新新节点插入之后,沿途节点的 span 值
            // 其中的 +1 计算的是新节点
            update[i]->level[i].span = (rank[0] - rank[i]) + 1;
        }
    
        /* increment span for untouched levels */
        // 未接触的节点的 span 值也需要增一,这些节点直接从表头指向新节点
        // T = O(1)
        for (i = level; i < zsl->level; i++) {
            update[i]->level[i].span++;
        }
    
        // 设置新节点的后退指针
        x->backward = (update[0] == zsl->header) ? NULL : update[0];
        if (x->level[0].forward)
            x->level[0].forward->backward = x;
        else
            zsl->tail = x;
    
        // 跳跃表的节点计数增一
        zsl->length++;
    
        return x;
    }
    

    删除

    /* Internal function used by zslDelete, zslDeleteByScore and zslDeleteByRank 
     * 
     * 内部删除函数,
     * 被 zslDelete 、 zslDeleteRangeByScore 和 zslDeleteByRank 等函数调用。
     *
     * T = O(1)
     */
    void zslDeleteNode(zskiplist *zsl, zskiplistNode *x, zskiplistNode **update) {
        int i;
    
        // 更新所有和被删除节点 x 有关的节点的指针,解除它们之间的关系
        // T = O(1)
        for (i = 0; i < zsl->level; i++) {
            if (update[i]->level[i].forward == x) {
                update[i]->level[i].span += x->level[i].span - 1;
                update[i]->level[i].forward = x->level[i].forward;
            } else {
                update[i]->level[i].span -= 1;
            }
        }
    
        // 更新被删除节点 x 的前进和后退指针
        if (x->level[0].forward) {
            x->level[0].forward->backward = x->backward;
        } else {
            zsl->tail = x->backward;
        }
    
        // 更新跳跃表最大层数(只在被删除节点是跳跃表中最高的节点时才执行)
        // T = O(1)
        while(zsl->level > 1 && zsl->header->level[zsl->level-1].forward == NULL)
            zsl->level--;
    
        // 跳跃表节点计数器减一
        zsl->length--;
    }
    
    /* Delete an element with matching score/object from the skiplist. 
     *
     * 从跳跃表 zsl 中删除包含给定节点 score 并且带有指定对象 obj 的节点。
     *
     * T_wrost = O(N^2), T_avg = O(N log N)
     */
    int zslDelete(zskiplist *zsl, double score, robj *obj) {
        zskiplistNode *update[ZSKIPLIST_MAXLEVEL], *x;
        int i;
    
        // 遍历跳跃表,查找目标节点,并记录所有沿途节点
        // T_wrost = O(N^2), T_avg = O(N log N)
        x = zsl->header;
        for (i = zsl->level-1; i >= 0; i--) {
    
            // 遍历跳跃表的复杂度为 T_wrost = O(N), T_avg = O(log N)
            while (x->level[i].forward &&
                (x->level[i].forward->score < score ||
                    // 比对分值
                    (x->level[i].forward->score == score &&
                    // 比对对象,T = O(N)
                    compareStringObjects(x->level[i].forward->obj,obj) < 0)))
    
                // 沿着前进指针移动
                x = x->level[i].forward;
    
            // 记录沿途节点
            update[i] = x;
        }
    
        /* We may have multiple elements with the same score, what we need
         * is to find the element with both the right score and object. 
         *
         * 检查找到的元素 x ,只有在它的分值和对象都相同时,才将它删除。
         */
        x = x->level[0].forward;
        if (x && score == x->score && equalStringObjects(x->obj,obj)) {
            // T = O(1)
            zslDeleteNode(zsl, x, update);
            // T = O(1)
            zslFreeNode(x);
            return 1;
        } else {
            return 0; /* not found */
        }
    
        return 0; /* not found */
    }
    
  • 相关阅读:
    《快速软件开发》学习笔记 之一
    Python+常用模块(2).md
    Python语法 (1).md
    使用mysql导入txt文件
    Python+numpy(3).md
    笔试二(程序题)
    啦啦啦 我的博客开通了
    java面试笔试
    笔试三(面试二)
    笔试三(面试)
  • 原文地址:https://www.cnblogs.com/pusidun/p/13725082.html
Copyright © 2020-2023  润新知