• [redis]dict和rehash


    一、底层结构剖析

    我们来自顶向下来分析redis内部字典的数据结构

    img

    dict

    typedef struct dict {
        dictType *type; //类型函数指针 这个结构体包含了一组处理特定类型的函数
        void *privdata; //私有数据 传给特定类型的函数
        dictht ht[2]; //哈希表
        long rehashidx; //rehash的进度 -1则为没有进行rehash
        unsigned long iterators; /* number of iterators currently running */
    } dict;
    

    dictht

    哈希表,只使用 ht[0] ht[1] 用于 rehash的临时空间

    typedef struct dictht {
        dictEntry **table; //哈希表数组 这是个数组 数组元素为 dictEntry指针 dictEntry保存了键值对
        
        unsigned long size;//table数组的大小
        unsigned long sizemask;//用于计算索引 size-1
        unsigned long used; //已经分配的键值对数量
    } dictht;
    

    计算索引

    h = dictHashKey(key) & n.sizemask;
    

    dictEntry

    存放键值对的结构体

    typedef struct dictEntry {
        void *key; //键
        
        //值
        union {
            void *val;
            uint64_t u64;
            int64_t s64;
            double d;
        } v;
        struct dictEntry *next; //下一个节点 因为哈希表用拉链法解决hash碰撞
    } dictEntry;
    

    dictType

    typedef struct dictType {
        uint64_t (*hashFunction)(const void *key);//计算哈希值
        void *(*keyDup)(void *privdata, const void *key);//复制键
        void *(*valDup)(void *privdata, const void *obj);//复制值
        //比较键
        int (*keyCompare)(void *privdata, const void *key1, const void *key2);
        //销毁键
        void (*keyDestructor)(void *privdata, void *key);
        //销毁值
        void (*valDestructor)(void *privdata, void *obj);
    } dictType;
    



    二、拉链法解决hash碰撞

    可以参考 https://www.cnblogs.com/biningooginind/p/12522333.html

    redis在发生碰撞后,将节点采用 头插法 链接到链表后面,这样就将插入节点的时间复杂度降低到 O(1)




    三、关于rehash

    为什么要rehash?

    键的数量可能会不断改变,增加键值对的话碰撞太多,造成查找效率的底下,如果键值对减少太多,那么空间可能会太大,造成数组空间的浪费。所以应该适当的 rehash ,从新分配空间

    何时进行

    1. redis会根据 used的值进行rehash,一旦达到了阀值,那么就开始rehash,借助ht[1]来进行

    2. 在redis创建子进程进行RDB、AOF备份的时候,不会进行rehash



    渐进式rehash

    为了避免影响主进程处理请求,redis采用 渐进式rehash策略即在插入或者删除键的时候进行rehash,因此需要rehashidx来表示rehash的进度

    但是这里带来一个问题,渐进式rehash那么如果需要插入或者删除键这么安排呢?

    redis在插入的时候不会在旧的ht[0]上操作,并且在删除键的时候需要在ht[0]、ht[1]中都寻找键,这样就保证了ht[0]只减少不增加,直到ht[0]全部rehash到ht[1]



    四、重要函数解析

    dictAdd

    给字典添加键值对

    static int dictAdd(dict *ht, void *key, void *val) {
        int index;
        dictEntry *entry;
    
        /* Get the index of the new element, or -1 if
         * the element already exists. */
        if ((index = _dictKeyIndex(ht, key)) == -1) //获取键的hashIndex
            return DICT_ERR;
    
        /* Allocates the memory and stores key */
        entry = malloc(sizeof(*entry)); //分配键值对空间
        entry->next = ht->table[index]; //头插法
        ht->table[index] = entry;
    
        /* Set the hash entry fields. */
        dictSetHashKey(ht, entry, key);
        dictSetHashVal(ht, entry, val);
        ht->used++;
        return DICT_OK;
    }
    

  • 相关阅读:
    【服务器数据恢复】StorNext文件系统数据恢复案例
    【数据库数据恢复】ASM磁盘组掉线,ASM实例不能mount的Oracle数据库数据恢复案例
    【服务器数据恢复】硬盘坏道和不稳定扇区导致服务运行过程中器崩溃的数据恢复案例
    【服务器数据恢复】重装系统导致XFS文件系统分区无法访问的数据恢复
    家中电脑的Vscode配置
    编码 乱码 解析 识别
    重构代码架构使具有良好扩展性
    第二单元总结性博客作业
    C语言实现顺序栈
    OpenGL 学习,入门程序
  • 原文地址:https://www.cnblogs.com/biningooginind/p/12813723.html
Copyright © 2020-2023  润新知