Redis设计实现学习笔记

最近在准备面试，问到redis相关知识，只能说个皮毛，说的既不深入也不全面，所以抓紧突击一下，先学《redis设计与实现》。

选择看书的原因是：

书中全面深入，且能出书一定十分用心；

搜博客也找不到比书更全面的文章，且费时;

直接看源码一个是对C掌握不好，且易困，效率不高，所以跟着书同步学源码，是我认为现在最好的选择。

一：五种常用数据类型

简单动态字符串

redis做了一个用作字符串的SDS，除了一些不需要修改的场景，都是用SDS

C字符串的底层实现总是一个N+1个字符长的数组

sds.h：

struct sdshdr {
    
    // buf 中已占用空间的长度
    int len;

    // buf 中剩余可用空间的长度
    int free;

    // 数据空间
    char buf[];
};

C字符串与SDS区别
1	C字符串	SDS
2	求长度，需要遍历O(n)	直接取len就可以O(1)
3	容易造成缓冲区溢出
4		减少了内存重新分配次数 (速度要求严苛，避免分配内存耗时多)
5		二进制安全

4：SDS有free，可以比C字符串多一些预留空间。空间优化策略主要有两种：

空间预分配
1. SDS进行修改时，会额外获得未使用空间。
2. 修改后空间n
  1. n<1M;free分配n+1byte(空字符)
  2. n>=1M;free分配1M+1byte
惰性空间释放
1. SDS进行缩短时，不释放删除的空间，加到free里。

SDS的API

sdsnew 创建
sdsempty 创建空的SDS
sdsfree 释放
sdslen 获取len
sdsvail 获取free数量
sdsdup 创建一个sds副本
。。

链表

redis自己构建的链表：

/*
 * 双端链表节点
 */
typedef struct listNode {

    // 前置节点
    struct listNode *prev;

    // 后置节点
    struct listNode *next;

    // 节点的值
    void *value;

} listNode;

/*
 * 双端链表迭代器
 */
typedef struct listIter {

    // 当前迭代到的节点
    listNode *next;

    // 迭代的方向
    int direction;

} listIter;

/*
 * 双端链表结构
 */
typedef struct list {

    // 表头节点
    listNode *head;

    // 表尾节点
    listNode *tail;

    // 节点值复制函数
    void *(*dup)(void *ptr);

    // 节点值释放函数
    void (*free)(void *ptr);

    // 节点值对比函数
    int (*match)(void *ptr, void *key);

    // 链表所包含的节点数量
    unsigned long len;

} list;

字典

也叫：符号表、关联数组、映射，用于保存键值对；

/*
 * 字典
 */
typedef struct dict {

    // 类型特定函数
    dictType *type;

    // 私有数据
    void *privdata;

    // 哈希表
    dictht ht[2];

    // rehash 索引
    // 当 rehash 不在进行时，值为 -1
    int rehashidx; /* rehashing not in progress if rehashidx == -1 */

    // 目前正在运行的安全迭代器的数量
    int iterators; /* number of iterators currently running */

} dict;

普通状态下的字典https://www.cnblogs.com/beiluowuzheng/p/9726741.html

理解：

字典dict；
- 属性type是指向dictType的；dictType是保存特定类型键值对的函数；redis会为不同的字典设置不同的函数。
- 属性privateData是存储对应类型的可选参数。
- ht是指向dictht的引用；
  - 其中table是指向dictEntry的二维引用，有两级。
  - 第一级是hash后的值，到阈值就要rehash扩缩容
    - dictEntry是哈希节点
    - key是键
    - value是值
    - 还有指向下一个节点的引用next，用于成链。

hash算法

冲突解决

哈希表使用链地址法来解决键冲突：

哈希表节点dictEntry的指针构成一个链，hash相同的就排在当前dictEntry的next

rehash

1.为ht[1]分配空间，与ht[0]比较，扩容则分配

 // 新哈希表的大小至少是目前已使用节点数的两倍
 // T = O(N)
return dictExpand(d, d->ht[0].used*2);

收缩则分配大小等于ht[0]的？

/*
 * 缩小给定字典
 * 让它的已用节点数和字典大小之间的比率接近 1:1
 * 返回 DICT_ERR 表示字典已经在 rehash ，或者 dict_can_resize 为假。
 * 成功创建体积更小的 ht[1] ，可以开始 resize 时，返回 DICT_OK。
 */
int dictResize(dict *d)
{
    int minimal;
    // 不能在关闭 rehash 或者正在 rehash 的时候调用
    if (!dict_can_resize || dictIsRehashing(d)) return DICT_ERR;
    // 计算让比率接近 1：1 所需要的最少节点数量
    minimal = d->ht[0].used;
    if (minimal < DICT_HT_INITIAL_SIZE)
        minimal = DICT_HT_INITIAL_SIZE;
    // 调整字典的大小
    // T = O(N)
    return dictExpand(d, minimal);
}

2.把ht[0]复制并重新hash计算到ht[1]上

3.把ht[0]释放，ht[1]设置为ht[0]。

hash表的扩容与收缩

哈希表会自动在表的大小的二次方之间进行调整。

在没有bgSave或bgRewriteAOF命令时，负载因子大于1;或者有bgSave或bgRewriteAOF命令时，负载因子大于5；时执行

负载因子= 已保存/哈希表大小

渐进式rehash

跳跃表

skipList

命令：

ZRANGE

ZCARD

有序，按value值排序？

平均O(logN)复杂度

适用于有序集合元素较多或集合中元素是较长字符串等场景。

具体应用：

实现有序集合键
在集群节点中用作内部数据结构

/*
 * 跳跃表
 */
typedef struct zskiplist {

    // 表头节点和表尾节点
    struct zskiplistNode *header, *tail;

    // 表中节点的数量
    unsigned long length;

    // 表中层数最大的节点的层数
    int level;

} zskiplist;

和

/*
 * 跳跃表节点
 */
typedef struct zskiplistNode {
    // 成员对象
    robj *obj;
    // 分值
    double score;
    // 后退指针
    struct zskiplistNode *backward;
    // 层
    struct zskiplistLevel {
        // 前进指针
        struct zskiplistNode *forward;
        // 跨度
        unsigned int span;
    } level[];
} zskiplistNode;

理解：

跳表zskipList；
- 属性header和tail分别指向zskiplistNode的头尾指针。
  - zskiplistNode
    - 层
    - 后退
    - 分支
    - 成员对象
- level记录层数最大的层数

整数集合

命令：

SADD numbers 1 3 5 7 9

typedef struct intset {
    
    // 编码方式
    uint32_t encoding;

    // 集合包含的元素数量
    uint32_t length;

    // 保存元素的数组
    int8_t contents[];

} intset;

uint32_t 　取值范围 0 ~ 4,294,967,295

int8_t 　　取值范围 -128 ~ 127

contents中的值从小到大排列，并且没有重复元素。

整数集合升级过程：

根据新元素的类型，扩展数组空间，为新元素分配空间。
将已有的数据转换成相同类型，保持排序。
将新元素加到新数组里。

升级之后不支持降级，即使没有当前等级的元素。

压缩表

zipList 是列表键和hash键的底层实现之一。

RPUSH lst 1 3 5 10086 "hello" "world"

对象

字符串对象
列表对象
哈希对象
集合对象
有序集合对象

每种对象都最少对应上述一种数据类型

不同的对象有不同的特性~（省略）。

二：单机

数据库

struct redisServer{
    
    // ~
    // 一个数组保存，保存服务器中所有数据库
    redisDb *db;
　 　// ~
　　//根据此数量决定在初始化时创建数据库个数
　　int dbnum;


} intset;

通过SELECT n 可以切换到不同的库

//TODO

原理

保存键值对的方法

过期键删除策略

定时删除
1. 设置过期时间的同时，创建一个定时器，定时器到时间执行对键的删除操作。 --- 定时器是怎么实现的？？
惰性删除
1. 放任过期时间不管，但是每次从键空间中获取键时，都检查取得的键是否过期。过期删除，没过期返回。--这个存在空间的浪费
定期删除

每隔一段时间，对数据库进行一次检查，删除过期key。检查力度由算法决定。

1.定时删除对内存最友好对CPU时间不友好

CPU紧张时，影响服务器的响应时间和吞吐量。

实现定时器，需要用到redis服务器中的时间事件，当前时间事件的实现方式是：无序链表，查找效率为O（N），效率较低。

现阶段来说不实用。

2.惰性删除对CPU时间友好对内存不友好

浪费内存，由内存泄漏的危险

3.定期删除

前两种的整合

每个一段时间执行一次删除过期键，减少内存浪费

删除太频繁或执行时间长，会退化成定时删除，节约CPU

所以这个要合理配置。

redis的过期键删除策略

惰性删除 + 定期删除

持久化机制

aof 和 rdb

事件、redis初始化过程等其他

三：分布式

Sentinel

复制

集群

四：独立功能

发布订阅

事务

Lua脚本

redis2.6引入Lua脚本

在redis客户端可以直接使用Lua脚本

redis> EVAL "return 'hello world'" 0

"hello world"

Lua环境初始化（对Lua环境进行修改产生的影响）

执行Lua脚本中包含redis命令的伪客户端

Lua脚本的脚本字典

管理脚本的命令SCRIPT FLUSH、SCRIPT EXISTS、SCRIPT LOAD、SCRIPT KILL

EVAL命令和EVALSHA命令

排序 SORT

Sort可以对int或者字符等进行排序

还可以使用 SORT ~ BY ~ 以什么字段为权重排序

sort命令的最简单的执行形式为 SORT <key>

redis> SORT numbsers

1)"1"

2)"2"

3)"3"

命令的详细步骤：

1.创建一个和numbsers列表长度相同的数组，数组的每一项都是redisSortObject结构

2.遍历数组，将Obj指针和列表之间一一对应

3.遍历数组，将obj指向的列表转换成double浮点数，放到u.score里

4.根据u.score属性从小到大排列

5.遍历数组，返回排序结果。

慢查询

redis分布式锁

https://www.cnblogs.com/jiangym/p/15877382.html#_label1_1

redisson

//todo

相关阅读:
Java字符串比较
 Java中定义不了可变长数组怎么办---集合泛型
 Java后台读取excel表格返回至Web前端
 JAVA中Stringbuffer的append( )方法
 Java操作Excel中HSSFCell.CELL_TYPE_STRING、BOOLEAN、NUMERIC无定义解决方法
 数据结构---公交线路提示系统05（内附读取表格+迪杰斯特拉算法Java代码）
.getCellType()的几种类型值
 数据结构---公交线路提示系统04
数据结构---公交线路提示系统03
转载一篇较为详细的caffe-ssd编译环境的搭建
原文地址：https://www.cnblogs.com/jiangym/p/15839229.html