四.跳跃表
跳跃表(skiplist)是一种有序数据结构,它通过在每个节点中维持多个指向其他节点的指针,从而达到快速访问节点的目的。
redis使用跳跃表作为有序集合的底层实现之一,如果一个有序集合包含的元素数量比较多,又或者有序集合中元素的成员是比较长的字符串时,redis就会使用跳跃表来作为有序集合键的底层实现。redis只在两个地方用到跳跃表,一个是实现有序集合键,另一个是在集群节点中用作内部数据结构。
4.1 跳跃表的实现
跳跃表由redis.h/zskiplistNode和redis.h/zskiplist两个结构定义,其中zskiplistNode结构用于表示跳跃表节点,而zskiplist结构则用于保存跳跃表节点的相关信息。
typedef struct zskiplistNode{ //层 struct zskiplistLevel{ //前进指针 struct zskiplistNode *forward; //跨度 unsigned int span; } level[]; //后退指针 struct zskiplistNode *backward; //分值 double score; //成员对象 robj *obj; }zskiplistNode;
(1).层
跳跃表节点的level数组可以包含多个元素,每个元素都包含一个指向其他节点的指针,程序可以通过这些层加快访问其他节点的速度,一般来说,层的数量越多,访问其他节点的速度就越快。
每次创建一个新跳跃表节点的时候,程序根据幂次定律随机生成一个介于1和32之间的值作为level数组的大小,这个大小就是层的“高度”。
(2).前进指针
(3).跨度
层的跨度用于记录两个节点之间的距离:
>两个节点之间的跨度越大,那么距离越远;
>指向null的所有前进指针的跨度是0。
跨度是用来计算排位(rank)的。
(4).后退指针
和可以一次跳过多个节点的前进指针不同,因为每个节点只有一个后退指针,所以每次只能后退到前一个节点。
(5)分值和成员
节点的分值是一个double类型的浮点数,跳跃表的所有节点都是按分值从小倒大排序。
节点的成员对象是一个指针,它指向一个字符串对象,而字符串对象则保存着一个SDS。
在同一张跳跃表中,各个节点保存的成员必须是唯一的,但是多个节点保存的分值却可以是相同的:分值相同的节点将按照成员对象在字典序中的大小进行排序,小的排前面。
typedef struct zskiplist{ //层 struct zskiplistNode *header,*tail; //表中节点的数量 unsigned long length; //表中层数最大的节点的层数 int level; }zskiplist;
header和tail指针分别指向跳跃表的表头和表尾节点,通过这两个指针,程序定位表头节点和表尾节点的复杂度是O(1)。通过length属性记录节点的数量。
六.整数集合
整数集合是集合键的底层实现之一,当一个集合只包含整数值元素,并且这个集合的元素数量不多时,redis就会使用整数集合作为集合键的底层实现。
typedef struct intset{ //编码方式 uint32_t encoding; //集合包含的元素数量 uint32_t length; //保存元素的数组 int8_t contents[]; }intset;
contents数组是整数集合的底层实现:整数集合的每个元素都是contents的一个数据项,每个项在数组中按值的大小从小到大排列,并且数组中不包含任何重复项。
另外还有一点就是 假设一个新元素add到整数集合中,并且新元素的encoding类型比整数集合现有所有元素的类型都要长时,整数集合需要先进行升级,然后才能讲新元素添加到整数集合中。一旦对数组进行了升级,无法降级。
七.压缩列表
压缩列表是列表键和哈希键的底层实现之一。当一个列表键只包含少量列表项,并且每个列表项要么就是小整数值,要么就是长度比较短的字符串,那么redis就会使用压缩列表作为列表键的底层实现。
redis>rpush lst 1 3 5 10086 "hello" "world" (integer) 6 redis>OBJECT ENCODING lst "ziplist"
另外,当一个哈希键只包含少量键值对,并且每个键值对的键和值要么就是小整数值,要么就是长度比较短的字符串,那么redis就会使用压缩列表来做哈希键的底层实现。
redis>hmset profile "name" "Jack" "age" 28 "job" "teacher" OK redis>OBJECT ENCODING profile "ziplist"
7.1 压缩列表的构成
压缩列表是redis为了节约内存而开发的,是由一系列特殊编码的连续内存块组成的顺序型数据结构。
一个压缩列表可以包含任意多个节点(entry),每个节点可以保存一个字节数组或者一个整数值。
7.2 压缩列表节点的构成
每个压缩列表节点都可以保存一个字节数组或者一个整数值。
(1)节点的previous_entry_length是以字节为单位,记录着前一节点的长度。通过这个属性以及当前节点的起始值,可以计算出上一节点的起始值。另外当前一节点的长度小于254字节,那么previous_entry_length的长度是1字节,如果前一节点的长度大于等于254字节,那么previous_entry_length的长度是5字节
(2)encoding记录了节点content属性所保存数据的长度和类型 :
>值的最高位是00,01,10的话,content保存的是字节数组;
>值的最高位是11的话,content保存的是整数。
7.3 连锁更新
当对压缩列表进行新增或者删除时,可能会发生连锁更新(因为当前一节点变成大于254字节的时候,当前节点previous_entry_length会由1字节变成5字节,假设恰好当前节点此时也变成大于254字节,那么当前节点的下一个节点的previous_entry_length也会变化....依次进行,产生了连锁更新)