redis的基本数据结构是动态数组
一、c语言动态数组
先看下一般的动态数组结构
struct MyData { int nLen; char data[0]; };
这是个广泛使用的常见技巧,常用来构成缓冲区。比起指针,用空数组有这样的优势:
1.不需要初始化,数组名直接就是所在的偏移
2.不占任何空间,指针需要占用
int
长度空间,空数组不占任何空间。
这个数组不占用任何内存,意味着这样的结构节省空间;
这样的写法最适合制作动态buffer。因为可以这样分配空间:
malloc(sizeof(struct XXX)+ buff_len);
看出来好处没有?直接就把buffer的结构体和缓冲区一块分配了。用起来也非常方便,因为现在空数组其实变成了buff_len长度的数组了。
这样的好处是:
一次分配解决问题,省了不少麻烦。大家知道为了防止内存泄漏,如果是分两次分配(结构体和缓冲区),那么要是第二次malloc失败了,必须回滚释放第一个分配的结构体。这样带来了编码麻烦。
其次,分配了第二个缓冲区以后,如果结构里面用的是指针,还要为这个指针赋值。同样,在free这个buffer的时候,用指针也要两次free。如果用空数组,所有问题一次解决。
其次,大家知道小内存的管理是非常困难的,如果用指针,这个buffer的struct部分就是小内存了,在系统内存在多了势必严重影响内存管理的性能。要是用空数组把struct和实际数据缓冲区一次分配大块问题,就没有这个问题。
如此看来,用空数组既简化编码,又解决了小内存碎片问题提高了性能,何乐不为?应该广泛采用。
二、Redis数据类型定义
sds(Simple Dynamic Strings)是 Redis中最基本的底层数据结构, 它既是 Redis 的 String 类型的底层实现, 也是实现 Hash 、 List 和 Set 等复合类型的基石。
除此之外,sds 还是 Redis 内部实现所使用的字符串类型,
//与 sds 实现有关的数据类型有两个,一个是 sds : // 字符串类型的别名 typedef char *sds; //另一个是 sdshdr : // 持有 sds 的结构 struct sdshdr { int len; // buf 中已被使用的字符串空间数量 int free; // buf 中预留字符串空间数量 char buf[]; // 实际储存字符串的地方 };
sds.c中有很多函数对sdshdr结构体的处理,这里就不多说明了,具体看代码
但是其中sds有空间预分配策略和惰性空间释放 两个优化策略
1)空间预分配策略
主要是针对分配空间时,预留一部分空间。小于1Mz那么程序分配和预留空间同样大小。
2)惰性空间释放
主要针对截断字符串时候,并不释放空间,而是把截断的位置赋值为' '
这里可以看看《Redis设计与实现》 里面有对源码分析,看源码配合着书一起看 还是很容易理解的