【redis】基本数据结构简单源码解析--688IT编程网

【redis】基本数据结构简单源码解析

（我贴的代码是本机6.2.1版本）

string:SDS(简单动态字符串)

redis是以c语⾔编写，但是redis的字符串没有直接使⽤C语⾔的以null结尾的字符串，⽽是采⽤SDS（Simple Dynamic String：简单动态

字符串）

struct SDS<T> {

T capacity; // 数组容量Redis 字符串的长度不得超过 512M 字节。创建字符串时 len 和 capacity ⼀样长，不会多分配冗余空间，这是因为绝⼤多数场景下我们不会使 T len; // 数组长度因为把长度写在头部，不⽤像C语⾔⼀样以\0识别字符串结束符，所以sds是⼆进制安全的

byte flags; // sds类型，5 8 16 32 64位

byte[] content; // 数组内容

}

//追加字符串append

sds sdscatlen(sds s, const void *t, size_t len) {

size_t curlen = sdslen(s);//原字符串长度

s = sdsMakeRoomFor(s,len);//空间调整

if (s == NULL) return NULL;//内存不⾜

memcpy(s+curlen, t, len);//追加字符串到当前的content数组中

sdssetlen(s, curlen+len);//设置追加后的长度值

s[curlen+len] = '\0';//与C语⾔字符串⼀致，可以printf()调试、便于直接使⽤ glibc 的字符串处理函数

return s;

}

/按需调整空间

sds sdsMakeRoomFor(sds s, size_t addlen) {

void *sh, *newsh;

size_t avail = sdsavail(s);

size_t len, newlen;

char type, oldtype = s[-1] & SDS_TYPE_MASK;

int hdrlen;

size_t usable;

/* 空间⾜够就直接返回新字符串 */

if (avail >= addlen) return s;

//接下来是空间不⾜的操作

len = sdslen(s);

sh = (char*)s-sdsHdrSize(oldtype);

newlen = (len+addlen);

assert(newlen > len); /* Catch size_t overflow */

if (newlen < SDS_MAX_PREALLOC) //⼩于SDS_MAX_PREALLOC（1M）时，每次分配的空间加倍

newlen *= 2;

else //⼤于SDS_MAX_PREALLOC后，每次加1Mredis八种数据结构

newlen += SDS_MAX_PREALLOC;

type = sdsReqType(newlen);//根据长度划分新字符串所属的SDS数据类型

/* 不要使⽤类型5：⽤户正在追加字符串，⽽类型5⽆法记住空格，因此必须在每次追加操作时调⽤sdsMakeRoomFor（） */ if (type == SDS_TYPE_5) type = SDS_TYPE_8;

hdrlen = sdsHdrSize(type);//根据所属SDS数据类型计算所占内存

assert(hdrlen + newlen + 1 > len); /* Catch size_t overflow */

if (oldtype==type) {//所属的SDS数据类型不变时

newsh = s_realloc_usable(sh, hdrlen+newlen+1, &usable);

if (newsh == NULL) return NULL;

s = (char*)newsh+hdrlen;

} else {

/* Since the header size changes, need to move the string forward,

* and can't use realloc

如果类型发⽣变化，地址内容不可复⽤，所以新的空间

newsh = s_malloc_usable(hdrlen+newlen+1, &usable);

if (newsh == NULL) return NULL;

memcpy((char*)newsh+hdrlen, s, len+1);//将s复制到(char*)newsh+hdrlen +1是复制上\0

s_free(sh);//释放前⾯的内存空间

s = (char*)newsh+hdrlen;//调整s开始的位置，即地址空间指向新的buf开始的位置

s[-1] = type;//flag位置

sdssetlen(s, len);//分配len的值

}

usable = usable-hdrlen-1;

if (usable > sdsTypeMaxSize(type))//实际占⽤不能⼤于所属SDS数据类型最长占⽤字节

usable = sdsTypeMaxSize(type);

sdssetalloc(s, usable);//(根据类型)设置sds字符串容量

return s;

}

注意sdsMakeRoomFor不仅⽤来增加内存，还可以⽤来修剪字符串.以下是我在sdsIncrLen头部注释看到的：

s = sdsMakeRoomFor(s, BUFFER_SIZE);（BUFFER_SIZE：缓冲区）当前字符串⽐之前缓冲区长度⼩的话，并不直接修剪。直到刷新缓冲区后

/* Increment the sds length and decrements the left free space at the

* end of the string according to 'incr'. Also set the null term

* in the new end of the string.

* This function is used in order to fix the string length after the

* user calls sdsMakeRoomFor(), writes something after the end of

* the current string, and finally needs to set the new length.

* Note: it is possible to use a negative increment in order to

* right-trim the string.

* Usage example:

* Using sdsIncrLen() and sdsMakeRoomFor() it is possible to mount the

* following schema, to cat bytes coming from the kernel to the end of an

* sds string without copying into an intermediate buffer:

* oldlen = sdslen(s);

* s = sdsMakeRoomFor(s, BUFFER_SIZE);

* nread = read(fd, s+oldlen, BUFFER_SIZE);

* ... check for nread <= 0 and handle it ...

* sdsIncrLen(s, nread);

void sdsIncrLen(sds s, ssize_t incr) {

embstr vs raw

Redis 的字符串有两种存储⽅式，在长度特别短时，使⽤ emb 形式存储 (embeded)，当长度超过 44 时，使⽤ raw 形式存储。

embstr 存储形式是这样⼀种存储形式，它将 RedisObject 对象头和 SDS 对象连续存在⼀起，使⽤ malloc ⽅法⼀次分配。⽽ raw 存储形式不⼀样，它需要两次 malloc，两个对象头在内存地址上⼀般是

不连续的。⽽内存分配器能分配的最⼤单位内存是64字节，如果总体超出了 64 字节，redis 认为它是⼀个⼤字符串，不再使⽤ emdstr 形式存储，⽽该⽤ raw 形式。

在字符串⽐较⼩时，SDS 对象头的⼤⼩是 capacity+3，⾄少是 3。

SDS 结构体中的 content 中的字符串是以字节\0 结尾的字符串。

SDS优势

获取字符串长度时间复杂度O（1）

避免内存溢出

减少内存重分配

空间预分配

惰性空间释放

hash、set、zset：dict(字典)

dict 是 Redis 服务器中出现最为频繁的复合型数据结构，除了 hash 结构的数据会⽤到字典外，整个 Redis 数据库的所有 key 和 value 也组成了⼀个全局字典，还有带过期时间的 key 集合也是⼀个字典。zset 集合中存储 value 和 score 值的映射关系也是通过 dict 结构实现的。

dict 结构内部包含两个 hashtable，通常情况下只有⼀个 hashtable 是有值的。但是在 dict 扩容缩容时，需要分配新的 hashtable，然后进⾏渐进式搬迁，这时候两个 hashtable 存储的分别是旧的 hashtable 和新的 hashtable。待搬迁结束后，旧的 hashtable 被删除，新的hashtable 取⽽代之。

hashtable的结构与java hashMap⼏乎⼀样，都是以数组+链表进⾏分桶的⽅式解决hash冲突。第⼀维是数组，第⼆维是链表。数组中存储的是第⼆维链表的第⼀个元素的指针。

struct dictEntry {

void* key;

void* val;

dictEntry* next; // 链接下⼀个 entry

}

struct dictht {

dictEntry** table; // ⼆维

long size; // 第⼀维数组的长度

long used; // hash 表中的元素个数

...

}

渐进式 rehash

⼤字典的扩容是⽐较耗时间的，需要申请新的数组，然后将旧字典所有链表中的元素挂接到新的数组

下⾯，这是⼀个 O(n)级别的操作，单线程的redis 很难承受这样耗时的过程，所以 Redis 使⽤渐进式 rehash 搬迁。

hash函数

评判hash函数好坏的依据在于其是否可以将key打散的⽐较均匀，并且性能⽐较好。redis 的字典默认的 hash 函数是 siphash。siphash 算法即使在输⼊ key 很⼩的情况下，也可以产⽣随机性特别好的输出，⽽且它的性能也⾮常突出。

hash攻击

如果 hash 函数存在偏向性，⿊客就可能利⽤这种偏向性对服务器进⾏攻击。存在偏向性的 hash 函数在特定模式下的输⼊会导致 hash

第⼆维链表长度极为不均匀，甚⾄所有的元素都集中到个别链表中，直接导致查效率急剧下降，从 O(1)退化到 O(n)。有限的服务器计算能⼒将会被 hashtable 的查效率彻底拖垮。这就是所谓 hash 攻击。

扩容条件

正常情况下，当hash表中元素的个数等于第⼀维数组的长度时，就会开始扩容，扩容的新数组是原数组⼤⼩的2倍。不过如果redis正在做bgsave，为了减少内存页的过多分离 (bgsave涉及Copy On Write)，redis 尽量不去扩容 (dict_can_resize)，但是如果 hash 表已经⾮常满了，元素的个数已经达到了第⼀维数组长度的 5 倍 (dict_force_resize_ratio)，说明 hash 表已经过于拥挤了，这个时候就会强制扩容。

缩容条件

当 hash 表因为元素的逐渐删除变得越来越稀疏时，Redis 会对 hash 表进⾏缩容来减少 hash 表的第⼀维数组空间占⽤。缩容的条件是元素个数低于数组长度的 10%。缩容不会考虑 Redis 是否正在做 bgsave。

set（集合）的结构

redis ⾥⾯ set 的结构底层实现也是字典，只不过所有的value都是 NULL，其它的特性和字典⼀模⼀样。

intset

当set中元素都是整数并且元素个数较少（最多64以内）时，采⽤intset，它是紧凑的数组结构

为什么不⽤ziplist？因为set的value全是空值，不需要再单独记录每个元素内容

struct intset<T> {

int32 encoding; // 决定整数位宽是 16 位、32 位还是 64 位

int32 length; // 元素个数

int<T> contents; // 整数数组，可以是 16 位、32 位和 64 位

}

zset、hash：ziplist(压缩列表)

Redis 为了节约内存空间使⽤，zset和 hash容器对象在元素个数较少的时候，采⽤压缩列表 (ziplist) 进⾏存储。压缩列表是⼀块连续的内存空间，元素之间紧挨着存储，没有任何冗余空隙。

struct ziplist<T> {

int32 zlbytes; // 整个压缩列表占⽤字节数

int32 zltail_offset; // 最后⼀个元素距离压缩列表起始位置的偏移量，⽤于快速定位到最后⼀个节点，⽀持双向遍历

int16 zllength; // 元素个数

T[] entries; // 元素内容列表，挨个挨个紧凑存储

int8 zlend; // 标志压缩列表的结束，值恒为 0xFF

}

struct entry {

int<var> prevlen; // 前⼀个 entry 的字节长度

int<var> encoding; // 元素类型编码

optional byte[] content; // 元素内容

}

因为 ziplist 都是紧凑存储，没有冗余空间 (对⽐⼀下 Redis 的字符串结构)。意味着插⼊⼀个新的元素就需要调⽤ realloc 扩展内存。取决于内存分配器算法和当前的ziplist 内存⼤⼩，realloc 可能会重新分配新的内存空间，并将之前的内容⼀次性拷贝到，也可能在原有的地址上进⾏扩展，这时就不需要进⾏旧内容的内存拷贝。如果 ziplist 占据内存太⼤，重新分配内存和拷贝内存就会有很⼤的消耗。所以 ziplist 不适合存储⼤型字符串，存储的元素也不宜过多。

级联更新

每个 entry 都会有⼀个 prevlen 字段存储前⼀个 entry 的长度。如果内容⼩于 254 字节，prevlen ⽤ 1 字节存储，否则就是 5 字节。这意味着如果某个 entry 经过了修改操作从 253 字节变成了 254 字节，那么它的下⼀个 entry 的 prevlen 字段就要更新，从 1 个字节扩展到 5 个字节；如果这个 entry 的长度本来也是 253 字节，那么后⾯ entry 的 prevlen 字段还得继续更新。如果 ziplist ⾥⾯每个 entry 恰好都存储了 253 字节的内容，那么第⼀个 entry 内容的修改就会导致后续所有 entry 的级联更新，这就是⼀个⽐较耗费计算资源的操作。

删除中间的某个节点也可能会导致级联更新，某个节点A前⼀个节点B原本是253字节内，它前前节点C⼤于253，B被删除后，A的prevlen就从1字节变成5字节，引发级联更新，A后⾯的假如之前prevlen = 1，现在全部要改为5了。

stream：listpack(紧凑列表)

5.0新增的数据结构，它是对 ziplist 结构的改进，在存储空间上会更加节省，⽽且结构上也⽐ ziplist 要精简。

listpack相对ziplist，字符串内部length放在字符串尾部，并且记录的是当前元素的长度。正因如此，它不需要存zltail_offset，因为可以⽤total_bytes、最后⼀个元素的length来计算。

688IT编程网

【redis】基本数据结构简单源码解析

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符回溯引用和前后查匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式选择题

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

688IT编程网

【redis】基本数据结构简单源码解析

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符 回溯引用和前后查 匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式 选择题

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

java正则表达式选择题

非零金额正则表达式

基本的元字符回溯引用和前后查匹配模式

java正则表达式选择题

非零金额正则表达式