Redis设计与实现——简单动态字符串(SDS)

Redis字符串简介

在Redis中,字符串的存储不是使用C语言传统的字符串表示,而是使用一种名为简单动态字符串(simple dynamic string)的数据结构表示。

例如: 这一条指令

redis>SET msg "hello"
OK

键值对的键是一个字符串对象,底层实现是一个保存着“msg”的SDS
键值对的值是一个字符串对象,底层实现是一个保存着“hello”的SDS

SDS的数据结构

image

SDS与C字符串区别

  • 字符串的结尾依然以空字符结尾,遵循了C字符串定义的惯例,为的是可以复用一部分C中函数库的函数,即兼容部分C字符串函数,而不需要重新写一套。
  • len的定义可以以O(1)的时间复杂度获取字符串的长度,在传统C的字符串中,需要进行全部遍历才能获取长度。在大量使用STRLEN时SDS将大大提升效率。
  • free的定义可以杜绝缓冲区溢出,例如:


    在这里插入图片描述

    原来内存中紧贴的两个字符串,使用了这个命令。

strcat(s1,"Cluster");
在这里插入图片描述

这样就会导致s1的内容溢出到了s2中。而在SDS中则不会发生,因为每次进行类似这种增加字符的操作,首先会判断free的长度是否大于增加的字符,如果小于,则会重新开辟新的空间再进行增加。

那开辟新的空间的长度与增加后的字符串长度相等的吗?
不是!为了减少修改字符串时带来的内存重分配,在SDS修改之后的长度(len长度)小于1MB时,程序会多分配与len长度相同的空间,即free的值与len值相等。反之,则多分配1MB的长度。例如修改之后len的值为13字节,那么程序会再分配13字节的未使用空间,总长度buf数组则为13+13+1=27字节(额外的一字节用来保存空字符)。若修改之后len的值为30MB,则buf数组为30MB+1MB+1Byte

  • 为了减少内存重分配的次数,SDS采用的是惰性空间释放,当字符串缩短时,程序不是立即回收缩短后多出来的字节,而是使用free变量来记录多出来的字节。如果担心内存浪费,SDS也提供了API可以在真正有需要时释放SDS的未使用空间。

二进制安全

Redis作为数据库存储,需要满足各种各样的存储形式,若使用传统C字符串,遇到空字符便会结束,而SDS使用len的值来判断字符串是否结束,所以程序在写入数据时怎么样,取出也是怎么样。

举个例子:
在这里插入图片描述

假如这种存储形式以空字符来划分字符,如用C字符串,读了Redis后面的字符就读不到了。

总结
在这里插入图片描述

你可能感兴趣的:(Redis设计与实现——简单动态字符串(SDS))