Redis源码之简单动态字符串(SDS)

简单动态字符串

介绍

  • Redis没有直接使用C语言传统的字符串表示(以空字符结尾的字符数组).
  • 而是自己构建了一种名为简单动态字符串( simple dynamic string, SDS)的抽象类型
  • 并将SDS用作Redis的默认字符串表示。

SDS的实现

    /*
     * 保存字符串对象的结构
     */
    struct sdshdr {
        
        // buf 中已占用空间的长度,等于SDS所保存字符串的长度
        int len;
    
        // buf 中剩余可用空间的长度
        int free;
    
        // 数据空间,用于保存字符串
        char buf[];
    };

Redis源码之简单动态字符串(SDS)_第1张图片

  • SDS结构体解释: (以上图为例)
    • len 属性的值为5,表示这个SDS保存了一个5字节长的字符串
    • free 属性的值为0,表示这个SDS没有分配任何未使用的空间.
    • buf属性是一个char类型的数组.数组的前五个字节分别保存了’R’ ,‘e’,‘d’ ,‘i’ , ‘s’五个字符,而最后一个字节则保存了空字符’\0’.

SDS比C字符串更适用于Redis的原因.

  • 常数复杂度获取字符串长度

    • 因为C字符串并不记录自身的长度信息,所以为了获取-一个C字符串的长度,程序必须遍历整个字符串,对遇到的每个字符进行计数,直到遇到代表字符串结尾的空字符为止,这个操作的时间复杂度为O(N).
    • 对于SDS来说,如果想要知道SDS中字符串的长度是多少,只需要访问SDS的len属性就可以了,这个操作的时间复杂度是 O(1).
  • 杜绝缓冲区溢出

    • 因为C字符串不记录自身的长度,所以在执行字符串拼接等函数的时候,就可以假定已经为拼接之后的字符串分配了足够多的内存,可以容纳拼接后的字符串中的所有内容,但是如果这个假定不成立时,就会产生缓冲区溢出.
    • 与C字符串不同,SDS的空间分配策略完全杜绝了发生缓冲区溢出的可能性,当SDS API需要对SDS进行修改时,API会先检查SDS的空间是否满足修改所需的要求,如果不满足的话,API就会自动将SDS的空间扩展至执行修改所需的大小,所以不会出现前面所说的缓冲区溢出问题.
  • 减少修改字符串时带来的内存重分配次数.

    • 因为C字符串并不记录自身的长度信息,所以对于一个包含了N个字符的C字符串来说,这个C字符串的底层实现总是一个N+1个字符长的数组,因为C字符串的长度和底层数组的长度之间存在这这种关联性.所以每次增长或者缩短一个C字符串,程序总是对保存这个C字符串的数组进行一次内存重分配操作.
    • 因为Redis使用了SDS结构,通过未使用空间(free)解除了字符串长度和底层数组长度之间的关联,在SDS中,buf数组的长度不一定就是字符数量+1,数组里面可以包含未使用的字节,这些未使用的字节的数量就记录在SDS的free属性中.
      在扩展SDS空间之前, SDS API会先检查未使用空间是否足够,如果足够的话, API就会直接使用未使用空间,而无须执行内存重分配。
      通过这种预分配策略,SDS将连续增长N次字符串所需的内存重分配次数从必定N次降低为最多N次。
  • 二进制安全

    • C字符串只能保存文本数据
    • Redis的SDS的API都是二进制安全的,所以可以保存文本和二进制数据.
  • 兼容部分C字符串函数

    • C字符串可以使用所有库中的函数
    • Redis的SDS可以使用一部分库中的函数

推荐:
服务器最低86元/年

拼团链接: 阿里云点击进入

你可能感兴趣的:(Redis)