open vswitch研究:基本数据结构

hmap

/* A hash map. */
struct hmap {
    struct hmap_node **buckets; /* Must point to 'one' iff 'mask' == 0. */
    struct hmap_node *one;
    size_t mask;
    size_t n;
};

/* A hash map node, to be embedded inside the data structure being mapped. */
struct hmap_node {
    size_t hash;                /* Hash value. */
    struct hmap_node *next;     /* Next in linked list. */
};

一个struct hmap_node* 的list是由相同hash的hmap_node组成,用*buckets来指向,buckets是struct hmap_node*的指针数组。其中buckets数组的第一个指针初始化存放在struct hmap_node* one里面。mask表示哈希值的取模,通过hash & mask得到hmap_node所在的buckets下标索引。n表示hmap里当前所有struct hmap_node的个数。一般来说,hmap的node个数不应该超过mask的2倍,如果超过了,需要调整mask值。


sset

sset是string的hmap

/* A set of strings. */
struct sset {
    struct hmap map;
};

struct sset_node {
    struct hmap_node hmap_node;
    char name[1];
};

sset_init, sset_destroy, sset_clear, sset_delete, 

sset_delete,删除sset的hmap对应的hmap_node,sset_clear对hmap删除所有hmap_node,sset_destroy删除所有hmap_node之后hmap_destroy整个hash map,sset_init初始化hmap

sset_find__,在sset的hmap中查找name对应的hmap_node

sset_add__,xmalloc一个sset_node结构,调用hmap_insert插入到sset的hmap中

SSET_FOR_EACH_SAFE宏用来遍历sset,SSET_NODE_FROM_HMAP_NODE, SSET_NAME_FROM_HMAP_NODE, SSET_NODE_NAME用来找到sset的某个hmap_node

SSET_FIRST, SSET_NEXT,用来找sset的第一个node, 下一个node


shash

shash和sset基本没啥区别,唯一区别在于sset是一个string的hmap,shash是一个key-value的hmap

struct shash {                                                                                        
    struct hmap map;                                                                                  
};           

struct shash_node {                                                                                   
    struct hmap_node node;                                                                            
    char *name;                                                                                       
    void *data;                                                                                       
};               

shash的操作和sset基本一致,就不多说了,无非是hmap的操作的封装


simap

这是一个string 2 integer的hmap数据结构

/* A map from strings to unsigned integers. */
struct simap {
    struct hmap map;            /* Contains "struct simap_node"s. */
};


struct simap_node {
    struct hmap_node node;      /* In struct simap's 'map' hmap. */
    char *name;
    unsigned int data;
};


ofpbuf

struct ofpbuf {
    void *base;                 /* First byte of allocated space. */
    size_t allocated;           /* Number of bytes allocated. */
    enum ofpbuf_source source;  /* Source of memory allocated as 'base'. */

    void *data;                 /* First byte actually in use. */
    size_t size;                /* Number of bytes in use. */

    void *l2;                   /* Link-level header. */
    void *l3;                   /* Network-level header. */
    void *l4;                   /* Transport-level header. */
    void *l7;                   /* Application data. */

    struct list list_node;      /* Private list element for use by owner. */
    void *private_p;            /* Private pointer for use by owner. */
};

ofpbuf是一种内存管理类,从名字上看,是给openflow protocol用的,可以通过list_node,把很多ofpbuf挂到一个list上,其成员enum ofpbuf_source source表示这段内存的性质,目前定义了3种,

enum ofpbuf_source {
    OFPBUF_MALLOC,              /* Obtained via malloc(). */
    OFPBUF_STACK,               /* Un-movable stack space or static buffer. */
    OFPBUF_STUB                 /* Starts on stack, may expand into heap. */
};

OFPBUF_MALLOC表示这段内存是malloc分配的,所以释放的时候要调用free; OFPBUF_STACK表示这段内存是栈空间; OFPBUF_STUB表示这段内存是栈空间,但可能会溢出到堆空间里(我汗。。哥们你搞笑呢?)

ofpbuf_use 基于malloc分配的内存创建一个ofpbuf结构,ofpbuf_use_stack,基于一块栈的内存创建ofpbuf结构,两者都调用了ofpbuf_use__,该函数把使用的size设置为0,表示这是一段未使用的内存。另一种创建ofpbuf的方式ofpbuf_use_const,把size设置为allocated的大小,说明内存已经用满。

ofpbuf_init, ofpbuf_uninit,用malloc/free分配释放一块内存

和skb一样,ofpbuf也有类似的指针,ofpbuf->base表示内存的开始位置,ofpbuf->data表示数据包的开始位置,ofpbuf_end返回base+allocated位置,表示内存的结束位置,ofpbuf_tail返回data+size位置,表示数据的结束位置。由此,ofpbuf_headroom返回从base到data之间的空间大小,ofpbuf_tailroom返回end到tail之间的空间大小。

ofpbuf_resize__,为当前数据包预留new_headroom长度的头部空间,和new_tailroom长度的尾部空间。该函数会重新分配一段内存,大小为size + new_headroom + new_tailroom,把原有数据拷贝到新内存,并相应修改base, data, l2, l3, l4, l7的位置。数据拷贝调用ofpbuf_copy__完成。ofpbuf_trim做相反的操作,把headroom, tailroom截断为0

ofpbuf_prealloc_tailroom/ofpbuf_prealloc_headroom,如果当前headroom/tailroom空间不满足要求,调用ofpbuf_resize__重新分配headroom/tailroom(至少64字节)

ofpbuf_new_with_headroom,分配一段size + headroom大小的内存,之后ofpbuf->data = ofpbuf->base  + size

ofpbuf_put_uninit,调用ofpbuf_prealloc_tailroom为内存段保留size大小的tailroom,返回新的tail位置。该函数有多个衍生函数: 

ofpbuf_put_zeros,除ofpbuf_put_uninit之外,把tail之后的size大小的内存空间置0; ofpbuf_put,除ofpbuf_put_uninit之外,拷贝一段size大小的数据; 

和skb结构体一样,ofpbuf也有push和pull的操作

ofpbuf_push_uninit,调用ofpbuf_prealloc_headroom为内存段保留size大小的headroom,之后数据往前长占用headroom的size个字节,此时headroom应该为0. 这种行为和skb的push基本一致。ofpbuf_push_zeros, ofpbuf_push为其衍生函数

ofpbuf_pull,把data往后移size个字节,相当于给headroom空出size个字节空间


flow

lib/flow.h lib/flow.c是用户态视角的flow定义,该结构和内核态的sw_flow完全不同,其真正包含了flow的各个field的内容,e.g.

struct flow {
    ovs_be64 tun_id;            /* Encapsulating tunnel ID. */
    struct in6_addr ipv6_src;   /* IPv6 source address. */
    struct in6_addr ipv6_dst;   /* IPv6 destination address. */
    struct in6_addr nd_target;  /* IPv6 neighbor discovery (ND) target. */
    uint32_t skb_priority;      /* Packet priority for QoS. */
    uint32_t regs[FLOW_N_REGS]; /* Registers. */
    ovs_be32 nw_src;            /* IPv4 source address. */
    ovs_be32 nw_dst;            /* IPv4 destination address. */
    ovs_be32 ipv6_label;        /* IPv6 flow label. */
    uint16_t in_port;           /* OpenFlow port number of input port. */
    ovs_be16 vlan_tci;          /* If 802.1Q, TCI | VLAN_CFI; otherwise 0. */
    ovs_be16 dl_type;           /* Ethernet frame type. */
    ovs_be16 tp_src;            /* TCP/UDP source port. */
    ovs_be16 tp_dst;            /* TCP/UDP destination port. */
    uint8_t dl_src[6];          /* Ethernet source address. */
    uint8_t dl_dst[6];          /* Ethernet destination address. */
    uint8_t nw_proto;           /* IP protocol or low 8 bits of ARP opcode. */
    uint8_t nw_tos;             /* IP ToS (including DSCP and ECN). */
    uint8_t arp_sha[6];         /* ARP/ND source hardware address. */ 
    uint8_t arp_tha[6];         /* ARP/ND target hardware address. */
    uint8_t nw_ttl;             /* IP TTL/Hop Limit. */
    uint8_t nw_frag;            /* FLOW_FRAG_* flags. */
    uint8_t reserved[2];        /* Reserved for 64-bit packing. */
};

flow_extract,解析ofpbuf里的skb数据包,并基于skb结构形成flow,其中需要确保skb的线性空间至少要包含tcp头和之前的所有内容。和flow_extract相反的操作flow_compose,基于一个struct flow构造一个skb数据包的ofpbuf出来

struct flow_wildcards {
    ovs_be64 tun_id_mask;       /* 1-bit in each significant tun_id bit. */
    flow_wildcards_t wildcards; /* 1-bit in each FWW_* wildcarded field. */
    uint32_t reg_masks[FLOW_N_REGS]; /* 1-bit in each significant regs bit. */
    ovs_be32 nw_src_mask;       /* 1-bit in each significant nw_src bit. */
    ovs_be32 nw_dst_mask;       /* 1-bit in each significant nw_dst bit. */
    struct in6_addr ipv6_src_mask; /* 1-bit in each signficant ipv6_src bit. */
    struct in6_addr ipv6_dst_mask; /* 1-bit in each signficant ipv6_dst bit. */
    struct in6_addr nd_target_mask; /* 1-bit in each significant
                                       nd_target bit. */
    ovs_be16 vlan_tci_mask;     /* 1-bit in each significant vlan_tci bit. */
    ovs_be16 tp_src_mask;       /* 1-bit in each significant tp_src bit. */
    ovs_be16 tp_dst_mask;       /* 1-bit in each significant tp_dst bit. */
    uint8_t nw_frag_mask;       /* 1-bit in each significant nw_frag bit. */
    uint8_t zeros[5];           /* Padding field set to zero. */
};

flow_wildcards用来做flow match的wildcard,wildcard表示匹配任意数值。对于各个mask的bit而言,bit为0表示这位被wildcard,match flow的时候被无视掉,bit 1则表示该bit需要被匹配

flow_wildcards_init_catchall,初始化struct flow_wildcards结构,使得可以匹配任意的flow。可以看出该函数首先把flow_wildcards->wildcards = FWW_ALL,之后设置所有mask为0

flow_wildcards_init_exact,这样初始化的wildcard,不会去wildcard任何的flow中的field or bit,也就是屏蔽wildcard功能。该函数把flow_wildcards->wildcards = 0,之后设置所有mask位为1

flow_wildcards_combine,合并src1, src2两个struct flow_wildcards*,对于flow_wildcards->wildcards,执行 | 操作,对于flow_wildcards其他field,执行 & 操作

flow_zero_wildcards,对flow的每个field,和flow_wildcards的相应field做 & 操作


dynamic-string

/* A "dynamic string", that is, a buffer that can be used to construct a
 * string across a series of operations that extend or modify it.
 *
 * The 'string' member does not always point to a null-terminated string.
 * Initially it is NULL, and even when it is nonnull, some operations do not
 * ensure that it is null-terminated.  Use ds_cstr() to ensure that memory is
 * allocated for the string and that it is null-terminated. */
struct ds {
    char *string;       /* Null-terminated string. */
    size_t length;      /* Bytes used, not including null terminator. */
    size_t allocated;   /* Bytes allocated, not including null terminator. */
};

ds类似于c++里的string类

ds_reserve(struct ds* ds, size_t length),调用xrealloc重新分配ds->allocated + MAX(ds->allocated, length)长度的内存,这表明每次ds_reserve,ds至少要增加一倍的长度

ds_put_uninit(struct ds* ds, size_t n),追加ds一个n个字节长度,返回第ds->length + 1个字节的地址

ds_truncate, ds_clear,仅仅修改ds->length的长度即可

ds_put_cstr(struct ds* ds, const char* s),把string s追加到ds尾部

ds_put_format_valist(struct ds* ds, const char* format, va_list args_),把按照format格式和va_list参数的字符串追加到ds尾部

ds_get_line,从文件里循环读字符,遇到EOF或者\n则停止,返回一行的内容

ds_cstr,给ds->string[ds->length] = '\0',返回ds->string


json

/* Type of a JSON value. */
enum json_type {
    JSON_NULL,                  /* null */
    JSON_FALSE,                 /* false */
    JSON_TRUE,                  /* true */
    JSON_OBJECT,                /* {"a": b, "c": d, ...} */
    JSON_ARRAY,                 /* [1, 2, 3, ...] */
    JSON_INTEGER,               /* 123. */
    JSON_REAL,                  /* 123.456. */
    JSON_STRING,                /* "..." */
    JSON_N_TYPES
};

json的数据结构如下

/* A JSON array. */
struct json_array {
    size_t n, n_allocated;
    struct json **elems;
};

/* A JSON value. */
struct json {
    enum json_type type;
    union {
        struct shash *object;   /* Contains "struct json *"s. */
        struct json_array array;
        long long int integer;
        double real;
        char *string;
    } u;
};

struct json_array对应json里的线性数据结构,[], {}, ()都是线性数据结构,但目前只用到[]。可以看到struct json_array是一个struct json* 的数组,大小为n_allocated,长度为n

struct json根据type不同对应的数据结构也不同,struct shash* object对应json dict,struct json_array是线性数组,这两个都是容器结构;剩下的就是integer, real, string了

static struct json *
json_create(enum json_type type)
{
    struct json *json = xmalloc(sizeof *json);
    json->type = type;
    return json;
}   

如果创建指定类型的json元素,e.g. json_boolean_create, json_string_create, json_array_create_empty, 都是调用json_create

对于json_array而言,通过json_array_add, json_array_trim, json_array_create来增减元素。对于json_object而言,json_object_put用来添加哈希表的元素。

json_destroy用来释放一个json结构,对于boolean, integer, real而言,只需free(json)即可,对于string还需free(json->u.string),对于object和array复杂一点,json_destroy_array对于每个element,递归调用json_destroy;json_destroy_object对于哈希表每个key<->value,递归调用json_destroy,最后释放整个shash占用的内存

json_clone,对于原子数据结构(e.g. integer, real, string)而言,调用json_xxx_create。对于JSON_OBJECT,调用json_clone_object,该函数把老object的每个元素顺序通过json_object_put到新的object里,对于JSON_ARRAY,调用json_clone_array,该函数把老array的每个元素放到struct json** elems中,通过json_array_create返回。


json的hash值计算函数如下:

size_t json_hash(const struct json *json, size_t basis)
{
    switch (json->type) {
    case JSON_OBJECT:
        return json_hash_object(json->u.object, basis);

    case JSON_ARRAY:
        return json_hash_array(&json->u.array, basis);

    case JSON_STRING:
        return hash_string(json->u.string, basis);

    case JSON_NULL:
    case JSON_FALSE:
    case JSON_TRUE:
        return hash_int(json->type << 8, basis);

    case JSON_INTEGER:
        return hash_int(json->u.integer, basis);

    case JSON_REAL:
        return hash_double(json->u.real, basis);

    case JSON_N_TYPES:
    default:
        NOT_REACHED();
    }
}

json_hash_object,首先对json object的数据结构struct shash进行排序,得到一个struct shash_node*的排序数组nodes,对nodes的每一个元素,循环计算hash值,每次计算的hash值都参与到后续hash值的计算中

static size_t
json_hash_object(const struct shash *object, size_t basis)
{
    const struct shash_node **nodes;
    size_t n, i;

    nodes = shash_sort(object);
    n = shash_count(object);
    for (i = 0; i < n; i++) {
        const struct shash_node *node = nodes[i];
        basis = hash_string(node->name, basis);
        basis = json_hash(node->data, basis);
    }
    return basis;
}       

json_hash_array和json_hash_object类似,对array每个元素调用json_hash


下面来看json的parse行为, parser器一个个把字符读进来分析,调用json_lex_input函数,该函数根据当前的parse状态决定下一步的行为,目前定义的状态有

enum json_lex_state {
    JSON_LEX_START,             /* Not inside a token. */
    JSON_LEX_NUMBER,            /* Reading a number. */
    JSON_LEX_KEYWORD,           /* Reading a keyword. */
    JSON_LEX_STRING,            /* Reading a quoted string. */
    JSON_LEX_ESCAPE             /* In a quoted string just after a "\". */
};

parser会顺序读下面的字符并存到一个dynamic-string结构里,除非遇到非法字符或者结束标记,e.g. 期望读数字结构读到逗号,读到字符串第二个引号,这时会调用json_lex_xxx,表示已经读完了一个json原子结构

json_lex_xxx,用来解析当前dynamic-string的内容,生成一个struct json_token之后,传给json_parser_input,目前的函数有json_lex_keyword,用来parse诸如true, false, null这样的常量,json_lex_number,以及json_lex_string。json_lex_string还要考虑反斜杠后面的特殊字符,所以会复杂些。

json_parser_input只接受object, array两类json容器开头的json字符串,如果是object,下面会调用json_parser_push_object,进而调用json_parser_push,如果当前json_parser->stack为空,让json_parser->stack[0]->json指向新的struct json*,否则调用json_parser_put_value

static void json_parser_put_value(struct json_parser *p, struct json *value)              
{                                                                             
    struct json_parser_node *node = json_parser_top(p);                       
    if (node->json->type == JSON_OBJECT) {                                    
        json_object_put(node->json, p->member_name, value);                   
        free(p->member_name);                                                 
        p->member_name = NULL;                                                
    } else if (node->json->type == JSON_ARRAY) {                              
        json_array_add(node->json, value);                                    
    } else {                                                                  
        NOT_REACHED();                                                        
    }                                                                         
}          

json_parser_top返回json_parser->stack最上端的struct json*,然后把key, value对存到该json node里面


我们以一个object的json为例,e.g. { "name" : "jerry", "score" : 100 }

假设该json由string传入,json_from_string会调用json_parser_create,生成一个struct json_parser结构,整个string2json的过程都会用到这个结构

/* A JSON parser. */                                                          
struct json_parser {                                                          
    int flags;                                                                
                                                                              
    /* Lexical analysis. */                                                   
    enum json_lex_state lex_state;                                            
    struct ds buffer;           /* Buffer for accumulating token text. */     
    int line_number;                                                          
    int column_number;                                                        
    int byte_number;                                                          
                                                                              
    /* Parsing. */                                                            
    enum json_parse_state parse_state;                                        
#define JSON_MAX_HEIGHT 1000                                                  
    struct json_parser_node *stack;                                           
    size_t height, allocated_height;                                          
    char *member_name;                                                        
                                                                              
    /* Parse status. */                                                       
    bool done;                                                                
    char *error;                /* Error message, if any, null if none yet. */
};                                        

enum json_parse_state parse_state状态代表了整个json解析过程的进展,表示期望的下一个字符,struct json_parser_node* stack是当出现了递归结构时,e.g. object的一个value又是一个object,把老的object压栈,先解析新的object


言归正传,json_from_string下面会调用json_parser_feed,该函数会一个个的读取字符,然后调用json_lex_input,我们的object第一个字符是{,其json_parser->lex_state初始化后为JSON_LEX_START, 此时可以得出当前token type为T_BEGIN_OBJECT,据此构造一个struct json_token,传给后续的json_parse_input

struct json_token {
    enum json_token_type type;
    union { 
        double real;
        long long int integer;
        const char *string;
    } u;
};      
            
enum json_lex_state {
    JSON_LEX_START,             /* Not inside a token. */
    JSON_LEX_NUMBER,            /* Reading a number. */
    JSON_LEX_KEYWORD,           /* Reading a keyword. */
    JSON_LEX_STRING,            /* Reading a quoted string. */
    JSON_LEX_ESCAPE             /* In a quoted string just after a "\". */
};

enum json_parse_state {
    JSON_PARSE_START,           /* Beginning of input. */
    JSON_PARSE_END,             /* End of input. */
    
    /* Objects. */
    JSON_PARSE_OBJECT_INIT,     /* Expecting '}' or an object name. */
    JSON_PARSE_OBJECT_NAME,     /* Expecting an object name. */
    JSON_PARSE_OBJECT_COLON,    /* Expecting ':'. */
    JSON_PARSE_OBJECT_VALUE,    /* Expecting an object value. */
    JSON_PARSE_OBJECT_NEXT,     /* Expecting ',' or '}'. */
            
    /* Arrays. */
    JSON_PARSE_ARRAY_INIT,      /* Expecting ']' or a value. */
    JSON_PARSE_ARRAY_VALUE,     /* Expecting a value. */
    JSON_PARSE_ARRAY_NEXT       

};

json_parser_input中,初始化的json_parser->parse_state为JSON_PARSE_START,此时期望接收的token为 { 或者 [ ,由于我们传入了 { , 会知道这是一个object,下面开始准备parse这个object,先把该object入栈,调用json_parser_push_object

json_parser_push_object 调用json_parser_push,即把一个struct json* 入栈到json_parser->stack里面,并把parse_state改为JSON_PARSE_OBJECT_INIT


下面继续json_parser_feed的主循环,下面json_lex_input会解析到开始字符" ,下面会开始连续尝试读取一个字符串,json_lex_input会一直被调用,直到读到结束的" 字符,此时调用json_lex_string,会生成一个T_STRING类型的struct json_token,传给json_parser_input

此时parse_state已经成为了JSON_PARSE_OBJECT_INIT,由于此时token类型不是 } ,代码很tricky的往下走,走到和JSON_PARSE_OBJECT_NAME,此时json_token的类型match到了T_STRING,此时为json_parser_push_object做准备,把json_parser->member_name 设为这个token->u.string,把json_parser->parse_state设为JSON_PARSE_OBJECT_COLON,表示期望接收一个冒号字符

下面自然就是读到一个冒号字符了,json_parser_intput会把状态变更为JSON_PARSE_OBJECT_VALUE,继续json_lex_input的循环,又会解析出一个字符串出来,在进入json_parser_input之后,调用json_parse_value,因为此时的字符串已经被当做value来处理了。

如果此时value是非容器类型,调用json_xxx_create生成一个struct json,再调用json_parser_put_value把这个json值放入栈顶的json里面。e.g. 如果栈顶是一个JSON_OBJECT,那么把member_name, value 组成的key-value对插入到这个JSON_OBJECT里,如果是一个JSON_ARRAY,那么就追加到数组末尾,最后把parse_state设为JSON_PARSE_OBJECT_NEXT


下面如果解析到的是, 字符,那么继续key-value对的解析,如果是 } 字符,说明object解析结束,此时调用json_parser_pop,此时这次解析的json结构已经存到了其父亲json的object/array里,所以此时弹出json_parser_top的struct json*是安全的


byteq





你可能感兴趣的:(open vswitch研究:基本数据结构)