杨博东的博客

Redis源码分析（dict）

源码版本：redis-4.0.1
源码位置：

dict.h：dictEntry、dictht、dict等数据结构定义。
dict.c：创建、插入、查找等功能实现。

一、dict 简介

dict (dictionary 字典)，通常的存储结构是Key-Value形式的，通过Hash函数对key求Hash值来确定Value的位置，因此也叫Hash表，是一种用来解决算法中查找问题的数据结构，默认的算法复杂度接近O(1)，Redis本身也叫REmote DIctionary Server (远程字典服务器)，其实也就是一个大字典，它的key通常来说是String类型的，但是Value可以是
String、Set、ZSet、Hash、List等不同的类型，下面我们看下dict的数据结构定义。

二、数据结构定义

与dict相关的关键数据结构有三个，分别是：

dictEntry 表示一个Key-Value节点。
dictht表示一个Hash表。
dict是Redis中的字典结构，包含两个dictht。

dictEntry结构的代码如下：

typedef struct dictEntry {
    void *key;                //key void*表示任意类型指针

    union {                   //联合体中对于数字类型提供了专门的类型优化
       void      *val;
       uint64_t  u64;
       int64_t   s64;
    } v;

    struct dictEntry *next;   //next指针

} dictEntry;

dictht的代码如下：

typedef struct dictht {
    dictEntry **table;        //数组指针，每个元素都是一个指向dictEntry的指针

    unsigned long size;       //表示这个dictht已经分配空间的大小，大小总是2^n

    unsigned long sizemask;   //sizemask = size - 1; 是用来求hash值的掩码，为2^n-1

    unsigned long used;       //目前已有的元素数量
} dictht;

最后是真正的dict结构：

typedef struct dict {
    dictType *type;     //type中定义了对于Hash表的操作函数，比如Hash函数，key比较函数等

    void *privdata;      //privdata是可以传递给dict的私有数据         

    dictht ht[2];       //每一个dict都包含两个dictht，一个用于rehash

    int rehashidx;      //表示此时是否在进行rehash操作

    int iterators;      //迭代器
} dict;

其实通过上面的三个数据结构，已经可以大概看出dict的组成，数据（Key-Value）存储在每一个dictEntry节点；然后一条Hash表就是一个dictht结构，里面标明了Hash表的size,used等信息；最后每一个Redis的dict结构都会默认包含两个dictht，如果有一个Hash表满足特定条件需要扩容，则会申请另一个Hash表，然后把元素ReHash过来，ReHash的意思就是重新计算每个Key的Hash值，然后把它存放在第二个Hash表合适的位置，但是这个操作在Redis中并不是集中式一次完成的，而是在后续的增删改查过程中逐步完成的，这个叫渐进式ReHash，我们后文会专门讨论。

三、创建、插入、键冲突、扩张

下面我们跟随一个例子来看有关dict的创建，插入，键冲突的解决办法以及扩张的问题。在这里推荐一个有关调试Redis数据结构代码的方法：下载一份Redis源码，然后直接把server.c中main函数注释掉，加入自己的代码，直接make之后就可以跑了。我们的例子如下所示：

int main(int argc, char **argv) {

    int ret;
    sds key = sdsnew("key");
    sds val = sdsnew("val");
    dict *dd = dictCreate(&keyptrDictType, NULL);

    printf("Add elements to dict\n");
    for (int i = 0; i < 6 ; ++i) {
        ret = dictAdd(dd, sdscatprintf(key, "%d", i), sdscatprintf(val, "%d", i));
        printf("Add ret%d is :%d ,", i, ret);
        printf("ht[0].used :%lu, ht[0].size :%lu, "
                       "ht[1].used :%lu, ht[1].size :%lu\n", dd->ht[0].used, dd->ht[0].size, dd->ht[1].used, dd->ht[1].size);
    }

    printf("\nDel elements to dict\n");
    for (int i = 0; i < 6 ; ++i) {
        ret = dictDelete(dd, sdscatprintf(key, "%d", i));
        printf("Del ret%d is :%d ,", i, ret);
        printf("ht[0].used :%lu, ht[0].size :%lu, "
                       "ht[1].used :%lu, ht[1].size :%lu\n", dd->ht[0].used, dd->ht[0].size, dd->ht[1].used, dd->ht[1].size);
    }

    sdsfree(key);
    sdsfree(val);
    dictRelease(dd);

    return 0;
}


Out >
Add elements to dict
Add ret0 is :0 ,ht[0].used :1, ht[0].size :4, ht[1].used :0, ht[1].size :0
Add ret1 is :0 ,ht[0].used :2, ht[0].size :4, ht[1].used :0, ht[1].size :0
Add ret2 is :0 ,ht[0].used :3, ht[0].size :4, ht[1].used :0, ht[1].size :0
Add ret3 is :0 ,ht[0].used :4, ht[0].size :4, ht[1].used :0, ht[1].size :0
Add ret4 is :0 ,ht[0].used :4, ht[0].size :4, ht[1].used :1, ht[1].size :8
Add ret5 is :0 ,ht[0].used :3, ht[0].size :4, ht[1].used :3, ht[1].size :8

Del elements to dict
Del ret0 is :0 ,ht[0].used :5, ht[0].size :8, ht[1].used :0, ht[1].size :0
Del ret1 is :0 ,ht[0].used :4, ht[0].size :8, ht[1].used :0, ht[1].size :0
Del ret2 is :0 ,ht[0].used :3, ht[0].size :8, ht[1].used :0, ht[1].size :0
Del ret3 is :0 ,ht[0].used :2, ht[0].size :8, ht[1].used :0, ht[1].size :0
Del ret4 is :0 ,ht[0].used :1, ht[0].size :8, ht[1].used :0, ht[1].size :0
Del ret5 is :0 ,ht[0].used :0, ht[0].size :8, ht[1].used :0, ht[1].size :0

dict *dd = dictCreate(&keyptrDictType, NULL); 创建了一个名为dd，type为keyptrDictType的dict，创建代码如下，需要注意的是这个操作只给dict本身申请了空间，但是像dict->ht->table这些数据存储节点并没有分配空间，这些空间是dictAdd的时候才分配的。

/* Create a new hash table */
dict *dictCreate(dictType *type,
        void *privDataPtr)
{
    dict *d = zmalloc(sizeof(*d));    //申请空间，sizeof(*d)为88个字节

    _dictInit(d,type,privDataPtr);    //一些置NULL操作，type和privdata置为参数指定值 
    return d;
}

ret = dictAdd(dd, sdscatprintf(key, "%d", i), sdscatprintf(val, "%d", i)); 接着我们定义了两个sds，并且for循环分别将他们dictAdd，来看下dictAdd的代码，它实际上调用了dictAddRaw函数：

dictEntry *dictAddRaw(dict *d, void *key, dictEntry **existing)
{
    int index;
    dictEntry *entry;
    dictht *ht;

    if (dictIsRehashing(d)) _dictRehashStep(d);

    /* Get the index of the new element, or -1 if
     * the element already exists. */
    if ((index = _dictKeyIndex(d, key, dictHashKey(d,key), existing)) == -1)
        return NULL;

    /* Allocate the memory and store the new entry.
     * Insert the element in top, with the assumption that in a database
     * system it is more likely that recently added entries are accessed
     * more frequently. */
    ht = dictIsRehashing(d) ? &d->ht[1] : &d->ht[0];
    entry = zmalloc(sizeof(*entry));
    entry->next = ht->table[index];
    ht->table[index] = entry;
    ht->used++;

    /* Set the hash entry fields. */
    dictSetKey(d, entry, key);
    return entry;
}

可以看到首先检测是否在进行ReHash（我们先跳过ReHash这个概念），接下来算出了一个index值，然后根据是否在进行ReHash选择了其中一个dt（0或者1），之后进行了头插，而且英文注释中也写的很清楚将数据插在头部基于数据库系统总是会经常访问最近添加的节点，然后将key设置之后就返回了，但是我们貌似还是没有发现申请空间的函数，其实是在算index的时候_dictKeyIndex()会自动判断，如下：

static int _dictKeyIndex(dict *d, const void *key, unsigned int hash, dictEntry **existing)
{
    unsigned int idx, table;
    dictEntry *he;
    if (existing) *existing = NULL;

    /* Expand the hash table if needed */
    if (_dictExpandIfNeeded(d) == DICT_ERR)
        return -1;
    for (table = 0; table <= 1; table++) {
        idx = hash & d->ht[table].sizemask;
        /* Search if this slot does not already contain the given key */
        he = d->ht[table].table[idx];
        while(he) {
            if (key==he->key || dictCompareKeys(d, key, he->key)) {
                if (existing) *existing = he;
                return -1;
            }
            he = he->next;
        }
        if (!dictIsRehashing(d)) break;
    }
    return idx;
}

_dictExpandIfNeeded(d)进行空间判断，如果还未申请，就创建默认大小，其中它里面也有dict扩容的策略（见注释）：

static int _dictExpandIfNeeded(dict *d)
{
    /* Incremental rehashing already in progress. Return. */
    if (dictIsRehashing(d)) return DICT_OK;  
    //如果正在ReHash，那直接返回OK，其实也表明申请了空间不久。

    /* If the hash table is empty expand it to the initial size. */
    if (d->ht[0].size == 0) return dictExpand(d, DICT_HT_INITIAL_SIZE);  
    //如果 0 号哈希表的大小为0，表示还未创建，按照默认大小`DICT_HT_INITIAL_SIZE=4`去创建

    /* If we reached the 1:1 ratio, and we are allowed to resize the hash
     * table (global setting) or we should avoid it but the ratio between
     * elements/buckets is over the "safe" threshold, we resize doubling
     * the number of buckets. */

    //如果满足 0 号哈希表used>size &&（dict_can_resize为1 或者 used/size > 5） 那就默认扩两倍大小
    if (d->ht[0].used >= d->ht[0].size &&
        (dict_can_resize ||
         d->ht[0].used/d->ht[0].size > dict_force_resize_ratio))
    {
        return dictExpand(d, d->ht[0].used*2);
    }
    return DICT_OK;
}

对于我们的代码，走的是if (d->ht[0].size == 0) return dictExpand(d, DICT_HT_INITIAL_SIZE);这个分支，也就是会去创建一个dictht的table大小为4的dict，如下：

int dictExpand(dict *d, unsigned long size)
{
    dictht n; /* the new hash table */
    unsigned long realsize = _dictNextPower(size);

    /* the size is invalid if it is smaller than the number of
     * elements already inside the hash table */
    if (dictIsRehashing(d) || d->ht[0].used > size)
        return DICT_ERR;

    /* Rehashing to the same table size is not useful. */
    if (realsize == d->ht[0].size) return DICT_ERR;

    /* Allocate the new hash table and initialize all pointers to NULL */
    n.size = realsize;
    n.sizemask = realsize-1;
    n.table = zcalloc(realsize*sizeof(dictEntry*));
    n.used = 0;

    /* Is this the first initialization? If so it's not really a rehashing
     * we just set the first hash table so that it can accept keys. */
    if (d->ht[0].table == NULL) {
        d->ht[0] = n;
        return DICT_OK;
    }

    /* Prepare a second hash table for incremental rehashing */
    d->ht[1] = n;
    d->rehashidx = 0;
    return DICT_OK;
}

需要注意的是_dictNextPower可以计算出距离size最近，且大于或者等于size的2的次方的值，比如size是4，那距离其最近的值为4（2的平方），size是6，距离其最近的值为8（2的三次方），然后申请空间，之后判断如果d->ht[0].table == NULL也就是我们目前的还未初始化的情况，则初始化 0 号Hash表，之后添加相应的元素，我们程序的输出如下所示：

Add ret0 is :0 ,ht[0].used :1, ht[0].size :4, ht[1].used :0, ht[1].size :0

如果图示目前的Hash表，如下所示:

接下来for循环继续添加，当i = 4时，也就是当添加第5个元素时，默认初始化大小为4的Hash表已经不够用了。此时的used=4，我们看看扩张操作发生了什么，代码从_dictExpandIfNeeded(d)说起，此时满足条件，会执行扩张操作，如下:

if (d->ht[0].used >= d->ht[0].size &&
        (dict_can_resize ||
         d->ht[0].used/d->ht[0].size > dict_force_resize_ratio))
    {
        return dictExpand(d, d->ht[0].used*2);
    }

dictExpand(d, d->ht[0].used*2); 表示重新申请了一个大小为之前2倍的Hash表，即 1 号Hash表。然后将d->rehashidx = 0;即表明此时开始ReHash操作。

Rehash就是将原始Hash表（0号Hash表）上的Key重新按照Hash函数计算Hash值，存到新的Hash表（1号Hash表）的过程。

这一步执行之后此时Hash表如下所示：

由图可以看到 0 号Hash表已经满了，此时我们的新数据被存到了 1 号哈希表中，接下来我们开始了第6次循环，我们继续看在ReHash的情况下数据是如何存入的，也就是第6次循环，即添加key5的过程，继续调用dictAddRaw函数：

if (dictIsRehashing(d)) _dictRehashStep(d);

此时因为d->rehashidx = 0，所以会执行渐进式Hash操作，即_dictRehashStep(d)：

static void _dictRehashStep(dict *d) {
    if (d->iterators == 0) dictRehash(d,1);  //如果迭代器是0，ReHash步长为1
}

int dictRehash(dict *d, int n) {
    int empty_visits = n*10; /* Max number of empty buckets to visit. */
    if (!dictIsRehashing(d)) return 0;

    while(n-- && d->ht[0].used != 0) {
        dictEntry *de, *nextde;

        /* Note that rehashidx can't overflow as we are sure there are more
         * elements because ht[0].used != 0 */
        assert(d->ht[0].size > (unsigned long)d->rehashidx);
        while(d->ht[0].table[d->rehashidx] == NULL) {
            d->rehashidx++;
            if (--empty_visits == 0) return 1;
        }
        de = d->ht[0].table[d->rehashidx];
        /* Move all the keys in this bucket from the old to the new hash HT */
        while(de) {
            unsigned int h;

            nextde = de->next;
            /* Get the index in the new hash table */
            h = dictHashKey(d, de->key) & d->ht[1].sizemask;
            de->next = d->ht[1].table[h];
            d->ht[1].table[h] = de;
            d->ht[0].used--;
            d->ht[1].used++;
            de = nextde;
        }
        d->ht[0].table[d->rehashidx] = NULL;
        d->rehashidx++;
    }

    /* Check if we already rehashed the whole table... */
    if (d->ht[0].used == 0) {
        zfree(d->ht[0].table);
        d->ht[0] = d->ht[1];
        _dictReset(&d->ht[1]);
        d->rehashidx = -1;
        return 0;
    }

    /* More to rehash... */
    return 1;
}

int empty_visits = n*10; empty_visits表示每次最多跳过10倍步长的空桶（一个桶就是ht->table数组的一个位置），然后当我们找到一个非空的桶时，就将这个桶中所有的key全都ReHash到 1 号Hash表。最后每次都会判断是否将所有的key全部ReHash了，如果已经全部完成，就释放掉ht[0],然后将ht[1]变成ht[0]。

也就是此次dictAdd操作不仅将key5添加进去，还将 0 号Hash表中2号桶中的key0 ReHash到了 1 号Hash表上。所以此时的 2 号Hash表上有3个元素，如下:

Add ret5 is :0 ,ht[0].used :3, ht[0].size :4, ht[1].used :3, ht[1].size :8

图示结果如下所示：

接下来我们的程序执行了删除操作，dictDelete函数，实际上调用的是dictGenericDelete函数。

static dictEntry *dictGenericDelete(dict *d, const void *key, int nofree) {
    unsigned int h, idx;
    dictEntry *he, *prevHe;
    int table;

    if (d->ht[0].used == 0 && d->ht[1].used == 0) return NULL;

    if (dictIsRehashing(d)) _dictRehashStep(d);
    h = dictHashKey(d, key);

    for (table = 0; table <= 1; table++) {
        idx = h & d->ht[table].sizemask;
        he = d->ht[table].table[idx];
        prevHe = NULL;
        while(he) {
            if (key==he->key || dictCompareKeys(d, key, he->key)) {
                /* Unlink the element from the list */
                if (prevHe)
                    prevHe->next = he->next;
                else
                    d->ht[table].table[idx] = he->next;
                if (!nofree) {
                    dictFreeKey(d, he);
                    dictFreeVal(d, he);
                    zfree(he);
                }
                d->ht[table].used--;
                return he;
            }
            prevHe = he;
            he = he->next;
        }
        if (!dictIsRehashing(d)) break;
    }
    return NULL; /* not found */
}

if (dictIsRehashing(d)) _dictRehashStep(d); 实际上也执行了ReHash步骤，这次将 0 号哈希表上的剩余3个key全部ReHash到了 1 号哈希表上，这其实就是渐进式ReHash了，因为ReHash操作不是一次性、集中式完成的，而是多次进行，分散在增删改查中，这就是渐进式ReHash的思想。

渐进式ReHash是指ReHash操作不是一次集中式完成的，对于Redis来说，如果Hash表的key太多，这样可能导致ReHash操作需要长时间进行，阻塞服务器，所以Redis本身将ReHash操作分散在了后续的每次增删改查中。

说到这里，我有个问题：虽然渐进式ReHash分散了ReHash带来的问题，但是带来的问题是对于每次增删改查的时间可能是不稳定的，因为每次增删改查可能就需要带着ReHash操作，所以可不可以fork一个子进程去做这个事情呢？

继续看代码，接下来通过h = dictHashKey(d, key);计算出index，然后根据有无进行ReHash确定遍历2个Hash表还是一个Hash表。因为ReHash操作如果在进行的话，key不确定存在哪个Hash表中，没有被ReHash的话就在0号，否则就在1号。
这次Delete操作成功删除了key0，而且将 0 号哈希表上的剩余3个key全部ReHash到了 1 号哈希表上，并且因为ReHash结束，所以将1号Hash表变成了0号哈希表，如图所示:

后续的删除操作清除了所有的key，然后我们调用了dictRelease(dd)释放了这个字典。

void dictRelease(dict *d)
{
    _dictClear(d,&d->ht[0],NULL);
    _dictClear(d,&d->ht[1],NULL);
    zfree(d);
}


int _dictClear(dict *d, dictht *ht, void(callback)(void *)) {
    unsigned long i;

    /* Free all the elements */
    for (i = 0; i < ht->size && ht->used > 0; i++) {
        dictEntry *he, *nextHe;

        if (callback && (i & 65535) == 0) callback(d->privdata);

        if ((he = ht->table[i]) == NULL) continue;
        while(he) {
            nextHe = he->next;
            dictFreeKey(d, he);
            dictFreeVal(d, he);
            zfree(he);
            ht->used--;
            he = nextHe;
        }
    }
    /* Free the table and the allocated cache structure */
    zfree(ht->table);
    /* Re-initialize the table */
    _dictReset(ht);
    return DICT_OK; /* never fails */
}

四、ReHash和渐进式ReHash

Rehash：就是将原始Hash表（0号Hash表）上的Key重新按照Hash函数计算Hash值，存到新的Hash表（1号Hash表）的过程。
渐进式ReHash：是指ReHash操作不是一次性、集中式完成的，对于Redis来说，如果Hash表的key太多，这样可能导致ReHash操作需要长时间进行，阻塞服务器，所以Redis本身将ReHash操作分散在了后续的每次增删改查中。

具体情况看上面例子。

五、ReHash期间访问策略

Redis中默认有关Hash表的访问操作都会先去 0 号哈希表查找，然后根据是否正在ReHash决定是否需要去 1 号Hash表中查找，关键代码如下（dict.c->dictFind()）:

for (table = 0; table <= 1; table++) {
        idx = h & d->ht[table].sizemask;
        he = d->ht[table].table[idx];
        while(he) {
            if (key==he->key || dictCompareKeys(d, key, he->key))
                return he;
            he = he->next;
        }
        if (!dictIsRehashing(d)) return NULL;   //根据这一句判断是否需要在 1 号哈希表中查找。
    }

五、遍历

可以使用dictNext函数遍历：

dictIterator *i = dictGetIterator(dd);    //获取迭代器
dictEntry *de;
while ((de = dictNext(i)) != NULL) {      //只要结尾不为NULL,就继续遍历
    printf("%s->%s\n",(char*)de->key, (char*)de->v.val);
}


Out >
key3->val3
key2->val2
key1->val1
key5->val5
key0->val0
key4->val4

有关遍历函数dictSacn()的算法，也是个比较难的话题，有时间再看吧。

六、总结

这篇文章主要分析了dict的数据结构、创建、扩容、ReHash、渐进式ReHash，删除等机制。只是单纯的数据结构的分析，没有和Redis一些机制进行结合映射，这方面后续再补充，但是已经是一篇深度好文了：）。

[完]

fortify安全扫描Access Control: Database问题解决飘零未归人 java 安全 fortify
概述AccessControl:Database说白了就是权限控制。在访问数据库(sql和nosql)需要加入当前用户的权限控制。不然会被fortify扫描出来，认为客户端可能不挟持和假冒，从而导致数据被泄露。但是这个并不是任何时候都需要的，有的接口本来就是可以任意访问的。还有就是我们本来就是微服务，可能用户数据拦截已经在其他的前置拦截服务中做了处理等等，但是这种情况，这个fortify扫描是不会
解释SQL和NoSQL数据库的区别，各自的适用场景是什么？破碎的天堂鸟学习教程 nosql 数据库
SQL与NoSQL数据库的深度对比及适用场景分析一、核心定义与数据模型差异1：SQL数据库结构化数据模型：基于关系型模型，数据以表格（行和列）形式存储，表之间通过外键建立关联。例如，客户表与订单表通过客户ID关联，形成严格的逻辑结构。预定义模式（Schema）：需提前定义表结构（字段类型、主键、外键等），修改结构需通过ALTER等命令，灵活性较低。标准化查询语言：使用SQL（StructuredQ
NoSQL 数据库有哪些类型? HUNAG-DA-PAO 数据库 nosql
目录NoSQL是什么?SQL和NoSQL有什么区别?NoSOL数据库有什么优势?NoSQL数据库有哪些类型?NoSQL是什么?NoSQL（NotOnlySQL的缩写）泛指非关系型的数据库，主要针对的是键值、文档以及图形类型数据存储。并且，NoSQL数据库天生支持分布式，数据冗余和数据分片等特性，旨在提供可扩展的高可用高性能数据存储解决方案。一个常见的误解是NoSQL数据库或非关系型数据库不能很好地
mysql和Nosql到底有什么区别，分别应用与什么场景？ ALGORITHM LOL mysql nosql 数据库
MySQL和NoSQL是两种不同类型的数据库技术，它们各有其特点和适用场景。了解它们之间的区别和应用场景可以帮助选择合适的技术来支持特定的应用需求。MySQLMySQL是一种关系数据库管理系统（RDBMS），它使用结构化查询语言（SQL）来访问数据库。MySQL是基于表的系统，数据存储在行和列中，每个表有固定的模式，定义了数据在表中如何存储，包括数据类型和是否允许为空等。特点:结构化和严格的模式：
【Redis基础篇】详细讲解Redis ‍小林同学学JAVA redis数据库 redis 服务器 nosql 缓存数据库 java spring boot
这篇文章让你详细了解Redis的相关知识，有代码讲解以及图片剖析，让你更轻松掌握制作不易，感觉不错，请点赞收藏哟！！！目录1redis基础1.1定义1.2SQL和NOSQL不同点1.3特征1.4Redis通用命令1.5Redis数据结构介绍1.6Redis的java客户端2Jedis快速入门2.1操作步骤2.2Jedis连接池3SpringDataRedis3.1定义3.2优势3.3API3.4操
redis(二) NoSql入门和概述(中) 21号新秀_邓肯
2.3V+3高2.1)大数据时代的3V海量Volume多样Variety实时Velocity2.2)互联网需求的3高高并发高可扩高性能3.当下的NoSql经典应用3.1)当下的应用是sql和nosql一起使用3.2)阿里巴巴中文站商品信息如何存放3.2.1看看阿里巴巴中文网站首页以女装/女包包为例3.2.1.1架构发展历程1.演变过程image.png2.第五代image.png3.第五代架构使命
史上最全SQL与NoSQL优缺点对比！一篇文章解决数据库选型的所有困惑麦聪聊数据数据库 nosql sql 数据库 sql nosql
导读：对于大多数企业来说，如何存储、保护和访问数据的决策，最终都归结为SQL或NoSQL数据库的选择。存储、保护和访问数据的最佳方式是什么？这是一个基本但关键的决定。毕竟，数据是几乎每个现代组织成功的基石。对于大多数公司来说，选择归结为SQL和NoSQL数据库。它们每个都有独特的优势和劣势。自1970年代以来，SQL数据库一直是一种行之有效的选择。它们由高度结构化的表格组成，由行和列组成，通过共
《MySQL 简易速速上手小册》第10章：未来趋势和进阶资源（2024 最新版）江帅帅《MySQL 简易速速上手小册》mysql 数据库数据分析 python 网络安全
文章目录10.1MySQL在云计算和容器化中的应用10.1.1基础知识10.1.2重点案例：使用Python部署MySQL到Kubernetes10.1.3拓展案例1：在AWSRDS上部署MySQL实例10.1.4拓展案例2：使用Docker部署MySQL10.2MySQL和NoSQL的整合策略10.2.1基础知识10.2.2重点案例：使用Python整合MySQL和MongoDB10.2.3拓展
mongodb的介绍仲夏那片海爬虫 python web后端文档 mongodb 数据库
1.mongodb的介绍1.1什么是mongodbmongodb是一个功能最丰富的NoSQL非关系数据库。由C++语言编写。mongodb本身提供S端存储数据，即server；也提供C端操作处理（如查询等）数据，即client。1.2SQL和NoSQL的主要区别在SQL中层级关系：数据库>表>数据而在NoSQL中则是：数据库>集合>文档1.2.1数据之间无关联性SQL中如何需要增加外部关联数据的话
SQL和NoSQL数据库的全面比较 wwwyx12138 sql nosql 数据库
SQL和NoSQL。两者到底谁强谁弱，我们又该在何种应用场景下使用呢?本文将和您对此进行深入探讨。1.SQL是什么SQL，即结构化查询语言，是传统的关系型数据库的查询语言。SQL数据库能够通过简化CRUD操作，处理数据库中的结构化数据。此处的CRUD代表了创建(create)、检索(或读取，retrieve、read)、更新(update)和删除(delete)，四种控制数据的主要操作。SQL数据
大前端nestjs入门教程系列(四):如何nestjs整合mysql数据库风清云淡_A nestjs 前端
经过前面的几篇文章，想必大家已经对nestjs有了基础的了解，那么这篇文章就带大家玩玩数据库，学会了这篇，就离大前端又进了一步Nest与数据库无关，使你可以轻松地与任何SQL或NoSQL数据库集成。根据你的喜好，你有多种选择。在最一般的层面上，将Nest连接到数据库只是为数据库加载适当的Node.js驱动程序的问题，下面我们就学习下如何整合mysql数据库为了与SQL和NoSQL数据库集成，Nes
Python操作mongodb数据库详解练习时长两年半的Programmer 数据库 mongodb nosql
数据库的分类数据库可以简单的分为MySQL和NOSQL两类。这里的NOSQL不是NOSQL的意思，他的意思是NotOnlyMySQLMySQL与NoSQL之间的区别：1、MySQL是一个基于表格设计的关系数据库，而NoSQL本质上是非关系型的基于文档的设计。2、MySQL数据库，覆盖了巨大的IT市场；具有固定市场的MySQL数据库包含一个庞大的社区。而NoSQL数据库是最新的到来，与MySQL相比
Redis简介与在Linux上的安装配置 fckey 从Redis实战看本质 redis linux 数据库
前提提要本博文Redis使用版本为redis-6.2.6虚拟机：VMwareWorkstation16proLinux系统版本：CentOS7.6资料推荐：Redis教程官方网站《Redis设计与实现》大多数企业都是基于Linux服务器来部署项目，而且Redis官方也没有提供Windows版本的安装包。因此对于本博文中我们会基于Linux系统来安装Redis.文章目录前提提要一.SQL和NOSQL
NoSQL基础知识小结程序员沉梦听雨数据库 nosql 数据库
NoSQL基础知识什么是NoSQL?NoSQL（NotOnlySQL的缩写）泛指非关系型的数据库，主要针对的是键值、文档以及图形类型数据存储。NoSQL数据库天生支持分布式，数据冗余和数据分片等特性，旨在提供可扩展的高可用高性能数据存储解决方案。NoSQL数据库代表：HBase、Cassandra、MongoDB、RedisMySQL和NoSQL的区别MySQLNoSQL数据模型使用关系型数据模型
springboot默认数据源如何设置连接数_超详细讲解SpringBoot——数据访问 weixin_39942995 访问spring boot后台报404
一、引言大部分系统都离不开数据访问，数据库包括SQL和NOSQL，SQL是指关系型数据库，常见的有SQLServer，Oracle，MySQL(开源)，NOSQL是泛指非关系型数据库，常见的有MongoDB，Redis。用spring开发时我们常用的ORM框架有JDBC、Mybatis，Hibernate，现在最常用的应该是Mybatis。在Springboot中对于数据访问层，无论是SQL还是N
超详细讲解SpringBoot——数据访问耶亚希 Java后端框架知识 Spring Boot java spring boot 后端
前言：大部分系统都离不开数据访问，数据库包括SQL和NOSQL，SQL是指关系型数据库，常见的有SQLServer，Oracle，MySQL(开源)，NOSQL是泛指非关系型数据库，常见的有MongoDB，Redis。用spring开发时我们常用的ORM框架有JDBC、Mybatis，Hibernate，现在最常用的应该是Mybatis。在Springboot中对于数据访问层，无论是SQL还是NO
NoSQL数据库Redis 正大光明瑞士卷 Redis nosql redis 数据库
目录一、NoSQL数据库简介Ⅰ、SQL和NoSQL1.关系型数据库2.非关系型数据库Ⅱ、SQL和NoSQL主要区别二、redis数据库Ⅰ、redis简介Ⅱ、redis的单线程模式Ⅲ、redis的优点和缺点三、redis的部署Ⅰ、redis安装Ⅱ、redis配置文件四、redis命令工具Ⅰ、redis-cliRedis命令行工具Ⅱ、redis-benchmark用于检测Redis在本机的运行效率五、
Sql和NoSql CHHC1880 sql nosql 数据库
Sql和NoSqlSQL使用：如果有大量的更新操作，一定要使用事务，效率高。大数据情况下，要对表字段建索引。比nosql好的地方：有事务，能回滚。SQL遇到的瓶颈：水平扩展场景：不同设备（水泵，流量计），不同属性的数据采集，统计分析水泵表（泵id，组id，泵状态，选择开关，故障状态)流量计表（泵id，组id，瞬时流量，累计流量)水泵历史数据表（泵id，泵状态，选择开关，故障状态）流量计历史数据表（
Elasticsearch 对比传统数据库：深入挖掘 Elasticsearch 的优势 Elastic 中国社区官方博客 Elasticsearch Elastic elasticsearch 数据库大数据人工智能全文检索搜索引擎 lucene
当你为项目选择数据库或搜索引擎时，了解每个选项的细微差别至关重要。今天，我们将深入探讨Elasticsearch的优势，并探讨它与传统SQL和NoSQL数据库的比较。1.Elasticsearch简介Elasticsearch以强大的ApacheLucene库为基础，是一个分布式搜索和分析引擎。它以其速度、可扩展性以及快速索引大量数据的能力而闻名。与许多传统数据库不同，Elasticsearch是
Redis 介绍、安装、Redis客户端 Claylpf 笔记
目录redis是什么，他的应用场景是什么？Redis的一些主要特点和应用场景：redis的官方网站：Redisredis是键值型数据库：（也就是key-value模式）（跟python的字典很像）认识NoSQLSQL和NoSQL的区别数据库结构之间的区别数据库关联之间的区别SQL查询和非SQL查询的区别事务上的差异总结认识Redis特征：一、安装Redis1、单机安装Redis（linux安装--
SQL 和 NoSQL Future丨
SQL和NoSQL区别SQL（StructuredQueryLanguage）数据库，指关系型数据库。主要代表：SQLServer，Oracle，MySQL(开源)，PostgreSQL(开源)。NoSQL（NotOnlySQL）泛指非关系型数据库。主要代表：MongoDB，Redis，CouchDB。存储方式SQL数据存在特定结构的表中；而NoSQL则更加灵活和可扩展，存储方式可以省是JSON文
掌握了这30道MySQL面试题，看完吊打面试官！ java耿
一个典型的互联网产品架构包含接入层、逻辑处理层以及存储层，其中存储层承载着数据落地和持久化的任务，同时给逻辑处理层提供数据查询功能支持。说到存储层就要说到数据库，数据库知识掌握程度也是面试考察的知识点。典型服务架构数据库分为关系型数据库和非关系型数据库，也就是我们常说的SQL和NoSQL，这两个方向的数据库代表产品分别是MySQL和Redis，这次我们主要以面试问答的形式，来学习下关系型数据库My
SQL与NoSQL数据库选型及实际业务场景探讨轻易云系统集成平台数据库
在企业系统架构设计中，选择合适的数据库类型是一项关键决策。本文将对比SQL和NoSQL数据库的特点，分析它们在数据模型、可扩展性、一致性与事务、查询复杂性与频率，以及性能与延迟等方面的优势和劣势。同时，结合轻易云数据集成平台作为实际业务场景的例子，探讨了为什么NoSQL数据库（如MongoDB）在特定业务场景下更加适用。通过实际案例，帮助读者在特定需求下做出恰当的数据库选择，以提升系统性能、可扩展
什么是SQL和NoSQL? ADRU redis redis 数据库缓存
目录认识NoSQL关系型数据库非关系型数据库关系型数据库与非关系型数据库之间的对比认识NoSQLSQL（StructuredQueryLanguage）是一种用于管理关系型数据库的语言。关系型数据库以表格的形式存储数据，表格由行和列组成。SQL语言提供了一种统一的方式来定义、查询、操作和管理数据。常见的关系型数据库包括MySQL、Oracle、SQLServer等。NoSQL（NotOnlySQL
利用Python操作MongoDB数据库的详细指南
目录数据库的分类mongodb是什么使用Python操作mongodb删除数据修改数据查找数据数据库的分类数据库可以简单的分为MySQL和NOSQL两类。这里的NOSQL不是NOSQL的意思，他的意思是NotOnlyMySQLMySQL与NoSQL之间的区别：1、MySQL是一个基于表格设计的关系数据库，而NoSQL本质上是非关系型的基于文档的设计。2、MySQL数据库，覆盖了巨大的IT市场；具有
有了MySQL，为什么还要有NoSQL 林在闪闪发光 java 数据库开发语言
今日学习目标：MySQL和NoSQL的区别✅创作者：林在闪闪发光⏰预计时间：30分钟个人主页：林在闪闪发光的个人主页林在闪闪发光的个人社区，欢迎你的加入:林在闪闪发光的社区目录noSQL的大概意思理论支撑为什么需要NoSQL为什么NoSQL有处理超大规模和超高并发的场景的优势超大规模的问题超高并发的问题关系型数据库的特点NoSQL有哪些优势NoSQL有哪些劣势NoSQL使用场景全方位对比为了你在乎
Python SQL和NoSQL数据库操作实战 wespten C C++Python Go AI 算法工程师语言处理数据库 mysql
一、Python访问与操作关系型数据库实战1、关系型数据库长期以来，关系数据库一直是存储和操纵数据的标准。这种技术十分成熟，无处不在。Python可以连接多种关系数据库，但Python处理所有数据库的方式都大致相同，所以这里将通过其中一种数据库sqlite3来演示基本原理，然后讨论在选择和使用关系数据库做数据存储时的一些差别和注意事项。2、sqlite3数据库的用法Python为各种数据库提供了很
Redis基本数据结构介绍和Redis的java客户端的简单操作 itmkyuan Redis java redis 数据结构
认识NoSQLSQL和NoSQL对比SQL:1.结构化（Structured）2.关联的（Relational）3.SQL查询4.事务（ACID）selectid,name,agefromtb_userwhereid=1NoSQL:1.非结构化2.无关联的（JSON嵌套的形式）3.非SQLredis:getuser:1MongoDB:db.users.find({_id:1})elasticsea
掌握了这30道MySQL面试题，看完吊打面试官！云析学院
一个典型的互联网产品架构包含接入层、逻辑处理层以及存储层，其中存储层承载着数据落地和持久化的任务，同时给逻辑处理层提供数据查询功能支持。说到存储层就要说到数据库，数据库知识掌握程度也是面试考察的知识点。典型服务架构数据库分为关系型数据库和非关系型数据库，也就是我们常说的SQL和NoSQL，这两个方向的数据库代表产品分别是MySQL和Redis，这次我们主要以面试问答的形式，来学习下关系型数据库My
Redis基础配置 Zcien redis 数据库缓存
文章目录一、关系数据库和非关系型数据库1、关系型数据库2、非关系型数据库二、关系型数据库和非关系型数据库区别1、数据存储方式不同2、扩散方式不同3、对事务性的支持不同4、非关系型数据库产生背景5、SQL和NoSQL数据的存储过程三、Redis数据库1.Redis数据库的概述2、Redis的特点3、Redis五种数据类型4、Redis效率快的原因四、Redis部署以及相关命令1、Redis安装部署的
Nginx负载均衡 510888780 nginx 应用服务器
Nginx负载均衡一些基础知识: nginx 的 upstream目前支持 4 种方式的分配 1)、轮询（默认）每个请求按时间顺序逐一分配到不同的后端服务器，如果后端服务器down掉，能自动剔除。 2)、weight 指定轮询几率，weight和访问比率成正比
RedHat 6.4 安装 rabbitmq bylijinnan erlang rabbitmq redhat
在 linux 下安装软件就是折腾，首先是测试机不能上外网要找运维开通，开通后发现测试机的 yum 不能使用于是又要配置 yum 源，最后安装 rabbitmq 时也尝试了两种方法最后才安装成功机器版本： [root@redhat1 rabbitmq]# lsb_release LSB Version: :base-4.0-amd64:base-4.0-noarch:core
FilenameUtils工具类 eksliang FilenameUtils common-io
转载请出自出处：http://eksliang.iteye.com/blog/2217081 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
xml文件解析SAX 不懂事的小屁孩 xml
xml文件解析:xml文件解析有四种方式， 1.DOM生成和解析XML文档(SAX是基于事件流的解析) 2.SAX生成和解析XML文档(基于XML文档树结构的解析) 3.DOM4J生成和解析XML文档 4.JDOM生成和解析XML 本文章用第一种方法进行解析，使用android常用的DefaultHandler import org.xml.sax.Attributes;
通过定时任务执行mysql的定期删除和新建分区，此处是按日分区酷的飞上天空 mysql
使用python脚本作为命令脚本，linux的定时任务来每天定时执行 #!/usr/bin/python # -*- coding: utf8 -*- import pymysql import datetime import calendar #要分区的表 table_name = 'my_table' #连接数据库的信息 host,user,passwd,db =
如何搭建数据湖架构？听听专家的意见蓝儿唯美架构
Edo Interactive在几年前遇到一个大问题：公司使用交易数据来帮助零售商和餐馆进行个性化促销，但其数据仓库没有足够时间去处理所有的信用卡和借记卡交易数据 “我们要花费27小时来处理每日的数据量，”Edo主管基础设施和信息系统的高级副总裁Tim Garnto说道：“所以在2013年，我们放弃了现有的基于PostgreSQL的关系型数据库系统，使用了Hadoop集群作为公司的数
spring学习——控制反转与依赖注入 a-john spring
控制反转（Inversion of Control，英文缩写为IoC）是一个重要的面向对象编程的法则来削减计算机程序的耦合问题，也是轻量级的Spring框架的核心。控制反转一般分为两种类型，依赖注入（Dependency Injection，简称DI）和依赖查找（Dependency Lookup）。依赖注入应用比较广泛。
用spool+unixshell生成文本文件的方法 aijuans xshell
例如我们把scott.dept表生成文本文件的语句写成dept.sql,内容如下: 　　set pages 50000; 　　set lines 200; 　　set trims on; 　　set heading off; 　　spool /oracle_backup/log/test/dept.lst; 　　select deptno||','||dname||','||loc
1、基础--名词解析(OOA/OOD/OOP) asia007 学习基础知识
OOA:Object-Oriented Analysis（面向对象分析方法）是在一个系统的开发过程中进行了系统业务调查以后，按照面向对象的思想来分析问题。OOA与结构化分析有较大的区别。OOA所强调的是在系统调查资料的基础上，针对OO方法所需要的素材进行的归类分析和整理，而不是对管理业务现状和方法的分析。　　OOA（面向对象的分析）模型由5个层次（主题层、对象类层、结构层、属性层和服务层）
浅谈java转成json编码格式技术百合不是茶 json编码 java转成json编码
json编码;是一个轻量级的数据存储和传输的语言在java中需要引入json相关的包,引包方式在工程的lib下就可以了 JSON与JAVA数据的转换（JSON 即 JavaScript Object Natation，它是一种轻量级的数据交换格式，非常适合于服务器与 JavaScript 之间的数据的交
web.xml之Spring配置(基于Spring+Struts+Ibatis) bijian1013 java web.xml SSI spring配置
指定Spring配置文件位置 <context-param> <param-name>contextConfigLocation</param-name> <param-value> /WEB-INF/spring-dao-bean.xml,/WEB-INF/spring-resources.xml, /WEB-INF/
Installing SonarQube（Fail to download libraries from server） sunjing Install Sonar
1. Download and unzip the SonarQube distribution 2. Starting the Web Server The default port is "9000" and the context path is "/". These values can be changed in &l
【MongoDB学习笔记十一】Mongo副本集基本的增删查 bit1129 mongodb
一、创建复本集假设mongod,mongo已经配置在系统路径变量上，启动三个命令行窗口，分别执行如下命令： mongod --port 27017 --dbpath data1 --replSet rs0 mongod --port 27018 --dbpath data2 --replSet rs0 mongod --port 27019 -
Anychart图表系列二之执行Flash和HTML5渲染白糖_ Flash
今天介绍Anychart的Flash和HTML5渲染功能 HTML5 Anychart从6.0第一个版本起，已经逐渐开始支持各种图的HTML5渲染效果了，也就是说即使你没有安装Flash插件，只要浏览器支持HTML5，也能看到Anychart的图形（不过这些是需要做一些配置的）。这里要提醒下大家，Anychart6.0版本对HTML5的支持还不算很成熟，目前还处于
Laravel版本更新异常4.2.8-> 4.2.9 Declaration of ... CompilerEngine ... should be compa bozch laravel
昨天在为了把laravel升级到最新的版本，突然之间就出现了如下错误： ErrorException thrown with message "Declaration of Illuminate\View\Engines\CompilerEngine::handleViewException() should be compatible with Illuminate\View\Eng
编程之美-NIM游戏分析-石头总数为奇数时如何保证先动手者必胜 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class Nim { /**编程之美 NIM游戏分析问题：有N块石头和两个玩家A和B，玩家A先将石头随机分成若干堆，然后按照BABA...的顺序不断轮流取石头，能将剩下的石头一次取光的玩家获胜，每次取石头时，每个玩家只能从若干堆石头中任选一堆，
lunce创建索引及简单查询 chengxuyuancsdn 查询创建索引 lunce
import java.io.File; import java.io.IOException; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Docume
[IT与投资]坚持独立自主的研究核心技术 comsci it
和别人合作开发某项产品....如果互相之间的技术水平不同,那么这种合作很难进行,一般都会成为强者控制弱者的方法和手段..... 所以弱者,在遇到技术难题的时候,最好不要一开始就去寻求强者的帮助,因为在我们这颗星球上,生物都有一种控制其
flashback transaction闪回事务查询 daizj oracle sql 闪回事务
闪回事务查询有别于闪回查询的特点有以下3个：（1）其正常工作不但需要利用撤销数据，还需要事先启用最小补充日志。（2）返回的结果不是以前的“旧”数据，而是能够将当前数据修改为以前的样子的撤销SQL（Undo SQL）语句。（3）集中地在名为flashback_transaction_query表上查询，而不是在各个表上通过“as of”或“vers
Java I/O之FilenameFilter类列举出指定路径下某个扩展名的文件游其是你 FilenameFilter
这是一个FilenameFilter类用法的例子，实现的列举出“c:\\folder“路径下所有以“.jpg”扩展名的文件。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
C语言学习五函数，函数的前置声明以及如何在软件开发中合理的设计函数来解决实际问题 dcj3sjt126com c
# include <stdio.h> int f(void) //括号中的void表示该函数不能接受数据，int表示返回的类型为int类型 { return 10; //向主调函数返回10 } void g(void) //函数名前面的void表示该函数没有返回值 { //return 10; //error 与第8行行首的void相矛盾 } in
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Pl dcj3sjt126com centos
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Please verify its path and try again 处理很简单，修改文件“/etc/yum.repos.d/epel.repo”，将baseurl的注释取消， mirrorlist注释掉。即可。 &n
单例模式 shuizhaosi888 单例模式
单例模式懒汉式 public class RunMain { /** * 私有构造 */ private RunMain() { } /** * 内部类，用于占位，只有 */ private static class SingletonRunMain { priv
Spring Security（09）——Filter 234390216 Spring Security
Filter 目录 1.1 Filter顺序 1.2 添加Filter到FilterChain 1.3 DelegatingFilterProxy 1.4 FilterChainProxy 1.5
公司项目NODEJS实践0.1 逐行分析JS源代码 mongodb nginx ubuntu nodejs
一、前言前端如何独立用nodeJs实现一个简单的注册、登录功能，是不是只用nodejs+sql就可以了？其实是可以实现，但离实际应用还有距离，那要怎么做才是实际可用的。网上有很多nod
java.lang.Math liuhaibo_ljf java Math lang
System.out.println(Math.PI); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1)); System.out.println(Math.abs(111111111)); System.out.println(Mat
linux下时间同步 nonobaba ntp
今天在linux下做hbase集群的时候，发现hmaster启动成功了，但是用hbase命令进入shell的时候报了一个错误 PleaseHoldException: Master is initializing，查看了日志，大致意思是说master和slave时间不同步，没办法，只好找一种手动同步一下，后来发现一共部署了10来台机器，手动同步偏差又比较大，所以还是从网上找现成的解决方
ZooKeeper3.4.6的集群部署 roadrunners zookeeper 集群部署
ZooKeeper是Apache的一个开源项目，在分布式服务中应用比较广泛。它主要用来解决分布式应用中经常遇到的一些数据管理问题，如：统一命名服务、状态同步、集群管理、配置文件管理、同步锁、队列等。这里主要讲集群中ZooKeeper的部署。 1、准备工作我们准备3台机器做ZooKeeper集群，分别在3台机器上创建ZooKeeper需要的目录。数据存储目录
Java高效读取大文件 tomcat_oracle java
　　读取文件行的标准方式是在内存中读取，Guava 和Apache Commons IO都提供了如下所示快速读取文件行的方法：　　Files.readLines(new File(path), Charsets.UTF_8); 　　FileUtils.readLines(new File(path)); 　　这种方法带来的问题是文件的所有行都被存放在内存中，当文件足够大时很快就会导致
微信支付api返回的xml转换为Map的方法 xu3508620 xml map 微信api
举例如下： <xml> <return_code><![CDATA[SUCCESS]]></return_code> <return_msg><![CDATA[OK]]></return_msg> <appid><