红衣女妖仙

走近科学之《Redis 的秘密》

走近科学之《Redis 的秘密》之精益求精

1、简介:

redis 是一个用 C/C++ 开发的开源、高性能、高并发、键值对的 Nosql 内存数据库。可用作缓存、数据库、消息中间件等。

2、特点:

性能优秀: 基于内存，内存天然支持高并发，单机可达 10w QPS（读 11w，些 8.1w）。
线程模型: 单进程单线程，采用非阻塞 IO 多路复用机制。
支持多种数据类型: 字符串(string)、散列(hash)、有序可重复集合(list)、无序去重集合(set)、有序去重集合(sorted set)、位图(bitmap)。
支持数据持久化: RDB 和 AOF 持久化机制，可将数据持久化到磁盘，重启时加载。
高并发、高可用: 主从架构、哨兵模式、集群模式。
用途: 缓存、分布式锁、消息中间件、发布/订阅。

3、redis 与 memcached:

memcached 是早些年各大互联网公司常用的缓存方案，redis 后来居上。

区别:

redis 支持丰富的数据类型；memcached 的数据类型较单一，只支持 string。
redis 原生支持集群模式；memcached 没有原生的集群模式，需要依靠客户端来实现往集群中分片写入数据。
redis 是单核；memcached 是多核。所以在单核 redis 上存储小数据性能要高于 memcached，在 100k 以上数据中，memcached 要优于 redis。

4、数据类型:

redis 主要支持 string、hash、list、set、sorted set 这几种数据类型。（关于这几种数据类型的具体操作命令可查看菜鸟教程，有各种骚操作哦）

string:

string 是最简单的数据类型，字符串，做最简单的 k v 缓存，普通的 set get 操作。字符串类型的值最大存储 512M 的内容。

set key value   # 存储
get key   # 查看
eg: set zed 瞬狱影杀阵
	get zed

hash:

hash 类似于 map 的数据类型，一般可以将结构化的数据放进 redis，比如对象（前提是这个对象没有嵌套其它对象），每次读写缓存的时候可以操作对象的某个属性。每个 hash 可以存储 2^32 - 1 个键值对（40 多亿）。

hset key field value field value   # 存储
hgetall key   # 查看
eg: hset zed Q q W q E e
	hgetall zed

list:

list 是有序可重复列表，可以存储一些类似于列表的数据结构，如用户列表、粉丝列表、评论列表等。

可以利用 pop 命令做消息队列，从 list 头进去，从尾巴出来。

可以利用 lrange 命令读取某个闭区间的元素，如基于 list 的缓存分页查询，比如 B 站评论下拉不断分页的功能。每个 key 可存储 2^32 - 1 个元素。

lpush key value value value   # 存储
lrange key startindex endindex   # 查看
eg: lpush mid zed fizz ahri riven
	lrange mid 0 -1   # 0 表示开始元素位置，-1表示结束元素位置
	lrange mid 2 3

set:

set 是无序去重的数据类型，如系统中某些数据需要去重则可以使用它。当服务是单节点时可以使用 HashSet 来实现，但当服务是多节点部署时就可以考虑使用 redis 的 set 数据类型。每个 key 可存储 2^32 - 1 个元素。

而且可以基于 set 玩儿两个集合的交集、并集、差集等，如看两个 up 的共同好友、共同粉丝等。

sadd key value value   # 存储
smembers key   # 查看

sorted set:

sorted set 时有序去重数据类型，在 set 的基础上做了排序。存储时可以给元素设置排序序号（double 类型），会自动根据序号进行排序。每个 key 可存储 2^32 - 1 个元素。

zadd key index value   # 存储，其中 value 表示该元素的排序位置
zrange key startindex endindex withscores   # 查看指定索引间的元素
eg: zadd mid 1 zed
	zadd mid 2 fizz
	zadd mid 3 ahri
	zrange mid 0 -1 withscores

bitmap:

简介:
bitmap 是 redis 中的一种存储机制或表示机制，并不是一种数据结构，实际上就是字符串，但是可以对字符串的位进行操作。
可以把 bitmap 想象成一个 bit 数组，数组的每个元素的值只能是 0 或 1，数组的下标叫做偏移量。
每个 bitmap 中最大可以存储 512M 的内容，512 * 1024 * 1024 * 8 = 2 ^ 32 bit，也就是一个 bitmap 中最多可以存放四十二亿多个值。

如上图所示，数字 0、5、16、27 在 bitmap 中的表示，实际上设置命令为 setbit momo 0/5/16/27 1，momo 为 key，0/5/16/27 表示 offset，1 为值。

命令:

setbit key offset value：设置 key 对应的 offset 偏移量的值，offset 取值范围为 0 <= offset < 2 ^ 32，value 取值只能为 0 或 1。
getbit key offset：获取 key 对应的 offset 偏移量的值，结果只为 0 或 1。
bitcount key [start end]：统计 key 中指定位置值为 1 的个数。

# setbit key offset value
setbit momo 24 1   # 设置 key 为 momo 偏移量为 24 位置的值为 1

# getbit key offset
getbit momo 24   # 获取 key 为 momo 偏移量为 24 位置的值，结果为 1

# bitcount key [start end]
bitcount momo   # 统计 key 为 momo 中值为 1 的个数
bitcount momo 0 0   # 统计 key 为 momo 中 第一个位置到第八个位置上值为 1 的个数

适用场景:
bitmap 多用来表示状态值，如有没有、是与否、对与错、0 与 1、true 与 false 等。
- 如用户签到、用户在线状态、用户是否会员等。
- 如视频属性，上亿个短视频是否具有某种属性，可以属性为 key，视频唯一标识为 offset，具不具有这种属性则其值是 0 或 1。

bitmap 特点是读写速度快，可在有限的空间内容纳大量小数据。

5、线程模型:

redis 是单进程单线程的。

redis 内部使用的文件事件处理器（file event handler），这个文件事件处理器是单线程的，所以 redis 才是单线程的模型。采用非阻塞的 IO 多路复用机制，同时监听多个 socket，将产生事件的 socket 压入内存队列中，然后事件分派器会根据 socket 上的事件类型来选择相应的事件处理器进行处理。

文件事件处理器包含四个部分，分别是：多个 socket、IO 多路复用程序、事件分派器、事件处理器（连接应答处理器、命令请求处理器、命令回复处理器）。

多个 socket 可能会并发的产生不同的操作，每个操作对应不同的事件，IO 多路复用程序会监听多个 socket，并将产生事件的 socket 放入内存队列排队，事件分派器每次从队列中取一个 socket，根据其事件类型交给对应的事件处理器进行处理器。

如图所示，客户端 socket01 向 redis 的 server socket 请求建立连接，此时 server socket 会产生一个 AE_READABLE 事件，IO 多路复用程序监听到 server socket 产生的事件后，会将其压入队列。事件分派器从队列中获取到该事件，并将其交给连接应答器处理，连接应答器会创建一个能与客户端通信的 socket01，并将 socket01 的 AE_READABLE 事件与命令请求处理器关联。

假设此时客户端发送了一个 set key value 的请求，此时，redis 中的 socket01 会产生 AE_READABLE 事件，IO 多路复用程序会将该事件压入队列中。事件分派器从队列中取到该事件，由于前面已经将该事件与命令请求处理器关联，所以事件分派器会直接将其交给命令请求处理器处理。命令请求处理器读取 socket01 的 key value，并在自己内存设置 key value。操作完成后，它会将 socket01 的 AE_WRITABLE 事件与命令回复器关联。

如果此时客户端准备好接收返回结果了，那 redis 中的 socket01 会产生一个 AE_WRITABLE 事件，IO 多路复用程序将其压入队列。事件分派器从队列中取到事件，并交给命令回复处理器处理。命令回复处理器会对本次操作产生一个结果，比如 ok，将其发送到客户端，之后解除 socket01 的 AE_WRITABLE 事件与命令回复处理器的关联。

这样便完成了一次通信。

6、过期策略:

redis 的过期策略是定期删除 + 惰性删除。

定期删除:

定期删除是指 redis 默认会每隔 100ms 随机抽取一些设置了过期时间的 key，检查其是否过期，若已过期则将其删除。

注意这里是随机抽取，并不是抽取所有设置了过期时间的 key。若 redis 里面存了 10w 个设置了过期时间的 key，那么一次定期删除可能直接就将 redis 干没了。

定期删除会造成很多过期了的 key 并没有被删除，于是就有了惰性删除。

惰性删除:

惰性删除是指当客户端获取某个 key 时，redis 会先检查该 key 是否设置了过期时间，如果设置了则再检查其是否过期了，如果已过期，那么 redis 会将其删除，并不会返回给客户端任何东西。

惰性删除会造成长时间不被使用且没有定期删除删除掉的 key 依旧存在的情况，长期如此将会耗尽内存，于是就有了内存淘汰机制。

7、内存淘汰机制:

八种内存淘汰机制:

no-eviction：禁止驱逐。即不采用任何淘汰机制。当内存不足以容纳新写入的数据时会报错，一般没人用。
allkeys-random：当内存不足以容纳新写入的数据时，会随机挑选 key 进行删除。
allkeys-lfu：当内存不足以容纳新写入的数据时，会挑选一段时间内最少使用的 key 进行删除。
allkeys-lru：当内存不足以容纳新写入的数据时，会挑选最近最少使用的 key 进行删除。
volatile-random：当内存不足以容纳新写入的数据时，从设置了过期时间的 key 中随机挑选 key 进行删除。
volatile-lfu：当内存不足以容纳新写入的数据时，从设置了过期时间的 key 中挑选一段时间内最少使用的 key 进行删除。
volatile-lru：当内存不足以容纳新写入的数据时，从设置了过期时间的 key 中挑选最近最少使用的 key 进行删除。
volatile-ttl：当内存不足以容纳新写入的数据时，从设置了过期时间的 key 挑选将要过期的 key 进行删除。

LRU 算法:

// 代码不见啦

8、持久化机制:

redis 提供了两种持久化方式，分别是 RDB（Redis Data Base）和 AOF（Append-only File）。

持久化主要是做灾难恢复、数据恢复，也是高可用的一种方案。如当 redis 宕机重启后，可通过持久化产生的文件恢复宕机前 redis 中存储的数据。

RDB:

RDB 持久化机制是对 redis 中的数据执行周期性的持久化。

RDB 会生成多个数据文件，每个文件都代表了某一时刻 redis 中的数据，这种多个数据文件的方式，非常适合做冷备，可以将数据文件发送到安全稳定的云服务上存储，已预定好的策略来定期备份 redis 中的数据。

RDB 对 redis 对外提供读写服务的影响非常小，也就是不会影响 redis 的高性能。因为 redis 只需要 fork 一个子进程，让子进程来执行磁盘 IO 操作进行 RDB 数据持久化即可。

RDB 在每次 fork 子进程执行 RDB 快照数据文件生成的时候，如果数据特别大，则可能会导致 redis 对客户端提供的服务暂停数毫秒，甚至数秒。

AOF:

AOF 持久化机制是将每条对 redis 数据操作的命令作为日志，以 append-only 的模式写入一个日志文件，在 redis 重启的时候，通过回放 AOF 日志文件中的指令来重新构建数据集。

AOF 可以更好的保护数据不丢失，一般 AOF 会每隔 1 秒，通过一个后台线程执行一次 fsync 操作，最多丢失一秒钟的数据。

AOF 日志文件以 append-only 的模式写入，所以没有任何磁盘寻址的开销，写入性能非常高，而且文件不易破损，即使文件尾部破损，也很容易修复。

AOF 日志文件过大时，会出现后台重写的操作，且不会对客户端的读写造成影响。因为在 rewrite log 的时候，会对指令进行压缩，创建出一份恢复数据的最小日志文件出来。在创建新日志文件的时候，老日志文件还是照常写入，当新的 merge 后日志文件 ready 的时候，再交换新老日志文件即可。

AOF 日志文件通过非常可读的方式进行记录，这个特性非常适合做灾难性误删的紧急恢复。比如某位小伙伴不小心用 flushall 命令清空了所有的数据，只要这个时候后台 rewrite log 还没发生，那么就可以立即拷贝 AOF 文件，将最后一条 flushall 命令删掉，然后再将该文件放回去，就可以通过恢复机制，自动恢复所有数据。

RDB 与 AOF 比较:

相对于 AOF 来说，直接基于 RDB 数据文件来重启和恢复 redis 进程，会更加快速。如果想要在 redis 故障时，尽可能少的丢失数据，那么 AOF 要优于 RDB。

一般来说，RDB 数据快照文件都是每隔 5 分钟，或者更长时间生成一次，这时候就得接收如果 redis 宕机，那么可能会丢失将近 5 分钟的数据。

AOF 开启后，支持的客户端的写 QPS 将略低于 RDB 支持的客户端的写 QPS，因为 AOF 一般会配成每秒 fsync 一次日志文件，多少都会影响客户端写。当然，每秒一次 fsync，性能还是很高的，如果是实时 fsync，那写的 QPS 会大降。

如何选择:

仅使用 RDB，虽然简单粗暴来得快，将会丢失很多数据；仅使用 AOF，虽然数据完整，但恢复速度较慢。

建议两者结合使用，天下无敌！

9、高并发&高可用:

redis 主要基于主从架构来实现高并发，基于哨兵模式来实现高可用。

redis 单机可达 10w QPS，但在很多业务场景下，10w 的 QPS 远远是不够的，可以通过增加 redis 节点的方式来提高其 QPS 能力，也就是主从架构。既然增加了节点，那就会存在某个/些节点宕机的可能，则可以通过哨兵模式来解决。

主从架构，即一主多从。一个主节点，多个从节点，一般主节点用来提供给写入服务，单机大几万 QPS；多从节点用来提供读取服务，多个从节点可提供 10w 的 QPS。

集群模式，如果一主多从依旧扛不住请求，或者想容纳大量的数据，那就可以考虑使用集群模式。redis 集群模式可以看成是多个主从架构的组合，在提供了更大并发量能力的同时，可以容纳更多的数据。集群之后可提供几十万的读写并发。

哨兵模式，可以为 redis 的主从架构提供高可用的保障。当主节点宕机后，它会从从节点中选择一个节点来作为主节点，即可以进行主备切换。实际上在集群模式下，高可用机制是基于哨兵模式实现的，所以说，redis 实现高可用的本质还是哨兵模式。

10、数据一致性问题:

如果数据库和缓存同时使用，那就会涉及到数据库和缓存的双存储双写，只要是双写，就一定会存在数据一致性问题，也就是数据库数据与缓存数据不一致的情况。

一般情况下，可以通过请求串行化来解决，即将读请求和写请求串行到一个内存队列中去。

串行化可以保证一定不会出现不一致的情况，但是它也会导致系统的吞吐量大幅度降低，可能需要用比正常情况下多几倍的机器来满足线上的并发量。所以，如果可以允许缓存跟数据库稍微偶尔的有不一致的情况，也就是系统不是严格要求 “缓存 + 数据库” 必须保持一致的话，最好不要做这个方案。

CAP:

CAP 即 Cache Aside Pattern，也就是最经典的缓存 + 数据库的读写模式。

读的时候，先读缓存，若缓存没有，再读数据库，取到数据后放入缓存，同时返回响应。

更新的时候，先更新数据库，然后删除缓存。

为什么是删除缓存，而不是更新缓存:

因为在很多时候，复杂业务场景下，缓存中的数据不单单是直接从数据库中取出来的。

比如有些时候，缓存数据是根据数据库中多张表的多个字段经过复杂计算得来的，而你更新时只更新了涉及这个缓存的一个或几个字段。如果这时候再去更新还缓存的话，必然会产生查询其它字段以及重新计算的耗时。

另外，如果更新的这个字段涉及多个缓存数据，那就会产生更新多个缓存的代价。

其次，对应的缓存会不会被频繁访问到？假设一个缓存涉及的表字段，在 1 分钟内更新了几十次、几百次，那么缓存也会跟着更新几十次、几百次，但是这 1 分钟内该缓存只被访问了一次。但如果你删除缓存的话，那么 1 分钟内，这个缓存只不过重新计算一次而已。将开销降到最低。

实际上删除缓存，而不是更新缓存，就是一个 lazy 处理的思想。不要每次都做那么复杂的计算，或者更新好多遍缓存，而是在它被访问的时候再去计算更新。

初级数据一致性问题:

问题描述：
先更新数据库，再删除缓存。如果删除缓存失败了，那么数据库中是新数据，缓存中是旧数据，就出现了数据不一致的问题。

比如在库存服务中，假设此时库存 1000 个，一个减库存的请求过来，数据库中库存更新为 999，然后删除缓存失败了，此时数据库中库存为 999，缓存中对应的库存为 1000，就出现了数据不一致。

解决方案：
先删除缓存，再更新数据库。删除缓存后，再去更新数据库，如果更新数据库失败了，则数据库中为旧数据，但缓存中是空的。假设此时一个请求过来，先访问缓存，发现是空的，然后访问数据库，从数据库获取到数据，更新到缓存。仅仅只是数据没有更新成功，并不会出现不一致的问题。

高级数据一致性问题:

问题描述：
先删除缓存，再更新数据库。先删除了缓存，再去更新数据库，假设此时一个请求过来，先访问缓存，发现缓存为空，则去访问数据库，此时数据库还没有更新完成，所以取到了旧数据，然后将其添加到缓存。随后数据库更新也完成了，就造成了数据库中为新数据，而缓存中为旧数据，数据不一致了。

只有在高并发场景下，才可能会出现这样的问题。如果并发量很低，特别是读并发量低，那么只会在极少情况下会出现不一致问题。但是如果你并发量很高，上亿流量，每秒并发读几万，那么一秒内只要有数据更新请求，就有可能会出现不一致问题。

解决方案：
请求串行化，即更新数据时，根据数据的唯一标识，操作路由之后，将更新操作放到一个 jvm 内存队列中去。读取数据时，如果缓存中没有，则将读取数据库 + 更新缓存的操作，也根据唯一标识路由之后，将操作放到同一个 jvm 内存队列中。

一个队列对应一个工作线程，每个工作线程一个一个的执行队列中的串行操作。这样的话，如果一个更新请求过来，先删除缓存，再更新数据库，假设更新数据库操作还没完成，来了一个获取数据的请求，发现缓存中没有，那将其访问数据库 + 更新缓存的操作放入队列，此时，工作线程会先执行完更新请求，轮到执行获取数据请求时，再从数据库获取，并更新到缓存，此时获取到的必然是新数据。

同时需要注意，如果读请求还在等待时间范围内，通过不断轮询取到值了，那就直接返回；如果请求等待超过一定时长，那么这一次直接从数据库中读取当前的旧值，以免阻塞时间过长，影响用户体验。

该解决方案需要注意的问题：

请求时长阻塞：
由于读请求进行了非常轻度的异步化（等待写请求执行完成），所以一定要注意读读超时问题，每个请求必须在超时时间范围内返回。

	该解决方案，最大的风险点在于说，可能数据更新很频繁，导致队列中积压了大量更
新操作在里面，然后读请求会发生大量的超时，最后导致大量的请求直接走数据库。务必通过一些
模拟真实的测试，看看更新数据的频率是怎样的。
另外一点，因为一个队列中，可能会积压针对多个数据项的更新操作，因此需要根据自己的业务情
况进行测试，可能需要部署多个服务，每个服务分摊一些数据的更新操作。如果一个内存队列里居
然会挤压 100 个商品的库存修改操作，每隔库存修改操作要耗费 10ms 去完成，那么最后一个商品
的读请求，可能等待 10 *100 = 1000ms = 1s 后，才能得到数据，这个时候就导致读请求的长时阻
塞。
	一定要做根据实际业务系统的运行情况，去进行一些压力测试，和模拟线上环境，去看看最繁忙的
时候，内存队列可能会挤压多少更新操作，可能会导致最后一个更新操作对应的读请求，会 hang
多少时间，如果读请求在 200ms 返回，如果你计算过后，哪怕是最繁忙的时候，积压 10 个更新操
作，最多等待 200ms，那还可以的。
	如果一个内存队列中可能积压的更新操作特别多，那么你就要加机器，让每个机器上部署的服务实
例处理更少的数据，那么每个内存队列中积压的更新操作就会越少。
其实根据之前的项目经验，一般来说，数据的写频率是很低的，因此实际上正常来说，在队列中积
压的更新操作应该是很少的。像这种针对读高并发、读缓存架构的项目，一般来说写请求是非常少
的，每秒的 QPS 能到几百就不错了。
	我们来实际粗略测算一下。
	如果一秒有 500 的写操作，如果分成 5 个时间片，每 200ms 就 100 个写操作，放到 20 个内存队
列中，每个内存队列，可能就积压 5 个写操作。每个写操作性能测试后，一般是在 20ms 左右就完
成，那么针对每个内存队列的数据的读请求，也就最多 hang 一会儿，200ms 以内肯定能返回了。
经过刚才简单的测算，我们知道，单机支撑的写 QPS 在几百是没问题的，如果写 QPS 扩大了 10
倍，那么就扩容机器，扩容 10 倍的机器，每个机器 20 个队列。

读请求并发量过高：
需要经过实际压测，在突然大量读请求到来时，看服务能不能扛得住，需要多少机器才能最大限度的抗住极限峰值。
多服务部署的请求路由：
如果部署了多个服务，那么必须保证，数据更新的请求和缓存更新的请求，都通过 nginx 路由到相同的服务实例上。
比如，对于同一个商品的读写请求，全部路由到同一台机器上。可以做服务间的按照某个请求参数的 hash 路由，也可以用 nginx 的 hash 路由功能等。
热点商品路由导致请求倾斜：
假设某个商品的读写请求特别高，为热点商品，然后全部请求打到了相同机器的同一队列中了，可能会造成该机器的负载过高。

11、雪崩&穿透&击穿问题:

缓存雪崩:

redis 雪崩指的是在高并发场景下，当 redis 中大量 key 同时失效（过期）或 redis 宕机，导致大量请求直接落到数据库上，从而导致数据库崩溃的情况。

解决方案:

事前：合理设置 key 过期时间，如对过期时间加上随机数，避免大量 key 同时失效；redis 高可用，主从 + 哨兵，redis cluster，避免全盘崩溃。
事中：本地 ehcache 缓存 + hystrix 限流&降级，避免数据库直接被干死。
事后：redis 持久化，一旦重启，可自动快速恢复缓存数据。

用户发送一个请求，系统收到请求后，先查本地 ehcache 缓存，若没有再查 redis，若 redis 也没有则查数据库，若数据库中有，则将其结果写入 ehcache 和 redis 中。

限流组件，可以设置每秒钟到达系统的请求，有多少能通过组件，剩余的未通过的怎么办？走降级，可以返回一些默认值或友好提示，或空值。

这样设计的好处是，数据库绝对不会死，限流组件确保了每秒只有多少个请求能直接到达数据库。对于没有通过限流组件的请求，对用户来说，无非就是多点几次页面，多刷新几次而已。

缓存穿透:

缓存穿透指的是，在高并发场景下，每秒内到达服务器的请求，百分之八九十都是黑客发出的恶意攻击，这些攻击会 “穿过” redis，直指数据库，直接导致数据库崩溃。

比如数据库 id 都是从 1 开始的，黑客发出的请求的 id 都是负数，那 redis 中肯定没有，然后就直接打到了数据库，最终导致数据库崩溃。

解决方案：
每次请求从数据库中没有查到数据时，就写一个空值到缓存中去，且设置一个过期时间，这样的话，下次有相同 key 来访问时，在缓存失效之前，都可以从缓存中取到数据。

这种方式虽然简单，但在某些场景下显得不优雅，还可能会缓存过多空值，更加优雅的方式是使用 redis 布隆过滤器。

缓存击穿:

缓存击穿指的是，某个 key 非常热点，访问非常频繁，处于集中式高并发访问的情况，在这个 key 失效的瞬间，大量请求会击穿缓存，直接落在数据库上，导致数据库崩溃。

解决方案：

若缓存的数据基本不会更新，则可将该热点数据设置为永不过期。
若缓存的数据更新不频繁，且更新缓存的整个流程耗时较少，则可以采用基于 redis、zookeeper 等分布式中间件的分布式互斥锁，或本地互斥锁，以保证仅少量的请求可以请求数据库，以重新构建缓存，其余请求在锁释放后访问新的缓存。
若缓存的数据更新频繁或更新流程耗时较长，则可以利用定时任务在缓存过期前主动构建缓存或延后缓存过期的时间，以保证所有的请求一直能访问到对应的请求。

缓存穿透重点在于 “透”，大量请求透过了缓存层；缓存击穿重点在于 “击”，一个或几个热点 key 直接击穿了缓存层。

12、并发竞争问题:

并发竞争问题指的是在高并发场景下多个客户端同时读写 key 而造成数据错误的问题。比如多个客户端同时写 key，key 对应 value 的初始值 1，正常情况下 value 值的写顺序为 2、3、4，最后是 4，但并于并发竞争写，顺序变成了 2、4、3，最后 value 变成了 3。

解决方案：

分布式锁 + 时间戳/版本号：利用分布式锁 + 时间戳/版本号的方式来保证 set 操作的执行顺序。
消息队列：利用消息中间件，将 set 操作读写串行化，来保证 set 操作的执行顺序。

13、布隆过滤器:

简介及原理:

简介:
布隆过滤器是一种巧妙的概率型数据结构，实际上它由一个很长的二进制向量和一系列随机映射函数组成。
布隆过滤器可以用于检索某一个元素是否在一个集合中。它可以告诉某种东西可能存在或一定不存在。当布隆过滤器说这种东西存在时，那么它可能存在，也可能不存在；但当布隆过滤器说这种东西不存在时，那么它一定不存在。
布隆过滤器的优点是空间占用少、查询时间短；缺点是存在一定误判，且元素不能删除。
特性:
- 检查一个元素是否在集合中，结果为一定不存在、可能存在。
- 支持添加元素、检查元素，但不支持删除元素。
- 检查结果存在一定误判率，但已进入布隆过滤器内的元素不会被误判，只有未进入的才可能被误判。
- 相比普通 set，非常节省空间。
- 添加的元素超过预设容量越多，误判的可能性就越大。
原理:
布隆过滤器的半只是一个巨大的 bit 数组和几个不同的无偏 hash 函数。
添加元素的过程是：首先使用多个不同的 hash 函数对元素进行哈希计算，得到多个 hash 值；每个 hash 值对 bit 数组取模得到其在数组中的位置 index；判断所有 index 的位置是否都为 1，若都为 1 则说明该元素可能存在了；任意一位不为 1 则说明一定不存在，且将不为 1 的位置置为 1。
需要注意的是，虽然使用了无偏 hash 函数，使得 hash 值尽可能的均匀，但是不同的元素的 hash 值依旧有可能重复，所以布隆过滤器说元素存在，实际上可能不存在。

布隆过滤器解决缓存穿透问题:

场景描述:
缓存穿透指的是大量请求请求缓存中不存在的 key，由于没有命中缓存，所以大量请求直接打到数据库，导致数据库崩溃。

利用布隆过滤器解决:
事先将存在的 key 都放入 redis 布隆过器中，进行存在性检测。当请求达到时，先通过布隆过滤器检查其所请求的 key 存不存在，若布隆过滤器说没有，那就一定没有，数据库中也没有，直接返回；若说有，那就可能有，放行。

布隆过滤器可能会误判，放过部分实际 key 不存在的请求，但不影响整体，所以，其是处理此类问题的最佳方案。

如上图所示，整个流程展示了 redis bloom filter 解决缓存穿透的过程。目前，已经介绍了两种解决缓存穿透问题的方案，分别是缓存空值和布隆过滤器，而图中，蓝色部分是缓存空值的方案，在外层加上布隆过滤器就是布隆过滤器的反感了。

应用场景:

解决缓存穿透:
解决缓存穿透问题参考上一节 “布隆过滤器解决缓存穿透问题”。
黑名单校验:
黑名单校验请参考第四条 “去重”。原理基本不差。
web 拦截器:
可防止黑客恶意攻击或相同请求恶意请求。
如第一次请求时以请求参数放入布隆过滤器，当同一个 ip 第二次请求时先判断请求参数是否被布隆过滤器命中，再进行拦截或放行操作。
去重:
可对大数据集的账号、号码、邮箱、url 等数据去重。
如有 10 亿个电话号码，对与新到的号码你需要判断其是否已经存在于这 10 亿个号码集中。有些小伙伴觉得可以放缓存中，但如果放缓存中的话，以 java 为背景，号码长度为 11，不能用 int 表示，这里用 long 表示，占 8 个字节，10 亿 * 8 / 1024 / 1024 / 1024 = 7.4 G。占用 7.4 G 的空间，但如果放进 bitmap 的话，一个 bitmap 最多可以表示 2 ^ 32 大概四十二亿个值，一个 bitmap 最多占用 512 M 空间。

bitmap 与 bloom filter:

两者都可以看成是一个巨大的 bit 数组。
bitmap 存放元素时是直接修改元素对应位的值；bloom filter 是先对元素进行多次不同 hash，再对 bit 数组取模，在修改模值对应位的值。
bitmap 中元素存不存在是一定的；bloom filter 中元素不存在是一定的，存在是可能的（这是由 hash 碰撞造成的）。
bitmap 中一位代表一个元素；bloom filter 中多位代表一个元素。
bitmap 的容量一定比 bloom filter 大，但在元素相同取值范围的作用下，bitmap 的内存利用率要低于 bloom filter。

14、集群模式:

集群模式，也就是 redis 的 cluster 模式，是 redis 原生的高可用机制。

Redis Cluster 介绍:

自动将数据进行分片，每个 master 上放一部分数据。

提供内置的高可用支持，部分 master 不可用时，还是可以继续工作的。

在 redis cluster 架构下，每个 redis 要开放两个端口，比如一个是 6379，则另外一个是 16379，即加 1w。

6379 端口是用来对外提供服务的，如读写服务。16379 端口是用来进行节点间通信的，也就是 cluster bus 的东西。cluster bus 通信用来进行故障检测、配置更新、故障转移授权等节点间的通信和数据交换。cluster bus 用了另一种二进制协议，gossip 协议，用来进行节点间高效的数据交换，占用更少的网络宽带和处理时间。

集群节点间的内部通信机制:

集群节点间的内部通信主要用来维护集群元数据，集群元数据的维护主要有两种方式：集中式、gossip 协议。Redis cluster 集群节点间采用 gossip 协议进行通信。

集中式:
集中式是将集群元数据（节点信息、故障等）存储在某个节点上。集中式元数据维护的一个典型代表，就是大数据领域的 storm。它是分布式的大数据实时计算引擎，是集中式元数据存储的架构，底层基于 zookeeper（分布式协调中间件）对所有元数据进行存储维护。

集中式的好处在于，元数据的读取和更新，时效性非常好，一单元数据发生了变更，就立即更新到集中式的存储中，其它节点读取的时候就可以感知到；不好的地方是，所有元数据的更新集中在一个地方，可能会导致元数据的存储有压力。
gossip 协议:
gossip 协议方式，所有节点都持有一份集群元数据，不同的节点如果出现了元数据的变更，就不断的将元数据发送给其它节点，让其它节点也进行元数据的变更。

goosip 的好处在于，元数据的更新比较分散，不是集中在一个地方，更新请求会陆续打到所有节点上去更新，降低了压力；不好的地方是，元数据的更新会有些许延迟，可能会导致集群中的一些操作会有一些滞后。

每个节点都有一个专门用于节点间通信的端口，就是自己对外提供服务的端口号 +1w。每个节点会每隔一段时间向其它几个节点发送 ping 消息，同时其它几个节点再接收到 ping 消息之后会返回 pong。

节点间交换的信息包括：故障信息、节点的增删、hash slot（哈希槽）信息等。

gossip 协议是一种二进制协议，包含多种消息，如 ping、pong、meet、fail 等。
- meet：某个节点发送 meet 给新加入的节点，让其加入节点集群中，然后新节点就开始与集群中的其它节点通信。
- ping：每个节点会频繁的向其它节点发送 ping，其中包含自己的状态和其维护的集群元数据，互相交换元数据。
- pong：作为 ping 和 meet 的返回，包含自己的状态和其它，也用于信息的广播和更新。
- fail：某个节点发现另一个节点 fail 后，就发送 fail 给其它节点，通知其它节点说，某个节点宕机啦。
ping 时要携带一些元数据，如果很频繁，则可能会增加网络负担。

每个节点每秒会执行 10 次 ping，每次会选择 5 个最久没有通信的其它节点。如果发现与某个节点间的通信延时达到了 cluster_node_timeout / 2，那么会立即发送 ping，以避免数据交换延时过长。cluster_node_timeout 可以调节，值越大，ping 的频率就越低。

每次 ping，会带上自己节点的信息，还会带上 1 / 10 其它节点的信息。至少包含 3 个其它节点信息，最多包含 n - 2 个节点的信息（n 为节点总数）。

主备切换原理:

Redis cluster 的高可用原理，跟哨兵模式非常相似，都是主备切换。

判断节点宕机:
如果一个节点认为另外一个节点宕机，那么就是 pfail，主观宕机；如果多个节点都认为另外一个节点宕机，那么就是 fail，客观宕机。跟哨兵的原理几乎一样，sdown、odown。
在 cluster-node-timeout 内，如果某个节点一直没有返回 pong，那么就会被认为 pfail。如果一个节点认为另外一个节点 pfail 了，就会在 gossip ping 消息中，ping 给其它节点，如果超过半数节点都认为该节点 pfail 了，那么就会变为 fail。
从节点过滤:
对宕机的主节点（master node），从其所有的从节点（slave node）中选择一个，切换成主节点。
检查每个 slave node 与 master node 的断开连接时间，如果超过了 cluster-node-timeout * cluster-slave-validity-factor，那就没有资格切换成 master node。
从节点选举:
每个 slave node 都根据自己对 master node 数据复制的 offset，来设置一个选举时间。offset 越大（复制的数据越多）的 slave node，选举时间越靠前，优先进行选举。
集群中所有 master node 开始为参与选举的 slave node 进行投票，如果大部分 master node （n / 2 + 1）都投给了某个 slave node，那么选举通过，被选举的 slave node 可以成为 master node。slave node 将进行主备切换，成为 master node。
与哨兵比较:
整个流程跟哨兵非常相似，所以说，redis cluster 功能强大，直接集成了 replication 和 sentinel。

15、分布式寻址算法:

hash 算法
一致性 hash 算法
hash slot 算法

hash 算法:

来了一个 key，先计算其 hash 值，再对节点数取模（hash(key) % n），然后根据取模的值将其打到对应的 master 节点上。一旦某个节点宕机，所有请求过来会基于剩余存活的节点数取模，然后尝试去取数据，这就导致大部分请求无法命中缓存，最终大量请求会直奔数据库。

一致性 hash 算法:

一致性 hash 算法是将整个 hash 值空间组织成一个虚拟的圆环，整个空间按顺时针方向组织。

一般的 hash 环是 hash 值取模运算，即 hash(key) % n，n 取 2 ^ 32，这样就形成了一个 0 ~ 32 的 hash 环。寻址按顺时针方向进行，查找最近的一个节点。

如图所示，将 4 个节点按照 “ip + 名称” 哈希取模，即 location = hash(ip + 名称) % n，然后，4 个节点落在了 hash 环上如图所示的四个位置。当一个请求到达时，对 key 也进行哈希取模，假设其落在了如图所示的位置，然后顺时针进行查找，找到节点 2，即请求 key 命中了节点 2。这便是一个简单的寻址过程。

当一个节点挂了，受影响的数据仅仅是该节点到上一个节点间的数据，即减少了容灾问题带来的数据迁移量大的问题，增加节点也同理。

然而，一致性 hash 算法因为节点分布不均匀或在节点太少的情况下，会造成缓存热点的问题。为了解决这种热点问题，一致性 hash 算法引入了虚拟节点机制，即对每一个节点计算多个 hash，每个计算结果位置都作为一个虚拟节点。这样就实现了数据的均匀分布，负载均衡。具体做法是在 “ip + 名称” 后面加上编号，如 “ip + 名称1”、“ip + 名称2”、“ip + 名称3”，对其哈希取模，确定其在 hash 环上的位置，当 key 定位到虚拟节点时，如 “ip + 名称2”，则其实际命中了 ip + 名称节点。

一致性 hash 算法的优点是有效减少了动态增删节点带来的数据迁移问题，缺点是节点很难均匀分布在 hash 环上。

hash slot 算法:

hash slot 即哈希槽，redis cluster 正是采用的这种寻址算法。

以 redis cluster 为例，redis cluster 有固定的 16384 个 hash slot，其中每个 master 都会持有部分 slot，如有 3 个 master，那可能每个 master 持有 5000 多个 slot。当请求到达时，先计算 key 对应的 hash slot，即 hash slot = CRC16(key) % 16384，然后根据 hash slot 就可以确定具体访问那个节点。

每增加一个节点，就将已有的 master 上的 hash slot 移动部分过去；每减少一个节点，就将其所持有的 hash slot 分到其它节点上。

移动 hash slot 的成本是非常低的，且任何节点宕机，都不会影响其它节点，因为 key 找的是 hash slot 而不是节点。这样，既减少了 hash 寻址带来的数据迁移问题，又相对一致性 hash 来说负载均衡效果更加明显。

16、分布式锁:

分布式锁是用来解决在分布式系统中的数据一致性问题的一种技术。解决分布式系统中数据一致性问题的技术主要有分布式锁、分布式事务等。

分布式锁的特点:

排它性：在同一时间只能有一个服务获取到锁，其它服务无法同时获取。
高可用&高性能：获取锁与释放锁要高可用、高性能。
避免死锁：具备锁失效机制，即一把锁在一段时间后一定会被释放，正常释放或异常释放。
非阻塞：具备非阻塞特性，即获取锁失败时不能阻塞。
可重入：具备可重入性，即同一个服务的一个请求在获取了一把锁之后，若在后续的处理流程中任需要锁，则可自动获取锁，不会因为之前已经获取过锁没释放而获取锁失败。

分布式锁的实现:

分布式锁的实现方式主要有三种，分别是：

基于数据库实现。
基于缓存实现。
基于分布式中间件实现。

基于数据库实现:

基于数据库实现分布式锁主要是利用乐观锁和悲观锁。

乐观锁方式:
乐观锁的方式实际上是在数据库表中增加版本号字段（version），每次更新数据时都对版本号值进行 version++。
如对于一个更新数据的请求，先从数据库中获取要更新数据的版本号，再执行更新操作。更新时要以 version 为条件，即只要当数据库中的版本号与获取到的版本号一致时才能更新，若不一致则说明在此期间有其它请求修改过该数据，则更新失败。同时要更新版本号，即 version++。
悲观锁方式:
悲观锁的方式是利用排它锁的机制，即利用 for update sql 语句为要更新的数据加锁，来保证在事务提交成功执行前没有其它请求更新数据。排它锁的作用是保证一个事务在未完成前其它事务可以读取但不能更新数据。
需要注意的是，mysql InnoDB 默认是表级锁，所以需要对查询条件字段添加索引，以变为行级锁。
遵循一锁、二判、三更新、四释放的原则（手动狗头）。

基于缓存实现:

以 redis 为例，基于缓存实现分布式锁的主要方式是利用 redis 的 setnx 命令。setnx 即 set if not exist，其维护的是乐观锁。setnx 的含义是若 key 不存在则放入。

主要原理是：对于一个更新数据的请求，先以要更新数据唯一标识为 key，以 UUID 为 value，将其放入 redis，且只能在 key 不存在的情况下放入。然后更新数据。更新完成后删除这个 key，且删除前要以 value 为条件删除，也就是删除当前请求生成的 UUID。

通过 setnx 命令设置 key 即加锁时，需要设置 expire 超时时间，超过该时间则自动释放锁。获取锁时也要设置 expire，即若超过这个时间未获取到锁则放弃获取锁。释放锁的时候，需要判断 UUID 是不是当前请求生成的，只有在 UUID 相等的情况下删除。

基于分布式中间件:

以 zookeeper 为例，zookeeper 是一个分布式中间件，其内部维护了一个分层的文件系统目录树结构，规定同一个目录下只能有一个唯一文件名。

zookeeper 实现分布式锁有两种方式，分别是：

方式一：利用节点名称的唯一性来实现共享锁。
若某客户端需要获取锁，则尝试在指定目录下创建节点，若创建成功，则活得锁。释放锁时，只需删除 lock 节点即可。
方式二：利用临时顺序节点实现共享锁。
若某客户端需要获取锁，则在指定目录下创建临时节点，若创建的节点的序列号小于目录下的其它节点序列号，则获得锁；若创建的节点序列号不是最小的，则监视比自己小的节点序列号，当其被删除时，自己再获得锁。
释放锁时只需要删除这个临时节点即可。

两种方式的区别：

方式一会产生惊群效应，即当有多个客户端在等待同一把锁，当锁被释放的时候所有等待的客户端都被唤醒，但仅有一个能获得锁。
方式二是按顺序排队的实现，多个客户端共同等待同一把锁，当锁被释放时仅有一个客户端会被唤醒，避免了惊群效应。
方式二优于方式一的另外一点是，当 zookeeper 宕机后，方式二中的临时节点会自动删除，获得锁的客户端会释放锁，不会造成锁等待；二方式一会造成锁等待。

分布式锁实现方式中基于分布式中间件的实现最多被使用，尤其是利用临时顺序节点的实现。

@XGLLHZ - 张国荣 -《当年情》.mp3

你可能感兴趣的:(数据库,redis,缓存,memcached)

guava loadingCache代码示例 IM 胡鹏飞 Java 工具类介绍
publicclassTest2{publicstaticvoidmain(String[]args)throwsException{LoadingCachecache=CacheBuilder.newBuilder()//设置并发级别为8，并发级别是指可以同时写缓存的线程数.concurrencyLevel(8)//设置缓存容器的初始容量为10.initialCapacity(10)//设置缓存
Guava LoadingCache sqyaa. java并发编程 Java知识 jvm 缓存 guava
LoadingCache是GoogleGuava库提供的一个高级缓存实现，它通过自动加载机制简化了缓存使用模式。核心特性自动加载机制当缓存未命中时，自动调用指定的CacheLoader加载数据线程安全：并发请求下，相同key只会加载一次灵活的过期策略支持基于写入时间(expireAfterWrite)和访问时间(expireAfterAccess)的过期可设置最大缓存大小，基于LRU策略淘汰丰富的
Android 开源组件和第三方库汇总 gyyzzr Android Android 开源框架
转载1、github排名https://github.com/trending,github搜索：https://github.com/search2、https://github.com/wasabeef/awesome-android-ui目录UIUI卫星菜单节选器下拉刷新模糊效果HUD与Toast进度条UI其它动画网络相关响应式编程地图数据库图像浏览及处理视频音频处理测试及调试动态更新热更新
Java大厂面试实录：谢飞机的电商场景技术问答（Spring Cloud、MyBatis、Redis、Kafka、AI等）
Java大厂面试实录：谢飞机的电商场景技术问答（SpringCloud、MyBatis、Redis、Kafka、AI等）本文模拟知名互联网大厂Java后端岗位面试流程，以电商业务为主线，由严肃面试官与“水货”程序员谢飞机展开有趣的对话，涵盖SpringCloud、MyBatis、Redis、Kafka、SpringSecurity、AI等热门技术栈，并附详细解析，助力求职者备战大厂面试。故事设定谢
Java大厂面试故事：谢飞机的互联网音视频场景技术面试全纪录（Spring Boot、MyBatis、Kafka、Redis、AI等）来旺 Java场景面试宝典 Java Spring Boot MyBatis Kafka Redis 微服务 AI
Java大厂面试故事：谢飞机的互联网音视频场景技术面试全纪录（SpringBoot、MyBatis、Kafka、Redis、AI等）互联网大厂技术面试不仅考察技术深度，更注重业务场景与系统设计能力。本篇以严肃面试官与“水货”程序员谢飞机的对话，带你体验音视频业务场景下的Java面试全过程，涵盖主流技术栈，并附详细答案解析，助你面试无忧。故事场景设定谢飞机是一名有趣但技术基础略显薄弱的程序员，这次应
vue keep-alive标签的运用
keep-alive，想必大家都不会很陌生，在一些选项卡中会使用到。其实，它的作用大概就是把组件的数据给缓存起来。比如果我有一个选项卡，标签一，标签二，标签三。现在，我需要实现，当我在标签一的表单中输入内容后，点击标签二，再回到标签一，表单的内容依然存在。如果按以往的做法，不使用keep-alive，那是不能实现的。然而，我们只需要在选项卡的内容最外层包一个keep-alive标签即可。但这儿有一
Redis Sentinel（哨兵）和 Redis Cluster（集群） G丶AEOM 八股普通学习区 Redis redis 数据库缓存
哨兵机制和集群有什么区别Redis集群主要有两种，一种是RedisSentinel哨兵集群，一种是RedisCluster。主从集群，包括一个Master和多个Slave节点，Master负责数据的读写，Slave负责数据的读取，Master上收到的数据变更会同步到Slave节点上实现数据同步，但不提供容错和恢复，在Master宕机时不会选出新的Master，导致后续客户端所有写请求直接失败。所以
CentOS7环境卸载MySQL5.7 Hadoop_Liang mysql 数据库 mysql
备份重要数据切记，卸载之前先备份mysql重要的数据。备份一个数据库例如：备份名为mydatabase的数据库到backup.sql的文件中mysqldump-uroot-ppassword123mydatabase>backup.sql备份所有数据库mysqldump-uroot-ppassword123--all-databases>all_databases_backup.sql注意：-p后
php SPOF 贵哥的编程之路(热爱分享为后来者) PHP语言经典程序100题 php 开发语言
1.什么是单点故障（SPOF）？单点故障指的是系统中某个组件一旦失效，整个系统或服务就会不可用。常见的单点有：数据库、缓存、Web服务器、负载均衡、网络设备等。2.常见单点故障场景只有一台数据库服务器，宕机后所有业务不可用只有一台Redis缓存，挂掉后缓存全部失效只有一台Web服务器，挂掉后网站无法访问只有一个负载均衡节点，挂掉后流量无法分发只有一条网络链路，断开后所有服务失联3.消除单点故障的主
php 高并发下日志量巨大，如何高效采集、存储、分析贵哥的编程之路(热爱分享为后来者) PHP语言经典程序100题 php 开发语言
1.问题背景高并发系统每秒产生大量日志（如访问日志、错误日志、业务日志等）。单机写入、存储、分析能力有限，容易成为瓶颈。需要支持实时采集、分布式存储、快速检索与分析。2.主流架构方案一、分布式日志采集架构[应用服务器(PHP等)]|v[日志采集Agent（如Filebeat、Fluentd、Logstash）]|v[消息队列/缓冲（如Kafka、Redis、RabbitMQ）]|v[日志存储（如E
centos7安装 mysql5.7(安装包) heiPony linux mysql mariadb centos mysql
一.卸载centos7自带数据库查看系统自带的Mariadbrpm-qa|grepmariadbmariadb-libs-5.5.44-2.el7.centos.x86_64卸载rpm-e--nodepsmariadb-libs-5.5.44-2.el7.centos.x86_64删除etc目录下的my.cnfrm/etc/my.cnf二.检查mysql是否存在(有就卸载,删除相关文件)rpm-q
MySQL Explain 详解：从入门到精通，让你的 SQL 飞起来
引言：为什么Explain是SQL优化的“照妖镜”？在Java开发中，我们常常会遇到数据库性能瓶颈的问题。一条看似简单的SQL语句，在数据量增长到一定规模后，可能会从毫秒级响应变成秒级甚至分钟级响应，直接拖慢整个应用的性能。此时，你是否曾困惑于：为什么这条SQL突然变慢了？索引明明建了，为什么没生效？到底是哪里出了问题？答案就藏在MySQL的EXPLAIN命令里。EXPLAIN就像一面“照妖镜”，
OpenWebUI(12)源码学习-后端constants.py常量定义文件青苔猿猿 AI大模型 openwebui constants常量定义
目录文件名：`constants.py`功能概述：主要功能点详解1.**MESSAGES枚举类**2.**WEBHOOK_MESSAGES枚举类**3.**ERROR_MESSAGES枚举类**✅默认错误模板✅认证与用户相关错误✅资源冲突与重复错误✅验证失败类错误✅权限限制类错误✅文件上传与格式错误✅模型与API错误✅请求频率与安全限制✅数据库与配置错误4.**TASKS枚举类**✅总结实际应用场
OKHttp3源码分析——学习笔记 Sincerity_ 源码相关 Okhttp 源码解析读书笔记 httpclient cache
文章目录1.HttpClient与HttpUrlConnection的区别2.OKHttp源码分析使用步骤:dispatcher任务调度器,（后面有详细说明）Request请求RealCallAsyncCall3.OKHttp架构分析1.异步请求线程池,Dispather2.连接池清理线程池-ConnectionPool3.缓存整理线程池DisLruCache4.Http2异步事务线程池,http
自动化运维工程师面试题解析【真题】
ZabbixAgent默认监听的端口是A.10050。以下是关键分析：选项排除：C.80是HTTP默认端口，与ZabbixAgent无关。D.5432是PostgreSQL数据库的默认端口，不涉及ZabbixAgent。B.10051是ZabbixServer的默认监听端口，用于接收Agent发送的数据，而非Agent自身的监听端口。ZabbixAgent的配置：根据官方文档，ZabbixAgen
什么是OA系统？使用OA系统对企业有哪些好处？
OA系统（OfficeAutomationSystem），即办公自动化系统，是将现代化办公和计算机网络功能结合起来的一种新型的办公方式。是现代企业管理中一种重要的信息化工具，它通过计算机技术、网络技术和数据库技术等手段，实现企业内部办公流程的自动化和信息化管理。使企业的信息交流更加顺畅，办公流程更加高效，从而提高企业的运营效率和管理水平。一、主要功能1.文档管理文档存储与检索：OA系统可以集中存储
LangChain中的向量数据库接口－Weaviate 洪城叮当 langchain 数据库经验分享笔记交互人工智能知识图谱
文章目录前言一、原型定义二、代码解析1、add_texts方法1.1、应用样例2、from_texts方法2.1、应用样例3、similarity_search方法3.1、应用样例三、项目应用1、安装依赖2、引入依赖3、创建对象4、添加数据5、查询数据总结前言 Weaviate是一个开源的向量数据库，支持存储来自各类机器学习模型的数据对象和向量嵌入，并能无缝扩展至数十亿数据对象。它提供存储文档嵌
Flutter——数据库Drift开发详细教程(七) 怀君 flutter flutter 数据库
目录入门设置漂移文件入门变量数组定义表支持的列类型漂移特有的功能导入嵌套结果LIST子查询Dart互操作SQL中的Dart组件类型转换器现有的行类Dart文档注释结果类名称支持的语句自定义SQL类型定义类型使用自定义类型在Dart中在SQL中方言意识支持的SQLite扩展json1fts5地缘垄断自定义查询带有生成的api的语句自定义选择语句自定义更新语句入门Drift提供了一个dart_api来
Python技能手册 - 模块module 金色牛神 Python python windows 开发语言
系列Python常用技能手册-基础语法Python常用技能手册-模块modulePython常用技能手册-包package目录module模块指什么typing数据类型int整数float浮点数str字符串bool布尔值TypeVar类型变量functools高阶函数工具functools.partial()函数偏置functools.lru_cache()函数缓存sorted排序列表排序元组排序
redis集群之Sentinel哨兵高可用会飞的爱迪生 redis redis sentinel bootstrap
Sentinel是官网推荐的高可用（HA）解决方案，可以实现redis的高可用，即主挂了从代替主工作，在一台单独的服务器上运行多个sentinel，去监控其他服务器上的redismaster-slave状态(可以监控多个master-slave)，当发现master宕机后sentinel会在slave中选举并启动新的master。至少需要3台redis才能建立起基于哨兵的reids集群。一、通过s
android中百度定位、城市选择列表，右侧字母展示
好久好久没光顾过自己空空的博客了，做项目的时候都是逛着别人的博客急着把功能实现，近来闲下来了总结总结。这个城市选择功能也是当时做项目急着实现从哪找来的框架不记得了，然后改改用到项目中来的。非常感谢提供最初源码的博主，主要的区别是添加了搜索功能、定位功能，把以前的操作本地数据库sqlite的部分，改为操作对assest文件的操作，封装的有百度地图定位方法、可删除的edittext。百度地图的key需
Flutter——数据库Drift开发详细教程之迁移(九) 怀君 flutter flutter 数据库
迁移入门引导式迁移配置用法例子切换到make-migrations开发过程中手动迁移迁移后回调导出模式导出架构下一步是什么？调试导出架构的问题修复这个问题架构迁移助手自定义分步迁移转向逐步迁移手动生成测试迁移编写测试验证数据完整性在运行时验证数据库模式迁移器API一般提示迁移视图、触发器和索引复杂的迁移更改列的类型更改列约束删除列重命名列合并列添加新列入门Drift通过严格的架构确保查询类型安全。
redis管道 -redis pipeline -redis pipelining shuair redis redis bootstrap 数据库
redis管道文档redis单机安装redis常用的五种数据类型redis数据类型-位图bitmapredis数据类型-基数统计HyperLogLogredis数据类型-地理空间GEOredis数据类型-流Streamredis数据类型-位域bitfieldredis持久化-RDBredis持久化-AOFredis持久化-RDB+AOF混合模式redis事务官方文档官网操作命令指南页面：https
redis中什么是bigkey？会有什么影响？ Vic2334 redis
什么是bigkey？会有什么影响？bigkey是指key对应的value所占的内存空间比较大，例如一个字符串类型的value可以最大存到512MB，一个列表类型的value最多可以存储23-1个元素。如果按照数据结构来细分的话，一般分为字符串类型bigkey和非字符串类型bigkey。字符串类型：体现在单个value值很大，一般认为超过10KB就是bigkey，但这个值和具体的OPS相关。非字符串
如何发现 Redis 中的 BigKey？ sevevty-seven redis bootstrap 数据库
如何发现Redis中的BigKey？Redis因其出色的性能，常被用作缓存、消息队列和会话存储。然而，在Redis的使用过程中，BigKey是一个不容忽视的问题。BigKey指的是存储了大量数据或包含大量成员的键。它们不仅会占用大量内存，还可能导致网络延迟、主从同步延迟，甚至在极端情况下引发Redis服务崩溃。因此，有效地发现和处理BigKey对于维护Redis服务的稳定性和性能至关重要。本文将深
《Python星球日记》第35天：全栈开发（综合项目） Code_流苏 Python星球日记编程项目实战 Python全栈开发 Django Flask 后端开发博客系统
名人说：路漫漫其修远兮，吾将上下而求索。——屈原《离骚》创作者：Code_流苏(CSDN)（一个喜欢古诗词和编程的Coder）专栏：《Python星球日记》，限时特价订阅中ing目录一、全栈开发概述1.全栈开发的优势2.全栈开发技能组合二、博客系统项目需求分析1.功能需求2.技术栈选择3.项目结构规划三、数据库设计1.实体关系分析2.Django模型设计四、后端开发1.Django项目创建2.视图
Spring 声明式事务：从原理到实现的完整解析 Code季风 Spring详解 spring 数据库后端开发语言 java spring boot
在后端开发中，事务管理是保证数据一致性的核心机制。尤其是在复杂业务场景下，一个操作可能涉及多步数据库操作，任何一步失败都需要回滚到初始状态。Spring的声明式事务通过AOP思想，将事务管理从业务逻辑中剥离，让开发者更专注于核心业务。本文将结合实际实现，详解声明式事务的核心机制和设计思路。一、为什么需要声明式事务？在讨论实现之前，我们先明确一个问题：为什么要用声明式事务，而不是手动编写事务代码？假
项目开发日记
框架整理学习UIMgr：一、数据结构与算法1.1关键数据结构成员变量类型说明m_CtrlsList当前正在显示的所有UI页面m_CachesList已打开过、但现在不显示的页面（缓存池）1.2算法逻辑查找缓存页面：从m_Caches中倒序查找是否已有对应ePageType页面，找到则重用。页面加载：从资源管理器ResMgr加载prefab并绑定控制器/视图组件。页面关闭：从m_Ctrls移除，添加
【Android】安卓四大组件之内容提供者（ContentProvider）：从基础到进阶 m0_59734531 Android android Java ContentProvider 安卓四大组件
你手机里的通讯录，存储了所有联系人的信息。如果你想把这些联系人信息分享给其他App，就可以通过ContentProvider来实现。。一、什么是ContentProvider‌ContentProvider‌是Android四大组件之一，负责实现‌跨应用程序的数据共享与访问‌，通过统一接口封装数据存储细节，提供标准化操作方式。其中主要功能包括：数据抽象层：将应用内部的数据（如SQLite数据库、文
400多个免费在线编程与计算机科学课程 zhufafa 基础理论课程理论计算机基础免费
来源：medium作者：DhawalShah五年前，麻省理工学院和斯坦福大学等学校首先向公众开放免费的在线课程。如今，全球有700多所学校创造了数以千计的免费在线课程。从入门到精通系列，是作者通过ClassCentral的课程数据库整理的400多个免费在线课程的简介和链接（来源于ClassCentral，一个在线课程搜索引擎），根据课程难度分为入门、进阶和高阶三大类，每门课程还有星级评分（统计自C
java解析APK 3213213333332132 java apk linux 解析APK
解析apk有两种方法 1、结合安卓提供apktool工具，用java执行cmd解析命令获取apk信息 2、利用相关jar包里的集成方法解析apk 这里只给出第二种方法，因为第一种方法在linux服务器下会出现不在控制范围之内的结果。 public class ApkUtil { /** * 日志对象 */ private static Logger
nginx自定义ip访问N种方法 ronin47 nginx 禁止ip访问
　　　因业务需要，禁止一部分内网访问接口，　由于前端架了F5，直接用deny或allow是不行的，这是因为直接获取的前端Ｆ５的地址。　　　所以开始思考有哪些主案可以实现这样的需求，目前可实施的是三种：　　　一：把ip段放在redis里，写一段lua 二：利用geo传递变量，写一段
mysql timestamp类型字段的CURRENT_TIMESTAMP与ON UPDATE CURRENT_TIMESTAMP属性 dcj3sjt126com mysql
timestamp有两个属性，分别是CURRENT_TIMESTAMP 和ON UPDATE CURRENT_TIMESTAMP两种，使用情况分别如下： 1. CURRENT_TIMESTAMP 当要向数据库执行insert操作时，如果有个timestamp字段属性设为 CURRENT_TIMESTAMP，则无论这
struts2+spring+hibernate分页显示 171815164 Hibernate
分页显示一直是web开发中一大烦琐的难题，传统的网页设计只在一个JSP或者ASP页面中书写所有关于数据库操作的代码，那样做分页可能简单一点，但当把网站分层开发后，分页就比较困难了，下面是我做Spring+Hibernate+Struts2项目时设计的分页代码，与大家分享交流。　　1、DAO层接口的设计，在MemberDao接口中定义了如下两个方法： public in
构建自己的Wrapper应用 g21121 rap
我们已经了解Wrapper的目录结构，下面可是正式利用Wrapper来包装我们自己的应用，这里假设Wrapper的安装目录为:/usr/local/wrapper。首先，创建项目应用 &nb
[简单]工作记录_多线程相关 53873039oycg 多线程
最近遇到多线程的问题,原来使用异步请求多个接口(n*3次请求) 方案一使用多线程一次返回数据,最开始是使用5个线程,一个线程顺序请求3个接口,超时终止返回缺点测试发现必须3个接
调试jdk中的源码，查看jdk局部变量程序员是怎么炼成的 jdk 源码
转自：http://www.douban.com/note/211369821/ 学习jdk源码时使用-- 学习java最好的办法就是看jdk源代码，面对浩瀚的jdk（光源码就有40M多，比一个大型网站的源码都多）从何入手呢，要是能单步调试跟进到jdk源码里并且能查看其中的局部变量最好了。可惜的是sun提供的jdk并不能查看运行中的局部变量
Oracle RAC Failover 详解 aijuans oracle
Oracle RAC 同时具备HA(High Availiablity) 和LB(LoadBalance). 而其高可用性的基础就是Failover(故障转移). 它指集群中任何一个节点的故障都不会影响用户的使用，连接到故障节点的用户会被自动转移到健康节点，从用户感受而言，是感觉不到这种切换。 Oracle 10g RAC 的Failover 可以分为3种： 1. Client-Si
form表单提交数据编码方式及tomcat的接受编码方式 antonyup_2006 JavaScript tomcat 浏览器互联网 servlet
原帖地址：http://www.iteye.com/topic/266705 form有2中方法把数据提交给服务器，get和post,分别说下吧。（一）get提交 1.首先说下客户端（浏览器）的form表单用get方法是如何将数据编码后提交给服务器端的吧。对于get方法来说，都是把数据串联在请求的url后面作为参数，如：http://localhost:
JS初学者必知的基础百合不是茶 js函数 js入门基础
JavaScript是网页的交互语言,实现网页的各种效果, JavaScript 是世界上最流行的脚本语言。 JavaScript 是属于 web 的语言，它适用于 PC、笔记本电脑、平板电脑和移动电话。 JavaScript 被设计为向 HTML 页面增加交互性。许多 HTML 开发者都不是程序员，但是 JavaScript 却拥有非常简单的语法。几乎每个人都有能力将小的
iBatis的分页分析与详解 bijian1013 java ibatis
分页是操作数据库型系统常遇到的问题。分页实现方法很多，但效率的差异就很大了。iBatis是通过什么方式来实现这个分页的了。查看它的实现部分，发现返回的PaginatedList实际上是个接口，实现这个接口的是PaginatedDataList类的对象，查看PaginatedDataList类发现，每次翻页的时候最
精通Oracle10编程SQL(15)使用对象类型 bijian1013 oracle 数据库 plsql
/* *使用对象类型 */ --建立和使用简单对象类型 --对象类型包括对象类型规范和对象类型体两部分。 --建立和使用不包含任何方法的对象类型 CREATE OR REPLACE TYPE person_typ1 as OBJECT( name varchar2(10),gender varchar2(4),birthdate date ); drop type p
【Linux命令二】文本处理命令awk bit1129 linux命令
awk是Linux用来进行文本处理的命令，在日常工作中，广泛应用于日志分析。awk是一门解释型编程语言，包含变量，数组，循环控制结构，条件控制结构等。它的语法采用类C语言的语法。 awk命令用来做什么？ 1.awk适用于具有一定结构的文本行，对其中的列进行提取信息 2.awk可以把当前正在处理的文本行提交给Linux的其它命令处理，然后把直接结构返回给awk 3.awk实际工
JAVA(ssh2框架)+Flex实现权限控制方案分析白糖_ java
目前项目使用的是Struts2+Hibernate+Spring的架构模式，目前已经有一套针对SSH2的权限系统，运行良好。但是项目有了新需求：在目前系统的基础上使用Flex逐步取代JSP，在取代JSP过程中可能存在Flex与JSP并存的情况，所以权限系统需要进行修改。【SSH2权限系统的实现机制】权限控制分为页面和后台两块：不同类型用户的帐号分配的访问权限是不同的，用户使
angular.forEach boyitech AngularJS AngularJS API angular.forEach
angular.forEach 描述: 循环对obj对象的每个元素调用iterator, obj对象可以是一个Object或一个Array. Iterator函数调用方法: iterator(value, key, obj), 其中obj是被迭代对象，key是obj的property key或者是数组的index，value就是相应的值啦. (此函数不能够迭代继承的属性.)
java-谷歌面试题-给定一个排序数组，如何构造一个二叉排序树 bylijinnan 二叉排序树
import java.util.LinkedList; public class CreateBSTfromSortedArray { /** * 题目:给定一个排序数组，如何构造一个二叉排序树 * 递归 */ public static void main(String[] args) { int[] data = { 1, 2, 3, 4,
action执行2次 Chen.H JavaScript jsp XHTML css Webwork
xwork 写道 <action name="userTypeAction" class="com.ekangcount.website.system.view.action.UserTypeAction"> <result name="ssss" type="dispatcher">
[时空与能量]逆转时空需要消耗大量能源 comsci 能源
无论如何,人类始终都想摆脱时间和空间的限制....但是受到质量与能量关系的限制,我们人类在目前和今后很长一段时间内,都无法获得大量廉价的能源来进行时空跨越..... 在进行时空穿梭的实验中,消耗超大规模的能源是必然
oracle的正则表达式(regular expression)详细介绍 daizj oracle 正则表达式
正则表达式是很多编程语言中都有的。可惜oracle8i、oracle9i中一直迟迟不肯加入，好在oracle10g中终于增加了期盼已久的正则表达式功能。你可以在oracle10g中使用正则表达式肆意地匹配你想匹配的任何字符串了。正则表达式中常用到的元数据(metacharacter)如下： ^ 匹配字符串的开头位置。 $ 匹配支付传的结尾位置。 *
报表工具与报表性能的关系 datamachine 报表工具 birt 报表性能润乾报表
在选择报表工具时，性能一直是用户关心的指标，但是，报表工具的性能和整个报表系统的性能有多大关系呢？要回答这个问题，首先要分析一下报表的处理过程包含哪些环节，哪些环节容易出现性能瓶颈，如何优化这些环节。一、报表处理的一般过程分析 1、用户选择报表输入参数后，报表引擎会根据报表模板和输入参数来解析报表，并将数据计算和读取请求以SQL的方式发送给数据库。 2、
初一上学期难记忆单词背诵第一课 dcj3sjt126com word english
what 什么 your 你 name 名字 my 我的 am 是 one 一 two 二 three 三 four 四 five 五 class 班级，课 six 六 seven 七 eight 八 nince 九 ten 十 zero 零 how 怎样 old 老的 eleven 十一 twelve 十二 thirteen
我学过和准备学的各种技术 dcj3sjt126com 技术
语言VB https://msdn.microsoft.com/zh-cn/library/2x7h1hfk.aspxJava http://docs.oracle.com/javase/8/C# https://msdn.microsoft.com/library/vstudioPHP http://php.net/manual/en/Html
struts2中token防止重复提交表单蕃薯耀重复提交表单 struts2中token
struts2中token防止重复提交表单 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月12日 11:52:32 星期日 ht
线性查找二维数组 hao3100590 二维数组
1.算法描述有序（行有序，列有序，且每行从左至右递增，列从上至下递增）二维数组查找，要求复杂度O(n) 2.使用到的相关知识：结构体定义和使用，二维数组传递（http://blog.csdn.net/yzhhmhm/article/details/2045816） 3.使用数组名传递这个的不便之处很明显，一旦确定就是不能设置列值 //使
spring security 3中推荐使用BCrypt算法加密密码 jackyrong Spring Security
spring security 3中推荐使用BCrypt算法加密密码了，以前使用的是md5， Md5PasswordEncoder 和 ShaPasswordEncoder，现在不推荐了，推荐用bcrpt Bcrpt中的salt可以是随机的，比如： int i = 0; while (i < 10) { String password = "1234
学习编程并不难,做到以下几点即可! lampcy java html 编程语言
不论你是想自己设计游戏，还是开发iPhone或安卓手机上的应用，还是仅仅为了娱乐，学习编程语言都是一条必经之路。编程语言种类繁多，用途各异，然而一旦掌握其中之一，其他的也就迎刃而解。作为初学者，你可能要先从Java或HTML开始学，一旦掌握了一门编程语言，你就发挥无穷的想象，开发各种神奇的软件啦。 1、确定目标学习编程语言既充满乐趣，又充满挑战。有些花费多年时间学习一门编程语言的大学生到
架构师之mysql----------------用group+inner join,left join ,right join 查重复数据（替代in) nannan408 right join
1.前言。如题。 2.代码 (1)单表查重复数据,根据a分组 SELECT m.a,m.b, INNER JOIN （select a,b,COUNT(*) AS rank FROM test.`A` A GROUP BY a HAVING rank>1 )k ON m.a=k.a （2）多表查询，使用改为le
jQuery选择器小结 VS 节点查找（附css的一些东西） Everyday都不同 jquery css name选择器追加元素查找节点
最近做前端页面，频繁用到一些jQuery的选择器，所以特意来总结一下：测试页面： <html> <head> <script src="jquery-1.7.2.min.js"></script> <script> /*$(function() { $(documen
关于EXT tntxia ext
ExtJS是一个很不错的Ajax框架，可以用来开发带有华丽外观的富客户端应用，使得我们的b/s应用更加具有活力及生命力。ExtJS是一个用 javascript编写，与后台技术无关的前端ajax框架。因此，可以把ExtJS用在.Net、Java、Php等各种开发语言开发的应用中。 ExtJs最开始基于YUI技术，由开发人员Jack
一个MIT计算机博士对数学的思考 xjnine Math
在过去的一年中，我一直在数学的海洋中游荡，research进展不多，对于数学世界的阅历算是有了一些长进。为什么要深入数学的世界？作为计算机的学生，我没有任何企图要成为一个数学家。我学习数学的目的，是要想爬上巨人的肩膀，希望站在更高的高度，能把我自己研究的东西看得更深广一些。说起来，我在刚来这个学校的时候，并没有预料到我将会有一个深入数学的旅程。我的导师最初希望我去做的题目，是对appe