Redis
是一个完全开源免费的,遵循BSD协议的高性能Key-Value类型的额内存数据库。因为是纯内存操作,Redis 的性能非常出色,每秒可以处理超过10万次的读写操作,是已是最快的Key-Value类型的Key-Value数据库。而且Redis是一个NOSQL类型数据库,是为了解决高并发、高扩展,大数据存储等一系列问题而产生的数据库解决方案,是一个非关系型的数据库。但是它无法替代关系型数据库,只能作为特定环境下的扩充。
优点
redis
数据读写速度非常快,因为它把数据都读取到内存中操作,而且Redis使用C语言编写的,是最接近操作系统的语言,所以执行速度快。
redis虽然数据都存在内存中,但最终还支持数据持久化到硬盘当中。
redis提供了丰富的数据结构
redis所有操作都具有原子性,支持事务,所谓原子性就是对数据的更改要么全执行,要么全部不执行。
redis支持主从复制,主机会自动同步数据到从机,可以进行读写分离。
缺点
由于是内存数据库,所以,单台机器,存储的数据量,跟机器本身的内存大小。虽然redis本身有key过期策略,但是还是需要提前预估和节约内存。如果内存增长过快,需要定期删除数据。
如果进行完整重同步,由于需要生成rdb文件,并进行传输,会占用主机的CPU,并会消耗现网的带宽。不过redis2.8版本,已经有部分重同步的功能,但是还是有可能有完整重同步的。比如,新上线的备机。
修改配置文件,进行重启,将硬盘中的数据加载进内存,时间比较久。在这个过程中,redis不能提供服务。
首先介绍一下memcached,Memcached 是一个高性能的分布式内存对象缓存系统,用于动态Web应用以减轻数据库负载。它通过在内存中缓存数据和对象来减少读取数据库的次数,从而提高动态、数据库驱动网站的速度。Memcached基于一个存储键/值对的hashmap。其守护进程(daemon )是用C写的,但是客户端可以用任何语言来编写,并通过memcached协议与守护进程通信。
二者区别在于:
因为Redis是基于内存的操作,CPU不是Redis的瓶颈,Redis的瓶颈最有可能就是机器内存的大小或者网络带宽。既然单线程容易实现,而且CPU还不会成为瓶颈,所以当然要用单线程方案了,毕竟多线程方案会带来许多的麻烦。
而且Redis使用的是多路I/O复用模型,非阻塞IO。
多路IO复用模型是利用select
,poll
,epoll
来监察多个流的I/O事件的能力,在空闲时,会把当前进程阻塞掉,当有一个或多个流有I/O事件时,就从阻塞态中唤醒,于是程序就会轮询一遍所有的流(epoll是值轮询那些真正发出事件的流),并且只依次顺序处理就绪的流,从而避免了大量无用工作。
多路
指的是多个网络连接,而复用
指的是复用同一个线程。Redis采用多路I/O复用技术可以让单个线程高效的处理多个连接请求(尽量减少网络连接消耗)。
Redis是一个高级的分布式协调Redis客服端,能帮助用户在分布式环境下轻松实现一些Java的对象。(Bloom filter, BitSet, Set, SetMultimap, ScoredSortedSet, SortedSet, Map, ConcurrentMap, List, ListMultimap, Queue, BlockingQueue, Deque, BlockingDeque, Semaphore, Lock, ReadWriteLock, AtomicLong, CountDownLatch, Publish / Subscribe, HyperLogLog)。
String
、List
、Set
、Hash
、Sorted Set
(1)会话缓存(Session Cache)
最常用的一种使用Redis的情景是会话缓存(session cache)。用Redis缓存会话比其他存储(如Memcached)的优势在于:Redis提供持久化。当维护一个不是严格要求一致性的缓存时,如果用户的购物车信息全部丢失,大部分人都会不高兴的,现在,他们还会这样吗?
幸运的是,随着 Redis 这些年的改进,很容易找到怎么恰当的使用Redis来缓存会话的文档。甚至广为人知的商业平台Magento也提供Redis的插件。
(2)全页缓存(FPC)
除基本的会话token之外,Redis还提供很简便的FPC平台。回到一致性问题,即使重启了Redis实例,因为有磁盘的持久化,用户也不会看到页面加载速度的下降,这是一个极大改进,类似PHP本地FPC。
再次以Magento为例,Magento提供一个插件来使用Redis作为全页缓存后端。
此外,对WordPress的用户来说,Pantheon有一个非常好的插件 wp-redis,这个插件能帮助你以最快速度加载你曾浏览过的页面。
(3)队列
Reids在内存存储引擎领域的一大优点是提供 list 和 set 操作,这使得Redis能作为一个很好的消息队列平台来使用。Redis作为队列使用的操作,就类似于本地程序语言(如Python)对 list 的 push/pop 操作。
如果你快速的在Google中搜索“Redis queues”,你马上就能找到大量的开源项目,这些项目的目的就是利用Redis创建非常好的后端工具,以满足各种队列需求。例如,Celery有一个后台就是使用Redis作为broker,你可以从这里去查看。
(4)排行榜/计数器
Redis在内存中对数字进行递增或递减的操作实现的非常好。集合(Set)和有序集合(Sorted Set)也使得我们在执行这些操作的时候变的非常简单,Redis只是正好提供了这两种数据结构。所以,我们要从排序集合中获取到排名最靠前的10个用户–我们称之为“user_scores”,我们只需要像下面一样执行即可:
当然,这是假定你是根据你用户的分数做递增的排序。如果你想返回用户及用户的分数,你需要这样执行:
ZRANGE user_scores 0 10 WITHSCORES
Agora Games就是一个很好的例子,用Ruby实现的,它的排行榜就是使用Redis来存储数据的,你可以在这里看到。
(5)发布/订阅
最后(但肯定不是最不重要的)是Redis的发布/订阅功能。发布/订阅的使用场景确实非常多。我已看见人们在社交网络连接中使用,还可作为基于发布/订阅的脚本触发器,甚至用Redis的发布/订阅功能来建立聊天系统!
用一句话概括持久化,就是把数据(内存中的对象)保存到可以永久保存的存储设备中。
Redis提供了两种持久化方式:
RDB
持久化方式:能够在指定的时间间隔对你的数据库进行快照存储到硬盘上。
AOF
持久化方式:以日志的形式记录每次对服务器写的操作,当服务器重启的时候会重新执行这些命令来恢复原始的数据状态。但当Redis进程或停电等问题可能会造成几分钟的写入丢失。
一般来说,如果想达到足以媲美PostgreSQL
的数据安全性,你应该同时使用两种持久化功能。如果你非常关心你的数据,但仍然可以承受数分钟之内的数据丢失,那么你可以只使用RDB持久化。
许多用户都只使用AOF持久化,但并不推荐这种方式:因为定时生成RDB快照(shapshot)非常便于进行数据库备份,并且RDB恢复数据集的速度页要比AOF恢复的速度要快,除此之外,使用RDB还可以避免之前提到的AOF程序的bug。
**定义:**缓存穿透是指查询一个一定不存在的数据,由于缓存是不命中,将去查询数据库,但是数据库也无此记录,并且处于容错考虑,我们没有将这次查询的null写入缓存,这将导致这个不存在的数据每次请求都要到存储层去查询,失去了缓存的意义。在流量大时,可能DB就挂掉了,要是有人利用不存在的key频繁攻击我们的应用,造成安全问题。
解决办法:
**定义:**对于一些设置了过期时间的key,如果这些key可能会在某些时间点被超高并发地访问,是一种非常“热点”的数据。这个时候,需要考虑一个问题:如果这个key在大量请求同时进来前正好失效,那么所有对这个key的数据查询都落到db,我们称为缓存击穿。
和缓存雪崩的区别:
**定义:**当缓存服务器重启或者大量缓存集中在某一个时间段失效时,这样在失效的情况下,会给DB造成很大的压力。具体来说,就是大量的key集体发生了缓存击穿,就是造成了缓存雪崩。
解决方法:
首先我们知道要设置Redis 的最大内存大小只需要在配置文件redis.conf 中配置一行 maxmemory xxx 即可,或者我们通过 config set 命令在运行时动态配置 Redis 的内存大小。
那么当Redis的内存不够时,我们需要通过某种策略来淘汰数据。在配置文件中使用maxmemory-policy
来配置策略。
策略的值如下:
这是 Redis 的默认策略
;olatile-lru, volatile-random, volatile-ttl 这几种情况在 Redis 中没有带有过期 Key 的时候跟 noeviction 策略是一样的。
策略执行的过程
近似的LRU算法
Redis 中的LRU算法不是精确的LRU算法,而是采样LRU。在Redis 3.x中做过优化,效率得到了很大提升。原文说不使用精准LRU是因为会耗费很多内存。
通过 redis> set name aaa ex 100
命令我们在redis中设置一个key为name,值为aaa的数据。
Redis对于过期键有三种清除策略:
被动删除: 只有key被操作时(如GET),REDIS才会被动检查该key是否过期,如果过期则删除之并且返回NIL。
这种策略对CPU友好,因为它只有在不得不的情况下猜会进行,不会浪费CPU资源。但对内存不友好,因为如果存在大量过期键又很少被访问,会造成大量内存空间浪费。
主动删除: 在Redis 中,常规操作由redis.c/serverCron实现。会在服务i其开启期间一直保持周期运行。在redis2.6 版本中,程序规定serverCron每秒运行10次。这种主动删除策略弥补了被动删除策略在内存上的不友好。因此,Redis会周期性的随机测试一批设置了过期时间的key并进行处理。测试到的已过期的key将被删除。典型的方式为,Redis每秒做10次如下的步骤:
并且当Redis运行在主从模式时,只有主节点猜会执行上述两种过期策略,然后把删除操作del key
同步到从节点。