目录
一、Memcached是什么
二、Memcached的特征
三、Memcached的设计哲学
四、Memcached的安装与配置
五、安装Memcache的PHP扩展,使用php支持memcached功能
六、使用libmemcached的客户端工具
七、Nginx整合memcached,为nginx提供静态页面缓存功能
Memcached是什么?
memcached是以LiveJournal旗下Danga Interactive 公司的Brad Fitzpatric 为首开发的一款软件。现在
已成为mixi、hatena、Facebook、Vox、LiveJournal等众多服务中提高Web应用扩展性的重要因素。
Memcached是一款开源、高性能、分布式内存对象缓存系统,可应用各种需要缓存的场景,其主要目的是通过降低对Database的访问来加速web应用程序。许多Web应用都将数据保存到RDBMS中,应用服务器从中读取数据并在浏览器中显示。 但随着数据量的增大、访问的集中,就会出现RDBMS的负担加重、数据库响应恶化、 网站显示延迟等重大影响。这时就该memcached大显身手了。memcached一般的使用目的是,通过缓存数据库查询的结果,减少数据库访问次数,以提高动态Web应用的速度、 提高可扩展性。它是一个基于内存的“键值对”存储,用于存储数据库调用、API调用或页面引用结果的直接数据,如字符串、对象等。
其工作流程图为:
二、memcached的特征
memcached作为高速运行的分布式内存缓存服务器,具有以下的特点。
协议简单
基于libevent的事件处理
内置内存存储方式
memcached不互相通信的分布式
1、协议简单
memcached的服务器客户端通信并不使用复杂的XML等格式, 而使用简单的基于文本行的协议。因此,通过telnet 也能在memcached上保存数据、取得数据。
2、基于libevent的事件处理
libevent是个程序库,它将Linux的epoll、BSD类操作系统的kqueue等事件处理功能 封装成统一的接口。即使对服务器的连接数增加,也能发挥O(1)的性能。 memcached使用这个libevent库,因此能在Linux、BSD、Solaris等操作系统上发挥其高性能。
注:o(1)特性使得10000个连接和1个连接的查询速度是一样的。
3、内置内存存储方式
为了提高性能,memcached中保存的数据都存储在memcached内置的内存存储空间中。 由于数据仅存在于内存中,因此重启memcached、重启操作系统会导致全部数据消失。 另外,内容容量达到指定值之后,就基于LRU(Least Recently Used)算法自动删除不使用的缓存。 memcached本身是为缓存而设计的服务器,因此并没有过多考虑数据的永久性问题。
memcached默认情况下采用了名为Slab Allocator的机制分配、管理内存。 在该机制出现以前,内存的分配是通过对所有记录简单地进行malloc和free来进行的。 但是,这种方式会导致内存碎片,加重操作系统内存管理器的负担,最坏的情况下, 会导致操作系统比memcached进程本身还慢。Slab Allocator就是为解决该问题而诞生的。
Slab Allocator的基本原理是按照预先规定的大小, 将分配的内存分割成各种尺寸的块(chunk), 并把尺寸相同的块分成组(chunk的集合,在图中指的是slab class)。各个尺寸的chunk大小是通过其增长因子(growth factor)来决定的,默认增长因子为1.25。下一个尺寸的chunk大小=之前一个chunk大小*增长因子。如下图所示:
而且,slab allocator还有重复使用已分配的内存的目的。 也就是说,分配到的内存不会释放,而是重复利用。不过由于slab Allocator分配的是特定长度的chunk,因此,当缓存的数据没有chunk长度大时,仍然会造成空间浪费。
4、memcached不互相通信的分布式
memcached尽管是“分布式”缓存服务器,但服务器端并没有分布式功能。 各个memcached不会互相通信以共享信息。那么,怎样进行分布式呢? 这完全取决于客户端的实现。
memcached的分布式可以由2种算法来实现:
1、余数分布式算法(或者取模分布式算法)
2、Consistent Hashing算法(一致性hash算法)
余数分布式算法
余数分布式算法是根据键做hash计算,将计算的结果除以服务器台数,并取最后的余数,这样余数为几,就将数据存储在哪台服务器上。
如有3台服务器。需要将键"hello",'nice','hi'存储在memecache上,分别对这些键做has计算,并将计算的结果处于服务器台数(这里为3),然后取其余数,假设这里余数分别为0、1、2。那么余数为0则将会将键"hello"存储在第一台服务器上,余数为1表示将键"nice"存储在第二台服务器上,余数为2表示将键"hi"存储在第三台服务器上。这就是余数分布式算法。
余数分布式算法的缺点在于,当新增或减少一台服务器上,其余数会发生改变,当程序需要获取数据时,这样会无法获取其之前相同服务器上的数据,导致缓存丢失。这种缓存丢失可能是全局的,因此,影响范围比较广,所以,此算法一般不建议采用。
Consistent Hashing的简单说明
首先求出memcached服务器(节点)的哈希值,并将其配置到0~232的圆(continuum)(图中白色的圆环)上。然后用同样的方法求出存储数据的键的哈希值(图中粉红色的圆就是键的hash值),并映射到圆上。然后从数据映射到的位置开始顺时针查找,将数据保存到找到的第一个服务器上。如果超过232仍然找不到服务器,就会保存到第一台memcached服务器上。如下图所示:
这种算法和上述算法相比,影响缓冲的命中率要小一些。不管是增加一个memcached节点,还是减少一个节点,它只会影响其该节点所在的continuum附加逆时针的少许数据。
三、Memcached的设计哲学
Memcached是一款开发工具,它既不是一个代码加速器,也不是数据库中间件。其设计哲学思想主要反映在如下方面:
1. 简单key/value存储:服务器不关心数据本身的意义及结构,只要是可序列化数据即可。存储项由“键、过期时间、可选的标志及数据”四个部分组成;
2. 功能的实现一半依赖于客户端,一半基于服务器端:客户负责发送存储项至服务器端、从服务端获取数据以及无法连接至服务器时采用相应的动作;服务端负责接收、存储数据,并负责数据项的超时过期;
3. 各服务器间彼此无视:不在服务器间进行数据同步;
4. O(1)的执行效率
5. 清理超期数据:默认情况下,Memcached是一个LRU缓存,同时,它按事先预订的时长清理超期数据;但事实上,memcached不会删除任何已缓存数据,只是在其过期之后不再为客户所见;而且,memcached也不会真正按期限清理缓存,而仅是当get命令到达时检查其时长;
四、memcached的安装与配置
Memcached提供了为数不多的几个命令来完成与服务器端的交互,这些命令基于memcached的协议实现。
存储类命令:set, add, replace, append, prepend
获取数据类命令:get, delete, incr/decr
统计类命令:stats, stats items, stats slabs, stats sizes
清理命令: flush_all
1、安装libevent
memcached依赖于libevent API,因此要事先安装之,项目主页:http://libevent.org/,读者可自行选择需要的版本下载。本文采用的是目前最新版本的源码包libevent-2.0.16-stable.tar.gz。安装过程:
# tar xf libevent-2.0.22-stable.tar.gz
# cd libevent-2.0.22-stable
# ./configure --prefix=/usr/local/libevent
# make && make install
# echo "/usr/local/libevent/lib" > /etc/ld.so.conf.d/libevent.conf
# ldconfig
2、安装配置memcached
(1)、安装memcached
# tar xf memcached-1.4.22.tar.gz
# cd memcached-1.4.22
# ./configure --prefix=/usr/local/memcached --with-libevent=/usr/local/libevent(libevent的安装目录)
# make && make install
(2)、memcached SysV的startup脚本代码如下所示,将其建立为/etc/init.d/memcached文件:
#!/bin/bash
#
# Init file for memcached
#
# chkconfig: - 86 14
# description: Distributed memory caching daemon
#
# processname: memcached
# config: /etc/sysconfig/memcached
. /etc/rc.d/init.d/functions
## Default variables
PORT="11211"
USER="nobody"
MAXCONN="1024"
CACHESIZE="64"
RETVAL=0
prog="/usr/local/memcached/bin/memcached"
desc="Distributed memory caching"
lockfile="/var/lock/subsys/memcached"
start() {
echo -n $"Starting $desc (memcached): "
daemon $prog -d -p $PORT -u $USER -c $MAXCONN -m $CACHESIZE
RETVAL=$?
echo
[ $RETVAL -eq 0 ] && touch $lockfile
return $RETVAL
}
stop() {
echo -n $"Shutting down $desc (memcached): "
killproc $prog
RETVAL=$?
echo
[ $RETVAL -eq 0 ] && rm -f $lockfile
return $RETVAL
}
restart() {
stop
start
}
reload() {
echo -n $"Reloading $desc ($prog): "
killproc $prog -HUP
RETVAL=$?
echo
return $RETVAL
}
case "$1" in
start)
start
;;
stop)
stop
;;
restart)
restart
;;
condrestart)
[ -e $lockfile ] && restart
RETVAL=$?
;;
reload)
reload
;;
status)
status $prog
RETVAL=$?
;;
*)
echo $"Usage: $0 {start|stop|restart|condrestart|status}"
RETVAL=1
esac
exit $RETVAL
使用如下命令配置memcached成为系统服务:
# chmod +x /etc/init.d/memcached
# chkconfig --add memcached
# service memcached start
查看memcached进程是否已经启动了。如:
# netstat -tnlp | grep 11211
tcp 0 0 0.0.0.0:11211 0.0.0.0:* LISTEN 3068/memcached
tcp 0 0 :::11211 :::* LISTEN 3068/memcached
(3)、使用telnet命令测试memcached的使用
Memcached提供一组基本命令用于基于命令行调用其服务或查看服务器状态等。
查看memcached的内部状态信息
首先是要telnet连接到memcached,然后再输入stats可以获取其memcached各种信息:
# telnet 127.0.0.1 11211
stats
STAT pid 14381
STAT uptime 307
STAT time 1427814867
STAT version 1.4.22
STAT libevent 2.0.22-stable
STAT pointer_size 64
STAT rusage_user 0.000000
STAT rusage_system 0.002999
STAT curr_connections 10
STAT total_connections 11
STAT connection_structures 11
STAT reserved_fds 20
STAT cmd_get 0
STAT cmd_set 0
STAT cmd_flush 0
STAT cmd_touch 0
STAT get_hits 0
STAT get_misses 0
STAT delete_misses 0
STAT delete_hits 0
STAT incr_misses 0
STAT incr_hits 0
STAT decr_misses 0
STAT decr_hits 0
STAT cas_misses 0
STAT cas_hits 0
STAT cas_badval 0
STAT touch_hits 0
STAT touch_misses 0
STAT auth_cmds 0
STAT auth_errors 0
STAT bytes_read 7
STAT bytes_written 0
STAT limit_maxbytes 67108864
STAT accepting_conns 1
STAT listen_disabled_num 0
STAT threads 4
STAT conn_yields 0
STAT hash_power_level 16
STAT hash_bytes 524288
STAT hash_is_expanding 0
STAT malloc_fails 0
STAT bytes 0
STAT curr_items 0
STAT total_items 0
STAT expired_unfetched 0
STAT evicted_unfetched 0
STAT evictions 0
STAT reclaimed 0
STAT crawler_reclaimed 0
STAT lrutail_reflocked 0
END
输入stats slabs或stats items可以获取其缓存相关信息,如:
stats slabs
STAT active_slabs 0
STAT total_malloced 0
END
stats items
END
测试,使用add命令添加数据
add命令语法格式:
add keyname flag timeout datasize
如:
add mykey 0 10 12
Hello world!
使用get命令获取指定key所对应的数据
get命令语法格式为:
get keyname
如:get mykey
VALUE mykey 0 12
Hello world!
END
(4)、memcached的常用选项说明
-l <ip_addr>:指定进程监听的地址;
-d: 以守护进程方式在后台运行;
-u <username>:以指定的用户身份运行memcached进程;
-m <num>:用于缓存数据的最大内存空间,单位为MB,默认为64MB;
-c <num>:最大支持的并发连接数,默认为1024;
-p <num>: 指定监听的TCP端口,默认为11211;
-U <num>:指定监听的UDP端口,默认为11211,0表示关闭UDP端口;
-t <threads>:用于处理入站请求的最大线程数,仅在memcached编译时开启了支持线程才有效;
-f <num>:设定Slab Allocator定义预先分配内存空间大小固定的块时使用的增长因子;
-M:当内存空间不够使用时返回错误信息,而不是按LRU算法利用空间;
-n: 指定最小的slab chunk大小;单位是字节;
-S: 启用sasl进行用户认证;
-s:监听的本地套接字
注意:配到这里,memcached服务器已经搭建好了,下面还需配置php,让其支持memcached功能。上面的部分和下面的部分不是在同一个服务器上进行的。
(在另一台服务器上的配置)
五、安装Memcache的PHP扩展,使用php支持memcached功能
默认情况下。php从数据库获得数据并不会自动缓存到memcache中,需要程序员在开发时,自行调用memcache api,这样才使得memcache功能生效。要想让php从数据库获取到的数据缓存到memcache中,需要安装php的memcache扩展。这样当php需要使用数据时,首先从memcache中查找,如果在memcache中找不到,然后再去数据库查询,并将查询的结果缓存在memcache中,然后在返回给应用程序。
对于php的安装这里不再详述了。(我这台服务器上已经安装了lnmp)
①安装PHP的memcache扩展
php的memcache扩展下载地址:http://pecl.php.net/package/memcache
# tar xf memcache-2.2.4.tgz
# cd memcache-2.2.4
# /usr/local/php/bin/phpize
# ./configure --with-php-config=/usr/local/php/bin/php-config --enable-memcache
# make && make install
上述安装完后会有类似以下的提示:
Installing shared extensions: /usr/local/php/lib/php/extensions/no-debug-non-zts-20131226/
②编辑vim /etc/php.d/memcache.ini,添加如下行信息:
extension=/usr/local/php/lib/php/extensions/no-debug-non-zts-20131226/memcache.so
而后对memcached功能进行测试,在网站根目录中建立测试页面test.php,添加如下内容:
# vim /usr/html/test.php
<?php
$mem = new Memcache;
$mem->connect("192.168.108.199", 11211) or die("Could not connect"); ##这里我的memcached服务器所在地址为192.168.108.199
$version = $mem->getVersion();
echo "Server's version: ".$version."<br/>\n";
$mem->set('testkey', 'Hello World', 0, 600) or die("Failed to save data at the memcached server");
echo "Store data in the cache (data will expire in 600 seconds)<br/>\n";
$get_result = $mem->get('testkey');
echo "$get_result is from memcached server.";
?>
测试,在浏览器上面输入http://192.168.108.230/test.php,如果显示如下信息,则表明memcache已经能够正常工作。
六、使用libmemcached的客户端工具
访问memcached的传统方法是使用基于perl语言开发的Cache::memcached模块,这个模块在大多数perl代码中都能良好的工作,但也有着众所周知的性能方面的问题。libMemcached则是基于C语言开发的开源的C/C++代码访问memcached的库文件,同时,它还提供了数个可以远程使用的memcached管理工具,如memcat, memping,memstat,memslap等。
1) 编译安装libmemcached
# tar xf libmemcached-1.0.2.tar.gz
# cd libmemcached-1.0.2
# ./configure
# make && make install
# ldconfig
2) 客户端工具
# memcat --servers=127.0.0.1:11211 mykey
# memping
# memslap
# memstat
七、Nginx整合memcached,为nginx提供静态页面缓存功能
虽然nginx自身可以提供缓存,不过由于该数据是缓存在磁盘上的,因此,性能赶不上memcached缓存性能。因此,我们也应当为nginx支持memecached功能,使其支持缓存静态页面功能。
server {
listen 80;
server_name www.xsl.com;
#charset koi8-r;
#access_log logs/host.access.log main;
location / {
set $memcached_key $uri;
##$memcached_key为键名,$uri为传递给memcached服务器的键
memcached_pass 192.168.108.199:11211; memcached服务器的地址和端口
default_type text/html;只缓存html格式的数据
error_page 404 @fallback;
##如果memcached上没有相应的数据,将会在后端应用程序服务器上寻找。
}
location @fallback {
proxy_pass http://127.0.0.1;
##这里的地址指的是后端应用程序服务器的地址。
}
}
六、Memcached管理与监控工具MemAdmin
MemAdmin是一款可视化的Memcached管理与监控工具,使用PHP开发,体积小,操作简单。
主要功能:
服务器参数监控:STATS、SETTINGS、ITEMS、SLABS、SIZES实时刷新
服务器性能监控:GET、DELETE、INCR、DECR、CAS等常用操作命中率实时监控
支持数据遍历,方便对存储内容进行监视
支持条件查询,筛选出满足条件的KEY或VALUE
数组、JSON等序列化字符反序列显示
兼容memcache协议的其他服务,如Tokyo Tyrant (遍历功能除外)
支持服务器连接池,多服务器管理切换方便简洁
安装MemAdmin
# tar xf memadmin-1.0.12.tar.gz
# mv memadmin /usr/html/
测试访问,在浏览器上输入http://192.168.108.230/memadmin/,如果出现如下画面则表示连接正常:
默认用户名和密码都为"admin",登陆进去之后,显示如下画面:
然后点击"开始管理",出现如下画面:
最后就可以根据需求管理自己的缓存服务器了。