1简介
Memcache是一个高性能的 分布式的内存对象缓存系统,通过在 内存里维护一个统一的巨大的 hash表,它能够用来存储各种 格式的数据,包括 图像、 视频、 文件以及 数据库检索的结果等。简单的说就是将数据调用到内存中,然后从内存中读取,从而大大提高读取速度。
Memcache是danga的一个项目,最早是LiveJournal 服务的,最初为了加速 LiveJournal 访问速度而开发的,后来被很多大型的网站采用。
Memcached是以守护程序方式运行于一个或多个 服务器中,随时会接收 客户端的 连接和操作。
2特性和限制
在 Memcached中可以保存的item数据量是没有限制的,只要内存足够 。
Memcached单进程最大使用内存为2G,要使用更多内存,可以分多个端口开启多个Memcached进程
最大30天的数据过期时间,设置为永久的也会在这个时间过期,常量REALTIME_MAXDELTA
60*60*24*30控制
最大键长为250字节,大于该长度无法存储,常量KEY_MAX_LENGTH 250控制
单个item最大数据是1MB,超过1MB数据不予存储,常量POWER_BLOCK 1048576进行控制,
它是默认的slab大小
最大同时连接数是200,通过 conn_init()中的freetotal进行控制,最大软连接数是1024,通过
settings.maxconns=1024 进行控制
跟空间占用相关的参数:settings.factor=1.25, settings.chunk_size=48, 影响slab的数据占用和步进方式
memcached是一种无阻塞的socket通信方式服务,基于libevent库,由于无阻塞通信,对内存读写速度非常之快。
memcached分服务器端和客户端,可以配置多个服务器端和客户端,应用于分布式的服务非常广泛。
memcached作为小规模的数据分布式平台是十分有效果的。
memcached是键值一一对应,key默认最大不能超过128个字 节,value默认大小是1M,也就是一个slabs,如果要存2M的值(连续的),不能用两个slabs,因为两个slabs不是连续的,无法在内存中 存储,故需要修改slabs的大小,多个key和value进行存储时,即使这个slabs没有利用完,那么也不会存放别的数据。
目前memcached支持C/C++、Perl、PHP、Python、Ruby、Java、C#、Postgres、Chicken Scheme、Lua、MySQL和Protocol等语言客户端。
3接口介绍
Memcache 客户端包含两组接口,一组是 面向过程的接口,一组是 面向对象的接口,具体可以参考PHP手册
MemCache“LXXV. Memcache Functions” 这章。
Memcache 面向对象的常用接口包括:
Memcache::connect -- 打开一个到Memcache的 连接
Memcache::pconnect -- 打开一个到Memcache的 长连接
Memcache::close -- 关闭一个Memcache的 连接
Memcache::set -- 保存数据到Memcache 服务器上
Memcache::get -- 提取一个保存在Memcache 服务器上的数据
Memcache::replace -- 替换一个已经存在Memcache 服务器上的项目(功能类似Memcache::set)
Memcache::delete -- 从Memcache 服务器上删除一个保存的项目
Memcache::flush -- 刷新所有Memcache 服务器上保存的项目(类似于删除所有的保存的项目)
Memcache::getStats -- 获取当前Memcache 服务器运行的状态
协议分析
如果你不喜欢 php_memcache.dll 扩展或者 服务器目前不支持这个扩展,那么就可以 考虑自己构建.
Memcahe的 客户端,要先了解Memcache协议的交互,这样才能开发自己的客户端,这里简单的分析一下Memcache的协议。(更详细的协议 内容请在Memcache 服务器端的 源码的 doc/protocol.txt 文件中)
Memcache既支持TCP协议,也支持UDP协议,不过我们这里是以TCP协议的协议作为主要 考虑对象,想了解UDP协议的过程,请参考 doc/protocol.txt 文件。
[ 错误 指令]
Memcache的协议的错误部分主要是三个错误提示 指令:
普通错误信息,比如 指令错误之类的
ERROR
客户端错误
CLIENT_ERROR <错误信息>
服务器端错误
SERVER_ERROR <错误信息>
[ 数据保存 指令]
数据保存是基本的功能,就是 客户端通过命令把数据 返回过来, 服务器端接收后进行处理。
指令格式:
<命令> <键> <标记> <有效期> <数据长度>
<命令> - command name
主要是三个储存数据的三个命令, set, add, replace
set 命令是保存一个叫做 key的数据到 服务器上
add 命令是添加一个数据到 服务器,但是服务器必须保证这个key是不存在的,能够保证数据不会被覆盖
replace 命令是 替换一个已经存在的数据,如果数据不存在,就是类似set功能
<键> - key
就是保存在 服务器上唯一的一个表示符,必须是跟其他的 key不冲突,否则会覆盖掉原来的数据,这个key是为了能够准确的存取一个数据项目
<标记> - flag
标记是一个16位的无符号整形数据,用来设置 服务器端跟 客户端一些交互的操作
<有效期> - expiration time
是数据在 服务器上的有效期限,如果是0,则数据永远有效,单位是秒,Memcache服务器端会把一个数据的有效期设置为当前Unix时间+设置的有效时间
<数据长度> - bytes
数据的 长度,block data 块数据的长度,一般在这个个长度 结束以后下一行跟着block data数据 内容,发送完数据以后, 客户端一般等待 服务器端的 返回,服务器端的返回:
数据保存成功
STORED
数据保存失败,一般是因为 服务器端这个数据 key已经存在了
NOT_STORED
[ 数据 提取命令]
从服务器端 提取数据主要是使用get 指令, 格式是:
get <键>*
<键>* - key
key是是一个不为空的字符串组合,发送这个 指令以后,等待 服务器的 返回。如果 服务器端没有任何数据,则是 返回:
END
证明没有不存在这个 key,没有任何数据,如果存在数据,则 返回指定 格式:
VALUE <键> <标记> <数据长度>
<数据块>
返回的数据是以VALUE 开始的,后面跟着 key和flags,以及数据 长度,第二行跟着 数据块。
<键> -key
是发送过来 指令的key 内容
<标记> - flags
是调用set 指令保存数据 时候的flags标记
<数据 长度> - bytes
是保存数据 时候定位的长度
<数据块> - data block
数据 长度下一行就是 提取的数据块 内容
[ 数据删除 指令]
数据删除 指令也是比较简单的,使用delete指令, 格式是:
delete <键> <超时时间>
<键> - key
key是你希望在 服务器上删除数据的 key键
<超时时间> - timeout
按照秒为单位,这个是个可选项,如果你没有指定这个值,那么 服务器上 key数据将马上被删除,如果设置了这个值,那么数据将在超时时间后把数据清除,该项 缺省值是0,表示永不过期。
删除数据后, 服务器端会 返回:
DELETED
删除数据成功
NOT_FOUND
这个 key没有在 服务器上找到
如果要删除所有 服务器上的数据,可以使用flush_all 指令, 格式:
flush_all
这个 指令执行后, 服务器上所有缓存的数据都被删除,并且 返回:
OK
这个 指令一般不要轻易使,除非你确实想把所有数据都干掉,删除完以后可以无法恢复的。
[其他 指令]
如果想了解当前Memcache 服务器的状态和版本等信息,可以使用状态查询 指令和版本查询指令。
如果想了解当前所有Memcache 服务器运行的状态信息,可以使用stats 指令, 格式
stats
服务器将 返回每行按照 STAT 开始的状态信息,包括20行,20项左右的信息,包括 守护进程的pid、版本、保存的项目 数量、内存占用、最大内存限制等等信息。
如果只是想获取部分项目的信息,可以指定 参数, 格式:
stats <参数>
这个 指令将只 返回指定 参数的项目状态信息。
如果只是想单独了解当前版本信息,可以使用version 指令, 格式:
version
将 返回以 VERSION 开头的版本信息
如果想 结束当前 连接,使用quit 指令,格式:
quit
将断开当前 连接
另外还有其他 指令,包括incr, decr 等,我也不太了解作用,就不做介绍了,如果感兴趣,可以自己去研究。
在中型网站中的应用
使用Memcache的网站一般流量都是比较大的,为了缓解 数据库的压力,让Memcache作为一个缓存区域,把部分信息保存在内存中,在前端能够迅速的进行存取。那么一般的焦点就是集中在如何分担 数据库压力和进行分布式,毕竟单台Memcache的内存容量的有限的。我这里简单提出我的个人看法,未经实践,权当参考。
[ 分布式应用]
Memcache本来支持分布式,我们 客户端稍加改造,更好的支持。我们的 key可以适当进行有规律的封装,比如以 user为主的网站来说,每个用户都有 UserID,那么可以按照固定的ID来进行 提取和存取,比如1开头的用户保存在第一台Memcache 服务器上,以2开头的用户的数据保存在第二台Memcache服务器上,存取数据都先按照User ID来进行相应的转换和存取。
但是这个有缺点,就是需要对User ID进行判断,如果业务不一致,或者其他类型的应用,可能不是那么合适,那么可以根据自己的实际 业务来进行 考虑,或者去想更合适的方法。
[ 减少 数据库压力]
这个算是比较重要的,所有的数据基本上都是保存在 数据库当中的,每次 频繁的存取数据库,导致数据库性能急剧下降,无法同时服务更多的用户,比如MySQL,特别频繁的锁表,那么让Memcache来分担数据库的压力吧。我们需要一种改动比较小,并且能够不会大规模改变前端的方式来进行改变目前的架构。
一个用PHP编写的可视化的MemCached管理系统
MemAdmin是一款可视化的Memcached管理与监控工具,使用PHP开发,体积小,操作简单。
主要功能:
服务器 参数监控:STATS、SETTINGS、ITEMS、SLABS、SIZES实时刷新;
服务器性能监控:GET、DELETE、INCR、DECR、CAS等常用操作命中率实时监控;
支持数据遍历,方便对 存储 内容进行监视;
支持条件查询,筛选出满足条件的KEY或VALUE;
数组、JSON等序列化字符反序列显示;
兼容memcache协议的其他服务,如Tokyo Tyrant (遍历功能除外);
支持 服务器 连接池,多 服务器管理切换方便简洁。