在项目中用到了memcached 做缓存,在实际应用中发现spymemcached 客户端在网络状态比较差是(大概延迟60ms左右)时的读取超时现象比较严重,而且造成应用的内存被消耗尽了(用jmap 查看过,发现memcache 的客户端用到的异步线程类占用很大的内存,估计是由于超时不断创建的缘故)。于是便换了http://www.whalin.com/memcached 这个的客户端。。在更换过程中也出现了一些问题,由于是晚上才发现,害得我晚上因为这事睡都睡不着。。。想好一些调试的办法,然后在明早进行测试。。
问题一:当key 为中文的时候,value取错了。
遇到这个问题时,由于对业务的理解,排除了是键重复的问题。由于是更换客户端后才出现的问题,也首选反应到是客户端的问题,但为了确定下,想在服务器端进行验证,然而在SecureCRT终端中输入不了中文,没办法在memcache服务器端进行测试。。在上线过程中也在测试机上测试,发现测试机上不会出现这个问题。。随后也反应到,中文经常是会涉及编码问题。。然后便查看了两边的操作系统默认编码,发现确实不一样。。线上服务器是默认的LANG=C,测试机是LANG=en_US.UTF-8。然后在测试机上也调成LANG=C,发现问题重现,大喜。。之后更加确定这个问题出现的原因。。然后便是对whalin memcache客户端源码进行研究了。
由于我把key的编码给关了mcc1.setSanitizeKeys(false); 所以对中文不会进行URLEncode编码。。然后查看了Java API 发现了 cmdLine.getBytes()方法的描述是:
关键字在于平台默认编码。。假如当用户输入中文时,是utf8编码,然后在getBytes方法的时候,不是用utf8解码,那就会出现问题了。我也在memcache 客户端中加入了一些调试代码后,再进行测试,发现中文打印的是“??”,每个中文解码由于解码不对称问题都统一转成一样的二进制编码。。。这就是原因所在了。。
解决办法:mcc1.setSanitizeKeys(true).但这种解决办法的缺点是由于对key做了URLEncode编码,在memecache 服务器中测试就比较困难了,因为我们也要首先把key转成URLEncode编码,然后在测试。
问题二:key中间出现空字符串,客户端一直未结束
这个问题是在问题一的测试中突然发现的。。经代码调试发现阻塞在下面的方法中。。
SocketChannel.read(ByteBuffer des)的JavaDoc的描述是
然后我在初始化memcache 这个客户端的时候已经设定了超时时间为3秒pool.setSocketTO(3000),但为什么到了3秒后依然没有报超时错误,这个我也纳闷,暂时也想不到原因。。不知道谁知道不。。
在调试中也发现了出现这个的读取一直阻塞的原因是memcache 命令的组装未检查key中带有特殊字符,下面是源码中key的组装
memcache 服务器端的协议也表明了,key 中不能有制表符和空白字符,并且长度不能超高250个字符。不然服务器端不会响应任何数据。。这个我也确实试了下,发现真没反应。。对memcache 服务器端表示不解。。
解决办法:和问题一的一样mcc1.setSanitizeKeys(true),对key进行URLEncode编码。。
问题三:批量获取接口取值和单个接口取值不一致
这个问题还是上去后不就发现的。。批量接口(getMutil())的应用比较少,所以才迟几天发现。。初始以为是我的程序问题,担心了一场,后来慢慢调试发现一些规律,就是key的Encoder的问题的,在getMutil()里竟然不会去判断key是否要编码,都按照未编码的key进行获取,当然获取不了了,晕死。。源码就不发了,想看的自己可以去下载看下,另外批量获取接口是用NIO来实现的和单个获取的方法不一样,暂时也没去深究了。。。没想到的是用了这么久的客户端,竟然有这样的bug存在。。不过在官网上还是挺给力的,最近才更新了2.5.3版本解决了这个问题。。
解决办法:更换2.5.3版本包。
最近做机型适配经常适配失败,弄了很久都不行,经过一周的摸索,发现有可能是key值的长度问题,网上说最大250,但实验最大是206个字符,而我写的程序使用到的key值是标识符+UA截取前200个字符,原本想用6个标识符的,后来改为5个,但加载时总有加载失败或者获取不了的。后来干脆截取前190个字符串,再加5个标识字符,结果发现所有UA作为KEY值加载时加载成功,获取也全部成功。写了个程序连续加载和读取都成功。明天进行并发测试,如果没有问题,下周就可以重新部署了。
实验证明key值最后不要接近最大长度,不知是否hash码问题,另外部分加载的UA只有几个字符,如F389这样,加上标识符也就十来个字符,但加载也失败,不知是否因为连续加载数据时引起的。