NoSQL误用和常见陷阱分析

NoSQL误用和常见陷阱分析
去哪儿网(Qunar.Com):孙立

被误用的NoSQL:非常容易出现的错误使用方法
循环网络调用:
Memcached的循环和批量GET对比
        Redis的循环和批量GET对比
不压缩大数据:
        外部client压缩(外部压缩,可以减小存储,提升IO性能,并且能够提升网络IO性能),
        NoSQ存储压缩(NoSQL内部压缩,可以减小存储,提升IO性能,不能提升网络IO性能),
        不压缩
跨语言交互:
        序列化,压缩与多语言

NoSQL陷阱:NoSQL是一个新兴的话题,大量的NoSQL产品;也都是新出来的,难免出现各式各样的陷阱;不能避免陷阱,但是得掉进去可以爬出来。
官方数据很美好:
        官方数据很少提到缺点
        官方数据有默认条件:如数据大小
场景错误:
        Redis做持久存储
        单点、复制问题
                数据超过内存性能急剧下降
                扩容问题
        Redis做Cache存储
                性能极高
                数据结构丰富
                可以持久化、避免雪崩现象
细节描述不清楚:
        Ttserver=>兼容memcached协议
                不支持memcached的flag参数
                早期版本increment与memcached不一致
                Stats命令不一致
缓存重建:
        系统重启后,大部分请求到磁盘
        整个系统的性能可能出现抖动
        出现连锁雪崩反应
NoSQL陷阱-32bit问题:
        Ttserver -2GB(32bit):Ttserver在32bit下,到达2g数据大小将出现无法启动的现象
        Mongodb-2.5GB (32 bit)
版本升级问题:
        版本升级带来兼容问题(官方未声明的)
        版本升级可能导致适用场景变化

NoSQL与MySQL:
        不要犹豫该用MySQL还是NoSQL,在你还没有掌握NoSQL前,最好先在小项目尝试下。
选择NoSQL需要考虑
        数据的安全性-是否久经考验,关键业务数据,如订单,支付
        事务性的保障
        数据的重要性(是否可从其他数据恢复过来)
        是否有DBA运维
        未来的业务需求变化
性能之争—差别在哪里?:
        普通磁盘的IOPS(几百个)
        寻道时间、延迟时间
        顺序读和顺序写吞吐上百MB/S
NoSQL在普通磁盘的优化:
        随机写变顺序写
        内存索引-热数据cache
        读写算法优化(场景化)
        网络协议优化
       
NoSQL无处不在:
        不管你信不信,你很可能早已在接触NoSQL了。
为什么要构建自己的NoSQL:
        考察清楚场景和需求
        现有产品满足需求成本高
        针对特殊场景,也许比想象的简单
        可掌控
构建自己的NoSQL:
IP查询:主键已排序的TreeMap<IPEntry,String> (开始IP,结束IP构造成Key)

NoSQL与运维:
        并不像官方宣称的那样,NoSQL无需DBA运维
运维NoSQL并不容易:
        文档齐全吗?
        网上交流多嘛?
        周边工具齐全吗?
        出现意外问题你能搞定吗?出现意外问题,很难求助到人
监控-运维之本:除了操作系统最基本的监控,还应该监控
        IO
        CPU
        延迟
        QPS
        抖动
        数据量
备份很重要:
        避免单点
        定期数据库备份
        开发前做好切换准备(定义好所有要使用方法的接口,以便达到可切换到其他产品来避免风险)

你可能感兴趣的:(NoSQL)