《高性能Mysql》- 操作系统和硬件优化

Mysql服务器性能受制于整个系统最薄弱的环节,承载它的操作系统和硬件往往是制约因素。根据不同的应用类型,计算密集型应用往往受限于CPU;IO密集型应用则容易受限于IO;可以通过CPU利用率判断应用是否为CPU密集型。

一、CPU之于性能

市面上的CPU通常是Intel或者AMD芯片的x86架构,64位架构;确保在64位硬件上采用64位操作系统,32位操作系统意味着单个进程不能寻址4G以上内存。比如4核CPU,并非4个核心有相同的运算能力,当只使用一个核心时,运行速度更快。

1.1 更快的CPU vs更多CPU

更快的CPU意味着低延迟,单个查询只能使用一个CPU;CPU主频提升得益于直接内存连接,PCIe闪存,操作系统改进,如对超线程对感知:知道什么时候执行单元是闲置的。

多核CPU意味着吞吐量的提升,可以同时运行多个查询,或者用额外CPU为后台任务服务;每个服务器有多个socket,每个socket可以有一个多核CPU,每个核心有多个硬件线程。多核CPU对复制用处不大,主库上的并发任务传递到备库就被简化为串行。多核CPU适用于OLTP联机事务处理,如web服务从多个连接发起请求,适合多个CPU运行。

查询响应时间分为执行时间和等待时间,等待包括在运行队列等待,锁等待,磁盘/网络等待;如果是等待锁则需要更快的CPU,对于运行队列等待,更快或更多的CPU都有帮助。

二、IO之于性能

2.1 平衡内存与磁盘资源

计算机的存储金字塔:cpu寄存器 - cpu缓存 - 内存 - 磁盘,越靠近顶端则越小、越快也越贵。cpu寄存器和cpu缓存对程序猿不可见;如果比喻成带抽屉的桌子,桌面是内存,存取更加方便;抽屉是磁盘。通常把热点数据放在内存;如何预测热点数据,也就是预读,基于空间时间的局部性原理,最近被使用的数据可能被再次使用,相邻数据可能再次使用。

随机IO与顺序IO

磁盘每秒可以执行100个随机IO,可以执行50M的顺序IO;如果每行100个字节,那么每秒钟随机IO可以读取10K,顺序IO可以读取50M,是随机IO的5000倍。内存每秒可以执行250000个随机IO,可以执行5000000个顺序IO,是随机IO的20倍;内存随机IO速度是磁盘的2500倍,顺序IO是磁盘的10倍。随机IO虽然只为查找一行数据,但需要读取一整页数据;顺序读则相当于遍历有序链表。磁盘的随机IO之所以慢是因为磁盘寻道;增加内存是解决随机IO的最好方法。

工作集

工作集是指应用程序确实要用到的数据,比如最近一小时内的工作集可能包括数据库50%的数据页面。只需要把工作集加载到内存。

硬盘

innoDB能很好的扩展到多个磁盘驱动器。选择硬盘时需要考虑:1)传输速度,取决于主轴转速和数据存储在磁盘表面上的密度,和主机系统接口的限制;2)访问时间,制约随机查找速度;3)物理尺寸,磁盘越小,移动读取磁头所需时间越短;

FlashCache

Facebook开源的一种内存、闪存、磁盘的组合方式;在内存和磁盘间加入中间层:第一层是InnoDB缓冲池;第二层是FlashCache;第三层是磁盘。基于磁盘、闪存创建块设备,闪存作为读写的高速智能缓存,弥补内存的不足;支持分区和创建文件系统。适用于IO密集型,且工作集太大,用内存优化不划算的应用;

2.2 更多关于硬盘

2.2.1 固态存储SSD

使用非易失性闪存芯片而不是磁性盘片,全称非易失性随机存取存储器;没有移动部件。解决随机读写性能差的问题;提供更好的并发支持。

闪存能够快速完成多次小单位读取,从而提高读操作的效率;但写入更加复杂,改写cell前需要擦除,擦除以512K的块为单位,操作缓慢通常需要几个毫秒,块有擦除次数限制。因此,SSD必须能搬迁页面并执行垃圾回收和磨损平衡;数据迁移中的额外写操作称为写放大。垃圾处理用来回收脏块。空闲块写入只需数百微秒,但剩余空间不足时,需要等待擦除导致速度变慢。闪存分为:1)单层单元SLC:企业级,每个单元存储一个bit;更贵更快,擦写寿命高达10万写周期,可持续使用20年。缺点是存储密度低;2)多层单元MLC:消费级,每个单元存储2-3个bit,存储密度更高;成本/速度/耐擦写都下降。

固态存储分为:1)固态硬盘SSD:提供兼容性功能,实现SATA串行高级技术附件,可直接插入现有插槽;提供写缓存来缓冲写入。2)PCIe卡:没有尝试应用SATA模拟硬盘驱动器,该接口不能完全发挥闪存的性能。PCIe更适用高性能需求。缺点是贵。使用操作系统驱动程序,把存储设备作为块设备输出。

2.2.2 RAID磁盘冗余阵列

RAID把小磁盘组合起来,包括传统磁盘和固态存储SSD,提供分布负载机制,由此达到提供冗余、扩展容量的目的。此外,RAID控制器提供带电池保护的写缓存,即使断电缓存中的数据也不会丢失。虽然RAID提供冗余,但仍需要监控磁盘失效及缓存电池:在磁盘数量多的时候,推荐设置热备盘,在有磁盘损害时启用;缓存电池失效时应该禁用缓存。

RAID级别包括:1)RAID 0,没有冗余,适用于备库;0表示损坏概率高于单块磁盘;2)RAID 1: 适用于只有两块硬盘又想做冗余的低端服务器;3)RAID 5: 如果两块磁盘不满足存储容量,则考虑RAID 5;通过分布奇偶校验把数据分散在多个磁盘,任何一个盘的数据失效,都可能在奇偶校验块恢复。4)RAID 10: 由分片镜像组成;相比RAID 5来说重建更加简单;5)RAID 50:条带化的RAID 5组成,适合用作数据仓库或庞大的OLTP系统。

你可能感兴趣的:(《高性能Mysql》- 操作系统和硬件优化)