mysql 案例 ~ 常见案例汇总

一 简介:这里汇总了一些mysql常见的问题
二 案例场景
   问题1 mysql设置了默认慢日志记录1S,为何会记录不超过1S的sql语句
   答案 mysql~log_queries_not_using_indexes变量会记录全表扫描的语句,判断优先级高于执行时间,也就是说,你如果打开这个变量,哪怕执行不到1S的查询也会记录到慢日志中,建议关闭
  问题2 程序错误信息 max_allowed_packet 设置过小导致java程序写入失败
  答案 1 max_allowed_packet=32M 写入配置文件并重启
           2 set global max_allowed_packet=33554432

  问题3 mysql崩溃后无法启动,mysql.error中报BUG报错

  分析  此问题最常见于断电后数据库无法启动造成的 

                         1数据页损坏

                         2数据字典损坏

                                在ibdata1中(或以其他方式命名)文件中的数据与在单个表空间/.ibd / .frm文件的数据之间有明显的关联。当该关联丢失或损坏,可能会发生不好的情况。所以这像这样的数据字典的错误出现,最常见的原因是有些文件被手动移动或修改。它通常归结为:“数据字典预计这一文件或表空间在这里,但它不在!”,或“.ibd / .frm文件预计此项目在数据字典中,但它不在! “。再次记住,数据字典存储在ibdata文件中,在大多数环境中,就是MySQL数据目录中的ibdata1。

                         3 日志页损坏

                         4 版本BUG(一些BUG是能起来的,比如AHI造成的,但是另一些是起不来的)

  通用解决办法:

         一 调整恢复级别

         1  调整恢复级别,请注意,恢复前先备份下,因为恢复是有代价的       

         2  设置参数 innodb_force_recovery=N 下面是恢复参数代价 

          1(SRV_FORCE_IGNORE_CORRUPT):忽略检查到的corrupt页。
          2(SRV_FORCE_NO_BACKGROUND):阻止主线程的运行,如主线程需要执行full purge操作,会导致crash。
          3(SRV_FORCE_NO_TRX_UNDO):不执行事务回滚操作。
          4(SRV_FORCE_NO_IBUF_MERGE):不执行插入缓冲的合并操作。
          5(SRV_FORCE_NO_UNDO_LOG_SCAN):不查看重做日志,InnoDB存储引擎会将未提交的事务视为已提交。
          6(SRV_FORCE_NO_LOG_REDO):不执行前滚的操作。
          

          当设置innodb_force_recovery大于0后,可以对标进行select、create、drop操作,但insert、update或者delete,import这类操作是不允许的。 
      3  进行页损坏表定位

           mysql进程停止下

           1 /nnochecksum -f /tol/mysql/data/ibdata1  ibdata1文件修复

           2  #!/bin/bash  ibd文件修复

             for i in $( ls /var/lib/mysql/*/*.ibd)

             do

            innochecksum $i

           done

         3 过滤出拥有页损坏的表

      4 mysqldump导出非页损坏的表 然后导入到新实例

   问题4  mysql所在服务器的linux时间不对 该怎么办

   分析 时间不对要根据分析进行定位 

           时间对mysql数据的影响有几个方面,由于mysql默认采用的是linux系统时间 1 now(),curdate()等时间函数 2 线程连接时间 Time()统计 3 datetime的uptime属性,默认插入时间等

    j解决办法: 1 如果时间小于正确时间,采用ntp更改即可,然后通过show processlst观察更改时间前后的数量统计,是否有连接数断开->如果更改时间,线程的time会加上你更改的时间段,防止超过wait_timeout限制而断开连接

                        2 如果时间大于正确时间,慎重修改,因为有人测试过,修改后,重启mysql服务会产生异常,最好采用MHA切换后再修改

     补充:强烈建议在机器上线时启动NTP服务,校对好,防止出问题

   四  innodb自增长不连续可能是什么情况        

      1 数据库重启造成的ID不连续
         分析 因为自增ID的值是保存在内存中的,如果重启后,最大增值ID会从表中取,而内存中的已经丢失,造成ID增长异常
     2 数据库插入数据唯一键冲突
        分析 当唯一键冲突插入失败时,虽然没有插入数据,但是自增ID还是需要+1的,这样就造成了不连续
    3 事务回滚
        分析 事务回滚也会造成增长ID不连续,因为涉及到复杂的回滚判断机制
    4 批量插入语句
       分析
       insert select load data等批量插入语句,mysql对于自增ID锁的申请并不会一次申请一个,会一次申请的数量慢慢增多,可能造成ID增长异常

   五  因为memory导致的主从同步异常

       现象:主库down机后MHA切换,从库指向新主却发生同步异常

       分析: 通过binlog定位分析出这是一张内存表,所以哪怕备份,内存表也是无法保存的,搭建的新的从库照样会有同步异常

       解决: 1 将内存表转化为innodb引擎 2 主从同步跳过内存表错误 3取消内存表相关业务 

       注意: 1 在row格式下,内存表的操作也是记录在binlog中的 2 memory引擎表是和myisam一样,表级别的锁

   六  insert  into  a  select from  b 究竟加什么锁

        分析 在RR模式下 insert select 会对B进行扫描加锁,包括行锁和gap lock,

                 1 insert into a selec from b  是默认扫描逐行加锁,并非表级锁,效果等同于order id(PK) 

         总结 1 由于在RR模式下要维持一致性读,所以需要加锁

                  2 这条语句属于一个事务

                  3 尽量在业务低峰期进行操作,减少影响

                  4 利用explain进行条件观察,减少锁定行数,条件必须要利用到索引,否则会导致锁定全表

    七  获取最新插入主键值,你需要知道什么     

        目的 当我们向主键是自增型的数据库表中(如 user 表)插入一条记录时,我们期望获取刚刚写入这条记录的id,(因为某些场景下需要获得这个id去做其他的操作),此时我们需要使用SELECT LAST_INSERT_ID()这个语句来获取插入记录后返回的自增id的值;
       注意 1假如你使用一条INSERT语句插入多个行, LAST_INSERT_ID() 只会返回插入的第一行数据时产生的值。
                 初次建立的LAST_INSERT_ID默认值为0,一旦有值插入,则获取自增列的最大值作为默认值
                2 每次session建立的LAST_INSERT_ID()都是独立的,新建立的session
                         1 对于主键,插入的值为获取主键最大值+1
                         2 对于其他,插入的值为初始化值0
                3 对于insert后执行,会获取指定的插入ID,符合我们的预期,请注意,对于每次的所有表插入操作都会进行统计,查询和插入所使用的Connection对象必须是同一个才可以,否则返回值是你所不希望看到的

   八  一个由于触发BUG导致的mysql cash问题

       日志输出  Error: semaphore wait has lasted > 600 seconds , 剩下的就是常见的叙述,您可能遇到一个mysql bug之类的

       现象分析  通过文档和相关资料查询,自适应hash索引可能导致 rw latch争用,导致cash

       解决方案  官方和网上都建议关闭自适应hash索引(set global innodb_adaptive_hash_index=0),但是这样会降低性能,而且此库压力本来就大

       我的方案  因为有MHA,可以高可用.先进行程序优化,减小压力(我觉得是因为压力导致的争用).如果再发生一次MHA切换,我就会考虑关闭自适应hash索引

 九 pt-osc导致的死锁问题

  1 死锁日志表现形式
    事务1 INSERT LOW_PRIORITY IGNORE INTO   
    事务2 REPLACE INTO
  2 分析
    pt-osc的死锁问题造成的核心就是自增锁的问题,
    路线1 pt-osc insert select是分段的,会在新表申请自增锁,然后插入.
    路线2 pt-osc tigger触发动作以replace into方式插入新表
    锁相关
    事务一
    持有:原表记录上的x锁
    等待:new表上的auto-inc lock
   事务二
   持有:new 表上的auto-inc lock
   等待:原 表上的S锁
   描述 程序日志也会打印针对原表的死锁
3  解决方式

    1 尽量切割减少锁定范围 chunk-size
     2 不要在表活动高峰期采用pt-osc工作
4 总结

  1 insert新表的时候,是区间进行对原表查询,在还没有insert完成的情况下,对原表这个区间的数据进行了更新操作,导致死锁的发生
  2 pt-osc其实还是很少发生死锁的

 十  mysql错误日志 sort
  错误日志:
  [ERROR] /usr/local/mysql/bin/mysqld: Sort aborted: Query execution was interrupted
  分析
   sort_buffer_size默认2M,通常用于order by。属于session独享.我的推测是由于某个session会话导致的,通常情况下,是不会报错的
  解决: 定位慢日志,优化慢sql.因为sort_buffer_size是session独享,不建议调节太大

 十一 mysqldump引发的数据覆盖

  需求:因为要同步线上库,又要保留本地测试库,所以mysqldump出一份,结果测试数据库被覆盖失误了

  分析: mysqldump -B 选项 会在sql文本里增加use选项,所以在指定新库然后导入后还是会选择覆盖原库.强烈不建议使用

           -add-drop-database 这里会添加删除想通库的提示,也请不要加入这个选项.为了您的数据安全

  十一 安装mysql相关工具导致的依赖包问题

      分析:安装MHA和xtrabackup工具发生依赖冲突,解决了好久

      解决方式: 1 删除/etc/yum/respond.d的yum源

                       2 下载两个yum源                        

                        wget http://mirrors.163.com/.help/CentOS7-Base-163.repo &&  wget -O /etc/yum.repos.d/epel.repo http://mirrors.aliyun.com/repo/epel-7.repo

                       3 yum clean all 执行后重新安装

 十二  mysql通过show processlist 大量处于open /close table阶段

     分析 open/close table基本是与table_cache有关,mysql相关的参数大概有2个 

             table_open_cache 表缓存个数,与数量有关

             table_open_cache_instances  涉及缓存表缓存的锁争用

     解决方式 1 降低查询本身频率  2 优化慢sql 3 设置读写分离 4 调整以上两个数值

十三  mysql在执行truncate时候,大量表处于open/close状态,但是一旦truncate完成,这种状态就会消失

     分析 这种案例和上面的案例有些相似,却又不同.八怪大神经过pt-stack跟踪源码问题,定位到了是AHI导致的可能BUG问题

     解决方式 关闭 自适应HASH索引

     补充: 1 上面也有一个因为AHI导致的BUG问题 导致mysql索引

               2 是否选择关闭AHI,要看关闭前后的程序效率对比,如果大量下降,请不要关闭.如果没什么影响,则建议关闭 

十四   程序执行事务时,报max_binlog_cache不足问题

      具体错误描述  ulti-statement TRANSACTION required more THAN 'max_binlog_cache_size' bytes of STORAGE、

      分析  1 事务根据生成binlog cache的大小算作事务的大小,由max_binlog_cache_size控制

               2 max_binlog_cache_size 默认大小为32K

               3 max_binlog_cache_size 是session级别独享的

      总结 1 调整 参数大小  2 对大事务进行拆分 

      补充

      1   Binlog_cache_disk_use表示因为我们binlog_cache_size设计的内存不足导致缓存二进制日志用到了临时文件的次数

          Binlog_cache_use  表示 用binlog_cache_size缓存的次数

      2  当对应的Binlog_cache_disk_use 值比较大的时候 我们可以考虑适当的调高 binlog_cache_size 对应的值
 十五  jdbc报连接错误问题

         具体错误描述   error code [1094]; Unknown thread id: 73125270; nested exception is java.sql.SQLException: Unknown thread id: 73125270

         分析 1  根据官网可以查看的错误代码解释,不过没什么用

                 2  经过与研发沟通,确认研发设置了jdbc超时时间 

          总结  jdbc超时时间的设置,一旦sql本身超过超时时间的设置,会发送kill session信息请求,导致jdbc报错

                  优化你的sql或者将超时时间设大都有助于错误的减少出现

            

                        

    

转载于:https://www.cnblogs.com/danhuangpai/p/10132204.html

你可能感兴趣的:(mysql 案例 ~ 常见案例汇总)