[转]解决一个 MySQL 服务器进程 CPU 占用 100%的技术笔记

解决一个 MySQL 服务器进程 CPU 占用 100%的技术笔记


http://www.XiaoHui.com 2007-03-07 [原创]
  • 关键字: MYSQL, tmp_table_size, CPU, 100%, 索引, index, MYSQL 性能提升, left join, where,
  • 摘要 : 早上帮朋友一台服务器解决了Mysql cpu 占用100% 的问题。经验总结如下:1. 增加tmp_table_size值;2.为 where, left join 等子句条件建立索引 Index
  •  MYSQL CPU 占用 100% 的现象描述


      早上帮朋友一台服务器解决了 Mysql cpu 占用 100% 的问题。稍整理了一下,将经验记录在这篇文章里:《 解决一个 MySQL 服务器进程 CPU 占用 100%的技术笔记》 http://www.xiaohui.com/weekly/20070307.htm

      朋友主机(Windows 2003 + IIS + PHP + MYSQL )近来 MySQL 服务进程 (mysqld-nt.exe) CPU 占用率总为 100% 高居不下。此主机有10个左右的 database, 分别给十个网站调用。据朋友测试,导致 mysqld-nt.exe cpu 占用奇高的是网站A,一旦在 IIS 中将此网站停止服务,CPU 占用就降下来了。一启用,则马上上升。

     MYSQL CPU 占用 100% 的解决过程

      http://www.xiaohui.com/weekly/20070307.htm

      今天早上仔细检查了一下。目前此网站的七日平均日 IP 为2000,PageView 为 3万左右。网站A 用的 database 目前有39个表,记录数 60.1万条,占空间 45MB。按这个数据,MySQL 不可能占用这么高的资源。

      于是在服务器上运行命令,将 mysql 当前的环境变量输出到文件 output.txt:
    d:\web\mysql> mysqld.exe --help >output.txt
      发现 tmp_table_size 的值是默认的 32M,于是修改 My.ini, 将 tmp_table_size 赋值到 200M:
    d:\web\mysql> notepad c:\windows\my.ini
    [mysqld]
    tmp_table_size=200M
    
      然后重启 MySQL 服务。CPU 占用有轻微下降,以前的CPU 占用波形图是 100% 一根直线,现在则在 97%~100%之间起伏。这表明调整 tmp_table_size 参数MYSQL 性能提升有改善作用。但问题还没有完全解决。

      于是进入 mysql 的 shell 命令行,调用 show processlist, 查看当前 mysql 使用频繁的 sql 语句:
    mysql> show processlist;
    
      反复调用此命令(每秒刷两次),发现网站 A 的两个 SQL 语句经常在 process list 中出现,其语法如下:
    SELECT t1.pid, t2.userid, t3.count, t1.date
    FROM _mydata AS t1 
    LEFT JOIN _myuser AS t3 ON t1.userid=t3.userid
    LEFT JOIN _mydata_body AS t2 ON t1.pid=t3.pid
    ORDER BY t1.pid
    LIMIT 0,15
    
      调用 show columns 检查这三个表的结构 :
    mysql> show columns from _myuser;
    mysql> show columns from _mydata;
    mysql> show columns from _mydata_body;
    
      终于发现了问题所在:_mydata 表,只根据 pid 建立了一个 primary key,但并没有为 userid 建立索引。而在这个 SQL 语句的第一个 LEFT JOIN ON 子句中:
    LEFT JOIN _myuser AS t3 ON t1.userid=t3.userid
      _mydata 的 userid 被参与了条件比较运算。于是我为给 _mydata 表根据字段 userid 建立了一个索引:
    mysql> ALTER TABLE `_mydata` ADD INDEX ( `userid` )
      建立此索引之后,CPU 马上降到了 80% 左右。看到找到了问题所在,于是检查另一个反复出现在 show processlist 中的 sql 语句:
    SELECT COUNT(*)
    FROM _mydata AS t1, _mydata_key AS t2
    WHERE t1.pid=t2.pid and t2.keywords = '孔雀'
    
      经检查 _mydata_key 表的结构,发现它只为 pid 建了了 primary key, 没有为 keywords 建立 index。_mydata_key 目前有 33 万条记录,在没有索引的情况下对33万条记录进行文本检索匹配,不耗费大量的 cpu 时间才怪。看来就是针对这个表的检索出问题了。于是同样为 _mydata_key 表根据字段 keywords 加上索引:
    mysql> ALTER TABLE `_mydata_key` ADD INDEX ( `keywords` )
      建立此索引之后,CPU立刻降了下来,在 50%~70%之间震荡。

      再次调用 show prosslist,网站A 的sql 调用就很少出现在结果列表中了。但发现此主机运行了几个 Discuz 的论坛程序, Discuz 论坛的好几个表也存在着这个问题。于是顺手一并解决,cpu占用再次降下来了。(2007.07.09 附注:关于 discuz 论坛的具体优化过程,我后来另写了一篇文章,详见:
    千万级记录的 Discuz! 论坛导致 MySQL CPU 100% 的 优化笔记 http://www.xiaohui.com/dev/server/20070701-discuz-mysql-cpu-100-optimize.htm)

     解决 MYSQL CPU 占用 100% 的经验总结

      http://www.xiaohui.com/weekly/20070307.htm

    1. 增加 tmp_table_size 值。mysql 的配置文件中,tmp_table_size 的默认大小是 32M。如果一张临时表超出该大小,MySQL产生一个 The table tbl_name is full 形式的错误,如果你做很多高级 GROUP BY 查询,增加 tmp_table_size 值。 这是 mysql 官方关于此选项的解释:
      tmp_table_size
      This variable determines the maximum size for a temporary table in memory. If the table becomes too large, a MYISAM table is created on disk. Try to avoid temporary tables by optimizing the queries where possible, but where this is not possible, try to ensure temporary tables are always stored in memory. Watching the processlist for queries with temporary tables that take too long to resolve can give you an early warning that tmp_table_size needs to be upped. Be aware that memory is also allocated per-thread. An example where upping this worked for more was a server where I upped this from 32MB (the default) to 64MB with immediate effect. The quicker resolution of queries resulted in less threads being active at any one time, with all-round benefits for the server, and available memory.
    2. 对 WHERE, JOIN, MAX(), MIN(), ORDER BY 等子句中的条件判断中用到的字段,应该根据其建立索引 INDEX。索引被用来快速找出在一个列上用一特定值的行。没有索引,MySQL不得不首先以第一条记录开始并然后读完整个表直到它找出相关的行。表越大,花费时间越多。如果表对于查询的列有一个索引,MySQL能快速到达一个位置去搜寻到数据文件的中间,没有必要考虑所有数据。如果一个表有1000行,这比顺序读取至少快100倍。所有的MySQL索引(PRIMARY、UNIQUE和INDEX)在B树中存储。
      根据 mysql 的开发文档:
      索引 index 用于
      • 快速找出匹配一个WHERE子句的行
      • 当执行联结(JOIN)时,从其他表检索行。
      • 对特定的索引列找出MAX()或MIN()值
      • 如果排序或分组在一个可用键的最左面前缀上进行(例如,ORDER BY key_part_1,key_part_2),排序或分组一个表。如果所有键值部分跟随DESC,键以倒序被读取。
      • 在一些情况中,一个查询能被优化来检索值,不用咨询数据文件。如果对某些表的所有使用的列是数字型的并且构成某些键的最左面前缀,为了更快,值可以从索引树被检索出来。

        假定你发出下列SELECT语句:
        mysql> SELECT * FROM tbl_name WHERE col1=val1 AND col2=val2;
        如果一个多列索引存在于col1和col2上,适当的行可以直接被取出。如果分开的单行列索引存在于col1和col2上,优化器试图通过决定哪个索引将找到更少的行并来找出更具限制性的索引并且使用该索引取行。
      开发人员做 SQL 数据表设计的时候,一定要通盘考虑清楚。

    相关文章: 千万级记录的 Discuz! 论坛导致 MySQL CPU 100% 的 优化笔记
    <script type="text/javascript"> </script><script src="http://pagead2.googlesyndication.com/pagead/show_ads.js" type="text/javascript"> </script><iframe name="google_ads_frame" marginwidth="0" marginheight="0" src="http://pagead2.googlesyndication.com/pagead/ads?client=ca-pub-5801877696325956&amp;amp;dt=1196305914091&amp;amp;lmt=1194623810&amp;amp;prev_fmts=728x90_as&amp;amp;format=728x15_0ads_al&amp;amp;output=html&amp;amp;correlator=1196305914091&amp;amp;channel=8913847665&amp;amp;url=http%3A%2F%2Fwww.xiaohui.com%2Fweekly%2F20070307.htm&amp;amp;color_bg=FFFFFF&amp;amp;color_text=000000&amp;amp;color_link=001188&amp;amp;color_url=001188&amp;amp;color_border=FFFFFF&amp;amp;ref=http%3A%2F%2Fwww.xiaohui.com%2Fdev%2Fserver%2F20070701-discuz-mysql-cpu-100-optimize.htm&amp;amp;cc=28&amp;amp;ga_vid=809738968.1196305914&amp;amp;ga_sid=1196305914&amp;amp;ga_hid=773092204&amp;amp;flash=9&amp;amp;u_h=1024&amp;amp;u_w=1280&amp;amp;u_ah=971&amp;amp;u_aw=1280&amp;amp;u_cd=32&amp;amp;u_tz=480&amp;amp;u_java=true" frameborder="0" width="728" scrolling="no" height="15" allowtransparency="allowtransparency"></iframe>

    第1楼  xjb 写于 2007-03-07 11:41
    嘿嘿,xiaohui很少写技术文章,这样心得一定要纪录下来,“发表是最好的记忆”
    XiaoHui 回复于 2007-03-08 00:10 :
    呵呵,多谢支持!:) 看看能不能坚持写一些。:)

    第2楼  nbvista 写于 2007-03-07 12:50
    刚好应用下,感谢

    第3楼  水手 写于 2007-03-08 11:23
    从没用过mysql在学校里都是用SQL Server
    早听说mysql速度快,
    XiaoHui 回复于 2007-03-09 03:12 :
    下面是 MySQL 开发小组自己写的比较文章: MySQL 与 mSQL (MS SQL)的比较
    因为没有线程创建开销、一个较小的语法分析器、较少功能和简单的安全性,mSQL应该在下列方面更快些:
    1. 执行重复的连接和断开的测试,在每个连接期间运行一个非常简单的查询。
    2. 有很少的列和键的插入很简单的表的INSERT操作。
    3. CREATE TABLE和DROP TABLE。
    4. 在不是一个索引的一些东西上SELECT。(一个表扫描是很容易的。)

    因为这些操作是如此简单,当你有更高的启动开销时,很难在这些方面变得更好。在连接被建立以后,MySQL应该性能好一些。在另一方面,MySQL比mSQL(以及大多数其他的SQL实现)在下列方面更好些
    1. 复杂的SELECT操作。
    2. 检索较大的结果(MySQL有一个更好、更快并且更安全的协议)。
    3. 有变长字符串的表,因为MySQL有更有效的并可在VARCHAR列上索引。
    4. 有很多列的表的处理。
    5. 由长记录的表的处理。
    6. 有很多许多表达式的SELECT。
    7. 在大表上的SELECT。
    8. 同时处理很多连接。MySQL充分是完全多线程化的,每个连接有它自己的线程,这意味着没有线程必须等待另一个线程(除非一个线程正在修改一张表,另外的线程想要存取)在mSQL中,一旦一个连接被建立了,所有其它线程必须等到第一个线程完成,不管连接正在运行的查询是短的或是长的。当第一个连接终止时,下一个才能工作,而此时所有其它线程再次等待,等等。
    9. 联结。如果你改变一个SELECT中的表的顺序,mSQL可能变得异常地慢。在基准套件中,比MySQL要慢超过15000倍的时间。这是由于mSQL缺乏一个联结优化器以便以最佳的顺序排定表。然而,如果你把表按完全正确的顺序放在mSQL2中并且WHERE是很简单的并使用索引列,联结将相对快些!见10.8 使用你自己的基准。
    10. ORDER BY和GROUP BY。
    11. DISTINCT。
    12. 使用TEXT或BLOB列

    第4楼  水手 写于 2007-03-17 17:48
    这相一对比就理论上知道了,但得实践做个东西来才有感觉。

    第5楼  游客 写于 2007-07-02 09:08
    使用php程序而不用LAPM架构,非常另人费解

    第6楼  转走拉! 写于 2007-07-31 15:50
    转走拉!

    第7楼  中草药 写于 2007-11-09 22:56
    晕吧!
    人家是缓存的,跟这个有屁事~~~

    你可能感兴趣的:(多线程,sql,mysql,应用服务器,SQL Server)