linux服务器性能分析与优化

#1 查看硬件产品名称
dmidecode |grep 'Product Name'

#2 查看主板序列号
dmidecode |grep -i 'serial number' |grep CN

#3 查看CPU型号
grep name /proc/cpuinfo

#4 查看CPU个(核)数:
grep 'physical id' /proc/cpuinfo

#5 查看cpu使用情况
top

#6 查看内存信息
grep MemTotal /proc/meminfo
free -m
vmstat

#7 查看分区大小情况
fdisk -l

#8 查看分区使用情况
df -h

#9 查看内核版本
cat /etc/redhat-release
cat /etc/issue
uname -rm

#10 查看系统启动信息
dmesg |grep sda

#11 查看各个设备中断请求(IRQ)
cat /proc/interrupts

#12 查看磁盘阵列级别

####################### 怎么找到性能瓶颈
操作系统完成一个任务是与系统自身设置、网络拓扑结构、路由设备、路由策略、
接入设备、物理线路等多个方面密切相关，当linux出现问题时，我们应当从
应用程序、操作系统、服务器硬件、网络环境综合排查，定位问题，然后解决。

<1> 操作系统当前运行状态: 系统负载、内存状态、进程状态、cpu负荷、
<2> 系统硬件信息: 磁盘IO、CUP型号、内存大小、网卡带宽
<3> 应用程序对系统资源的使用情况(DB/BUG/内存溢出)
<4> 接口程序的执行效率、慢查询语句、SQL优化、代码执行效率低.
例如问题:
CPU资源过度使用会造成系统中出现大量等待进程,导致应用程序响应缓慢.
进程大量增加会导致系统内存资源增加
物理内存耗尽，系统会使用虚拟内存，虚拟内存的使用会造成磁盘IO的增加并加大
CPU的开销。

解决问题遵循的流程:
   查看系统系统硬件、网络设备、操作系统配置、应用程序架构和程序代码

CPU瓶颈：应用邮件服务器、动态WEB服务器(CPU配置和性能)
         方案:运行SMP内核支持超线程,CPU数量越多，超线程性能提高越少,
              两个4核的CPU性能比8个单核的CPU性能低25%-30%

内存瓶颈: 打印服务器、数据库服务器、静态web服务器.(加大内存大小)
          方案:64位，开启linux大内存内核支持

磁盘IO瓶颈：raid0(不安全、至少2盘) raid1(安全磁盘镜像利用率50%)
            raid5(奇偶效应) raid10(至少4块盘)
           方案: 根据业务选择合适的raid级别
                raid0: 对读写操作频繁并对数据安全性要求不高的应用
                raid1: 对读写没特殊要求，对数据安全要求较高的应用
                raid5: 对读要求高,对写要求不高，并保证数据安全的应用
                raid10: 对读写要求都很高，对数据安全性要求也高的应用

系统性能标准表:
             好               坏                         糟糕
CPU       user%+sys%<70%     user%+sys%=85%          user%+sys%>=90%

内存      Swap In (si) =0    Per CPU with 0 page/s   More Swap In & Swap Out
          Swap Out (so)=0

磁盘      iowait%<20%        iowait%=35%             iowait%>=50%

其中:
    user% 表示CPU处于用户模式下时间百分比
    sys%   表示CPU处于系统模式下时间百分比
    iowait%表示CPU等待输入输出完成时间的百分比
    Swap In即 si 表示虚拟内存的页导入，从swap disk交换到ram
    Swap Out即 so 表示虚拟内存的页导出，从ram 交换到swap disk



################---------------------- 性能分析工具

#1 vmstat
[root@home-mysql1 ~]# vmstat 3 5
procs -----------memory---------- ---swap-- -----io---- --system-- -----cpu------
r b   swpd   free   buff cache   si   so    bi    bo   in   cs us sy id wa st
0 0      0 895504 12540 49092    0    0     3     3 1003   21 0 0 100 0 0
0 0      0 895504 12548 49084    0    0     0    19 978   21 0 1 99 0 0
0 0      0 895504 12548 49092    0    0     0     0 986   21 0 0 100 0 0
0 0      0 895504 12548 49092    0    0     0     0 969   20 0 0 100 0 0

解释:
si 表示磁盘调入内存
so 表示内存调入磁盘
一般情况下si和so值都是0，如果长期不是，表示系统内存不足，需要增加系统内存.

bi 表示读磁盘(kb/s)
bo 表示写磁盘(kb/s)
bi+bo参考值100，如果超过1000，而且wa值较大说明磁盘IO有问题.考虑磁盘读写性能

in 表示在某一时间间隔内观测到的每秒设备中断数
cs 表示上下文切换次数
in和cs 值越大，由内核消耗的CPU时间越多

us列显示用户进程消耗的CPU时间百分比,如果长期大于50%，就需要考虑优化程序或算法
sy列显示内核进程消耗的CPU时间百分比,sy值较高时，说明内核消耗的CPU资源很多。
us+sy参考值是80%,如果大于80%，说明可能存在CPU资源不足

id列显示了CPU处在空闲状态的时间百分比
wa列显示IO等待所占用的CPU时间百分比。
wa值越高，说明I/O等待越严重，根据经验，wa参考值是20%，超过说明I/O等待严重.
引起I/O等待原因可能是磁盘大量随机读写造成的，也可能是磁盘控制器的带宽瓶颈造成的.

#2 sar

#3 iostat

#4 free -m (以M为单位的使用情况)
[root@home-mysql1 ~]# free -m
             total       used       free     shared    buffers     cached
Mem:          1000        127        873          0         12         47
-/+ buffers/cache:         66        934
Swap:         2047          0       2047

经验公式：
当应用程序可用内存/系统物理内存>70%时表示系统内存资源严重不足，不影响系统性能。
当应用程序可用内存/系统物理内存<20%时表示系统内存资源紧张，需要增加系统内存。
当20%< 应用程序可用内存/系统物理内存<70%时表示系统内存资源基本满足应用需求，暂时不
影响系统性能.
不间断检测内存使用情况：free -b -s 5

#5 uptime
[root@home-mysql1 ~]# uptime (1分钟 5分钟 15分钟)
20:28:31 up 11:35, 1 user, load average: 0.00, 0.00, 0.00
3个值大小不能大于系统CPU的个数，说明负载很高，可能影响系统性能，偶尔大于不担心，
如果出现值小于CPU个数，表示CPU有空闲时间片。

#6 netstat 显示本机网络链接、运行端口、路由表详情

netstat -a 显示本机所有连接和监听端口
netstat -n 显示当前建立的有效连接和端口
netstat -r 显示路由表信息
netstat -t 显示所有TCP连接
netstat -u 显示所有UTP连接
netstat -i 显示自动配置接口状态

[root@home-mysql1 ~]# netstat -i
Kernel Interface table
Iface       MTU Met    RX-OK RX-ERR RX-DRP RX-OVR    TX-OK TX-ERR TX-DRP TX-OVR Flg
eth0       1500   0     3634      0      0      0     1950      0      0      0 BMRU
lo        16436   0      172      0      0      0      172      0      0      0 LRU
Iface         表示接口名称
MTU           表示最大传输单元单位字节
RX-OK/TX-OK   表示已经准确无误的接收/发送了多少数据包
RX-ERR/TX-ERR 表示接收/发送数据包时产生了多少错误
RX-DRP/TX-DRP 表示接收/发送数据包时丢弃了多少数据包
RX-OVR/TX-OVR 表示由于误差而遗失了多少数据包
正常情况下 RX-ERR/TX-ERR RX-DRP/TX-DRP RX-OVR/TX-OVR 值应该为0
如果不是，网络质量肯定有问题(检测网卡设备)

#7 top
top - 22:36:51 up 13:43, 1 user, load average: 0.00, 0.00, 0.00
Tasks: 57 total,   2 running, 55 sleeping,   0 stopped,   0 zombie
Cpu(s): 0.0%us, 0.0%sy, 0.0%ni,100.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Mem:   1024932k total,   132320k used,   892612k free,    14056k buffers
Swap: 2096472k total,        0k used, 2096472k free,    49868k cached

PID USER      PR NI VIRT RES SHR S %CPU %MEM    TIME+ COMMAND


3225 root      15   0 12632 1112 876 R 0.3 0.1   0:00.05 top


    1 root      18   0 10372 752 632 S 0.0 0.1   0:00.66 init
#8 Nginx php-cgi

开启10个Nginx进程消耗150MB内存(15MB*10=150MB)
开启64个php-cgi进程消耗120内存(20MB*64=1280MB)
加上系统自身消耗内存，总共消耗不到2G内存.

如果服务器内存较小，可以只开25个php-cgi进程这样消耗php-cgi消耗总内存数才500MB
用Webbench做压力测试

同等硬件环境下，Nginx的处理能力相当于Apache的5到10倍。

本文转自cloves 51CTO博客，原文链接:http://blog.51cto.com/yeqing/1597040

linux服务器性能分析与优化

你可能感兴趣的:(linux服务器性能分析与优化)