最近部门的测试环境总是半夜挂掉,有感于线上问题排查的种种困惑,所以打算彻底扫盲一下问题排查的一些关键命令,在真正火灾来临的时候,能够迅速的定位问题。
重用的linux命令总体分为几个大类,以前自己觉得,这些命令,在用的时候现查就行,但是经历了几次事情之后,我觉得对于这些工具在问题真正来临的会后需要灵活运用,灵活运用需要平时对这些就很熟悉,自己很多没有熟悉,所系需要恶补一下,在问题真正来临的时候,自己能够冷静准确的处理问题。
(1)ping :
功能是检测主机,执行ping指令会使用ICMP传输协议,发出要求回应的信息,若远端主机的网络功能没有问题,就会回应该信息,因而得知该主机运作正常。
(2) netstat:
显示与IP、TCP、UDP和ICMP协议相关的统计数据,一般用于检验本机各端口的网络连接情况。
·netstat –s
本选项能够按照各个协议分别显示其统计数据。如果我们的应用程序(如Web浏览器)运行速度比较慢,或者不能显示Web页之类的数据,那么我们就可以用本选项来查看一下所显示的信息。我们需要仔细查看统计数据的各行,找到出错的关键字,进而确定问题所在。
·netstat –e
本选项用于显示关于以太网的统计数据。它列出的项目包括传送的数据报的总字节数、错误数、删除数、数据报的数量和广播的数量。
·netstat –a
本选项显示一个所有的有效连接信息列表,包括已建立的连接(ESTABLISHED),也包括监听连接请(LISTENING)的那些连接。
·netstat –n
显示所有已建立的有效连接。
(3)hostname
显示或设置系统的主机名;如果无任何选项和主机名,则用于显示系统的主机名。
在看这个命令的时候想起了windows中修改host文件来进行测试,这里顺便了解了一下host文件的作用。
Hosts文件的格式:
这个文件包含IP地址到HOST name(主机名)的映射关系.每一条独自占有一行.
IP地址应该放在第一位,后面应该紧跟着Host name. IP地址与Host name之间应该被最少一个空格隔开.对于每行的映射说明,用“#”分割后用文字说明。
Hosts文件在Windows中的用途:
访问某个网站通常是根据域名访问,比如:http://www.9usb.net.我们在浏览器中输入以上域名后,后台就首先通过DNS服务器把网络域名www.9usb.net解析成173.XXX.XXX.XXX的IP地址后,我们的计算机才能访问。要是对于每个域名请求我们都要等待域名服务器解析后返回IP信息,这样访问网络的效率就会降低。
Hosts文件起作用的地方就是在由域名转换成IP的过程中。hosts文件在本地保存了一个域名和IP地址的映射,能提高解析效率。Windows系统在进行DNS请求以前,Windows系统会先检查Hosts文件中是否有这个地址映射关系,如果有则调用这个IP地址映射,如果没有再向已知的DNS服务器提出域名解析。
Hosts的请求级别比DNS高。
Host文件在具体使用中的作用
1.绕开DNS请求,节省域名解析时间
对于要经常访问的网站,我们可以通过在Hosts中配置域名和IP的映射关系,这样当我们输入域名计算机就能很快解析出IP,而不用请求网络上的DNS服务器。在本地进行域名解析比请求DNS服务器进行转换要省时间,这大大加快了访问速度。
2.方便局域网用户
通常局域网一般不会架设DNS服务器,访问某些服务要输入难记的IP地址,这就比较不方便。现在可以分别给这些服务器取个容易记住的名字,然后在Hosts中建立IP映射,这样以后访问的时候我们输入这个服务器的名字就OK了。
3、屏蔽网站和解屏蔽网站
4.顺利连接系统
(4)uptime
linux系统中的uptime命令主要用于获取主机运行时间和查询linux系统负载等信息。
uptime命令可以显示系统已经运行了多长时间,信息显示依次为:现在时间、系统已经运行了多长时间、目前有多少登陆用户、系统在过去的1分钟、5分钟和15分钟内的平均负载。
uptime命令用法十分简单:直接输入uptime即可.
例如: 17:07:22 up 79 days, 17:57, 1 user, load average: 0.08, 0.08, 0.02
(5)TOP
TOP显示的内容详解
在TOP命令运行的过程中,点击下面的键,可以进行进一步的显示。
(1)u:指定显示用户进程。
(2)1 :显示每个CPU的统计信息。
(3)P:按%CPU使用率排行。shift+p。
(4)M:按%MEM排行。shift+m。
(5)<Space>:立即刷新。
(6)-H : 显示线程。当这个设定开启时,将显示所有进程产生的线程。
(7)-p : 监控指定的进程。当监控多个进程时,进程ID以逗号分隔。这个选项只能在命令行下使用。
---------------------------------------------------------------------------------------
- 查看java进程中各个线程占用CPU以及内存情况
top -H -p `pgrep java -u admin`
- 加入看到8440这个线程有异常,进制转换
printf '0x%x\n' 8440
- 看这个线程在做什么事情
sudo -u admin /opt/taobao/java/bin/jstack `pgrep java -u admin` | grep -C 20 0x20f8 –color
---------------------------------------------------------------------------------------
(6)sar
sar 的主要作用:
主要负责收集、汇报与存储系统运行信息的。有两个参数非常非常常用,就是“时间间隔”和“输出次数”。默认输出CPU的信息,但是内存、Load、IO的情况都可以查看
1、把sar输出的信息保存到文件中,只要 -o filename即可,不过在看次文件的时候,需要sar -f filename 否则通过cat看到的是乱码
2、CPU是多核的情况下,查看每一下的情况已经统计情况,
sar -P ALL 显示每一核的情况已经总体情况
sar -P 数字 显示特定CPU的情况
3、查看历史的sar的情况
sar -u(r/q/) -f /var/log/sa/sa01 最后一个为具体的日志(sa+日期中的天数)
4、sar -q 查看load的情况
5、sar -r 查看内存
6、sar -n 查看网络情况
(7)vmstat
(8)ps
(9)grep/egrep/fgrep
(10)awk
(11)kill
(12)mapstat
(13)iostat
(14)df/du
(15)
查看挂接的分区状态: mount | column -t
查看hosts配置:cat /etc/hosts
netstat -anp|grep 端口号 或 lsof -i:端口号
netstat -tln 查看服务监听端口