java问题排查常用linux命令

 最近部门的测试环境总是半夜挂掉,有感于线上问题排查的种种困惑,所以打算彻底扫盲一下问题排查的一些关键命令,在真正火灾来临的时候,能够迅速的定位问题。

    重用的linux命令总体分为几个大类,以前自己觉得,这些命令,在用的时候现查就行,但是经历了几次事情之后,我觉得对于这些工具在问题真正来临的会后需要灵活运用,灵活运用需要平时对这些就很熟悉,自己很多没有熟悉,所系需要恶补一下,在问题真正来临的时候,自己能够冷静准确的处理问题。

 

(1)ping :

功能是检测主机,执行ping指令会使用ICMP传输协议,发出要求回应的信息,若远端主机的网络功能没有问题,就会回应该信息,因而得知该主机运作正常。 

 

(2)  netstat:
显示与IP、TCP、UDP和ICMP协议相关的统计数据,一般用于检验本机各端口的网络连接情况。
·netstat –s
本选项能够按照各个协议分别显示其统计数据。如果我们的应用程序(如Web浏览器)运行速度比较慢,或者不能显示Web页之类的数据,那么我们就可以用本选项来查看一下所显示的信息。我们需要仔细查看统计数据的各行,找到出错的关键字,进而确定问题所在。
·netstat –e
本选项用于显示关于以太网的统计数据。它列出的项目包括传送的数据报的总字节数、错误数、删除数、数据报的数量和广播的数量。

·netstat –a
本选项显示一个所有的有效连接信息列表,包括已建立的连接(ESTABLISHED),也包括监听连接请(LISTENING)的那些连接。
·netstat –n
显示所有已建立的有效连接。

 

(3)hostname
显示或设置系统的主机名;如果无任何选项和主机名,则用于显示系统的主机名。

在看这个命令的时候想起了windows中修改host文件来进行测试,这里顺便了解了一下host文件的作用。

Hosts文件是一个纯文本的文件,用普通的文本编辑软件如记事本等都能打开。 


Hosts文件的格式: 
这个文件包含IP地址到HOST name(主机名)的映射关系.每一条独自占有一行. 
IP地址应该放在第一位,后面应该紧跟着Host name. IP地址与Host name之间应该被最少一个空格隔开.对于每行的映射说明,用“#”分割后用文字说明。 
Hosts文件在Windows中的用途: 
访问某个网站通常是根据域名访问,比如:http://www.9usb.net.我们在浏览器中输入以上域名后,后台就首先通过DNS服务器把网络域名www.9usb.net解析成173.XXX.XXX.XXX的IP地址后,我们的计算机才能访问。要是对于每个域名请求我们都要等待域名服务器解析后返回IP信息,这样访问网络的效率就会降低。 
Hosts文件起作用的地方就是在由域名转换成IP的过程中。hosts文件在本地保存了一个域名和IP地址的映射,能提高解析效率。Windows系统在进行DNS请求以前,Windows系统会先检查Hosts文件中是否有这个地址映射关系,如果有则调用这个IP地址映射,如果没有再向已知的DNS服务器提出域名解析。 
Hosts的请求级别比DNS高。 


Host文件在具体使用中的作用 
1.绕开DNS请求,节省域名解析时间 
对于要经常访问的网站,我们可以通过在Hosts中配置域名和IP的映射关系,这样当我们输入域名计算机就能很快解析出IP,而不用请求网络上的DNS服务器。在本地进行域名解析比请求DNS服务器进行转换要省时间,这大大加快了访问速度。 
2.方便局域网用户 
通常局域网一般不会架设DNS服务器,访问某些服务要输入难记的IP地址,这就比较不方便。现在可以分别给这些服务器取个容易记住的名字,然后在Hosts中建立IP映射,这样以后访问的时候我们输入这个服务器的名字就OK了。 
3、屏蔽网站和解屏蔽网站 
4.顺利连接系统 

 

(4)uptime

linux系统中的uptime命令主要用于获取主机运行时间和查询linux系统负载等信息。
uptime命令可以显示系统已经运行了多长时间,信息显示依次为:现在时间、系统已经运行了多长时间、目前有多少登陆用户、系统在过去的1分钟、5分钟和15分钟内的平均负载。
uptime命令用法十分简单:直接输入uptime即可.

例如: 17:07:22 up 79 days, 17:57,  1 user,  load average: 0.08, 0.08, 0.02

 

(5)TOP

 

TOP显示的内容详解

java问题排查常用linux命令_第1张图片

 

在TOP命令运行的过程中,点击下面的键,可以进行进一步的显示。

 

(1)u:指定显示用户进程。

(2)1 :显示每个CPU的统计信息。

(3)P:按%CPU使用率排行。shift+p。

(4)M:按%MEM排行。shift+m。

(5)<Space>:立即刷新。

(6)-H : 显示线程。当这个设定开启时,将显示所有进程产生的线程。

(7)-p : 监控指定的进程。当监控多个进程时,进程ID以逗号分隔。这个选项只能在命令行下使用。

 

 java问题排查常用linux命令_第2张图片

 

 

---------------------------------------------------------------------------------------

 

  • 查看java进程中各个线程占用CPU以及内存情况

top -H -p `pgrep java -u admin`

  • 加入看到8440这个线程有异常,进制转换

printf '0x%x\n' 8440

  • 看这个线程在做什么事情

sudo -u admin /opt/taobao/java/bin/jstack `pgrep java -u admin` | grep -C 20 0x20f8 –color

 

---------------------------------------------------------------------------------------

 

 

 

(6)sar

sar 的主要作用:

主要负责收集、汇报与存储系统运行信息的。有两个参数非常非常常用,就是“时间间隔”和“输出次数”。默认输出CPU的信息,但是内存、Load、IO的情况都可以查看

1、把sar输出的信息保存到文件中,只要  -o filename即可,不过在看次文件的时候,需要sar  -f  filename   否则通过cat看到的是乱码

2、CPU是多核的情况下,查看每一下的情况已经统计情况,

    sar -P ALL   显示每一核的情况已经总体情况

    sar -P 数字  显示特定CPU的情况

 

    java问题排查常用linux命令_第3张图片

3、查看历史的sar的情况

     sar   -u(r/q/) -f    /var/log/sa/sa01    最后一个为具体的日志(sa+日期中的天数)

4、sar -q  查看load的情况

 java问题排查常用linux命令_第4张图片

    

5、sar -r  查看内存

  java问题排查常用linux命令_第5张图片

 

6、sar -n  查看网络情况

 

java问题排查常用linux命令_第6张图片 

 

java问题排查常用linux命令_第7张图片

 

 

 

(7)vmstat

 

 

(8)ps

 

 

(9)grep/egrep/fgrep

 

 

(10)awk

 

(11)kill

 

 

(12)mapstat

 

 

(13)iostat

 

(14)df/du

 

(15)

 

 

系统配置相关:
 
查看内核/操作系统/CPU信息: uname -a
 
查看操作系统版本: head -1 /etc/issue
 
查看网卡信息:cat  /sbin/ifconfig
 
查看cpu配置:  cat /proc/cpuinfo
 
查看mem配置: cat /proc/meminfo
 
查看环境变量 资源: env 
 
查看各分区使用情况:  df -h
 
查看指定目录的大小: du -sh
 
查看系统负载 磁盘和分区: cat /proc/loadavg 

查看挂接的分区状态:  mount | column -t 

查看hosts配置:cat
 /etc/hosts
 
查看所有网络接口的属性: ifconfig 
 
查看路由表: route -n
 
查看tcp协议配置(ipv4):  /proc/sys/net/ipv4
 
 
性能分析相关工具:
 
ps,pstree: 命令是系统分析最常用的基本命令,ps命令提供了一个正在运行的进程的列表,列出进程的数量取决于命令所附加的参数。
 
uptime: 查看系统运行时间、用户数、负载
 
top :实时显示cpu负载、进程资源占用
 
vmstat:整体性能监控,cpu,mem,页面io等。
 
free: free命令显示系统的所有内存的使用情况,包括空闲内存、被使用的内存和交换内存空间。Free命令显示也包括一些内核使用的缓存和缓冲区的信息。
-m  以M形式展示数据
-g 以G形式展示数据
 
 
pmap: pmap命令显示一个或者多个进程使用内存的数量,你可以用这个工具来确定服务器上哪个进程占用了过多的内存从而导致内存瓶颈。
 
iostat:iostat是sysstat包的一部分。Iostat显示自系统启动后的平均CPU时间(与uptime类似),它也可以显示磁盘子系统的使用情况,iostat可以用来监测CPU利用率和磁盘利用率。
 
sar: sar也是sysstat安装包的一部分。sar命令用于收集、报告和保存系统的信息。
 
mpstat: mpstat命令也是sysstat包的一部分。Mpstat命令用于监测一个多CPU系统中每个可用CPU的情况。Mpstat命令可以显示每个CPU或者所有CPU的运行情况
 
ulimit: 可以通过ulimit来控制系统资源的使用。
 
 
java应用性能分析:
 
jmap(配合jhat分析heapdump)、jstat、jconsole、jvisualvm、jprofiler、visualGC等等多种多样。
 
 
 
查看进程和端口号相关netstat:
 
Netstat 用于显示与IP、TCP、UDP和ICMP协议相关的统计数据,一般用于检验本机各端口的网络连接情况。
通过netstat可以查看网络连接、端口号等占用情况
 
查看TCP/UDP端口:netstat -tuoln

查看进程名运行的端口号:netstat -anp|grep 进程名
当需要监控某个服务的端口号时可以首先获取该服务的监听端口号,如tomact进程
netstat -anp|grep tomcat
 
 根据端口查看运行的进程:
netstat -anp|grep 端口号  或  lsof -i:端口号
通常用于查看某个端口号下建立的连接数,如8083端口号下的连接数统计:
netstat -anp|grep:8083|wc -l 

netstat -tln 查看服务监听端口
 
查看进程    ps aux
 
查看指定服务的进程号,如tomcat服务: ps aux|grep tomcat
结束进程   kill -15 pid 立即释放资源; kill -9 pid 不会立即释放资源 
 
查看特定文件中特定文本的个数
egrep -o "[A-Z|a-z]\w*""Exception" map.log | sort | uniq -c | sort –nr   
 
 
最后制定定时执行任务,合理利用空闲时间:
 
crontab -e: 设置计划任务;
 

你可能感兴趣的:(linux命令)