telegraf收集数据说明

收集数据说明#

CPU#

Idel:cpu空任务时间。一般大于70%正常。

Iowait:cpu空闲等待io时间。一般小于30%。

Irq:服务终端时间。在虚拟环境其他操作花费的时间。

Nice:用做nice加权的进程分配的用户态cpu时间比

cpu_usage_user:用户态使用的cpu时间比

cpu_usage_system:系统态使用的cpu时间比

cpu_usage_steal:虚拟机偷取时间

Disk#

free :(integer, bytes)

total :(integer, bytes)

used :(integer, bytes)

used_percent :(float, percent)

inodes_free :(integer, files)

inodes_total :(integer, files)

inodes_used :(integer, files)

一个Inodes数对应一个文件,IFree就代表还能打开的文件数,文件数上限并不针对当前的目录,而是针对整个系统。

Diskio#

"reads": io.ReadCount,

"writes": io.WriteCount,

"read_bytes": io.ReadBytes,

"write_bytes": io.WriteBytes,

"read_time": io.ReadTime,

"write_time": io.WriteTime,

"io_time": io.IoTime,

所有的值都是从启动时的累积值。

MEM#

mem_total

mem_available

mem_used

mem_free

mem_used_percent

mem_available_percent

NETSTAT#

支持TCP连接状态。

tcp_established

tcp_syn_sent

tcp_syn_recv

tcp_fin_wait1

tcp_fin_wait2

tcp_time_wait

tcp_close

tcp_close_wait

tcp_last_ack

tcp_listen

tcp_closing

tcp_none

udp_socket

System#

Load1:1-分钟平均负载

Load5:5-分钟平均负载

Load15:15-分钟平均负载

Uptime

uptime_format

Load:

load1 -= load1 -* exp(-5 / 60) -+ n * (1 – exp(-5 / 60 ))

load5 -= load5 -* exp(-5 / 300) + n * (1 – exp(-5 / 300))

load15 = load15 * exp(-5 / 900) + n * (1 – exp(-5 / 900))

“Load值=CPU核数”,这是最理想的状态,没有任何竞争,一个任务分配一个核。

由于数据是每隔5秒钟检查一次活跃的进程数,然后根据这个数值算出来的。如果这个数除以CPU的核数,结果高于5的时候就表明系统在超负荷运转了。

SWAP#

"total": swap.Total,

"used": swap.Used,

"free": swap.Free,

"used_percent": swap.UsedPercent,

"in": swap.Sin,

"out": swap.Sout,

SWAP就是LINUX下的虚拟内存分区,它的作用是在物理内存使用完之后,将磁盘空间(也就是SWAP分区)虚拟成内存来使用.

你可能感兴趣的:(telegraf收集数据说明)