皮皮冰燃

运维-3-在zabbix中添加主机和监控项

参考zabbix从放弃到入门（3）：在zabbix中添加主机
参考zabbix从放弃到入门（4）：在zabbix中添加监控项
参考zabbix从放弃到入门（5）：在zabbix中添加带有参数的监控项
地址http://192.168.0.91/zabbix
账号/密码Admin/zabbix

1 工作场景

假设，我们想要使用zabbix监控一台linux服务器，那么，我们肯定要将这个服务器纳入zabbix的管理范围，而”添加主机”这个操作，就是将被监控的主机纳入zabbix管理范围的一个必须操作，如果我们有10台主机都需要被zabbix监控呢，没错，这10台主机都必须被添加到zabbix的监控列表中。
在zabbix中，我们将被监控的对象称之为”主机”，”主机”不一定是服务器，也可以是路由器，交换机等网络设备，而且，根据主机的属性、角色、特征的不同，我们还能够将主机分组。
比如，我们有10台服务器，10台服务器中，有3台windows服务器，有7台linux服务器，那么，我们可以按照操作系统的不同，将他们分成两组，windos服务器组与linux服务器组。
或者我们不按照操作系统对主机进行分组，而是根据服务器的角色对主机分组，比如，一共10台服务器，3台是是提供ldap服务的，2台是提供web服务的，5台是提供数据库服务的，我们也可以把它们按照角色分成3组，ldap主机组、web主机组、db主机组。
当然，我们只是举个例子，实际应用中，具体怎样分组，是根据实际需求视情况而定的，那么，为什么要将主机分组呢，这是为了方便管理，因为同一类主机需要被监控的指标很有可能都是相同的，所以将他们分为一组方便管理，这是后话，我们到时候再聊。

上面一段话中，我们提到了两个zabbix的常用术语，”主机”与”主机组”，我们再来总结一遍：
(1)host(主机)：需要被zabbix监控的对象，被称为主机，主机必须属于某个主机组。
(2)hostgroup(主机组)：”主机组”也被称为”主机群组”，是由具有相同属性、特征、角色的多个主机组成的逻辑单元。

2 添加主机

我们已经将zabbix-server、zabbix-database、zabbix-web安装在了192.168.0.91上。
同时，我们将zabbix-agent安装在了192.168.0.199上。
所以此处，192.168.0.199就是被监控的对象，我们需要将199添加为zabbix主机。

2.1 树莓派安装zabbix-agent

树莓派自带源，agent版本可以跟server端版本不一致。

sudo apt-get install zabbix-agent
systemctl status zabbix-agent查看状态

$ cd /etc/zabbix/
查看配置文件zabbix_agentd.conf

我们在刚开始介绍zabbix时，说过的”主动模式”与”被动模式”？这两种模式的相关配置，都需要在zabbix_agentd.conf中定义，打开这个文件，我们来配置一下最常用的agent端配置。
(1)通用参数配置段
首先，可以看到配置文件中有很多注释，打开配置文件，首先看到的就是”通用参数配置段”，我们可以在此配置段配置zabbix_agent进程的进程编号文件路径，存储日志方式，日志文件位置，日志滚动阈值等常用设定，细心如你一定已经发现，zabbix_agent配置文件的”通用配置段”中的参数大多数与zabbix_server配置文件中的常用参数意义相同，所以，此处不再过多赘述，如果没有特殊需要，保持默认即可。
(2)”主动模式”与”被动模式”
我们已经在最开始的概念介绍中，描述过，”主动模式”与”被动模式”都是对于agent端来说的，而且它们可以同时存在，并不冲突。

我们先来看看”被动模式”的相关配置参数。
(2-1)Passive checks related
被动模式相关参数如下：

(1)Server：用于指定允许哪台服务器拉取当前服务器的数据，
当agent端工作于被动模式，则代表server端会主动拉取agent端数据，
那么server端的IP必须与此参数的IP对应，此参数用于实现基于IP的访问控制，
如果有多个IP ,可以使用逗号隔开。

(2)ListenPort：用于指定当agent端工作于被动模式时所监听的端口号，
默认端口为10050，也就是说，server端默认访问10050端口，从而拉取数据。

(3)ListenIP：用于指定agent端工作于被动模式时所监听的IP地址，
默认值为0.0.0.0，表示监听本机的所有IP地址。

(4)StartAgents：用于指定预生成的agent进程数量。

(2-2)Active checks related
好了，被动模式的参数说完了，现在聊聊主动模式。
主动模式的常用参数如下：

(1)ServerActive：此参数用于指定当agent端工作于主动模式时，
将信息主动推送到哪台server上，当有多个IP时，可以用逗号隔开。

(2)Hostname：此参数用于指定当前主机的主机名，
server端通过此参数对应的主机名识别当前主机。

(3)RefreshActiveChecks：
此参数用于指明agent端每多少秒主动将采集到的数据发往server端。

此处，我们同时设置”被动模式”与”主动模式”的如下参数，其他保持默认即可，修改完成后保存退出。

Server=192.168.0.91
ServerActive=192.168.0.91
Hostname=raspberrypi

配置文件修改完成后，启动agent端进程。

systemctl restart zabbix-agent

2.2 添加主机群组

点击 “配置”= =>“主机群组” ，可以看到，系统默认已经为我们准备了一些主机组，如果这些主机组不满足我们的需要，我们也可以创建新的主机组，点击下图中的”创建主机群组”按钮，即可创建主机组，但是，现在我们还不用深入研究主机组，此处只是让大家了解一下，对主机组有一个初步的认识即可。

创建主机群组：raspberry。

2.3 添加主机

同样，点击 “配置”= => “主机” ，即可查看已经被加入zabbix主机列表的主机，可以看到，zabbix默认将zabbix server添加为了一台主机，以便可以自己监控自己。

但是此处，我们需要添加一台我们自己的主机，就是192.168.0.199，点击”创建主机”，点击创建主机之前，可以选择左侧的”群组”下拉菜单，以确定将要创建的主机所在的主机组，当然，我们也可以先不选主机组，直接点击”创建主机”按钮。

(1)我们可以在主机名称的文本框中填写被监控主机的主机名称。
(2)可见名称一般使用简短的、易读的、见名知义的名称表示主机即可。
(3)我们可以选择将要创建的主机属于哪个主机组，当然，如果没有合适的主机组，我们也可以直接在创建主机时，直接新建主机组，我们说过，每个主机必须存在于某个主机组中，所以，主机组是必须的。
(4)选择通过哪种接口监控当前主机，可选的方式有IPMI接口、JMX接口、SNMP接口、agent接口。
我们说过，”主机”在zabbix中，可以是服务器，路由器，交换机等等硬件设备，有的硬件设备只支持某种接口，所以，当我们添加主机时，会让我们选择通过哪种合适的接口监控它。

当然，如果一台主机能被多种接口所监控，也可以同时配置多个接口监控这台主机，但是当前，我们需要监控的主机是一台Linux服务器，而且已经安装了对应的agent端，所以此处，我们只使用agent接口对当前主机进行监控，而使用agent接口时，可以通过IP连接到对应agent，也可以使用主机名连接到对应agent，而此处，我们选择使用IP地址连接到对应的agent，IP地址就是我们将要添加的主机的IP，192.168.0.199 ，对应端口为默认的10050。

如果你想要使用主机名连接到对应的agent，那么需要保证主机名能够被正常解析到192.168.0.199上，此处不再赘述，如果有多个IP可以连接到对应agent，可以点击”添加”，添加一条新的IP。

(5)对将要添加的主机进行描述，添加相应的描述信息即可。

(6)表示是否使用zabbix proxy监控当前主机，虽然上图中，此处翻译为”由agent代理程序监测”，但是实际是用于指定zabbix proxy的，与zabbix agent并没有关系，但是因为我们没有配置zabbix_proxy,所以此处保持默认即可。

2.4 查看结果

好了，按照上述界面中的配置进行设置以后，点击”添加”按钮，即可简单的添加一台主机，可以看到，192.168.0.199已经被添加到了主机列表中。

可以看到我们刚才添加的testzbx1主机，但是testzbx1主机的”可用性”对应的4种接口都是灰色的。

上图中，ZBX就代表agent接口，虽然我们在添加主机时，配置了通过agent监控对应主机，但是，由于我们并没有配置监控主机的任何指标，所以，ZBX仍然是灰色的，也就是说，我们现在只是将192.168.0.199加入了zabbix的监控范围，但是并没有对它进行任何实际的监控，因为我们还没有配置任何”监控项”，至于怎样配置监控项，且听下回分解。

3 添加监控项

前文中，已经描述了怎样在zabbix中添加主机，但是，我们并没有对主机进行任何指标的实际监控，那么现在，我们来说说，具体怎样监控我们想要监控的指标。

3.1 监控理论

在具体操作之前，我们先聊聊理论，假设我们想要监控磁盘的使用率，在没有zabbix这种监控工具时，我们怎样监控呢，再或者，我们不仅没有zabbix这种监控工具，我们也不会写脚本，更不会写任何程序，我们该如何监控磁盘的使用率呢。

没错，人工监控，当我们无法依赖任何工具或者脚本等外部助力时，我们只能不停的看着屏幕，查看当前磁盘的使用率，如果磁盘使用率达到了我们设定的阈值，我们就会作出相应的处理动作。即使我们是通过人工完成监控的，我们也要想办法能够获取到被监控目标的数据，比如我们想要监控磁盘使用率，那么我们就要不停的获取磁盘的使用率信息，以便我们能够随时的了解磁盘的空间使用情况，那么我们怎样获取磁盘的使用率呢，就拿centos为例，我们可能会通过如下命令，获取每个分区的磁盘使用率。

获取每个分区的磁盘使用率
df -h

没错，我们通过命令，获取到了磁盘使用率的信息，当然，这个命令比较简短，方便我们从键盘键入，如果一条简单的命令，无法获取到磁盘使用率的信息呢，那么我们可能会通过一条稍微复杂的命令去实现监控，比如，如果我们只想要监控”根分区”磁盘使用率，我们可能会使用如下命令实现。

df -h | awk '$6~/^\/$/{print $5,$6}'

我们发现，获取监控信息的命令越来越长了，那么我们能不能尽量简化这些较长的命令呢，必须能啊，设置个别名不就行了，那么，我们把刚才的命令设置一个别名，直接执行命令别名试试。

alias rdu="df -h | awk '\$6~/^\/$/{print \$5,\$6}'"

可以看到，原本比较长的命令只缩减为了rdu三个字符。是不是比原来方便了许多呢，我们只需要三个字符，就能获取到根分区的使用情况。

这个时候，你可能会问，linux的命令别名与zabbix的监控项有关系吗，我们是来看怎么添加zabbix监控项的，不是来听你瞎BB的。

好吧，其实它们并没有什么关系，但是他们有一些类似的地方，比如，我们刚才做的工作，无非就是获取监控信息，需要获取监控信息，就要执行对应的命令，我们也可以通过别名，调用对应的命令，从而获取到我们想要或得到的监控信息。

在zabbix中，我们要监控的某一个指标，被称为”监控项”，就像我们的磁盘使用率，在zabbix中就可以被认为是一个”监控项”(item)，如果要获取到”监控项”的相关信息，我们则要执行一个命令，但是我们不能直接调用命令，而是通过一个”别名”去调用命令，这个”命令别名”在zabbix中被称为”键”(key)。

所以，在zabbix中，如果我们想要获取到一个”监控项”的值，则需要有对应的”键”，通过”键”能够调用相应的命令，获取到对应的监控信息，我们暂且这样理解，方便我们入门。

好了，我们此处又提到了两个新的术语，我们来总结一遍：

(1)监控项（item）：某个监控指标，在zabbix中就被称之为一个item，某个主机中可能有多个需要被监控的指标，也就是说，某个host中可能有多个item。

(2)键（key 、item key）：如果想要获取监控项对应的数据，则必须通过某个key去获取，我们可以把key想象成调用对应命令的”命令别名”，zabbix中自带一些key，这些key往往比较通用，比如，通过这些key，我们可以监控cpu，内存，硬盘等常用指标，获取不同的指标信息，需要不同的key，但是如果这些自带的key无法满足我们的监控需求时，我们也可以自定义key，通过自定义key执行对应的操作，这些都是后话，我们慢慢来。

3.2 添加监控项

一、点击pi20211121主机上的”监控项”,如下图所示位置。

二、进入监控项配置界面后，可以根据一些条件，筛选出已经存在的一些监控项，但是我们并没有任何监控项，所以此处，我们直接点击”创建监控项”按钮，以便新建监控项。

三、假如，现在我们想要监控pi20211121这台主机的CPU的上下文切换次数，那么我们可以在此界面进行如下配置。

(1)首先，在名称文本框中设置监控项的名称，我们此处监控的指标为cpu上下文切换次数，所以，命名此监控项为”cpu+context+switches”。
(2)因为我们在pi20211121这台主机上安装了zabbix agent，所以，此处类型保持默认，选择zabbix客户端。
(3)在键值一栏中,我们可以选择对应的key，也就是说，我们通过哪个key，获取到cpu的上下文切换次数的信息，所以，点击”选择”按钮,点击选择按钮以后，可以看到非常多的预先定义好的key，这些key都是zabbix自带的key，这些key一般都是系统级别的通用的监控项所能够用到的key，如果这些”键”不能满足我们的需求，我们则需要自定义key，这是后话，到时再聊，此处，我们选择system.cpu.switches。

(4)我们就是通过agent接口监控数据的，agent监听在10050端口上，此处保持默认即可。
(5)而我们刚才也看到了，通过zabbix_get获取到的system.cpu.switches的数据，都是一些十进制的整数，所以，信息类型选择数字，数据类型选择十进制。
(6)单位，次数。
(7)数据更新间隔表示每隔多长时间获取一次监控项对应的数据，为了演示方便，能够尽快获取到数据，我们设定为每隔30秒获取一次监控信息，此处表示每隔30秒获取一次192.168.0.199主机的cpu上下文切换次数。

但是需要注意，在生产环境中，如果不是特别重要的、敏感的、迅速变化的数据，不要获取的这么频繁，因为如果我们的监控项变得特别多时，获取信息的时间间隔过于频繁会带来巨大的监控压力，同时对数据库的写入也是一种考验。

(8)当然，我们也可以灵活的定义时间间隔，比如，周一到周五我们的业务量比较少，可以10分钟获取一次数据，而周六周日的业务量会剧增，为了实时监控，可以设置5分钟获取一次数据，这里只是举个例子，如果有类似的需求，可以通过”自定义时间间隔”配置段，添加不同时间段的不同监测频率。

(9)因为我们每隔30秒就获取一次数据，那么这些数据都会变成历史数据，存入数据库中，通过上图中的历史数据文本框，可以设置历史数据的保存时长。

上图中，我们设置历史数据保存8天，此监控项超过100天的数据将会被zabbix删除。

从上图中，还可以看到有一个趋势数据保存天数，趋势数据是什么意思呢？趋势数据就是每个小时收集到的历史数据中的最大值、最小值，平均值以及每个小时收集到的历史数据的数量，所以，趋势数据每小时收集一次，数据量不会特别大，一般情况下，历史数据的保留时间都比趋势数据的保留时间短很多，因为历史数据比较多，如果我们监控的主机非常多，而且监控的频率特别频繁，那么数据库的压力则会变得非常大。

(10)继续向下看，可以看到查看值下拉框。
那么查看值是什么意思呢？查看值可以改变监控数据的展示方式，以便监控人员更容易理解，此处我们保持默认即可，在实际用到时我们再做解释。
(11)新的应用集与应用集是什么意思呢？
我们可以把”应用集”理解为同一类型的监控项的集合,”应用集”英文原词为application ，application为一组item（监控项）的集合，比如，我们有3个监控项，它们分别监控”磁盘使用率”，”磁盘写入速率”，”磁盘读取速率”，虽然它们监控的指标不同，但是他们都是监控”磁盘”的监控项，所以，我们可以把它们归类为”磁盘”应用集。

同理，如果有2个监控项，一个是监控nginx连接数量的，一个是监控nginx请求数量的，虽然它们监控的指标不同，但是他们都是监控nginx相关指标的，所以，我们可以把他们归为nginx应用集。

但是，由于我们没有创建过任何应用集，所以上图中，应用集选择框中没有任何可选应用集，如果没有可选的合适的应用集，我们可以直接在”新的应用集”文本框中填入要创建的应用集名称，那么对应应用集会自动被创建，当前监控项也会自动归类为这个应用集。

(12)”填入主机资产纪录栏位”我们后面再聊。

(13)描述信息栏填写关于这个监控项的相关描述。

(14)“已启用”默认被勾选，表示此监控项被创建后，立即生效，即创建此监控项后立即开始监控。
(15)点击添加按钮以后，可以看到，pi20211121主机的第一个监控项已经被添加，而且处于已启用状态。

3.3 查看监控项

我们已经创建了一个监控项，那么怎样查看这个监控项的监控情况呢？
(1)点击 “监测中” ==>“最新数据”，但是目前并没有展示出任何数据，因为我们还没有指定要查看哪些监控数据。

(2)筛选查询

(3)点击图形
点击上图中的”图形”连接，可以看到如下界面，zabbix已经监控到了对应的cpu上下文切换频率，并且绘制出了对应的”图形”。

从上图中，可以看到，zabbix除了为我们绘制出了图形以外，还显示出了最大值、最小值、平局值等信息，上图中，正常显示为中文。

如果你的界面不能正常显示中文，那么证明你没有上传中文字体，或者没有正确的配置显示字体选项，我们在安装zabbix 的文章中已经描述了解决问题的过程，此处不再赘述。

我们已经为主机添加了第一个监控项，并且已经成功监控到了对应的数据，好了，我们已经入门了。

3.4 zabbix_get服务端命令

我们在介绍zabbix的概念时已经说过：管理员可以在server端使用一个名为zabbix_get的工具，测试是否能够从agent端拉取数据。
我们可以在服务端安装zabbix_get包，以便向agent端发起测试采集数据请求。

其实，我们可以先通过命令行，看看对应的”键”返回的信息到底是什么样子的。
我们在server端，使用如下命令，获取一下system.cpu.switches这个键对应的值。

zabbix_get -s 192.168.0.199 -k system.cpu.switches
通过-s选项指定被监控主机的IP，
通过-k选项指定对应的KEY，即可获得对应主机的对应监控指标的信息。

上图中，我们在server端通过zabbix_get命令，使用system.cpu.switches这个”键”，获得了192.168.0.199这台主机上的cpu上下文切换次数。

可以看到，cpu的上下文切换次数是在不停的增长的，而且返回的值是一个整数。

4 添加带有参数的监控项

这次，我们再为testzbx1主机添加一个监控项，用于监控磁盘分区的使用率。
(1)点击zabbix控制台的 “配置”==>“主机”，点击pi20211121主机的监控项。
(2)点击”创建监控项”按钮。
(3)我们命名监控项名称为RootPartitionUsed。
(4)选择键。

这次我们选择的键，除了键名以外，还多出了传入参数的位置。

对于”vfs.fs.size[fs,<mode>]”这个键来说，
”vfs.fs.size”就是键名，
”[fs,<mode>]”就是这个键需要的参数。

而”[fs,<mode>]”这两个参数中，fs是不可省参数，mode是可省参数。
如果参数被尖括号括起，则代表这个参数是可省参数，例如上述的<mode>。
如果参数没有被尖括号括起，则代表是不可省参数，例如上述的fs。

fs代表对应的文件系统，我们可以理解为对应的文件系统所在的分区。
mode的值可以为：

total，获取对应文件系统的总大小（省略mode参数时，此为默认值）。
free，获取对应文件系统的空余空间大小。
used，获取对应文件系统的已经使用的空间的大小。
pfree，空闲率。
pused，使用率。

还记得这个键返回的两种数据类型吗，如果我们将mode设置为total，free，used，那么，这个键返回的数据类型将为整形（就是一个整数）。
如果我们将mode设置为pfree或者pused，那么这个键返回的信息的数据类型就是浮点型（带有小数点的数字）。
而且，帮助文档中还给出了这个”键”的使用示例vfs.fs.size[/tmp,free]，示例表示获取/tmp所对应的文件系统的剩余空间大小。

当我们选择了对应的键以后，我们还需要做出适当的修改，将其参数值改成我们所需要的值vfs.fs.size[/,pused]。
(5)由于我们获取的数据为根分区的使用率，返回的信息为浮点型，所以，信息类型选择浮点型，由于返回的信息为磁盘使用率，所以单位设置为 “%”
(6)为了演示方便，我并没有将数据更新间隔设置为3600,而是设置10秒收集一次磁盘数据，再次强调，这样设置只是为了快速获取演示效果，生产环境中对于类似这样的数据不要监控的如此频繁，配置如下后，点击添加按钮。

(7)监控项添加完毕后，等待一分钟左右，查看对应的监控数据，如下，点击监控项对应的”图形”连接。

如果数据较多，我们可以拖动监控视图的”镜头”，调整”镜头”的远近以及位置，即可看到不同时间段的监控数据，但是因为我们磁盘使用率一直没有多大变化，所以，看不出镜头移动时的效果，如果是长时间的波动的数据，拖动镜头时的效果则比较明显。
次，我们又添加了一个监控项，只是与上一次相比，我们这次添加的监控项可以传入参数。

而且，我们已经了解到，如果想要搞明白zabbix的各种自带key的作用，可以参考zabbix官方在线手册：
在线手册
https://www.zabbix.com/documentation/3.0/manual/config/items/itemtypes/zabbix_agent

2020年最新程序员职业发展路线指南，超详细！编程流川枫 11 编程语言程序员互联网 IT 职业
【文章来源微信公众号：每天学编程】01、程序员的特性技术出身的职场人特性很明显，与做市场、业务出身的职场人区别尤其明显。IT行业中常见的一些职场角色：老板、项目经理、产品经理、需求分析师、设计师、开发工程师、运维工程师等。开发工程师具有如下特征：1、逻辑思维清晰、严谨和细腻；但是有时不容易转弯，有些程序员容易较劲、钻牛角尖。2、性格偏内向、不善于沟通、表达和交际；但是在网络聊天工具上，有些显为幽默
【从问题中去学习k8s】k8s中的常见面试题（夯实理论基础）（二十八）向往风的男子 k8s 学习 kubernetes 容器
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》从问题中去学习k8s《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》
ruby和python哪个好学 hakesashou python基础知识 ruby python 开发语言
Ruby和python都挺好学的。建议学习Python，语法的话，Python相对更简洁。而且Python应用场合更广泛，运维、网站开发、数据处理、科学研究都可以。Ruby和Python十分相似，有很多共同点，但也有一些不同之外，以下是Python和Ruby的对比：1、Python和Ruby都是面向对象的语言，都是动态和灵活的。二者的主要区别在于他们解决问题的方式。Ruby提供了不同的方法，而Py
华为云分布式缓存服务DCS与开源服务差异对比 hcinfo_18 redis使用华为云 Redis5.0 分布式缓存服务 Redis客户端
分布式缓存服务DCS提供单机、主备、集群等丰富的实例类型，满足用户高读写性能及快速数据访问的业务诉求。支持丰富的实例管理操作，帮助用户省去运维烦恼。用户可以聚焦于业务逻辑本身，而无需过多考虑部署、监控、扩容、安全、故障恢复等方面的问题。DCS基于开源Redis、Memcached向用户提供一定程度定制化的缓存服务，因此，除了拥有开源服务缓存数据库的优秀特性，DCS提供更多实用功能。一、与开源Red
软件测试/测试开发/全日制 |利用Django REST framework构建微服务霍格沃兹-慕漓 django 微服务 sqlite
霍格沃兹测试开发学社推出了《Python全栈开发与自动化测试班》。本课程面向开发人员、测试人员与运维人员，课程内容涵盖Python编程语言、人工智能应用、数据分析、自动化办公、平台开发、UI自动化测试、接口测试、性能测试等方向。为大家提供更全面、更深入、更系统化的学习体验，课程还增加了名企私教服务内容，不仅有名企经理为你1v1辅导，还有行业专家进行技术指导，针对性地解决学习、工作中遇到的难题。让找
Prometheus运维六 PromQL查询语言详解及操作安顾里 Prometheus 监控类大数据 kubernetes 运维 linux
海阔凭鱼跃，天高任鸟飞Prometheus官网：https://prometheus.io/文章目录1.什么是PromQL?2.PromQL的基本使用2.1时间序列选择器2.1.1瞬时向量选择器2.2区间向量选择器2.2.1范围向量选择器2.2.2时间位移操作2.2.3使用聚合操作2.3标量和字符串3.PromQL操作符4.内置常用函数5.HTTPAPI操作PromQL6.使用建议1.什么是Pro
Ansible架构介绍与安装 2401_86637445 ansible 架构
一、介绍Ansible什么是Ansible?Ansible是一款自动化运维工具，其主要功能是帮助运维实现IT工作的自动化、降低人为操作失误、提高业务自动化率、提升运维工作效率。实现了批量系统配置、批量程序部署、批量运行命令等功能。ansiblepuppetsaltstack主流的三种。ansible自动化运维工具被红帽收购阿里巴巴在用saltstackpython开发。无客户端，只需安装SSH、P
【K8S】kubernetes集群架构与组件奇奇怪怪^ 云 Linux IT 运维服务器 linux
文章目录【K8S】kubernetes集群架构与组件kubernetes组件**master组件**node组件整体流程POD终止过程【K8S】kubernetes集群架构与组件kubernetes组件K8S是属于主从设备模型(Master-slave架构)，即有Master节点负责集群的调度、管理和运维，Slave节点是集群中的运算工作负载节点在K8S中，主节点一般被称为Master节点，而从节
Spring Boot实现多租户架构 spring_root spring boot 架构后端
一、概述1什么是多租户架构？多租户架构是指在一个应用中支持多个租户（Tenant）同时访问，每个租户拥有独立的资源和数据，并且彼此之间完全隔离。通俗来说，多租户就是把一个应用按照客户的需求“分割”成多个独立的实例，每个实例互不干扰。2多租户架构的优势更好地满足不同租户的个性化需求。可以降低运维成本，减少硬件、网络等基础设施的投入。节约开发成本，通过复用代码，快速上线新的租户实例。增强了系统的可扩展
【Linux 从基础到进阶】Puppet配置管理工具使用爱技术的小伙子 Linux从基础到进阶 linux puppet 运维
Puppet配置管理工具使用Puppet是一种开源的配置管理工具，广泛用于自动化管理和配置服务器。它通过声明式的语言定义系统状态，能够跨多台服务器实现一致性配置。Puppet对运维团队来说，是一种强大的工具，能够有效管理服务器配置并简化操作复杂性。本文将详细介绍Puppet的核心概念、安装步骤、以及如何在CentOS和Ubuntu系统上进行配置和管理。1.Puppet的核心概念在使用Puppet之
Docker 安装配置和基本命令详解以及案例示范 J老熊 docker 容器运维面试 linux
1.引言容器化技术的快速发展给软件开发和运维带来了革命性的变化，Docker作为这一领域的领军者，已经成为软件开发和部署流程中的重要工具。Docker的轻量化、快速启动和高效资源利用让开发者能够在不同的环境中实现一致的开发体验。本篇文章将详细讲解如何在CentOS系统中安装Docker，如何配置阿里云镜像加速，Docker的基本命令和语法，以及通过实际的电商交易系统案例来演示如何在Docker环境
服务器运维小技巧（二）——如何进行监控告警 baiolkdnhjaio 网络安全
服务器运维难度高的原因，很大程度是因为服务器一旦出现问题，生产环境的业务就会受到严重影响，极有可能带来难以承担的后果。因此这份工作要求工程师保持高要求的服务质量，能够快速响应问题，及时解决问题。但是“及时”的这一点很难做到，需要通过优化工作流程、建立预警系统，搭建自动化等行为快速响应。今天主要介绍如何通过服务器运维工具搭建监控预警的手段来辅助缩短响应时间。首先打开牧云主机管理助手，进入系统设置界面
科锐国际（计算机类），汤臣倍健，中建三局，宁德时代，途游游戏，得物，顺丰，康冠科技24春招内推 weixin_53585422 c++算法 python java c语言
科锐国际（计算机类），汤臣倍健，中建三局，宁德时代，途游游戏，得物，顺丰，康冠科技24春招内推①汤臣倍健【内推岗位】：市场类、营销类、研发类、电商类、职能类、IT技术类、商业分析类、生产运营类【内推链接】https://sourl.cn/JSDhLU【推荐码】ES3W2T②科锐国际(OD项目组--计算机专场)【招聘岗位】软件开发工程师、软件测试工程师、大数据开发工程师、运维工程师等计算机类岗位，2
前端发布 CDN缓存跳动的世界线前端缓存 CDN
公司给服务器加了CDN，导致有时前端代码上传打包后，正式环境页面效果却不更新。每次都需要去找运维刷CDN…让我彻底记住了CDN缓存CDN（ContentDeliveryNetwork，内容分发网络）是一种广泛使用的互联网技术，旨在提高用户访问网站的速度和可靠性。CDN的核心思想是将网站的内容缓存到全球分布的边缘节点上，让用户能够从最近的节点获取数据，从而减少延迟和带宽消耗。CDN缓存机制的基本原理
如何快速的构建企业运维可视化大屏益达_glmsb
基于AIOps理念研发的新一代运维监大屏全盘展示IT运行状态，减轻运维人员的重复性工作量，提高IT系统排错速度，加速运维知识学习积累。图片1.png领先的数据可视化平台，把IT运维化繁为简图片2.jpg图片3.png图片4.png图片5.png图片6.png全面提升IT运维管理水平1.直接导出精美的IT运行可视化报表图片7.png2.资源分析对比图片8.png3.自动生成监控项运行“脑图”图片9.
使用MLOps进行AI部署的顶级公司 AI研报人工智能
自从AI技术进入主流领域以来，MLOps（机器学习运维）已成为在生产环境中部署和管理机器学习模型的一系列实践，这对企业的成败起着关键作用。各种背景的公司都在采用MLOps技术，以简化操作、提高模型效率和扩展AI解决方案。本文介绍了在AI部署方面表现突出的顶尖公司，它们的策略以及成功案例。使用MLOps进行AI部署的公司1.谷歌谷歌在MLOps领域处于领先地位，凭借其在云计算和机器学习研发方面的深厚
ansible入门打败404 运维 linux ansible
一、ansible简介1、ansible是什么？ansible是目前最受运维欢迎的自动化运维工具，基于Python开发，集合了众多运维工具（SaltStackpuppet、chef、func、fabric）的优点，实现了批量系统配置、批量程序部署、批量运行命令等功能。ansible是基于paramiko开发的,并且基于模块化工作，本身没有批量部署的能力。真正具有批量部署的是ansible所运行的模
云平台下存储运维的变革与实践宋罗世家技术屋 VIP专栏运维大数据
【摘要】未来存储监控平台可结合整体智能运维分层立体的监控体系，实现从基础设施到租户业务的端到端全覆盖的立体监控，提供基础监控、业务监控、链路监控等方面通用平台能力，将监控平台+云服务+一线运维等各云服务监控整合基于监控平台实现自己特定业务监控。现有运维体系的建设现状随着银行数字化转型升级进程的加快，IT系统架构越来越复杂，软件更新迭代越来越快。银行信息化建设中的大量业务和数据需要依靠信息系统来完成
构建Java微服务架构的CI/CD流程微赚淘客系统@聚娃科技架构 java 微服务
构建Java微服务架构的CI/CD流程大家好，我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编，也是冬天不穿秋裤，天冷也要风度的程序猿！今天，我们来探讨如何构建一个高效的Java微服务架构的持续集成和持续部署（CI/CD）流程。随着微服务架构的流行，CI/CD已成为开发和运维流程中的关键部分，通过自动化的构建、测试和部署，能够大幅提高开发效率和系统可靠性。什么是CI/CD？CI/C
云原生应用——软件的未来快乐非自愿云原生
随着云计算技术的飞速发展，企业对于软件应用的部署和运行方式提出了新的要求。传统的软件部署模式已经难以满足现代企业对于敏捷性、可伸缩性和高可用性的需求。因此，云原生应用应运而生，它代表了软件开发和运维的新范式，预示着软件的未来。什么是云原生应用？云原生应用是指那些专门为在云环境中运行而量身定制和优化的应用程序。这些应用程序充分利用了云计算的核心特性，例如弹性伸缩、按需资源分配、微服务架构、容器化技术
Psutil：Python 系统和进程监控利器 ivwdcwso 运维开发 python 开发语言 Psutil 运维自动化系统管理
引言在现代IT运维和系统管理中，实时监控系统资源和进程状态是一项至关重要的任务。Python的psutil（PythonSystemandProcessUtilities）库为我们提供了一个跨平台的工具，使得获取系统信息和管理进程变得简单而高效。本文将详细介绍psutil的主要功能，并通过实际案例展示其在日常运维中的应用。什么是Psutil？Psutil是一个跨平台的库，用于获取运行进程和系统利用
利用zabbix监控ogg进程(Windows平台) Linux运维老纪万象人生-坚守Zabbix企业级监控岗位运维开发服务器云计算 zabbix linux
欢迎来到我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐:Linux运维老纪的首页,持续学习,不断总结,共同进步,活到老学到老导航剑指大厂系列:全面总结运维核心技术:系统基础、数据库、网路技术、系统安全、自动化运维、容器技术、监控工具、脚本编程、云服务等。常用运维工具系列:常用的运维开发工具,zab
TDengine和DolphinDB哪个更好，哈哈哈哈，闲来无聊分析了一下。(1) 2401_84023482 程序员 tdengine 大数据时序数据库
TDengine是专为时序数据设计的，针对的是物联网、工业互联网、IT运维场景。这些场景是不需要特殊的查询函数的，更关心的是写入速度、查询速度。而且这些场景下，也需要一些其他数据库不具备的功能，比如插值、时间聚合等等如果要问TDengine和DolphinDB最大的特色，存储引擎可能是TDengine最大的特色，性能也非常好；DolphinDB的最大特色毫无疑问是它的计算引擎。可以毫不夸张的说，D
CentOS 运维常用的shell脚本一碗情深运维运维 centos linux
文章目录一、操作系统磁盘空间查看实时获取系统运行状态获取cpu、内存等系统运行状态获取系统信息二、应用程序获取进程运行状态查看有多少远程的IP在连接本机三、用户管理统计当前Linux系统中可以登录计算机的账户有多少个创建用户四、自动化管理自动备份日志文件监控的页面地址，对tomcat状态进行重启或维护实时监控本机内存和硬盘，剩余空间不足发送报警邮件一、操作系统磁盘空间查看disk_info.shd
【从问题中去学习k8s】k8s中的常见面试题（夯实理论基础）（十一）向往风的男子 k8s 学习 kubernetes 容器
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》从问题中去学习k8s《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》
【2023年】云计算金砖牛刀小试3 geekgold 云计算 linux 运维容器 kubernetes 云原生
A场次题目：OpenStack平台部署与运维业务场景：某企业拟使用OpenStack搭建一个企业云平台，用于部署各类企业应用对外对内服务。云平台可实现IT资源池化，弹性分配，集中管理，性能优化以及统一安全认证等。系统结构如下图：企业云平台的搭建使用竞赛平台提供的两台云服务器，配置如下表：设备名称主机名接口ip地址云服务器1controllereth0，eth1私网：192.168.100.10/2
【2023年】云计算金砖牛刀小试 geekgold linux 容器 grafana prometheus ansible kubernetes 云原生
A模块题目OpenStack平台部署与运维任务1私有云平台环境初始化（6分）IP主机名192.168.157.30controller192.168.157.31compute1.配置主机名把controller节点主机名设置为controller,compute节点主机名设置为compute。分别在controller节点和compute节点将hostname命令的返回结果提交到答题框。【0.5
【2023年】云计算金砖牛刀小试2 geekgold 云计算运维容器 jenkins kubernetes devops docker
A场次题目：Openstack平台部署与运维control172.17.31.10compute172.17.31.20compute任务1私有云平台环境初始化1.初始化操作系统使用提供的用户名密码，登录竞赛云平台。根据表1中的IP地址规划，设置各服务器节点的IP地址，确保网络正常通信，设置控制节点主机名为Controller，计算节点主机名为Compute，并修改hosts文件将IP地址映射为主
网络安全（黑客）自学白帽子凯哥 web安全安全网络安全服务器网络
一、什么是网络安全网络安全可以基于攻击和防御视角来分类，我们经常听到的“红队”、“渗透测试”等就是研究攻击技术，而“蓝队”、“安全运营”、“安全运维”则研究防御技术。无论网络、Web、移动、桌面、云等哪个领域，都有攻与防两面性，例如Web安全技术，既有Web渗透，也有Web防御技术（WAF）。作为一个合格的网络安全工程师，应该做到攻守兼备，毕竟知己知彼，才能百战百胜。二、怎样规划网络安全如果你是一
网络安全（黑客）——自学2024 白帽子黑客-宝哥 web安全安全嵌入式硬件网络单片机
一、什么是网络安全网络安全是一种综合性的概念，涵盖了保护计算机系统、网络基础设施和数据免受未经授权的访问、攻击、损害或盗窃的一系列措施和技术。经常听到的“红队”、“渗透测试”等就是研究攻击技术，而“蓝队”、“安全运营”、“安全运维”则研究防御技术。作为一个合格的网络安全工程师，应该做到攻守兼备，毕竟知己知彼，才能百战百胜。二、网络安全怎么入门安全并非孤立存在，而是建立在其计算机基础之上的应用技术。
二分查找排序算法周凡杨 java 二分查找排序算法折半
一：概念二分查找又称折半查找（折半搜索/ 二分搜索），优点是比较次数少，查找速度快，平均性能好；其缺点是要求待查表为有序表，且插入删除困难。因此，折半查找方法适用于不经常变动而查找频繁的有序列表。首先，假设表中元素是按升序排列，将表中间位置记录的关键字与查找关键字比较，如果两者相等，则查找成功；否则利用中间位置记录将表分成前、后两个子表，如果中间位置记录的关键字大于查找关键字，则进一步
java中的BigDecimal bijian1013 java BigDecimal
在项目开发过程中出现精度丢失问题，查资料用BigDecimal解决，并发现如下这篇BigDecimal的解决问题的思路和方法很值得学习，特转载。原文地址：http://blog.csdn.net/ugg/article/de
Shell echo命令详解 daizj echo shell
Shell echo命令 Shell 的 echo 指令与 PHP 的 echo 指令类似，都是用于字符串的输出。命令格式： echo string 您可以使用echo实现更复杂的输出格式控制。 1.显示普通字符串: echo "It is a test" 这里的双引号完全可以省略，以下命令与上面实例效果一致： echo Itis a test 2.显示转义
Oracle DBA 简单操作周凡杨 oracle dba sql
--执行次数多的SQL select sql_text,executions from ( select sql_text,executions from v$sqlarea order by executions desc ) where rownum<81; &nb
画图重绘朱辉辉33 游戏
我第一次接触重绘是编写五子棋小游戏的时候，因为游戏里的棋盘是用线绘制的，而这些东西并不在系统自带的重绘里，所以在移动窗体时，棋盘并不会重绘出来。所以我们要重写系统的重绘方法。在重写系统重绘方法时，我们要注意一定要调用父类的重绘方法，即加上super.paint(g)，因为如果不调用父类的重绘方式，重写后会把父类的重绘覆盖掉，而父类的重绘方法是绘制画布，这样就导致我们
线程之初体验西蜀石兰线程
一直觉得多线程是学Java的一个分水岭，懂多线程才算入门。之前看《编程思想》的多线程章节，看的云里雾里，知道线程类有哪几个方法，却依旧不知道线程到底是什么？书上都写线程是进程的模块，共享线程的资源，可是这跟多线程编程有毛线的关系，呜呜。。。线程其实也是用户自定义的任务，不要过多的强调线程的属性，而忽略了线程最基本的属性。你可以在线程类的run()方法中定义自己的任务，就跟正常的Ja
linux集群互相免登陆配置林鹤霄 linux
配置ssh免登陆 1、生成秘钥和公钥 ssh-keygen -t rsa 2、提示让你输入，什么都不输，三次回车之后会在~下面的.ssh文件夹中多出两个文件id_rsa 和 id_rsa.pub 其中id_rsa为秘钥，id_rsa.pub为公钥，使用公钥加密的数据只有私钥才能对这些数据解密 c
mysql : Lock wait timeout exceeded; try restarting transaction aigo mysql
原文：http://www.cnblogs.com/freeliver54/archive/2010/09/30/1839042.html 原因是你使用的InnoDB 表类型的时候, 默认参数:innodb_lock_wait_timeout设置锁等待的时间是50s, 因为有的锁等待超过了这个时间,所以抱错. 你可以把这个时间加长,或者优化存储
Socket编程基本的聊天实现。 alleni123 socket
public class Server { //用来存储所有连接上来的客户 private List<ServerThread> clients; public static void main(String[] args) { Server s = new Server(); s.startServer(9988); } publi
多线程监听器事件模式(一个简单的例子) 百合不是茶线程监听模式
多线程的事件监听器模式监听器时间模式经常与多线程使用,在多线程中如何知道我的线程正在执行那什么内容,可以通过时间监听器模式得到创建多线程的事件监听器模式思路: 1, 创建线程并启动,在创建线程的位置设置一个标记 2,创建队
spring InitializingBean接口 bijian1013 java spring
spring的事务的TransactionTemplate，其源码如下： public class TransactionTemplate extends DefaultTransactionDefinition implements TransactionOperations, InitializingBean{ ... } TransactionTemplate继承了DefaultT
Oracle中询表的权限被授予给了哪些用户 bijian1013 oracle 数据库权限
Oracle查询表将权限赋给了哪些用户的SQL，以备查用。 select t.table_name as "表名", t.grantee as "被授权的属组", t.owner as "对象所在的属组"
【Struts2五】Struts2 参数传值 bit1129 struts2
Struts2中参数传值的3种情况 1.请求参数绑定到Action的实例字段上 2.Action将值传递到转发的视图上 3.Action将值传递到重定向的视图上一、请求参数绑定到Action的实例字段上以及Action将值传递到转发的视图上 Struts可以自动将请求URL中的请求参数或者表单提交的参数绑定到Action定义的实例字段上，绑定的规则使用ognl表达式语言
【Kafka十四】关于auto.offset.reset[Q/A] bit1129 kafka
I got serveral questions about auto.offset.reset. This configuration parameter governs how consumer read the message from Kafka when there is no initial offset in ZooKeeper or
nginx gzip压缩配置 ronin47 nginx gzip 压缩范例
nginx gzip压缩配置更多 0 nginx gzip 配置随着nginx的发展，越来越多的网站使用nginx，因此nginx的优化变得越来越重要，今天我们来看看nginx的gzip压缩到底是怎么压缩的呢？ gzip(GNU-ZIP)是一种压缩技术。经过gzip压缩后页面大小可以变为原来的30%甚至更小，这样，用
java-13.输入一个单向链表，输出该链表中倒数第 k 个节点 bylijinnan java
two cursors. Make the first cursor go K steps first. /* * 第 13 题：题目：输入一个单向链表，输出该链表中倒数第 k 个节点 */ public void displayKthItemsBackWard(ListNode head,int k){ ListNode p1=head,p2=head;
Spring源码学习-JdbcTemplate queryForObject bylijinnan java spring
JdbcTemplate中有两个可能会混淆的queryForObject方法： 1. Object queryForObject(String sql, Object[] args, Class requiredType) 2. Object queryForObject(String sql, Object[] args, RowMapper rowMapper) 第1个方法是只查
[冰川时代]在冰川时代,我们需要什么样的技术? comsci 技术
看美国那边的气候情况....我有个感觉...是不是要进入小冰期了? 那么在小冰期里面...我们的户外活动肯定会出现很多问题...在室内呆着的情况会非常多...怎么在室内呆着而不发闷...怎么用最低的电力保证室内的温度.....这都需要技术手段... &nb
js 获取浏览器型号 cuityang js 浏览器
根据浏览器获取iphone和apk的下载地址 <!DOCTYPE html> <html> <head> <meta charset="utf-8" content="text/html"/> <meta name=
C# socks5详解转 dalan_123 socket C#
http://www.cnblogs.com/zhujiechang/archive/2008/10/21/1316308.html 这里主要讲的是用.NET实现基于Socket5下面的代理协议进行客户端的通讯，Socket4的实现是类似的，注意的事，这里不是讲用C#实现一个代理服务器，因为实现一个代理服务器需要实现很多协议，头大，而且现在市面上有很多现成的代理服务器用，性能又好，
运维 Centos问题汇总 dcj3sjt126com 云主机
一、sh 脚本不执行的原因 sh脚本不执行的原因只有2个 1.权限不够 2.sh脚本里路径没写完整。二、解决You have new mail in /var/spool/mail/root 修改/usr/share/logwatch/default.conf/logwatch.conf配置文件 MailTo = MailFrom 三、查询连接数
Yii防注入攻击笔记 dcj3sjt126com sql WEB安全 yii
网站表单有注入漏洞须对所有用户输入的内容进行个过滤和检查，可以使用正则表达式或者直接输入字符判断，大部分是只允许输入字母和数字的，其它字符度不允许；对于内容复杂表单的内容，应该对html和script的符号进行转义替换：尤其是<,>,',"",&这几个符号这里有个转义对照表： http://blog.csdn.net/xinzhu1990/articl
MongoDB简介[一] eksliang mongodb MongoDB简介
MongoDB简介转载请出自出处：http://eksliang.iteye.com/blog/2173288 1.1易于使用 MongoDB是一个面向文档的数据库，而不是关系型数据库。与关系型数据库相比，面向文档的数据库不再有行的概念，取而代之的是更为灵活的“文档”模型。另外，不
zookeeper windows 入门安装和测试 greemranqq zookeeper 安装分布式
一、序言以下是我对zookeeper 的一些理解： zookeeper 作为一个服务注册信息存储的管理工具，好吧，这样说得很抽象，我们举个“栗子”。栗子1号：假设我是一家KTV的老板，我同时拥有5家KTV，我肯定得时刻监视
Spring之使用事务缘由(2-注解实现) ihuning spring
Spring事务注解实现 1. 依赖包： 1.1 spring包： spring-beans-4.0.0.RELEASE.jar spring-context-4.0.0.
iOS App Launch Option 啸笑天 option
iOS 程序启动时总会调用application:didFinishLaunchingWithOptions:，其中第二个参数launchOptions为NSDictionary类型的对象，里面存储有此程序启动的原因。 launchOptions中的可能键值见UIApplication Class Reference的Launch Options Keys节。 1、若用户直接
jdk与jre的区别（_） macroli java jvm jdk
简单的说JDK是面向开发人员使用的SDK，它提供了Java的开发环境和运行环境。SDK是Software Development Kit 一般指软件开发包，可以包括函数库、编译程序等。 JDK就是Java Development Kit JRE是Java Runtime Enviroment是指Java的运行环境，是面向Java程序的使用者，而不是开发者。如果安装了JDK，会发同你
Updates were rejected because the tip of your current branch is behind qiaolevip 学习永无止境每天进步一点点众观千象 git
$ git push joe prod-2295-1 To [email protected]:joe.le/dr-frontend.git ! [rejected] prod-2295-1 -> prod-2295-1 (non-fast-forward) error: failed to push some refs to '[email protected]
[一起学Hive]之十四-Hive的元数据表结构详解 superlxw1234 hive hive元数据结构
关键字：Hive元数据、Hive元数据表结构之前在 “[一起学Hive]之一–Hive概述，Hive是什么”中介绍过，Hive自己维护了一套元数据，用户通过HQL查询时候，Hive首先需要结合元数据，将HQL翻译成MapReduce去执行。本文介绍一下Hive元数据中重要的一些表结构及用途，以Hive0.13为例。文章最后面，会以一个示例来全面了解一下，
Spring 3.2.14，4.1.7，4.2.RC2发布 wiselyman Spring 3
Spring 3.2.14、4.1.7及4.2.RC2于6月30日发布。其中Spring 3.2.1是一个维护版本(维护周期到2016-12-31截止)，后续会继续根据需求和bug发布维护版本。此时，Spring官方强烈建议升级Spring框架至4.1.7 或者将要发布的4.2 。其中Spring 4.1.7主要包含这些更新内容。