No_red

运维笔记31 (pacemaker高可用集群搭建的总结)

概述：

pacemaker是heartbeat到了v3版本后拆分出来的资源管理器，所以pacemaker并不提供心跳信息，我们这个集群还需要corosync（心跳信息）的支持才算完整。pacemaker的功能是管理整个HA的控制中心，客户端通过pacemaker来配置管理整个集群。还有一款帮助我们自动生成配置文件，并且进行节点配置文件同步的crmshell是我们搭建集群的时候的一个利器。

1.安装集群软件

    yum install pacemaker corosync -y

直接通过yum安装pacemaker和corosync

crmsh-1.2.6-0.rc2.2.1.x86_64.rpm

pssh-2.3.1-2.1.x86_64.rpm

安装以上两个rpm包，其中crmsh对pssh有依赖性。

2.通过crm配置集群

[root@ha1 ~]# crm
crm(live)#

直接输入crm(cluster resource manager)进入集群资源管理器

crm(live)# 
?           cib         exit        node        ra          status      
bye         configure   help        options     resource    up          
cd          end         history     quit        site

输入tab键可以看到相关的管理项

我们现在需要配置集群，所有进入configure。

ERROR: running cibadmin -Ql: Could not establish cib_rw connection: Connection refused (111)
Signon to CIB failed: Transport endpoint is not connected
Init failed, could not perform requested operations

出现了如上的错误，这应该是没有开启corosync服务造成的。就算没有看到错误，我们连心跳层都没有开更不要谈开启更高层的集群管理了，所以现在先配置corosync。

[root@ha1 ~]# rpm -ql corosync
/etc/corosync
/etc/corosync/corosync.conf.example

使用rpm命令查找到corosync的配置文件的位置。

将配置文件后的example去掉，配置文件内容修改成如下即可：

# Please read the corosync.conf.5 manual page
compatibility: whitetank

totem {
	version: 2
	secauth: off
	threads: 0
	interface {
		ringnumber: 0			
		bindnetaddr: 192.168.5.0		#集群管理信息所传送的网段
		mcastaddr: 226.94.1.1			#确定多播地址
		mcastport: 5405				#确定多播端口
		ttl: 1					#只向外多播ttl为1的报文，防止发生环路
	}
}

logging {
	fileline: off
	to_stderr: no
	to_logfile: yes
	to_syslog: yes
	logfile: /var/log/cluster/corosync.log
	debug: off
	timestamp: on
	logger_subsys {
		subsys: AMF
		debug: off
	}
}

amf {
	mode: disabled
}
service {		#让corosync去加载pacemaker
	name: pacemaker
	ver: 0		#版本号，如果版本号是1的话这个插件不会去启动pacemaker，如果为0就会自动启用pacemaker
}

接下来启动corosync如果启动成功，而且日志中没有报错，那么就成功了。

现在crm应该可以正常使用了。

crm(live)# configure 
crm(live)configure# show
node ha1.mo.com
node ha2.mo.com
property $id="cib-bootstrap-options" \
	dc-version="1.1.10-14.el6-368c726" \
	cluster-infrastructure="classic openais (with plugin)" \
	expected-quorum-votes="2"

[root@ha1 cluster]# crm configure show
node ha1.mo.com
node ha2.mo.com
property $id="cib-bootstrap-options" \
	dc-version="1.1.10-14.el6-368c726" \
	cluster-infrastructure="classic openais (with plugin)" \
	expected-quorum-votes="2"

在bash下输入相应命令也会显示，但是没有了补全。

现在咱们给集群添加相应服务

先是较为简单的ip服务

crm(live)configure# primitive vip ocf:heartbeat:IPaddr2 params ip=192.168.5.100 cidr_netmask=24 op monitor interval=30s

这条命令看似很长，但其实都是补全出来的，你只要理解你的操作，基本不需要记忆就可以配置出来这些，其中ocf表示的是集群服务脚本，LSB是linux下的标准脚本，也就是放置在/etc/init.d下的脚本。

每次修改了一下配置文件，并不是马上就被保存并输出成程序可读的xml，需要你进行commit操作才可以。

crm(live)configure# commit
   error: unpack_resources: 	Resource start-up disabled since no STONITH resources have been defined
   error: unpack_resources: 	Either configure some or disable STONITH with the stonith-enabled option
   error: unpack_resources: 	NOTE: Clusters with shared data need STONITH to ensure data integrity
Errors found during check: config not valid
Do you still want to commit?

我提交后出现了如上的错误，是STONITH的问题，说我们定义了STONITH，但是没进行配置，这里我们先不管，因为我们添加的是ip服务，直接确定提交。注意确认提交后，服务就会生效了。

我们通过crm自带的查看功能看一下服务是否正常。

crm(live)configure# cd
crm(live)# resource 
crm(live)resource# show
 vip	(ocf::heartbeat:IPaddr2):	Stopped 
crm(live)resource# start vip
crm(live)resource# show
 vip	(ocf::heartbeat:IPaddr2):	Stopped

通过cd回到一开始的目录下，然后进入resource查看资源情况，发现没有启动这就很奇怪了，手动启动后仍然失败，说明配置有问题，我们查看下日志。

GINE [ input=I_PE_CALC cause=C_FSA_INTERNAL origin=abort_transition_graph ]
Feb 27 07:14:09 ha1 pengine[6053]:    error: unpack_resources: Resource start-up disabled since no STONITH resources have been defined
Feb 27 07:14:09 ha1 pengine[6053]:    error: unpack_resources: Either configure some or disable STONITH with the stonith-enabled option
Feb 27 07:14:09 ha1 pengine[6053]:    error: unpack_resources: NOTE: Clusters with shared data need STONITH to ensure data integrity

只发现了STONITH的错误，我们尝试关闭STONITH。

crm(live)configure# property stonith-enabled=false
crm(live)resource# show
 vip	(ocf::heartbeat:IPaddr2):	Started

发现服务已经正常。所以一定要清除ERROR。经过上面的操作，大家一定感觉这个pacemaker很好用，配置集群的时候只要在一个节点上修改，所有节点就都修改好了不用再继续分发操作。

现在测试一下是否有健康检查，关闭ha1的网络

[root@ha2 ~]# crm_mon

Last updated: Mon Feb 27 07:30:23 2017
Last change: Mon Feb 27 07:16:50 2017 via cibadmin on ha1.mo.com
Stack: classic openais (with plugin)
Current DC: ha2.mo.com - partition WITHOUT quorum
Version: 1.1.10-14.el6-368c726
2 Nodes configured, 2 expected votes
1 Resources configured

Online: [ ha2.mo.com ]
OFFLINE: [ ha1.mo.com ]

一般STONITH是一个硬件设备，我们的服务是虚拟机，所以需要一个虚拟的fence设备。

[root@ha1 ~]# stonith_admin -I
 fence_pcmk
 fence_legacy
2 devices found

查看已经安装的fence设备，没有我们需要的fence_xvm。我们查一下万能的yum

fence-virt.x86_64 : A pluggable fencing framework for virtual machines

发现这个很符合我们的需求，安装看一下

[root@ha1 ~]# stonith_admin -I
 fence_xvm
 fence_virt
 fence_pcmk
 fence_legacy
4 devices found

现在就有了我们需要的fence_xvm

[root@ha1 ~]# stonith_admin -M -a fence_xvm

使用上面命令添加fence代理
进入crm将fence的配置添加进去。

crm(live)configure# primitive vmfence stonith:fence_xvm params pcmk_host_map="ha1.mo.com:ha1;ha2.mo.com:ha2" op monitor interval=20s

上面的pcmk_host_map代表的是虚拟机的主机名和虚拟机的域名的对应关系。
现在查看一下fence的运行状况

vmfence (stonith:fence_xvm):    Started ha2.mo.com

现在添加一个http服务测试一下。

crm(live)configure# primitive apache lsb:httpd op monitor interval=30s

查看运行情况
现在结合一下我们前几天学的RHCS套件，ip和http服务的启动顺序是要由先后的，所以我们接下来要定义服务的先后顺序。

crm(live)configure# group website vip apache

这样就将vip和apache绑定成了一个组，而且是vip先启动然后是http服务。现在看一下服务的状态

crm(live)resource# show
 vmfence	(stonith:fence_xvm):	Started 
 Resource Group: website
     vip	(ocf::heartbeat:IPaddr2):	Started 
     apache	(lsb:httpd):	Started

现在一个服务的基本雏形已经出来了，我们测试一下fence是否有效。关闭ha1的http服务。

Failed actions:
    apache_monitor_30000 on ha1.mo.com 'not running' (7): call=27, status=complete, last-rc-change='Mon Feb 27 22:32:36 2017', queued=0ms, exec=0ms

通过在ha2上对集群的观察，集群已经发现了ha1上的http服务关闭，但是并没有启动fence，而是直接开启了ha1的http服务。
现在让ha1的网卡挂掉

2 Nodes configured, 2 expected votes
3 Resources configured


Node ha1.mo.com: UNCLEAN (offline)
Online: [ ha2.mo.com ]

 Resource Group: website
     vip        (ocf::heartbeat:IPaddr2):	Started ha1.mo.com
     apache     (lsb:httpd):    Started ha1.mo.com

出现了一个奇怪的现象，服务并没有进行切换，仍然在ha1上。原来pacemaker有一个法定人数的选项我们没有设置，如果开启，集群就会认为当节点少于2个节点集群就坏掉了，在实际情况下，是一种容灾策略。

crm(live)configure# property no-quorum-policy=ignore

将这条输入，继续测试，当前服务在2上，现在将2的网卡关闭

Last change: Mon Feb 27 22:46:35 2017 via cibadmin on ha2.mo.com
Stack: classic openais (with plugin)
Current DC: ha1.mo.com - partition with quorum
Version: 1.1.10-14.el6-368c726
2 Nodes configured, 2 expected votes
3 Resources configured


Online: [ ha1.mo.com ha2.mo.com ]

vmfence (stonith:fence_xvm):    Started ha1.mo.com
 Resource Group: website
     vip        (ocf::heartbeat:IPaddr2):	Started ha1.mo.com
     apache     (lsb:httpd):    Started ha1.mo.com

可以看到服务切到了1上，而且ha2关机了。

现在将ldirectord服务加上，这样我们的集群就具备对lvs的操作功能了。关于ldirectord的配置在上一章博客上已经有说明，这里我们要配置一个虚拟ip是172.25.3.100，分配负载的两节点ip是172.25.3.3和172.25.3.4。

现在将ldirectord加入配置文件

crm(live)configure# primitive lvs lsb:ldirectord op  monitor interval=30s

接下来我们要为这个website添加存储服务。在这之前介绍几条命令，用于让某个节点下线和上线。

Last updated: Tue Feb 28 22:35:00 2017
Last change: Tue Feb 28 22:34:04 2017 via cibadmin on ha1.mo.com
Stack: classic openais (with plugin)
Current DC: ha1.mo.com - partition with quorum
Version: 1.1.10-14.el6-368c726
2 Nodes configured, 2 expected votes
3 Resources configured


Node ha1.mo.com: standby
Online: [ ha2.mo.com ]

vmfence (stonith:fence_xvm):    Started ha2.mo.com
 Resource Group: website
     vip        (ocf::heartbeat:IPaddr2):	Started ha2.mo.com
     apache     (lsb:httpd):    Started ha2.mo.com

现在服务在ha2上运行，让ha2掉线看结果

Last updated: Tue Feb 28 22:37:21 2017
Last change: Tue Feb 28 22:37:21 2017 via crm_attribute	on ha2.mo.com
Stack: classic openais (with plugin)
Current DC: ha1.mo.com - partition with quorum
Version: 1.1.10-14.el6-368c726
2 Nodes configured, 2 expected votes
3 Resources configured


Node ha1.mo.com: standby
Node ha2.mo.com: standby

现在两节点都处在standby状态，我们让ha1上线

Node ha2.mo.com: standby
Online: [ ha1.mo.com ]

vmfence (stonith:fence_xvm):    Started ha1.mo.com
 Resource Group: website
     vip        (ocf::heartbeat:IPaddr2):	Started ha1.mo.com
     apache     (lsb:httpd):    Started ha1.mo.com

ha1开始接管

如果配置文件已经确实没有错误了，但是服务依旧起不来，比如我开启集群后，忘记开启真机的fence_virtd导致虚拟机的vmfence无法启动，可以尝试下面的命令，cleanup的作用就是刷新资源的状态

crm(live)resource# cleanup vmfence

Cleaning up vmfence on ha1.mo.com
Cleaning up vmfence on ha2.mo.com
Waiting for 1 replies from the CRMd. OK

现在查看一下各个资源脚本的一些要求

start and stop Apache HTTP Server (lsb:httpd)

The Apache HTTP Server is an efficient and extensible  \
 	       server implementing the current HTTP standards.

Operations' defaults (advisory minimum):

    start         timeout=15
    stop          timeout=15
    status        timeout=15
    restart       timeout=15
    force-reload  timeout=15
    monitor       timeout=15 interval=15

以上是apache脚本的一些介绍。

接下来为集群添加一个drbd共享存储和mysql服务。

首先为ha1和ha2加入两块4G的硬盘，关于DRBD从源码包成为rpm包的具体过程可以传送门

[root@ha1 x86_64]# ls
drbd-8.4.2-2.el6.x86_64.rpm                  drbd-heartbeat-8.4.2-2.el6.x86_64.rpm                 drbd-pacemaker-8.4.2-2.el6.x86_64.rpm  drbd-xen-8.4.2-2.el6.x86_64.rpm
drbd-bash-completion-8.4.2-2.el6.x86_64.rpm  drbd-km-2.6.32_431.el6.x86_64-8.4.2-2.el6.x86_64.rpm  drbd-udev-8.4.2-2.el6.x86_64.rpm
drbd-debuginfo-8.4.2-2.el6.x86_64.rpm        drbd-km-debuginfo-8.4.2-2.el6.x86_64.rpm              drbd-utils-8.4.2-2.el6.x86_64.rpm

最终生成的rpm包。之后下载mysql，将mysql的文件放到drbd的共享存储下。

将drbd的meta数据创建好，启动服务，强制为primary，这里注意你的drbd底层存储一定不能格式化过，否则你怎样强制primary都不会成功的，我已经犯了两次错误了。将drbd设备挂载到/var/lib/mysql也就是mysql的根目录，这样mysql的数据就在drbd设备中了。切记停止mysql再去切换drbd的主备，不要让drbd的存储中有mysql的sock文件存在。

现在将dbrd服务关闭，开始让pacemaker集群接管。

首先添加drbd资源

crm(live)resource# primitive drbddata ocf:linbit:drbd params drbd_resource=mo op monitor interval=120s

这次使用的脚本是ocf的linbit，且一定要定义drbd_resource

设置drbd的主备

crm(live)resource# ms drbdclone drbddata meta master-max=1 master-node-max=1 clone-max=2 clone-node-max=1 notify=true

设置drbd设备的挂载

crm(live)resource# primitive sqlfs ocf:heartbeat:Filesystem params device=/dev/drbd1 directory=/var/lib/mysql fstype=ext4

将sqlfs和drbd设置到一个联合里面，方便后面定义启动顺序

crm(live)resource# colocation sqlfs-with-drbd inf: sqlfs drbdclone:Master

设置当drbd为主设备的时候才启动文件系统

crm(live)resource# order sqlfs-after-drbd inf: drbdclone:promote sqlfs:start

现在commit一下，看下是否生效。如果出现时间上的warning可以先暂时不理他们。

crm(live)resource# show
 vmfence	(stonith:fence_xvm):	Started 
 Resource Group: website
     vip	(ocf::heartbeat:IPaddr2):	Started 
     apache	(lsb:httpd):	Started 
     sqlfs	(ocf::heartbeat:Filesystem):	Started 
 Master/Slave Set: drbdclone [drbddata]
     Masters: [ ha1.mo.com ]

可以看到服务正常运行

最后将mysql服务的配置添加进入配置文件中

crm(live)configure# primitive mysql lsb:mysqld op monitor interval=60s

crm(live)configure# group mydb vip sqlfs mysql

再删除之前的website组现在观察一下服务是否正常。

crm(live)resource# show
 vmfence	(stonith:fence_xvm):	Started 
 Master/Slave Set: drbdclone [drbddata]
     Masters: [ ha2.mo.com ]
     Stopped: [ ha1.mo.com ]
 apache	(lsb:httpd):	Started 
 Resource Group: mydb
     vip	(ocf::heartbeat:IPaddr2):	Started 
     sqlfs	(ocf::heartbeat:Filesystem):	Started 
     mysql	(lsb:mysqld):	Started

网络运维学习笔记（DeepSeek优化版） 023 HCIP-Datacom OSPF邻居建立过程、四种网络类型、OSPF高级配置、LSA类型与管理技术小齐网络运维学习
文章目录OSPF邻居建立过程、四种网络类型、OSPF高级配置、LSA类型与管理邻居建立过程图示文字概述关键机制说明DD报文三重作用OSPF确认机制MTU协商机制四种网络类型详解网络类型邻接关系总表1.广播网络（Broadcast）核心特性组播地址说明2.点到点网络（P2P）核心特性3.NBMA网络核心特性4.点到多点网络（P2MP）核心特性实验查看邻居状态查看接口状态计时器说明OSPF高级配置CO
网络运维学习笔记（DeepSeek优化版） 018 HCIA-Datacom综合实验03 技术小齐网络运维学习
文章目录综合实验3实验需求一：A公司网络规划二：B公司网络规划配置一、ip、vlan、vlanif，stp、eth-trunkSW1SW2R1二、ospfSW1R1三、NATR1ISP四、拒绝ping允许httpSW1五、右半部分vlan、dhcp、ospf、NATSW4R2综合实验3实验需求一：A公司网络规划SW1/2/3组成了A公司的交换网络，其中SW1是核心层，SW2/3是接入层。三台交换机
网络运维学习笔记 017 HCIA-Datacom综合实验01 技术小齐网络运维学习
文章目录综合实验1实验需求总部特性分支8分支9配置一、基本配置（IP+二层VLAN+链路聚合）ACC_SWSW-S1SW-S2SW-Ser1SW-CoreSW8SW9DHCPISPGW二、单臂路由GW三、vlanifSW8SW9四、OSPFSW8SW9GW五、DHCPDHCPGW六、NAT+缺省路由GW七、HTTPGW综合实验1实验需求总部1.除了SW8和SW9是三层交换机，其他交换机均为二层交换
网络运维学习笔记（DeepSeek优化版）004网工初级（HCIA-Datacom与CCNA-EI）Console管理台使用、登录认证、破解恢复密码技术小齐网络运维学习
文章目录Console管理台使用、登录认证、破解恢复密码一、Console管理台使用和登录认证1.1思科设备配置1.1.1基本配置流程1.1.2验证配置1.2华为设备配置1.2.1本地密码认证1.2.2AAA认证配置二、远程管理协议Telnet和SSH配置2.1思科Telnet基本配置2.2华为Telnet基本配置telnet配置之aaa相关配置ssh配置之aaa相关配置三、FTP文件传输3.1思
网络运维学习笔记 013网工初级（HCIA-Datacom与CCNA-EI）DHCP动态主机配置协议（此处只讲华为）技术小齐网络运维学习
文章目录DHCP（DynamicHostConfigurationProtocol，动态主机配置协议）网关配置DHCP服务器配置如果没有DHCP服务器，只在网关上做DHCP服务器：DHCP（DynamicHostConfigurationProtocol，动态主机配置协议）依据地址池自动分配IP地址，减少工作量，避免地址冲突。DHCP报文类型1.DHCPDISCOVER客户端寻找DHCP服务器（广
MySql数据库运维学习笔记像linux的企鹅 Linux运维数据库 mysql 运维
数据库运维常识DQL、DML、DCL和DDL是SQL（结构化查询语言）中的四个重要类别，它们分别用于不同类型的数据库操作，下面为你简单明了地解释这四类语句：1.DQL（数据查询语言，DataQueryLanguage）定义：主要用于从数据库中查询数据，不涉及对数据的修改、插入或删除操作。常用命令：SELECT是DQL中最核心的命令，用于指定查询的字段、表以及查询条件等。示例：从employees表
网络运维学习笔记 009网工初级（HCIA-Datacom与CCNA-EI）STP生成树协议与VRRP虚拟路由冗余协议技术小齐网络运维学习
文章目录STP(SpanningTreeProtocol，生成树协议)思科：华为：实验思科华为VRRP（VirtualRouterRedundancyProtocol，虚拟路由冗余协议）思科华为STP(SpanningTreeProtocol，生成树协议)提高可靠性（使用冗余链路）的同时避免环路产生的问题（广播风暴，MAC地址表震荡）。STP模式有三种：MSTP（默认，而且常用）、RSTP、STP
运维学习————Zookeeper(2) 乆乄学习
目录一、zk节点和节点类型1、节点类型2、常用命令1、客户端链接2、常用命令3、权限控制相关命令特性授权格式测试一、zk节点和节点类型1、节点类型1、PERSISTENT--持久化目录节点客户端与zookeeper断开连接后，该节点依旧存在2、PERSISTENT_SEQUENTIAL-目持久化顺序编号录节点客户端与zookeeper断开连接后，该节点依旧存在，只是Zookeeper给该节点名称进
MySQL运维学习（1）：4种日志入门如入土学习
1.错误日志mysql错误日志记录了mysql发生任何严重错误时的信息，若数据库无法正常使用时，可以先查看错误日志默认情况下错误日志是开启的，文件名为/var/log/mysqld.log，如果文件不在默认位置，可以通过下面的命令查看其位置：showvariableslike'%log_error%';由于错误日志内的文件行很多，可以用tail命令查看其尾部信息tail-n10/var/log/m
活动回顾｜RocketMQ 运维经验圆桌交流「第二期」后端java
2023年12月3日，AutoMQ举办了第二场线上交流会RocketMQ运维经验圆桌交流「第二期」，本次交流会汇聚了RocketMQ的作者以及来自腾讯云、网易、社区的技术专家。在这个充满交流热情的活动中，大家共同探讨了RocketMQ的运维经验，分享了宝贵的见解。接下来让我们一起回顾此次RocketMQ运维学习之旅！从用户堆积问题看RocketMQ可观测的实现腾讯云RocketMQ技术专家李伟老师
阿Q的Linux运维学习之路（day6-2）-Linux文件管理-拷贝、移动命令叫我阿Q_
拷贝命令cpLinux的拷贝命令就好像我们Windows系统里面的复制粘贴一样语法格式：cp[OPTION]…SOURCE…DIRECTORY命令：cp选项：-v:详细显示命令执行的操作-r:递归处理目录与子目录-p:保留源文件或目录的属性参数：路径例：[root@localhost~#cpfile/tmp/将当前目录下的file文件拷贝至/tmp/目录下[root@localhost~]#cpf
命令行教程—Linux必备_全栈工程师技能 Coder_Boy_ DevOps
命令行教程使用场景：ApplemacOS和大多数Linux服务器几乎使用完全相同的命令，因此本教程适用于两者。即使您使用WindowsPC，这也很有用，因为您的网站很可能托管在Linux服务器上。基本命令行知识前提知识具备基本的计算机知识进阶知识Web开发和编程服务器运维学习目标了解命令行界面是什么以及它与计算机的关系学习一些与命令行相关的基本术语学习最常见，最有用的命令必须掌握的能力显示当前目录
【Xiao.Lei】- 开发运维：技能要求与学习路线详解 Xiao.Lei Linux 运维学习
引言在当今IT领域，开发运维（DevOps）已经成为一种全新的工作模式和文化，旨在通过整合开发（Development）和运维（Operations）部门，实现软件交付和IT运营的高效协同。本文将深入探讨什么是开发运维，开发运维人员需要掌握哪些技能，以及一个完整的开发运维学习路线。1.什么是开发运维？开发运维，简称DevOps，是一种融合了软件开发和IT运维的工作流程和文化。它的目标是通过自动化、
Linux运维学习笔记我是六月生运维 linux 学习
导航此笔记为学习https://www.bilibili.com/video/BV1nW411L7xm/?vd_source=3f851e85e66ef33269a2eefee664cec2的学习记录，希望能找到运维的实习吖Ｏ(≧▽≦)Ｏ文章目录导航Linux的终端终端组成部分Linux关机命令使用VMware备份操作系统快照克隆Linux系统的文件文件与文件夹Linux系统的文件目录结构Linu
linux运维学习笔记：集群系列之01：linux集群基础概念周少言
linux运维学习笔记：集群系列之01：linux集群基础概念作者：周少言2018年1月，于北京声明：本博客是本人周少言在某培训机构学习期间所写，其中参考借鉴了他人的博客，本文将会选择性给出相关链接，如有侵权，恳请告知。本文如有错误，恳请告知，欢迎交流。参考连接一、集群的类型：1、scaleon:向上扩展意思就是将我们的服务器的内存容量调大和cpu数量增加些.缺点:在一定的范围之内它的性能是上升的
快准稳：值得所有运维学习的SRE故障处理经验 LinkSLA 运维学习服务器
在网络上关于SRE的讨论中，故障相关的内容比比皆是，但关于故障发生时的应急处理过程的详细讨论却寥寥无几。然而面对故障，故障指挥官一定面临着较大的压力，需要快速、正确地处置故障，应对内外部的挑战。在这篇文章中，我们将重点探讨故障指挥官在故障处理过程中的具体行动思路。值得注意的是，本文总结了作者在担任故障指挥官时，对故障感知、故障定级、故障处理以及故障恢复等环节的经验和心得，而并未涉及如何预防故障或进
小白的2023总结与未来的妄想我不是少爷. 杂谈 python django kubernetes 容器
嘿，各位，很高兴各位能看到这篇文章，先祝各位家人2024财源茂盛达三江，生意兴隆通四海！！！！那么作为一个还在读大三的入门小白，这一年得益于身边的各个校外大佬与校内老师的提携，让我学到了很多学校并不会教授你的编程能力与对未来的规划。我本身学习的专业让我更加偏向于云开发与运维，但是综合我这两三年的学习来看，我总觉得云开发学起来过于的“虚无缥缈”，让我没有什么规划，所以我在大二开始又偏向于运维学习，直
Go开发学习 | 如何使用日志记录模块包针对日志按天数、按大小分隔文件示例... 全栈工程师修炼指南全栈之后端开发学习 golang 学习 java 开发语言后端
欢迎关注「全栈工程师修炼指南」公众号点击下方卡片即可关注我哟!设为「星标⭐」每天带你基础入门到进阶实践再到放弃学习！“花开堪折直须折，莫待无花空折枝。”作者主页：[https://www.weiyigeek.top]博客：[https://blog.weiyigeek.top]作者安全运维学习答疑交流群：请关注公众号回复【学习交流群】文章目录:0x00前言简述sirupsen/logrus模块-日
【面试题】查找文件中1到20行之间，同时将"aaa"替换为"AAA","ddd"替换"DDD" 李导996
老男孩教育oldboyedu.com.png运维学习交流群-点我加群:598972270[root@oldboyedu59~]#cat/oldboy/lidao.txtabcdefghijklmnopqrstuvwxyzaaadddaaadddaaadddaaadddaaadddaaaddd思路1:简单的替换aaa替换为AAA，ddd替换为DDDawk'NR==1,NR==20{gsub(/aaa
智能化运维学习笔记【2】运维仙人运维运维大数据
第四章、分布式消息队列4.1开源消息队列对比与分析目前市面上存在ZeroMQActiveMQRockeMQKafka等消息中间件，本人在工作中接触到比较多的是ActiveMQ和Kafka。4.1.1ZeroMQZeroMQ一种基于消息队列的多线程网络库，其对套接字类型、连接处理、帧甚至路由的底层细节进行抽象，提供跨越多种传输协议的套接字。4.1.2ActiveMQActiveMQ是开源的消息队列，
Linux运维学习笔记之十九：数据库服务之MySQL基础放飞的心灵 Linux MySQL linux 运维
第四部分数据库服务第三十章MySQL基础一、MySQL单实例源码cmake方式编译安装1、安装cmake软件（1）解压cmaketarzxfcmake-2.8.8.tar.gzcdcmake-2.8.8（2）configure./configure（3）gmakegmake（4）gmakeinstallgmakeinstallcd..2、确认依赖包是否安装rpm-qa|grepncursesncu
linux运维搭建官网,Linux运维学习之LAMP搭建个人博客网站 weixin_39806288 linux运维搭建官网
Linux运维学习之LAMP搭建个人博客网站个人博客、lamp从开始学习Linux，我就知道搭建博客，也很好奇怎么搭建的博客，今天终于学到了这个知识点，网上的很多的教程感觉都是含糊其辞，对于基础稍微有点薄弱的，根本实现不出来，而今天我就来篇基础教程，基于LAMP来搭建，L：Linux，A：apache，M，mysql或mariadb，P：php，乍一看感觉好难，其实只要稍微配置一下很简单的能够实现
linux运维学习教程：LVM管理和ssm存储管理器使用侠盗安全
全套学习资料移步至公众号【学神来啦】本节所讲内容：15.1LVM的工作原理15.2创建LVM的基本步骤15.3实战-使用SSM工具为公司的邮件服务器创建可动态扩容的存储池LVM的基本概念实战场景：对于生产环境下的服务器来说,如果存储数据的分区磁盘空间不够了怎么办?答：只能换一个更大的磁盘。如果用了一段时间后，空间又不够了，怎么办？再加一块更大的？换磁盘的过程中，还需要把数据从一个硬盘复制到另一个硬
Go开发学习 | 如何使用Gomail.v2模块包发送邮箱验证码消息及附件学习记录全栈工程师修炼指南全栈之后端开发学习 golang 学习开发语言后端
欢迎关注「全栈工程师修炼指南」公众号点击下方卡片即可关注我哟!设为「星标⭐」每天带你基础入门到进阶实践再到放弃学习！“花开堪折直须折，莫待无花空折枝。”作者主页：[https://www.weiyigeek.top]博客：[https://blog.weiyigeek.top]作者安全运维学习答疑交流群：请关注公众号回复【学习交流群】原文地址:Go开发学习|如何使用Gomail.v2模块包发送邮箱
Linux运维学习路线服务猿 Linux linux运维
最近看到了一篇不错的资料，其中对于Linux入门学习的描述挺详细的，因此特别摘抄其中段落，制作成思维导图分享给大家。教程内容：Linux入门首先要分为5个阶段，各阶段从前到后技术实力依次增加，相应的也更加能够符合企业的用人需求。为了让大家对于这5个阶段的能力水平有更清楚的认识，我们特别对能力进行了分解，按照各阶段可在企业中承担的任务进行标注。第一阶段：企业级Linux运维工程师1、Linux运维最
高级运维学习（十四）Zabbix监控（一）久一 Linux 高级运维学习运维学习 zabbix linux 服务器
一监控概述1监控的目的（1）报告系统运行状况每一部分必须同时监控内容包括吞吐量、反应时间、使用率等（2）提前发现问题进行服务器性能调整前，知道调整什么找出系统的瓶颈在什么地方2监控的资源类别（1）公开数据Web、FTP、SSH、数据库等应用服务TCP或UDP端口（2）私有数据CPU、内存、磁盘、网卡流量等使用信息用户、进程等运行信息3系统监控命令#uptime可以查看系统已经运行了多久。最后的3个
高级运维学习（十五）Zabbix监控（二）久一 Linux 高级运维学习运维学习 zabbix linux 服务器自动化
一Zabbix报警机制1基本概念自定义的监控项默认不会自动报警首页也不会提示错误需要配置触发器与报警动作才可以自动报警2概念介绍（1）触发器(trigger)表达式，如内存不足300M，用户超过30个等当触发条件发生后，会导致一个触发事件触发事件会执行某个动作（2）动作(action)触发器的条件被触发后的行为可以是发送邮件、也可以是重启某个服务等3配置告警默认情况下，监控项不会自动发送告警消息需
高级运维学习（十六）Prometheus 监控久一 Linux 高级运维学习运维学习 prometheus linux 自动化
Prometheus概述Prometheus是一个开源系统监控和警报工具包，最初由SoundCloud构建。也是一款监控软件，也是一个时序数据库。Prometheus将其指标收集并存储为时间序列数据，即指标信息与记录时的时间戳以及称为标签的可选键值对一起存储。主要用在容器监控方面，也可以用于常规的主机监控。使用google公司开发的go语言编写。Prometheus是一个框架，可以与其他组件完美结
Linux 系统运维学习方法汇总 weixin_33895604 数据库操作系统 php
大纲一、前言二、Linux运维大环境说明三、Linux运维学习思路四、Linux运维大方向说明五、Linux运维学习必看书籍推荐六、Linux运维实践内容简介注，本博文主要用于交流与学习。如有雷同，纯属意外。一、前言最近，有不少博友问我。刚进入运维行业怎么学习呢？思路是什么？一点思路也没有，然后与大家在群里交流了一下。现在总结一下，与大家分享一下。下面我们就废话不多说，直接上干货。^_^……二、L
Go开发学习 | 如何快速读取json/yaml/ini等格式的配置文件使用示例全栈工程师修炼指南全栈之后端开发学习 golang 学习 json java 数据库
欢迎关注「全栈工程师修炼指南」公众号点击下方卡片即可关注我哟!设为「星标⭐」每天带你基础入门到进阶实践再到放弃学习！“花开堪折直须折，莫待无花空折枝。”作者主页：[https://www.weiyigeek.top]博客：[https://blog.weiyigeek.top]作者安全运维学习答疑交流群：请关注公众号回复【学习交流群】文章目录:0x00前言简述0x01常用模块encoding/js
集合框架天子之骄 java 数据结构集合框架
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
Table Driven（表驱动）方法实例 bijian1013 java enum Table Driven 表驱动
实例一： /** * 驾驶人年龄段 * 保险行业，会对驾驶人的年龄做年龄段的区分判断 * 驾驶人年龄段：01-[18,25);02-[25,30);03-[30-35);04-[35,40);05-[40,45);06-[45,50);07-[50-55);08-[55,+∞) */ public class AgePeriodTest { //if...el
Jquery 总结 cuishikuan java jquery Ajax Web jquery方法
1.$.trim方法用于移除字符串头部和尾部多余的空格。如：$.trim(' Hello ') // Hello2.$.contains方法返回一个布尔值，表示某个DOM元素（第二个参数）是否为另一个DOM元素（第一个参数）的下级元素。如：$.contains(document.documentElement, document.body); 3.$
面向对象概念的提出麦田的设计者 java 面向对象面向过程
面向对象中，一切都是由对象展开的，组织代码，封装数据。在台湾面向对象被翻译为了面向物件编程，这充分说明了，这种编程强调实体。下面就结合编程语言的发展史，聊一聊面向过程和面向对象。 c语言由贝尔实
linux网口绑定被触发 linux
刚在一台IBM Xserver服务器上装了RedHat Linux Enterprise AS 4，为了提高网络的可靠性配置双网卡绑定。一、环境描述我的RedHat Linux Enterprise AS 4安装双口的Intel千兆网卡，通过ifconfig -a命令看到eth0和eth1两张网卡。二、双网卡绑定步骤： 2.1 修改/etc/sysconfig/network
XML基础语法肆无忌惮_ xml
一、什么是XML？ XML全称是Extensible Markup Language，可扩展标记语言。很类似HTML。XML的目的是传输数据而非显示数据。XML的标签没有被预定义，你需要自行定义标签。XML被设计为具有自我描述性。是W3C的推荐标准。二、为什么学习XML？用来解决程序间数据传输的格式问题做配置文件充当小型数据库三、XML与HTM
为网页添加自己喜欢的字体知了ing 字体秒表 css
@font-face { font-family: miaobiao;//定义字体名字 font-style: normal; font-weight: 400; src: url('font/DS-DIGI-e.eot');//字体文件 } 使用： <label style="font-size:18px;font-famil
redis范围查询应用-查找IP所在城市矮蛋蛋 redis
原文地址： http://www.tuicool.com/articles/BrURbqV 需求根据IP找到对应的城市原来的解决方案 oracle表（ip_country）：查询IP对应的城市： 1.把a.b.c.d这样格式的IP转为一个数字，例如为把210.21.224.34转为3524648994 2. select city from ip_
输入两个整数，计算百分比 alleni123 java
public static String getPercent(int x, int total){ double result=(x*1.0)/(total*1.0); System.out.println(result); DecimalFormat df1=new DecimalFormat("0.0000%");
百合——————>怎么学习计算机语言百合不是茶 java 移动开发
对于一个从没有接触过计算机语言的人来说，一上来就学面向对象，就算是心里上面接受的了，灵魂我觉得也应该是跟不上的，学不好是很正常的现象，计算机语言老师讲的再多，你在课堂上面跟着老师听的再多，我觉得你应该还是学不会的，最主要的原因是你根本没有想过该怎么来学习计算机编程语言，记得大一的时候金山网络公司在湖大招聘我们学校一个才来大学几天的被金山网络录取，一个刚到大学的就能够去和
linux下tomcat开机自启动 bijian1013 tomcat
方法一：修改Tomcat/bin/startup.sh 为: export JAVA_HOME=/home/java1.6.0_27 export CLASSPATH=$CLASSPATH:$JAVA_HOME/lib/tools.jar:$JAVA_HOME/lib/dt.jar:. export PATH=$JAVA_HOME/bin:$PATH export CATALINA_H
spring aop实例 bijian1013 java spring AOP
1.AdviceMethods.java package com.bijian.study.spring.aop.schema; public class AdviceMethods { public void preGreeting() { System.out.println("--how are you!--"); } } 2.beans.x
[Gson八]GsonBuilder序列化和反序列化选项enableComplexMapKeySerialization bit1129 serialization
enableComplexMapKeySerialization配置项的含义 Gson在序列化Map时，默认情况下，是调用Key的toString方法得到它的JSON字符串的Key，对于简单类型和字符串类型，这没有问题，但是对于复杂数据对象，如果对象没有覆写toString方法，那么默认的toString方法将得到这个对象的Hash地址。 GsonBuilder用于
【Spark九十一】Spark Streaming整合Kafka一些值得关注的问题 bit1129 Stream
包括Spark Streaming在内的实时计算数据可靠性指的是三种级别： 1. At most once，数据最多只能接受一次，有可能接收不到 2. At least once, 数据至少接受一次，有可能重复接收 3. Exactly once 数据保证被处理并且只被处理一次，具体的多读几遍http://spark.apache.org/docs/lates
shell脚本批量检测端口是否被占用脚本 ronin47
#!/bin/bash cat ports |while read line do#nc -z -w 10 $line nc -z -w 2 $line 58422>/dev/null2>&1if[ $?-eq 0]then echo $line:ok else echo $line:fail fi done 这里的ports 既可以是文件
java-2.设计包含min函数的栈 bylijinnan java
具体思路参见：http://zhedahht.blog.163.com/blog/static/25411174200712895228171/ import java.util.ArrayList; import java.util.List; public class MinStack { //maybe we can use origin array rathe
Netty源码学习-ChannelHandler bylijinnan java netty
一般来说，“有状态”的ChannelHandler不应该是“共享”的，“无状态”的ChannelHandler则可“共享” 例如ObjectEncoder是“共享”的, 但 ObjectDecoder 不是因为每一次调用decode方法时，可能数据未接收完全（incomplete），它与上一次decode时接收到的数据“累计”起来才有可能是完整的数据，是“有状态”的 p
java生成随机数 cngolon java
方法一： /** * 生成随机数 * @author [email protected] * @return */ public synchronized static String getChargeSequenceNum(String pre){ StringBuffer sequenceNum = new StringBuffer(); Date dateTime = new D
POI读写海量数据 ctrain 海量数据
import java.io.FileOutputStream; import java.io.OutputStream; import org.apache.poi.xssf.streaming.SXSSFRow; import org.apache.poi.xssf.streaming.SXSSFSheet; import org.apache.poi.xssf.streaming
mysql 日期格式化date_format详细使用 daizj mysql date_format 日期格式转换日期格式化
日期转换函数的详细使用说明 DATE_FORMAT(date,format) Formats the date value according to the format string. The following specifiers may be used in the format string. The&n
一个程序员分享8年的开发经验 dcj3sjt126com 程序员
在中国有很多人都认为IT行为是吃青春饭的，如果过了30岁就很难有机会再发展下去!其实现实并不是这样子的，在下从事.NET及JAVA方面的开发的也有8年的时间了，在这里在下想凭借自己的亲身经历，与大家一起探讨一下。明确入行的目的很多人干IT这一行都冲着“收入高”这一点的，因为只要学会一点HTML, DIV+CSS，要做一个页面开发人员并不是一件难事，而且做一个页面开发人员更容
android欢迎界面淡入淡出效果 dcj3sjt126com android
很多Android应用一开始都会有一个欢迎界面，淡入淡出效果也是用得非常多的，下面来实现一下。主要代码如下： package com.myaibang.activity; import android.app.Activity;import android.content.Intent;import android.os.Bundle;import android.os.CountDown
linux 复习笔记之常见压缩命令 eksliang tar解压 linux系统常见压缩命令 linux压缩命令 tar压缩
转载请出自出处:http://eksliang.iteye.com/blog/2109693 linux中常见压缩文件的拓展名 *.gz gzip程序压缩的文件 *.bz2 bzip程序压缩的文件 *.tar tar程序打包的数据，没有经过压缩 *.tar.gz tar程序打包后，并经过gzip程序压缩 *.tar.bz2 tar程序打包后，并经过bzip程序压缩 *.zi
Android 应用程序发送shell命令 gqdy365 android
项目中需要直接在APP中通过发送shell指令来控制lcd灯，其实按理说应该是方案公司在调好lcd灯驱动之后直接通过service送接口上来给APP，APP调用就可以控制了，这是正规流程，但我们项目的方案商用的mtk方案，方案公司又没人会改，只调好了驱动，让应用程序自己实现灯的控制，这不蛋疼嘛！！！！发就发吧！一、关于shell指令：我们知道，shell指令是Linux里面带的
java 无损读取文本文件 hw1287789687 读取文件无损读取读取文本文件 charset
java 如何无损读取文本文件呢？以下是有损的 @Deprecated public static String getFullContent(File file, String charset) { BufferedReader reader = null; if (!file.exists()) { System.out.println("getFull
Firebase 相关文章索引 justjavac firebase
Awesome Firebase 最近谷歌收购Firebase的新闻又将Firebase拉入了人们的视野，于是我做了这个 github 项目。 Firebase 是一个数据同步的云服务，不同于 Dropbox 的「文件」，Firebase 同步的是「数据」，服务对象是网站开发者，帮助他们开发具有「实时」（Real-Time）特性的应用。开发者只需引用一个 API 库文件就可以使用标准 RE
C++学习重点 lx.asymmetric C++笔记
1.c++面向对象的三个特性：封装性，继承性以及多态性。 2.标识符的命名规则：由字母和下划线开头，同时由字母、数字或下划线组成；不能与系统关键字重名。 3.c++语言常量包括整型常量、浮点型常量、布尔常量、字符型常量和字符串性常量。 4.运算符按其功能开以分为六类：算术运算符、位运算符、关系运算符、逻辑运算符、赋值运算符和条件运算符。 &n
java bean和xml相互转换 q821424508 java bean xml xml和bean转换 java bean和xml转换
这几天在做微信公众号做的过程中想找个java bean转xml的工具，找了几个用着不知道是配置不好还是怎么回事，都会有一些问题，然后脑子一热谢了一个javabean和xml的转换的工具里，自己用着还行，虽然有一些约束吧，还是贴出来记录一下顺便你提一下下，这个转换工具支持属性为集合、数组和非基本属性的对象。 packag
C 语言初级位运算 1140566087 位运算 c
第十章位运算 1、位运算对象只能是整形或字符型数据，在VC6.0中int型数据占4个字节 2、位运算符：运算符作用 ~ 按位求反 << 左移 >> 右移 & 按位与 ^ 按位异或 | 按位或他们的优先级从高到低； 3、位运算符的运算功能： a、按位取反： ~01001101 = 101
14点睛Spring4.1-脚本编程 wiselyman spring4
14.1 Scripting脚本编程脚本语言和java这类静态的语言的主要区别是:脚本语言无需编译,源码直接可运行; 如果我们经常需要修改的某些代码,每一次我们至少要进行编译,打包,重新部署的操作,步骤相当麻烦; 如果我们的应用不允许重启,这在现实的情况中也是很常见的; 在spring中使用脚本编程给上述的应用场景提供了解决方案,即动态加载bean; spring支持脚本

运维笔记31 (pacemaker高可用集群搭建的总结)

你可能感兴趣的:(运维学习)