ting--

MHA实现mysql的高可用

关于 MHA：

1.Master HA，对主节点进行监控，可实现自动故障转 移至其它从节点；通过提升某一从
节点为新的主节点，基于主从复制实现，还需要客户端配合实现，目前MHA主要支持一主多
从的架构，要搭建MHA,要求一个复制集群中必须最少有 三台数据库服务器，一主二从，
即一台充当master，一台充当备用master，另外一台充当从库，如果财大气粗，也
可以用一台专门的服务器来当MHA监控管理服务器
2.MHA工作原理
	1 从宕机崩溃的master保存二进制日志事件（binlog events） 
	2 识别含有最新更新的slave 
	3 应用差异的中继日志（relay log）到其他的slave 
	4 应用从master保存的二进制日志事件（binlog events） 
	5 提升一个slave为新的master 
	6 使其他的slave连接新的master进行复制 
	
	注意：MHA需要基于ssh，key验证登入方法

MHA软件由两部分组成，Manager工具包和Node工具包，具体的说明如下。
1.Manager工具包主要包括以下几个工具：
	masterha_check_ssh              检查MHA的SSH配置状况
	masterha_check_repl             检查MySQL复制状况
	masterha_manger                 启动MHA
	masterha_check_status           检测当前MHA运行状态
	masterha_master_monitor         检测master是否宕机
	masterha_master_switch          控制故障转移（自动或者手动）
	masterha_conf_host              添加或删除配置的server信息
2.Node工具包（这些工具通常由MHA Manager的脚本触发，无需人为操作）主要包括以下几个工具：
	save_binary_logs                保存和复制master的二进制日志
	apply_diff_relay_logs           识别差异的中继日志事件并将其差异的事件应用于其他的slave
	filter_mysqlbinlog              去除不必要的ROLLBACK事件（MHA已不再使用这个工具）
	purge_relay_logs                清除中继日志（不会阻塞SQL线程）

环境设定

base2	172.25.78.12	主master，MHA manager
base3	172.25.78.13	备用master
base4	172.25.78.14	slave

1.先搭建一主二从环境

# 在base2上

[root@base2 ~]# vim /etc/my.cnf
server-id=1
gtid_mode=ON
enforce-gtid-consistency=true
log_bin = binlog
log_slave_updates=ON

[root@base2 ~]# systemctl start mysqld
[root@base2 ~]# mysql -p
Enter password: 
mysql> grant replication slave on *.* to repl@'172.25.78.%' identified by 'Ting@666';
mysql> INSTALL PLUGIN rpl_semi_sync_master SONAME 'semisync_master.so';
mysql> INSTALL PLUGIN rpl_semi_sync_slave SONAME 'semisync_slave.so';
mysql> SET GLOBAL rpl_semi_sync_master_enabled=1;
mysql> SET GLOBAL rpl_semi_sync_master_timeout=1000000000000;
mysql> show variables like '%rpl%';

mysql> show status like '%rpl%';

mysql> QUIT
Bye

# 在base3上

[root@base3 ~]# vim /etc/my.cnf
server_id=2
gtid_mode =ON
enforce-gtid-consistency=true
log_bin = binlog
log_slave_updates=ON

[root@base3 ~]# systemctl start mysqld
[root@base3 ~]# mysql -p
Enter password:
mysql> stop slave;
mysql> change master to master_host='172.25.78.12',master_user='repl',master_password='Ting@666',MASTER_AUTO_POSITION=1;
mysql> start slave;
mysql> INSTALL PLUGIN rpl_semi_sync_master SONAME 'semisync_master.so';
mysql> INSTALL PLUGIN rpl_semi_sync_slave SONAME 'semisync_slave.so';
mysql> SET GLOBAL rpl_semi_sync_master_enabled=1;
mysql> stop slave io_thread;
mysql> start slave io_thread;
mysql> show slave status\G;

mysql> stop slave io_thread;
mysql> start slave io_thread;
mysql> show slave status\G;

如果出现了以下情况

#解决方案：

base2:
mysql> reset  master;
base3:
mysql> stop slave;
mysql> start slave;

mysql> quit
Bye

# 在base4上

[root@base4 ~]# vim /etc/my.cnf
server_id=3
gtid_mode=ON
enforce-gtid-consistency=true
log_slave_updates=ON
log_bin=binlog

[root@base4 ~]# systemctl start mysqld
mysql> stop slave;
mysql> change master to master_host='172.25.78.12',master_user='repl',master_password='Ting@666',MASTER_AUTO_POSITION=1;
mysql> start slave;
mysql> show slave status\G;

mysql> INSTALL PLUGIN rpl_semi_sync_master SONAME 'semisync_master.so';
mysql> INSTALL PLUGIN rpl_semi_sync_slave SONAME 'semisync_slave.so';
mysql> SET GLOBAL rpl_semi_sync_master_enabled=1;
mysql> stop slave io_thread;
mysql> start slave io_thread;
mysql> QUIT
Bye

测试主从复制

# 在master上：

mysql> use test;
Database changed
mysql> create table userlist (
    -> username varchar(20) not null,
    -> password varchar(15) not null);
mysql> insert into userlist values('user1',111);
mysql> insert into userlist values('user2',222);
mysql> select * from userlist;

# 在base3上

mysql> select * from test.userlist;

# 在base4上

mysql> select * from test.userlist;

2.搭建mha架构

1.数据同步（数据一致性逻辑检测）
2.数据架构逻辑

[root@base2 ~]# ls
mha4mysql-manager-0.58-0.el7.centos.noarch.rpm  perl-Mail-Sender-0.8.23-1.el7.noarch.rpm
mha4mysql-manager-0.58.tar.gz                   perl-Mail-Sendmail-0.79-21.el7.noarch.rpm
mha4mysql-node-0.58-0.el7.centos.noarch.rpm     perl-MIME-Lite-3.030-1.el7.noarch.rpm
perl-Config-Tiny-2.14-7.el7.noarch.rpm          perl-MIME-Types-1.38-2.el7.noarch.rpm
perl-Email-Date-Format-1.002-15.el7.noarch.rpm  perl-Parallel-ForkManager-1.18-2.el7.noarch.rpm
perl-Log-Dispatch-2.41-1.el7.1.noarch.rpm
[root@base2 ~]# yum install -y *.rpm
[root@base2 ~]# ssh-keygen   # 做免密

[root@base2 ~]# ssh-copy-id base2
[root@base2 ~]# ssh-copy-id base3
[root@base2 ~]# ssh-copy-id base4
[root@base2 ~]# mkdir /etc/masterha/
[root@base2 ~]# vim /etc/masterha/app1.cnf
[server default]
manager_workdir=/etc/masterha       # 设置manager的工作目录
manager_log=/var/log/masterha.log   #  设置manager的日志
master_binlog_dir=/var/lib/mysql       # 设置master保存binlog的位置
#master_ip_failover_script= /usr/local/bin/master_ip_failover    # 设置自动failover时候的切换脚本
#master_ip_online_change_script= /usr/local/bin/master_ip_online_change    # 设置手动切换的脚本
password=Ting@666                                   # 监控用户密码
user=root                                                  # 监控用户root
ping_interval=1                                        # 设置监控主库,发送ping包的间隔,默认3秒,尝试三次没有回应的时候自动进行failover
remote_workdir=/tmp                                  # 设置远端mysql在发生切换时binlog的保存位置
repl_password=Ting@666                      # 复制用户密码
repl_user=repl                                                # 复制用户
#report_script=/usr/local/send_report             # 设置发生切换后发送的报警的脚本
#secondary_check_script=/usr/local/bin/masterha_secondary_check -s server03 -s server02   
#shutdown_script=""
ssh_user=root

[server2]
hostname=172.25.78.12
port=3306

[server3]
hostname=172.25.78.13
port=3306
candidate_master=1
check_repl_delay=0   # 忽略，不检测
# 默认情况下如果一个slave落后master 100M的relay logs的话,MHA将不会选择该slave作为一个新的master,
因为对于这个slave的恢复需要花费很长时间,通过设置check_repl_delay=0,MHA触发切换在选择一个新的master
的时候将会忽略复制延时,这个参数对于设置了candidate_master=1的主机非常有用,因为这个候选主在切换的过程
中一定是新的master
[server4]
hostname=172.25.78.14
port=3306
no_master=1   # 表示base4一直是slave

[root@base3 ~]# yum install -y mha4mysql-node-0.58-0.el7.centos.noarch.rpm 
[root@base4 ~]# yum install -y mha4mysql-node-0.58-0.el7.centos.noarch.rpm

# 免密检测，会报错，彼此之间都要进行检测

[root@base2 ~]# masterha_check_ssh --conf=/etc/masterha/app1.cnf

[root@base2 ~]# scp -r .ssh/ base3:
[root@base2 ~]# scp -r .ssh/ base4:
[root@base2 ~]# masterha_check_ssh --conf=/etc/masterha/app1.cnf

# 再次检测，全部ok

# 检测彼此是否复制

[root@base2 ~]# masterha_check_repl --conf=/etc/masterha/app1.cnf

解决问题

[root@base2 ~]# mysql -p
Enter password: 
mysql> grant all on *.* to root@'%' identified by 'Ting@666';       # 创建监控root，给监控用户授权
mysql> quit

有报错，继续解决报错

解决方案:在base3和base4上两台slave服务器设置read_only（从库对外提供读服
务，只所以没有写进配置文件，是因为随时slave会提升为master）

# 继续有报错：

解决方案（在base2上）：

# 再次检查

[root@base2 ~]# masterha_check_repl --conf=/etc/masterha/app1.cnf   # 健康检查通过

测试高可用

# 1.故障手动切换

[root@base2 masterha]# systemctl stop mysqld    # 模拟down掉master
[root@base2 ~]# masterha_master_switch --master_state=dead --conf=/etc/masterha/app1.cnf --dead_master_host=172.25.78.12 --dead_master_port=3306 --new_master_host=172.25.78.13 --new_master_port=3306    # 在mha服务器上开始手动切换

[root@base2 ~]# masterha_master_switch --master_state=dead --conf=/etc/masterha/app1.cnf --dead_master_host=172.2.78.12 --dead_master_port=3306 --new_master_host=172.25.78.13 --new_master_port=3306   --dead_master_ip=172.2.78.12 # 添加上参数之后，继续切换

# 2.热切（master是好的，切换master）

热切原理

1. 检查当前的配置信息及主从服务器的信息
    包括读取MHA的配置文件/etc/masterha/app1.cnf及检查当前slave的健康状态
2. 阻止对当前master的更新
   主要通过如下步骤：
   1） 等待1.5s（$time_until_kill_threads*100ms），等待当前连接断开。
   2> 执行 read_only=1，阻止新的DML操作
   3> 等待0.5s，等待当前DML操作完成。
   4> kill掉所有连接。
   5> FLUSH NO_WRITE_TO_BINLOG TABLES
   6> FLUSH TABLES WITH READ LOCK
	3. 等待新master执行完所有的relay log
	Waiting to execute all relay logs on 192.168.244.20(192.168.244.20:3306)..
	4. 将新master的read_only设置为off，并添加VIP
	5. slave切换到新master上。
	   1> 等待slave（192.168.244.30）应用完原主从复制产生的relay log，然后执行change master操作切换到新master上。
	   2> 释放原master上加的锁。
	   3> 因masterha_master_switch命令行中带有--orig_master_is_new_slave参数，故原master也切换为新master的从。

6. 清理新master的相关信息。
 主要是执行了reset slave all操作，清除之前的复制信息。

 [root@base2 ~]# masterha_master_switch --conf=/etc/masterha/app1.cnf --master_state=alive --new_master_host=172.25.78.13 --new_master_port=3306 --orig_master_is_new_slave --running_updates_limit=10000

# 在原来的master（base2）上

mysql> STOP SLAVE; 
mysql> CHANGE MASTER TO MASTER_HOST='172.25.78.13',MASTER_PORT=3306, MASTER_AUTO_POSITION=1,MASTER_USER='repl', MASTER_PASSWORD='Ting@666'; 
mysql> START SLAVE;
mysql> set GLOBAL SQL_SLAVE_SKIP_COUNTER=1;

# 在slave（base4）端查看

mysql> show slave status\G;

# 在base3上查看

mysql> show slave status;
mysql> show master status;

# 3.自动切

# 在mha上

[root@base2 masterha]# nohup masterha_manager --conf=/etc/masterha/app1.cnf &> /dev/null &   # 开启监控，并打入后台

# 在master上

[root@base3 ~]# systemctl stop mysqld   # 模拟master服务器down掉

# 再在slave上查看master已经切换

mysql>  show slave status \G;

# 回到mha监控

[root@base2 masterha]#                  # 已经从后台自动退出
[1]+  Done                    nohup masterha_manager --conf=/etc/masterha/app1.cnf &>/dev/null

[root@base2 masterha]# pwd
/etc/masterha
[root@base2 masterha]# ls   # 并且会生成一个文件
app1.cnf  app1.failover.complete

注：默认情况下，MHA发生切换后会在日志目录，也就是上面设置的/data产生app1.failover.complete文件，下次再次切换的时候如果发现该目录下存在该文件将不允许触发切换，除非在第一次切换后收到删除该文件，如果下次想继续进行切换，添加这个参是–ignore_last_failover

# 在原来的master(base3)上

[root@base3 ~]# systemctl start mysqld
[root@base3 ~]# mysql -p
Enter password: 
mysql> stop slave;
mysql> CHANGE MASTER TO MASTER_HOST='172.25.78.12', MASTER_PORT=3306, MASTER_AUTO_POSITION=1, MASTER_USER='repl', MASTER_PASSWORD='Ting@666';   # 改变自己身份为slave
mysql> start slave;

3.mha实现vip漂移

在mha服务端

[root@base2 ~]# tar zxf mha4mysql-manager-0.58.tar.gz
[root@base2 ~]# cd mha4mysql-manager-0.58
[root@base2 mha4mysql-manager-0.58]# cd samples/
[root@base2 samples]# ls
conf  scripts
[root@base2 samples]# cd scripts/
[root@base2 scripts]# ls
master_ip_failover  master_ip_online_change  power_manager  send_report
[root@base2 scripts]# cp master_ip_failover  master_ip_online_change /usr/local/bin/
[root@base2 scripts]# cd /usr/local/bin/
[root@base2 bin]# ls
master_ip_failover  master_ip_online_change
[root@base2 bin]# vim master_ip_failover 
 my $vip = '172.25.78.100/24';
 my $ssh_start_vip = "/sbin/ip addr add $vip dev eth0";   # 注意自己使用的网卡设备名
 my $ssh_stop_vip = "/sbin/ip addr del $vip dev eth0

[root@base2 bin]# vim master_ip_online_change 
 my $vip = '172.25.78.100/24';
 my $ssh_start_vip = "/sbin/ip addr add $vip dev eth0";
 my $ssh_stop_vip = "/sbin/ip addr del $vip dev eth0";
 my $exit_code = 0;

[root@base2 bin]# chmod 755 *
[root@base2 bin]# vim /etc/masterha/app1.cnf 
master_ip_failover_script=/usr/local/bin/master_ip_failover
master_ip_online_change_script=/usr/local/bin/master_ip_online_change

# 开始测试

[root@base2 ~]# ip addr add 172.25.78.100/24 dev eth0  # 因为base2是，master，所以先手动给master添加Vip
[root@base2 ~]# ip a

# 开始热切换

[root@base2 bin]# masterha_master_switch --conf=/etc/masterha/app1.cnf --master_state=alive --new_master_host=172.25.78.13 --new_master_port=3306 --orig_master_is_new_slave --running_updates_limit=10000

查看是否切换成功

[root@base3 ~]# ip a   # 新master上出现了vip，即vip漂移成功

[root@base2 ~]# ip a   # 原master上的vip已经切换

# 实现vip自动漂移

在mha上进行后台监控

[root@base2 bin]# nohup masterha_manager --conf=/etc/masterha/app1.cnf &>/dev/null &

在master上

[root@base3 ~]# systemctl stop mysqld
[root@base3 ~]# ip a   # vip已经飘走

[root@base2 ~]# ip a

# 远程测试

[kiosk@foundation78 Desktop]$ mysql -h 172.25.78.100 -u root -p  # 客户端远程登录，vip在哪台服务器上，客户端就登录的是哪台服务器
MySQL [(none)]> select * from test.userlist;

当服务器故障切换时，客户端也会卡顿，无法进行操作

零基础搭建免费IP代理池：从原理到实战的保姆级指南傻啦嘿哟关于代理IP那些事儿 tcp/ip 网络协议网络
目录一、代理池的核心价值与底层原理二、环境搭建全流程详解2.1开发环境准备2.2核心组件安装三、核心配置深度解析3.1配置文件精要（setting.py）3.2自定义代理源开发四、核心模块实现原理4.1调度系统架构4.2代理验证算法五、运维实战技巧5.1性能优化策略5.2故障排查手册六、安全加固方案七、扩展升级路径八、典型问题解决方案九、性能基准测试十、合规使用指南一、代理池的核心价值与底层原理在
AI 技术重塑 IT 服务，解锁架构可视化的未来腾讯云开发者人工智能架构
引言在当下时代，企业数字化转型已迈入深水区，传统的IT运维模式正面临着成本升高、效率瓶颈、服务质量难以保障等难题，在此时，架构可视化与AI技术的出现成为企业IT服务管理上新的突破口。架构可视化能够通过图形化手段，将复杂的系统架构直观呈现，提升系统设计的可理解性、可维护性和协作效率，降低认知门槛，帮助团队快速掌握系统全貌。应该如何在多云、混合云的复杂环境中实现统一管理？如何让IT架构从抽象的技术语言
AI 智能运维，重塑大型企业软件运维：从自动化到智能化的进阶实践 AI、少年郎人工智能运维自动化
一、引言：企业软件运维的智能化转型浪潮在数字化转型加速的背景下，大型企业软件架构日益复杂，微服务、多云环境、分布式系统的普及导致传统运维模式面临效率瓶颈。AI技术的渗透催生了智能运维（AIOps）的落地，通过机器学习、大模型、智能Agent等技术，实现从"人工救火"到"智能预防"的范式转变。本文结合头部企业实践，解析AI在运维领域的核心应用场景、技术架构及未来趋势，特别针对基础运维中流程重构、技术
灰度发布实战：在生产环境中安全迭代功能荣华富贵8 程序员的知识储备2 程序员的知识储备3 consul 服务发现算法网络 wpf
摘要随着互联网服务规模的不断扩大，如何在保证系统稳定性和用户体验的前提下快速迭代新功能，已经成为大型分布式系统运维和开发团队面临的核心挑战。灰度发布（GreyRelease或CanaryRelease）作为一种渐进式发布策略，通过对少量用户或流量进行新版本试运行，实时监控关键指标、收集用户反馈，从而在生产环境中实现安全的功能迭代和风险管控。本文以某大型电商平台灰度发布实战为例，深入探讨技术原理、系
FTP登录成功但无法LIST和下载文件的问题排查桑汤奈伊伏异常解决 ftp port模式主动模式无法下载登录成功
问题背景：最近有一个系统对接需求，采用了古老的ftp交换文件方式来对接。于是我用了commons-net包的3.6版本来进行ftp的连接和文件的传输。连接ftp成功，登录也没问题，但是在传输文件的时候会卡住，程序没有往下走，一段时间后抛异常。传输文件的代码如下（顺便提一下如果你连都连不上，那先理清架构，问下你们运维是不是用了代理，如果用了代理，java代码里面需要设置使用代理连接）//初始化ftp
KVM中使用桥接模式.运维就业技术教程
在KVM中使用桥接模式可以让虚拟机直接接入物理网络，使其成为局域网中的独立节点。以下是配置和使用桥接模式的详细指南：一、桥接模式原理作用:虚拟机通过宿主机的网桥（如virbr0）直接与物理交换机/路由器通信，获得与宿主机相同的网段IP。特点:虚拟机拥有独立IP，可被局域网内其他设备直接访问。无需NAT转换，网络性能更高。需确保宿主机网桥已正确配置。二、配置步骤1.创建网桥接口大多数Linux发行版
某国产数据库“热情过头”的发布会，该收收了！ IT邦德数据库国产数据库数据库
作者：IT邦德中国DBA联盟(ACDU)成员，15年DBA工作经验Oracle、PostgreSQLACECSDN博客专家及B站知名UP主，全网粉丝15万+擅长主流Oracle、MySQL、PG、高斯及Greenplum备份恢复，安装迁移，性能优化、故障应急处理文章目录01兼容性？02多模融合？03性能玄学？04智能运维？05终极暴击总结哥们儿，还记得十年前DBA圈那场著名论战不？OLTP和OLA
某银行基于容器负载均衡信创替代，实现完整全自动对外服务暴露的流水线实践
一、背景介绍外部硬件负载均衡作为容器业务统一入口的架构模式已在我行运行3年之久，通过长时间的容器云平台使用经验与负载均衡运维经验积累，在我行容器云环境形成一套特有的负载均衡适配模型，现部署模式下实现了应用上线人员以自服务的形式将容器服务对外暴露。根据2022年1月银保监会办发[2022]2号中关于科技能力建设的指导意见，坚持关键技术自主可控原则，降低外部依赖、避免单一依赖。为配合推进指导意见，同时
一文掌握oracle19c之离线情况下命令行安装和建库（上）运维家
声明：本文乃“运维家”原创，转载请注明出处，更多内容请关注公众号“运维家”。主旨oracle作为主流数据库之一，身为IT人员，怎么能不会搭建呢？我不允许哈，下来看看如何一步一步的搭建起来吧。建议收藏，不然一会儿就找不见了，哈哈哈。环境linux环境oracle软件根目录下磁盘空间最少4G软件下载官网下载太慢，而且需要注册，这里直接从公众号“运维家”后台回复“oracle”即可获取软件包，即取即用。
运维技术干货 — 不仅是 Linux 运维最佳实践 python算法小白 Linux
附Java/C/C++/机器学习/算法与数据结构/前端/安卓/Python/程序员必读书籍书单大全：书单导航页（点击右侧极客侠栈即可打开个人博客）：极客侠栈①【Java】学习之路吐血整理技术书从入门到进阶最全50+本（珍藏版)②【算法数据结构+acm】从入门到进阶吐血整理书单50+本（珍藏版)③【数据库】从入门到进阶必读18本技术书籍网盘吐血整理网盘(珍藏版)④【Web前端】从HTML到JS到AJ
项目快速上手指南：8 大核心切入点 weixin_43391139 技术工程化架构设计模式学习方法
一、文档体系速览需求层产品需求文档（PRD）：明确业务目标、用户故事和功能边界非功能需求：性能指标、安全要求、合规标准设计层架构图：系统分层、技术栈选型、核心组件交互ER图与数据字典：表结构关系、字段约束、业务术语定义API文档：接口规范、请求示例、错误码说明操作层用户手册：功能导航、操作流程、常见问题管理后台指南：权限配置、运维操作、数据报表二、代码库解构路径全局视野目录范式：MVC/DDD分层
掌握未来云原生：Kamaji Kubernetes 控制平面管理器白羿锟
掌握未来云原生：KamajiKubernetes控制平面管理器项目简介在Kubernetes的世界里，我们迎来了Kamaji——一款创新的Kubernetes控制平面管理器。这个项目基于托管控制平面的理念，将Kubernetes控制面组件运行在Pod中，而不是独立的物理或虚拟机上。通过这种方式，Kamaji使大规模集群管理和扩展变得更为高效且降低了运维负担。Kamaji就像一支全天候工作的Site
运维老司机私藏的Docker命令清单，建议收藏！飞乐鸟干货 docker
Docker常用命令无论是开发、测试还是运维，Docker已成为现代技术栈的标配。面对众多命令，整理了最实用的Docker命令清单，覆盖90%日常使用场景，助你快速成为容器化高手！镜像管理镜像构建//-t指定镜像名称和标签、构建上下文环境（包含Dockerfile的目录）dockerbuild-tmyapp:1.0. //指定Dockerfile路径dockerbuild-f./dockerfil
2025年华为认证之HCIE-云计算方向的报考流程
一、先搞明白：HCIE-云计算认证到底是啥？HCIE-云计算（华为认证ICT专家-云计算）是华为体系里云计算领域的顶级认证，说白了，就是证明你有能力搞定大型企业的云平台设计、部署和运维。现在政企、金融这些行业上云需求猛增，招人的时候，这证书经常是“加分项”甚至“硬门槛”。但这证不好拿，得闯两关：笔试和实验考试。从报名到拿证，流程说复杂也复杂，说简单也简单，关键是每个环节都得踩对节奏，不然容易走弯路
Kubernetes 集群简介部署搭建及常用命令 GHY@CloudGuardian Kubernetes kubernetes 容器云原生运维 linux
Kubernetes集群简介Kubernetes（简称K8s）是一个开源的容器编排平台，用于自动化容器化应用的部署、扩展和管理。它为容器提供了一个完整的管理框架，帮助开发者和运维团队在大规模环境中高效地部署和管理应用。Kubernetes集群是由多个组件组成的，主要包括控制平面和工作节点。集群的核心目的是确保容器化应用的高可用性、可扩展性、负载均衡、自动化部署等功能。Kubernetes集群的基本
k8s学习 — （运维）第九章 Helm 包管理器 2401_83740189 2024年程序员学习运维 linux 面试
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以点击这里获取！一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！config包含了可以合并到打包的chart中的
详解Linux(Ubuntu/RedHat/CentOS)及国产服务器统一加域管理方案
本期内容将通过一个实际案例讲清楚数据中心服务器身份认证场景的痛点及宁盾身份域管在其中的作用和价值。很多行业，像金融、运营商，还有那些关系国计民生的服务单位，均会受到监管制度统一要求，对数据中心的服务器执行定期修改口令、统一身份认证和MFA多因素认证。另外，等保、密评同样要求对服务器运维进行安全管控。但一般数据中心服务器规模较大，存在各种管理乱象，如：1.各种Linux，如Ubuntu、Redhat
K8S的Helm包管理器程序员Rocky 运维 DevOps k8s kubernetes docker 容器 helm helm安装包
一、背景官网:https://helm.sh/我们针对K8S环境中，部署对应的应用，无外乎就是编写一堆yaml资源清单文件.资源清单、依赖性少的时候，可以直接手动维护。但是，随着资源清单越来越复杂，越来越多，不同的环境切换不同的资源清单配置，如果还是手动维护，那将会是一场运维灾难。没有Helm之前的问题:1、手动管理YAML文件：需要手动编写和维护大量YAML文件，容易出错2、缺乏标准化：各团队有
运维打铁: Ruby 脚本在运维自动化中的应用探索懂搬砖运维打铁原力计划运维 ruby 自动化
文章目录一、思维导图二、基础介绍1.Ruby语言特点2.运维自动化概念三、应用场景1.服务器配置管理2.定时任务执行3.日志分析处理四、代码示例1.服务器配置脚本2.定时任务脚本3.日志分析脚本五、优势与挑战1.优势2.挑战六、总结与展望一、思维导图Ruby脚本在运维自动化中的应用基础介绍应用场景代码示例优势与挑战总结与展望Ruby语言特点运维自动化概念服务器配置管理定时任务执行日志分析处理服务器
运维打铁: Shell 脚本自动化任务编写与优化懂搬砖运维打铁原力计划运维 ruby 自动化
文章目录思维导图一、基础编写1.变量与数据类型2.控制结构if-else语句for循环3.函数定义二、高级特性1.正则表达式2.文件处理3.远程操作三、性能优化1.代码结构优化2.资源管理3.并发处理总结思维导图Shell脚本自动化任务编写与优化基础编写高级特性性能优化变量与数据类型控制结构函数定义正则表达式文件处理远程操作代码结构优化资源管理并发处理一、基础编写1.变量与数据类型在Shell脚本
达梦数据库运维-DM8到ORACLE11g创建DBLINK
DM8到ORACLE11g创建DBLINK一、安装Oracle11g客户端安装配置1)解压安装客户端进入/dm/创建oracle客户端目录mkdir-p/dm8/oracleclient/chowndmdba.dinstall-R/dm8/oracleclient/cd/dm8/oracleclient/tar-xvfdbclt11204_x64_RHEL7U4_x64.tar.gz2)将orac
GPU网络运维一行代码通万物网络运维 GPU
一、GPU网络架构与核心技术GPU集群网络需适配分布式训练中“多节点数据同步”（如all-reduce、broadcast）的高频、大流量需求，主流技术方案及特点如下：网络技术核心优势适用场景运维重点InfiniBand低延迟（~1us）、高带宽（400Gb/s）、原生RDMA支持超大规模集群（≥1000节点）、千亿参数模型训练子网管理、固件兼容性、链路健康RoCE（RDMAoverConverg
sshpass原理详解及自动化运维实践
什么是SSHpass？SSHpass是一个用于非交互式SSH密码验证的工具，它能够通过命令行直接提供SSH密码，从而绕过交互式密码输入提示。这在自动化脚本和批处理操作中尤为有用。工作原理SSHpass的工作原理可以概括为以下几个关键点：密码传递机制：SSHpass通过命令行参数、环境变量或文件等方式接收密码伪终端模拟：它模拟一个伪终端（pseudo-terminal）来与SSH客户端交互自动响应：
# 检测 COM 服务器在线状态胡八一、报错解决服务器 qt 运维
适用场景OPCDA／OPCAE等基于DCOM的工业软件巡检自动化部署脚本中批量验证远程COM组件是否可用Windows服务开机自检1.背景在工业控制与运维场景下，我们经常需要判断某台机器上的COM/DCOM服务器（例如OPCServer）是否存活，并在掉线时及时告警或自动重连。.NET自带的System.Type.GetTypeFromProgID/Activator.CreateInstance
Linux系统磁盘挂载操作及原理详解
前言：在Linux系统的日常运维与管理中，磁盘存储的配置是一项基础且关键的工作。无论是新增一块物理硬盘、扩展云服务器的云盘，还是处理分区扩容，最终都绕不开“挂载”这一核心操作——只有将磁盘分区正确挂载到系统目录树中，其存储空间才能被有效利用。然而，挂载并非简单的“连接”操作，它涉及分区识别、文件系统格式化、挂载点设置、开机自动挂载配置等多个环节，每个步骤都有其特定的逻辑和注意事项。例如，不同文件系
Docker深度详解：从原理到实践的全方位指南一切皆有迹可循 docker容器技术 docker 容器 linux 服务器后端 java
前言Docker作为容器化技术的标杆，凭借其轻量级、可移植性和隔离性，彻底改变了软件的开发、部署和运维方式。本文将深入解析Docker的核心原理、架构设计及实战技巧，结合具体代码示例和生产级经验，帮助读者全面掌握这一现代软件开发的关键技术。一、Docker核心概念与架构1.基础概念扩展（1）镜像分层原理#查看镜像层信息dockerhistoryubuntu:20.04#输出示例IMAGECREAT
[特殊字符] 实时数据洪流突围战：Flink+Paimon实现毫秒级分析的架构革命（附压测报告）——日均百亿级数据处理成本降低60%的工业级方案 Lucas55555555 flink 大数据
引言：流批一体的时代拐点据阿里云2025白皮书显示，实时数据处理需求年增速达240%，但传统Lambda架构资源消耗占比超运维成本的70%。某电商平台借助Flink+Paimon重构实时数仓后，端到端延迟从分钟级压缩至800ms，计算资源节省5.6万核/月。技术红利窗口期：2025年ApachePaimon1.0正式发布，支持秒级快照与湖仓一体，成为替代Iceberg的新范式一、痛点深挖：实时数仓
自动化运维工程师面试题解析【真题】
ZabbixAgent默认监听的端口是A.10050。以下是关键分析：选项排除：C.80是HTTP默认端口，与ZabbixAgent无关。D.5432是PostgreSQL数据库的默认端口，不涉及ZabbixAgent。B.10051是ZabbixServer的默认监听端口，用于接收Agent发送的数据，而非Agent自身的监听端口。ZabbixAgent的配置：根据官方文档，ZabbixAgen
【运维实战】解决 K8s 节点无法拉取 pause:3.6 镜像导致 API Server 启动失败的问题 gs80140 各种问题运维 kubernetes 容器
目录【运维实战】解决K8s节点无法拉取pause:3.6镜像导致APIServer启动失败的问题问题分析✅解决方案：替代拉取方式导入pause镜像Step1.从私有仓库拉取pause镜像Step2.重新打tag为Kubernetes默认命名Step3.导出镜像为tar包Step4.拷贝镜像到目标节点Step5.在目标节点导入镜像到containerd的k8s.io命名空间Step6.验证镜像是否导
为什么你的服务器总被攻击？运维老兵的深度分析
作为运维人员，最头疼的莫过于服务器在毫无征兆的情况下变得异常缓慢、服务中断，甚至数据泄露。事后查看日志，常常发现一些“莫名其妙”的攻击痕迹。为什么服务器会成为攻击者的目标？这些攻击又是如何悄无声息发生的？今天，我们就从实战角度分析几种常见且容易被忽视的攻击模式，并教你如何通过日志分析初步定位问题。一、服务器被攻击的常见“莫名其妙”原因“扫楼式”探测与弱口令爆破：现象：服务器CPU、内存无明显异常，
怎么样才能成为专业的程序员？ cocos2d-x小菜编程 PHP
如何要想成为一名专业的程序员？仅仅会写代码是不够的。从团队合作去解决问题到版本控制，你还得具备其他关键技能的工具包。当我们询问相关的专业开发人员，那些必备的关键技能都是什么的时候，下面是我们了解到的情况。关于如何学习代码，各种声音很多，然后很多人就被误导为成为专业开发人员懂得一门编程语言就够了？！呵呵，就像其他工作一样，光会一个技能那是远远不够的。如果你想要成为
java web开发高并发处理 BreakingBad java Web 并发开发处理高
java处理高并发高负载类网站中数据库的设计方法（java教程,java处理大量数据，java高负载数据）一：高并发高负载类网站关注点之数据库没错,首先是数据库,这是大多数应用所面临的首个SPOF。尤其是Web2.0的应用，数据库的响应是首先要解决的。一般来说MySQL是最常用的，可能最初是一个mysql主机，当数据增加到100万以上，那么，MySQL的效能急剧下降。常用的优化措施是M-S（
mysql批量更新 ekian mysql
mysql更新优化：一版的更新的话都是采用update set的方式，但是如果需要批量更新的话，只能for循环的执行更新。或者采用executeBatch的方式，执行更新。无论哪种方式，性能都不见得多好。三千多条的更新，需要3分多钟。查询了批量更新的优化，有说replace into的方式，即： replace into tableName(id,status) values
微软BI（3） 18289753290 微软BI SSIS
1) Q：该列违反了完整性约束错误；已获得 OLE DB 记录。源:“Microsoft SQL Server Native Client 11.0” Hresult: 0x80004005 说明:“不能将值 NULL 插入列 'FZCHID'，表 'JRB_EnterpriseCredit.dbo.QYFZCH'；列不允许有 Null 值。INSERT 失败。”。 A：一般这类问题的存在是
Java中的List g21121 java
List是一个有序的 collection（也称为序列）。此接口的用户可以对列表中每个元素的插入位置进行精确地控制。用户可以根据元素的整数索引（在列表中的位置）访问元素，并搜索列表中的元素。与 set 不同，列表通常允许重复
读书笔记永夜-极光读书笔记
1. K是一家加工厂,需要采购原材料,有A,B,C,D 4家供应商,其中A给出的价格最低,性价比最高,那么假如你是这家企业的采购经理,你会如何决策? 传统决策: A:100%订单 B,C,D:0% &nbs
centos 安装 Codeblocks 随便小屋 codeblocks
1.安装gcc,需要c和c++两部分,默认安装下,CentOS不安装编译器的,在终端输入以下命令即可yum install gccyum install gcc-c++ 2.安装gtk2-devel,因为默认已经安装了正式产品需要的支持库,但是没有安装开发所需要的文档.yum install gtk2* 3. 安装wxGTK yum search w
23种设计模式的形象比喻 aijuans 设计模式
1、ABSTRACT FACTORY—追MM少不了请吃饭了，麦当劳的鸡翅和肯德基的鸡翅都是MM爱吃的东西，虽然口味有所不同，但不管你带MM去麦当劳或肯德基，只管向服务员说“来四个鸡翅”就行了。麦当劳和肯德基就是生产鸡翅的Factory 　　工厂模式：客户类和工厂类分开。消费者任何时候需要某种产品，只需向工厂请求即可。消费者无须修改就可以接纳新产品。缺点是当产品修改时，工厂类也要做相应的修改。如：
开发管理 CheckLists aoyouzi 开发管理 CheckLists
开发管理 CheckLists(23) -使项目组度过完整的生命周期开发管理 CheckLists(22) -组织项目资源开发管理 CheckLists(21) -控制项目的范围开发管理 CheckLists(20) -项目利益相关者责任开发管理 CheckLists(19) -选择合适的团队成员开发管理 CheckLists(18) -敏捷开发 Scrum Master 工作开发管理 C
js实现切换百合不是茶 JavaScript 栏目切换
js主要功能之一就是实现页面的特效,窗体的切换可以减少页面的大小,被门户网站大量应用思路: 1,先将要显示的设置为display:bisible 否则设为none 2,设置栏目的id ,js获取栏目的id,如果id为Null就设置为显示 3,判断js获取的id名字;再设置是否显示代码实现: html代码: <di
周鸿祎在360新员工入职培训上的讲话 bijian1013 感悟项目管理人生职场
这篇文章也是最近偶尔看到的，考虑到原博客发布者可能将其删除等原因，也更方便个人查找，特将原文拷贝再发布的。“学东西是为自己的，不要整天以混的姿态来跟公司博弈，就算是混，我觉得你要是能在混的时间里，收获一些别的有利于人生发展的东西，也是不错的，看你怎么把握了”，看了之后，对这句话记忆犹新。 &
前端Web开发的页面效果 Bill_chen html Web Microsoft
1.IE6下png图片的透明显示： <img src="图片地址" border="0" style="Filter.Alpha(Opacity)=数值(100),style=数值(3)"/> 或在<head></head>间加一段JS代码让透明png图片正常显示。 2.<li>标
【JVM五】老年代垃圾回收：并发标记清理GC(CMS GC) bit1129 垃圾回收
CMS概述并发标记清理垃圾回收(Concurrent Mark and Sweep GC）算法的主要目标是在GC过程中，减少暂停用户线程的次数以及在不得不暂停用户线程的请夸功能，尽可能短的暂停用户线程的时间。这对于交互式应用，比如web应用来说，是非常重要的。 CMS垃圾回收针对新生代和老年代采用不同的策略。相比同吞吐量垃圾回收，它要复杂的多。吞吐量垃圾回收在执
Struts2技术总结白糖_ struts2
必备jar文件早在struts2.0.*的时候，struts2的必备jar包需要如下几个： commons-logging-*.jar Apache旗下commons项目的log日志包 freemarker-*.jar
Jquery easyui layout应用注意事项 bozch jquery 浏览器 easyui layout
在jquery easyui中提供了easyui-layout布局，他的布局比较局限，类似java中GUI的border布局。下面对其使用注意事项作简要介绍：如果在现有的工程中前台界面均应用了jquery easyui，那么在布局的时候最好应用jquery eaysui的layout布局，否则在表单页面（编辑、查看、添加等等）在不同的浏览器会出
java-拷贝特殊链表：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？ bylijinnan java
public class CopySpecialLinkedList { /** * 题目：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？拷贝pNext指针非常容易，所以题目的难点是如何拷贝pRand指针。假设原来链表为A1 -> A2 ->... -> An，新拷贝
color Chen.H JavaScript html css
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <HTML> <HEAD>&nbs
[信息与战争]移动通讯与网络 comsci 网络
两个坚持:手机的电池必须可以取下来光纤不能够入户,只能够到楼宇建议大家找这本书看看:<&
oracle flashback query(闪回查询) daizj oracle flashback query flashback table
在Oracle 10g中，Flash back家族分为以下成员： Flashback Database Flashback Drop Flashback Table Flashback Query(分Flashback Query,Flashback Version Query，Flashback Transaction Query) 下面介绍一下Flashback Drop 和Flas
zeus持久层DAO单元测试 deng520159 单元测试
zeus代码测试正紧张进行中,但由于工作比较忙,但速度比较慢.现在已经完成读写分离单元测试了,现在把几种情况单元测试的例子发出来,希望有人能进出意见,让它走下去. 本文是zeus的dao单元测试: 1.单元测试直接上代码 package com.dengliang.zeus.webdemo.test; import org.junit.Test; import o
C语言学习三printf函数和scanf函数学习 dcj3sjt126com c printf scanf language
printf函数 /* 2013年3月10日20:42:32 地点：北京潘家园功能：目的：测试%x %X %#x %#X的用法 */ # include <stdio.h> int main(void) { printf("哈哈！\n"); // \n表示换行 int i = 10; printf
那你为什么小时候不好好读书? dcj3sjt126com life
dady, 我今天捡到了十块钱, 不过我还给那个人了 good girl! 那个人有没有和你讲thank you啊没有啦....他拉我的耳朵我才把钱还给他的, 他哪里会和我讲thank you 爸爸, 如果地上有一张5块一张10块你拿哪一张呢.... 当然是拿十块的咯... 爸爸你很笨的, 你不会两张都拿爸爸为什么上个月那个人来跟你讨钱, 你告诉他没
iptables开放端口 Fanyucai linux iptables 端口
1，找到配置文件 vi /etc/sysconfig/iptables 2，添加端口开放，增加一行，开放18081端口 -A INPUT -m state --state NEW -m tcp -p tcp --dport 18081 -j ACCEPT 3，保存 ESC :wq! 4，重启服务 service iptables
Ehcache（05）——缓存的查询 234390216 排序 ehcache 统计 query
缓存的查询目录 1. 使Cache可查询 1.1 基于Xml配置 1.2 基于代码的配置 2 指定可搜索的属性 2.1 可查询属性类型 2.2 &
通过hashset找到数组中重复的元素 jackyrong hashset
如何在hashset中快速找到重复的元素呢?方法很多，下面是其中一个办法： int[] array = {1,1,2,3,4,5,6,7,8,8}; Set<Integer> set = new HashSet<Integer>(); for(int i = 0
使用ajax和window.history.pushState无刷新改变页面内容和地址栏URL lanrikey history
后退时关闭当前页面 <script type="text/javascript"> jQuery(document).ready(function ($) { if (window.history && window.history.pushState) {
应用程序的通信成本 netkiller.github.com 虚拟机应用服务器陈景峰 netkiller neo
应用程序的通信成本什么是通信一个程序中两个以上功能相互传递信号或数据叫做通信。什么是成本这是是指时间成本与空间成本。时间就是传递数据所花费的时间。空间是指传递过程耗费容量大小。都有哪些通信方式全局变量线程间通信共享内存共享文件管道 Socket 硬件（串口，USB）等等全局变量全局变量是成本最低通信方法，通过设置
一维数组与二维数组的声明与定义恋洁e生二维数组一维数组定义声明初始化
/** * */ package test20111005; /** * @author FlyingFire * @date:2011-11-18 上午04:33:36 * @author ：代码整理 * @introduce :一维数组与二维数组的初始化 *summary： */ public c
Spring Mybatis独立事务配置 toknowme mybatis
在项目中有很多地方会使用到独立事务，下面以获取主键为例（1）修改配置文件spring-mybatis.xml  <tx:annotation-driven transaction-manager="transactionManager" /> &n
更新Anadroid SDK Tooks之后，Eclipse提示No update were found xp9802 eclipse
使用Android SDK Manager 更新了Anadroid SDK Tooks 之后，打开eclipse提示 This Android SDK requires Android Developer Toolkit version 23.0.0 or above, 点击Check for Updates 检测一会后提示 No update were found

MHA实现mysql的高可用

关于 MHA：

环境设定

1.先搭建一主二从环境

# 在base2上

# 在base3上

如果出现了以下情况

#解决方案：

# 在base4上

测试主从复制

# 在master上：

# 在base3上

# 在base4上

2.搭建mha架构

# 免密检测，会报错，彼此之间都要进行检测

# 再次检测，全部ok

# 检测彼此是否复制

解决问题

有报错，继续解决报错

# 继续有报错：

解决方案（在base2上）：

# 再次检查

测试高可用

# 1.故障手动切换

# 2.热切（master是好的，切换master）

# 在原来的master（base2）上

# 在slave（base4）端查看

# 在base3上查看

# 3.自动切

# 在mha上

# 在master上

# 再在slave上查看master已经切换

# 回到mha监控

# 在原来的master(base3)上

3.mha实现vip漂移

在mha服务端

# 开始测试

# 开始热切换

# 实现vip自动漂移

# 远程测试

当服务器故障切换时，客户端也会卡顿，无法进行操作

你可能感兴趣的:(运维)