NNULjl

基于Ubuntu 14.04 Pacemaker+Corosync+Drbd+Mysql主备

1.Drbd设备安装

参见上一篇博客 http://blog.csdn.net/nnuljl/article/details/38266737

2.心跳程序Corosync

安装心跳程序，在两个节点均安装corosync

apt-get install -y --force-yes corosync

开启corosync。可能遇到的问题server corosync start 无响应

root@controller1:~# vim /etc/default/corosync
# start corosync at boot [yes|no]
START=yes
~                                                                                                                                            
~

将原来默认的no，修改为yes，否则service corosync start 无反应

3.配置Corosync

root@controller1:~# vim /etc/corosync/corosync.conf

配置文件如下

totem {
        version: 2

        # How long before declaring a token lost (ms)
        token: 3000

        # How many token retransmits before forming a new configuration
        token_retransmits_before_loss_const: 10
# Please read the openais.conf.5 manual page

totem {
        version: 2

        # How long before declaring a token lost (ms)
        token: 3000

        # How many token retransmits before forming a new configuration
        token_retransmits_before_loss_const: 10

        # How long to wait for join messages in the membership protocol (ms)
        join: 60

        # How long to wait for consensus to be achieved before starting a new round of membership configuration (ms)
        consensus: 3600

        # Turn off the virtual synchrony filter
        vsftype: none

        # Number of messages that may be sent by one processor on receipt of the token
        max_messages: 20

        # Limit generated nodeids to 31-bits (positive signed integers)
        clear_node_high_bit: yes

        # Disable encryption
        secauth: off

        # How many threads to use for encryption/decryption
        threads: 0

        # Optionally assign a fixed node id (integer)
        # nodeid: 1234

        # This specifies the mode of redundant ring, which may be none, active, or passive.
        rrp_mode: active

        interface {
                # The following values need to be set based on your environment 
                ringnumber: 0
                bindnetaddr: 192.168.2.11
                mcastaddr: 226.94.1.4
                mcastport: 5405
        }
        interface {
                ringnumber: 1
                bindnetaddr: 192.168.99.2
                mcastaddr: 226.94.1.4
                mcastport:5405
        }

}

amf {
        mode: disabled
}

quorum {
        # Quorum for the Pacemaker Cluster Resource Manager
        provider: corosync_votequorum
        expected_votes: 1
}

aisexec {
        user:   root
        group:  root
}

logging {
        fileline: off
        to_stderr: yes
        to_logfile: yes
        logfile: /var/log/corosync/corosync.log
        to_syslog: yes
        syslog_facility: daemon
        debug: off
        timestamp: on
        logger_subsys {
                subsys: AMF
                debug: off
                tags: enter|leave|trace1|trace2|trace3|trace4|trace6
        }
}
# Now this is just for test, add a comment

需要修改配置的地方为totem域内的interface

rrp_mode: active

        interface {
                # The following values need to be set based on your environment 
                ringnumber: 0
                bindnetaddr: 192.168.2.11
                mcastaddr: 226.94.1.4
                mcastport: 5405
        }
        interface {
                ringnumber: 1
                bindnetaddr: 192.168.99.2
                mcastaddr: 226.94.1.4
                mcastport:5405
        }

可以配置多个心跳接口，ringnumber不要写成一样的即可。bindnetaddr为绑定的IP，还有就是广播IP。

查看心跳集群情况，如下为在节点查看情况

root@controller1:~# corosync-cmapctl |grep members
runtime.totem.pg.mrp.srp.members.1084752395.config_version (u64) = 0
runtime.totem.pg.mrp.srp.members.1084752395.ip (str) = r(0) ip(192.168.2.11) r(1) ip(192.168.99.2) 
runtime.totem.pg.mrp.srp.members.1084752395.join_count (u32) = 1
runtime.totem.pg.mrp.srp.members.1084752395.status (str) = joined
runtime.totem.pg.mrp.srp.members.1084752396.config_version (u64) = 0
runtime.totem.pg.mrp.srp.members.1084752396.ip (str) = r(0) ip(192.168.2.12) r(1) ip(127.0.0.1) 
runtime.totem.pg.mrp.srp.members.1084752396.join_count (u32) = 1
runtime.totem.pg.mrp.srp.members.1084752396.status (str) = joined

节点2查看情况

root@controller2:~# corosync-cmapctl |grep members
runtime.totem.pg.mrp.srp.members.1084752395.config_version (u64) = 0
runtime.totem.pg.mrp.srp.members.1084752395.ip (str) = r(0) ip(192.168.2.11) r(1) ip(192.168.99.2) 
runtime.totem.pg.mrp.srp.members.1084752395.join_count (u32) = 1
runtime.totem.pg.mrp.srp.members.1084752395.status (str) = joined
runtime.totem.pg.mrp.srp.members.1084752396.config_version (u64) = 0
runtime.totem.pg.mrp.srp.members.1084752396.ip (str) = r(0) ip(192.168.2.12) r(1) ip(127.0.0.1) 
runtime.totem.pg.mrp.srp.members.1084752396.join_count (u32) = 1
runtime.totem.pg.mrp.srp.members.1084752396.status (str) = joined

我们看到有一个IP是127.0.0.1因为节点2，因为硬件资源问题和192.168.99.2相对接的网卡被移除了，所以显示为本地IP。

4.安装Pacemaker

apt-get install -y --force-yes pacemaker

5.配置Pacemaker

ocf日志配置

root@controller1:/usr/lib/ocf/lib/heartbeat# ls
apache-conf.sh  ocf-binaries     ocf-rarun        ocf-shellfuncs  sapdb-nosha.sh
http-mon.sh     ocf-directories  ocf-returncodes  ora-common.sh   sapdb.sh

配置ocf-directories文件

# Binaries and binary options for use in Resource Agents

prefix=/usr
exec_prefix=/usr
: ${INITDIR:=/etc/init.d}
: ${HA_DIR:=/etc/ha.d}
: ${HA_RCDIR:=$HA_DIR/rc.d}
: ${HA_CONFDIR=$HA_DIR/conf}
: ${HA_CF:=$HA_DIR/ha.cf}
: ${HA_VARLIB:=/var/lib/heartbeat}
: ${HA_RSCTMP:=/var/run/resource-agents}
: ${HA_RSCTMP_OLD:=/var/run/heartbeat/rsctmp}
: ${HA_FIFO:=/var/lib/heartbeat/fifo}
: ${HA_BIN:=/usr/lib/heartbeat}
: ${HA_SBIN_DIR:=/usr/sbin}
: ${HA_DATEFMT:="%Y/%m/%d_%T "}
: ${HA_DEBUGLOG:=/dev/null}
: ${HA_RESOURCEDIR:=$HA_DIR/resource.d}
: ${HA_DOCDIR:=/usr/share/doc/heartbeat}
: ${__SCRIPT_NAME:=`basename $0`}
: ${HA_VARRUN:=/var/run/}
: ${HA_VARLOCK:=/var/lock/subsys/}
: ${HA_LOGFILE:=/var/log/ha/ha.log}
: ${HA_DEBUGLOG:=/var/log/ha/ha_debug.log}

新增最后两行，并在/var/log下创建ha目录，当使用ocf资源时会生成日志。

6.配置Pacemaker服务资源

crm status 查看集群情况

root@controller1:/usr/lib/ocf/lib/heartbeat# crm status
Last updated: Wed Jul 30 13:03:46 2014
Last change: Wed Jul 30 12:39:21 2014 via crm_attribute on controller2
Stack: corosync
Current DC: controller1 (1084752395) - partition with quorum
Version: 1.1.10-42f2063
2 Nodes configured
20 Resources configured


Node controller2 (1084752396): standby
Online: [ controller1 ]

controller2 被笔者认为设置为standby，初始状态应该两者都为online。

root@controller1:~# crm ra
crm(live)ra# classes
lsb
ocf / heartbeat linbit openstack pacemaker rabbitmq redhat
service
stonith
upstart

查看pacemaker资源脚本，这些脚本控制着服务

crm(live)ra# help

This level contains commands which show various information about
the installed resource agents. It is available both at the top
level and at the `configure` level.

Available commands:

        classes          list classes and providers
        list             list RA for a class (and provider)
        meta             show meta data for a RA
        providers        show providers for a RA and a class
        help             show help (help topics for list of topics)
        end              go back one level
        quit             exit the program

其中crm(live)ra# meta IPaddr2 是作为虚拟IP绑定的资源。

配置服务资源

root@controller1:~# crm configure
crm(live)configure#

为交换命令可以用help查看命令帮助

Available commands:

        node             define a cluster node
        primitive        define a resource
        monitor          add monitor operation to a primitive
        group            define a group
        clone            define a clone
        ms               define a master-slave resource
        rsc_template     define a resource template
        location         a location preference
        colocation       colocate resources
        order            order resources
        rsc_ticket       resources ticket dependency
        property         set a cluster property
        rsc_defaults     set resource defaults
        fencing_topology node fencing order
        role             define role access rights
        user             define user access rights
        op_defaults      set resource operations defaults
        schema           set or display current CIB RNG schema
        show             display CIB objects
        edit             edit CIB objects
        filter           filter CIB objects
        delete           delete CIB objects
        default-timeouts set timeouts for operations to minimums from the meta-data
        rename           rename a CIB object
        modgroup         modify group
        refresh          refresh from CIB
        erase            erase the CIB
        ptest            show cluster actions if changes were committed
        rsctest          test resources as currently configured
        cib              CIB shadow management
        cibstatus        CIB status management and editing
        template         edit and import a configuration from a template
        commit           commit the changes to the CIB
        verify           verify the CIB with crm_verify
        upgrade          upgrade the CIB to version 1.0
        save             save the CIB to a file
        load             import the CIB from a file
        graph            generate a directed graph
        xml              raw xml
        help             show help (help topics for list of topics)
        end              go back one level
:

需要说明的primitive为定义一个资源，group将多个资源定义为组，方便多操作。location定义资源节点黏性，即优先运行于哪个节点，colocation定义多个服务运行于同一节点，或者不能运行于同一节点，order定义服务节点顺序。

crm(live)configure# show
node $id="1084752395" controller1 \
        attributes standby="off"
node $id="1084752396" controller2 \
        attributes standby="on"
...

primitive p_api_ip ocf:heartbeat:IPaddr2 \
        params ip="192.168.99.3" cidr_netmask="24" \
        op monitor interval="30s"
primitive p_fs_mysql ocf:heartbeat:Filesystem \
        params device="/share-s/mysql" directory="/var/lib/mysql" fstype="ext4" options="relatime" \
        op start interval="0" timeout="120s" \
        op stop interval="0" timeout="180s" \
        op monitor interval="60s" timeout="120s" \
        meta target-role="Started"
primitive p_mysql ocf:heartbeat:mysql \
        params additional_parameters="--bind-address=0.0.0.0" config="/etc/mysql/my.cnf" pid="/var/run/mysqld/mysqld.pid" socket="/var/run/mysqld/mysqld.sock" log="/var/log/mysql/mysqld.log"
primitive p_drbd_mysql ocf:linbit:drbd \
	params drbd_resource="mysql" \
	op start interval="0" timeout="240s" \
	op stop interval="0" timeout="180s" \
	op promote interval="0" timeout="180s" \
	op demote interval="0" timeout="180s" \
	op monitor interval="30s" role="Slave" \
	op monitor interval="29s" role="Master"

group g_1_mysql p_ip_admin p_fs_mysql p_mysql
ms ms_drbd_mysql p_drbd_mysql \
	meta notify="true" clone-max="2"
colocation c_mysql_on_drbd inf: g_1_mysql ms_drbd_mysql:Master
order o_drbd_before_mysql inf: ms_drbd_mysql:promote g_1_mysql:start

如上，定义了Drbd资源，虚拟IP资源，文件系统挂载资源，MySQL启动资源。

当定义好资源后可以在交互命令里面验证，提交。

root@controller1:~# crm configure
crm(live)configure# verify 
WARNING: p_mysql: default timeout 20s for start is smaller than the advised 120
WARNING: p_mysql: default timeout 20s for stop is smaller than the advised 120
crm(live)configure# commit 
INFO: apparently there is nothing to commit
INFO: try changing something first

提交以后资源就会在Pacemaker内运行了，可以通过crm status或者crm_mon查看。

Last updated: Wed Jul 30 13:20:54 2014
Last change: Wed Jul 30 12:39:21 2014 via crm_attribute on controller2
Stack: corosync
Current DC: controller1 (1084752395) - partition with quorum
Version: 1.1.10-42f2063
2 Nodes configured
20 Resources configured


Node controller2 (1084752396): standby
Online: [ controller1 ]

 Resource Group: g_1_mysql
     p_ip_admin (ocf::heartbeat:IPaddr2):       Started controller1
     p_fs_mysql (ocf::heartbeat:Filesystem):    Started controller1
     p_mysql    (ocf::heartbeat:mysql): Started controller1

如果可以看到相关资源，当然Drbd也会显示在里面，但是由于笔者的测试环境已经切换为iSCSI共享存储，所以相关数据就没有了。

7.Pacermaker维护

Pacermaker restart时，资源会进行迁移，同时可以在资源执行节点#crm node standby设置节点为备用，如果要恢复#crm node online

重启某个服务#crm resource restart 例如#crm resource restart g_1_mysql 所有mysql资源会重启，#crm resource stop p_mysql MySQL即会关闭。

8.配置STONITH注意事项

pacemaker提供fence机制，配置STONITH资源即可需要注意的时，要设置stonith-action，否则fence看不出效果。

property $id="cib-bootstrap-options" \
        dc-version="1.1.10-42f2063" \
        cluster-infrastructure="corosync" \
        stonith-enabled="false" \
        no-quorum-policy="ignore" \
        stonith-action="reboot"

如果启用fence的stonith，将stonith-enabled设置为true，并且设置stonith-action，参数值可通过交互命令Tab知晓

crm(live)configure# property 
batch-limit=                  enable-startup-probes=        pe-error-series-max=          stonith-enabled=
cluster-delay=                is-managed-default=           pe-input-series-max=          stonith-timeout=
cluster-recheck-interval=     maintenance-mode=             pe-warn-series-max=           stop-all-resources=
crmd-transition-delay=        migration-limit=              placement-strategy=           stop-orphan-actions=
dc-deadtime=                  no-quorum-policy=             remove-after-stop=            stop-orphan-resources=
default-action-timeout=       node-health-green=            shutdown-escalation=          symmetric-cluster=
default-resource-stickiness=  node-health-red=              start-failure-is-fatal=       
election-timeout=             node-health-strategy=         startup-fencing=              
enable-acl=                   node-health-yellow=           stonith-action=               
crm(live)configure# property stonith-action=
stonith-action (enum, [reboot]): Action to send to STONITH device
    Action to send to STONITH device  Allowed values: reboot, poweroff, off

系统能提供哪些STONITH服务可通过命令查询

root@controller1:~# crm ra
crm(live)ra# classes
lsb
ocf / heartbeat linbit openstack pacemaker rabbitmq redhat
service
stonith
upstart
crm(live)ra# list stonith
apcmaster                   apcmastersnmp               apcsmart                    baytech                     bladehpi
cyclades                    drac3                       external/drac5              external/dracmc-telnet      external/hetzner
external/hmchttp            external/ibmrsa             external/ibmrsa-telnet      external/ipmi               external/ippower9258
external/kdumpcheck         external/libvirt            external/nut                external/rackpdu            external/riloe
external/ssh                external/vcenter            external/vmware             external/xen0               external/xen0-ha
fence_legacy                fence_pcmk                  ibmhmc                      ipmilan                     meatware
null                        nw_rpc100s                  rcd_serial                  rps10                       ssh
suicide                     wti_mpc                     wti_nps

如需转载注明出处：http://blog.csdn.net/nnuljl

一、Docker：一场颠覆应用部署与运维的容器革命 IvanCodes Docker教程 docker 容器
作者：IvanCodes日期：2025年7月3日专栏：Docker教程在现代软件开发的世界里，Docker已经从一个新奇的工具演变成了一项基础性技术。它彻底改变了我们构建、打包、分发和运行应用程序的方式。无论你是开发者、运维工程师还是技术爱好者，理解Docker都是一项不可或缺的技能。本文将带你回顾Docker的发展历史，探索它能解决的实际问题，并清晰地解析其核心名词概念。一、Docker的“前世
Kubernetes (K8s) 详解：从入门到进阶半夏一 1024程序员节
Kubernetes(K8s)详解：从入门到进阶什么是Kubernetes？Kubernetes，通常简称为K8s，是一个开源的容器编排平台，用于自动化部署、扩展和管理容器化应用。它最初由Google开发，现在由CNCF（云原生计算基金会）维护。Kubernetes可以帮助开发人员和运维人员简化应用程序的管理，尤其是在云环境中。核心概念在深入Kubernetes的架构和使用之前，我们需要了解一些核
大前端日志分析的AI应用：从海量日志中提取有价值的运维信息欧阳天羲大前端与 AI 的深度融合 #AI 在大前端安全与运维篇前端人工智能运维
在大前端技术快速发展的今天，前端应用的复杂度呈指数级增长，涵盖Web、移动端H5、小程序、快应用等多端形态。随之而来的是海量日志数据的爆发式增长——从浏览器控制台输出到移动端性能埋点，从用户行为轨迹到API调用异常，这些日志分散在不同终端、格式异构，传统的人工分析或规则引擎已难以应对。本文将系统阐述AI技术如何赋能大前端日志分析，从日志采集到智能诊断的全流程解决方案，结合实际案例展示如何利用机器学
【mongodb】mongodb数据备份与恢复向往风的男子运维日常 DBA mongodb 数据库
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》暂未更新《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》运维日常《l
数据仓库技术及应用（Hive 产生背景与架构设计，存储模型与数据类型）娟恋无暇数据仓库笔记 hive
1.Hive产生背景传统Hadoop架构存在的一些问题：MapReduce编程必须掌握Java，门槛较高传统数据库开发、DBA、运维人员学习门槛高HDFS上没有Schema的概念，仅仅是一个纯文本文件Hive的产生：为了让用户从一个现有数据基础架构转移到Hadoop上现有数据基础架构大多基于关系型数据库和SQL查询Facebook诞生了Hive2.Hive是什么官网：https://hive.ap
Redis 的特性、工作机制与性能优化全解（含搭建实战教程）
文章目录二、Redis的核心特性三、Redis的工作机制解析单线程模型（性能为何强大？）数据结构是性能的关键持久化机制（数据如何存下来？）四、Redis性能优化实战1.优化内存使用2.提升并发性能3.使用分片/集群机制4.异步处理五、Redis搭建流程（Linux环境）1.下载与解压2.编译并安装3.修改配置文件（推荐复制一份）4.启动Redis5.客户端连接测试六、Redis运维技巧与监控命令七
提到交换机堆叠大家就害怕，其实堆叠很简单！ wljslmz 网络技术交换机堆叠
一提到“交换机堆叠”这四个字，很多网络工程师眉头就皱了起来，仿佛堆叠就等于配置复杂、故障难查、升级噩梦。其实真不是！交换机堆叠（Stacking）说白了，就是“多台交换机一起干活，还装得像一台”。如果你认真了解过堆叠背后的逻辑和原理，掌握了几个关键细节，这项技术其实相当香，无论是运维、扩展，还是冗余能力，都是妥妥加分项！今天我们就来一次不装神弄鬼、不炫术语、不堆RFC的通透解读，把“交换机堆叠”这
输电线路导线舞动在线监测装置：技术解析与应用价值
在高压输电网络中，导线舞动是威胁电网安全稳定运行的典型动态风险。作为一种专为输电线路设计的智能监测设备，导线舞动在线监测装置通过实时感知、数据传输与智能分析，为电网运维提供了精准的技术支撑。一、核心工作原理该装置基于多参数协同监测技术，通过高精度传感器阵列实现动态数据采集。其运行流程可分为三个关键环节：数据采集层：在输电线路关键节点部署加速度计、位移传感器及微气象监测单元。加速度计以不低于200H
微服务VS单体架构：代购系统如何用“乐高模式”破解百万订单困局？ Joe13265449558 代购系统跨境电商自建站独立站无货源
微服务架构vs单体架构：代购系统选型指南在跨境电商代购系统年交易规模突破3.2万亿元的背景下，系统架构选型直接决定了企业的扩展能力、运维成本与用户体验。2024年数据显示，采用微服务架构的代购平台故障率较单体架构低41%，但初期开发成本高出27%。本文将从技术原理、适用场景、实战案例三个维度，深度解析两种架构在代购系统中的选型逻辑。一、架构本质：从“巨无霸”到“乐高积木”的演进1.单体架构：一座封
云原生AI研发体系建设路径 TechVision大咖圈人工智能云原生人工智能云原生AI研发体系
当AI遇上云原生，就像咖啡遇上牛奶，总能擦出不一样的火花☕️文章目录引言：为什么要建设云原生AI研发体系整体架构设计：搭建AI研发的"乐高积木"技术栈选择：选择合适的"武器装备"开发流程设计：从代码到生产的"高速公路"部署运维策略：让AI应用"稳如老狗"监控治理体系：AI应用的"健康管家"总结：建设路径与最佳实践引言：为什么要建设云原生AI研发体系在这个AI满天飞的时代，如果你还在用传统的方式搞A
MySQL 8.0 权限审计实战：揪出那些“权力过大”的用户运维开发王义杰系统运维 mysql mysql android 数据库
在日常的运维和开发工作中，数据库的安全性是我们绝对不能忽视的一环。随着攻击手段的日益多样化，仅仅设置一个复杂的密码是远远不够的。我们需要定期对数据库的权限进行审计和加固，遵循“最小权限原则”（PrincipleofLeastPrivilege），确保每个用户只拥有其完成工作所必需的最小权限。在MySQL8.0中，权限管理变得更加精细。今天，我将带大家通过几个简单的SQL查询，快速锁定两类高风险用户
Linux 云服务器开启 SSH 会话保持，避免长时间断开连接 #Linux #SSH #云服务器 #CentOS #会话保持 #运维代码简单说运维宝典限时特惠 linux 服务器运维 SSH 会话保持
Linux云服务器开启SSH会话保持，避免长时间断开连接标签：#Linux#SSH#云服务器#CentOS#会话保持#运维操作场景在使用SSH登录CentOS云服务器时，很多开发者都会遇到一个常见问题：长时间不操作后，SSH会话自动断开，导致需要重新登录。这种情况不仅影响开发效率，还可能中断正在执行的任务。本文将详细介绍如何通过配置SSH服务端，保持SSH会话持续连接，避免自动断开。注意：本文涉及
【java】list集合遍历的5种方式 IT_Most java 集合 java
平凡也就两个字:懒和惰;成功也就两个字:苦和勤;优秀也就两个字:你和我。跟着我从0学习JAVA、spring全家桶和linux运维等知识，带你从懵懂少年走向人生巅峰，迎娶白富美！关注微信公众号【IT特靠谱】，每天都会分享技术心得~【java】list集合遍历的5种方式List集合在Java日常开发中是非常常见的，快速选择合适的遍历方式能极大提高我们的开发效率。下面我总结了五种List集合的遍历方式
Oracle数据库中JOIN连接查询的高效应用与性能优化教程 caifox菜狐狸 Oracle相关知识笔记 Oracle PL/SQL 编程入门数据库 oracle JOIN LEFT JOIN FULL JOIN INNER JOIN 连接查询
在Oracle数据库的日常使用中，JOIN连接查询是实现多表数据关联查询的核心手段。无论是企业级的数据分析，还是日常的业务报表生成，JOIN操作都扮演着不可或缺的角色。然而，JOIN查询的性能优化一直是数据库开发和运维人员面临的挑战。一个低效的JOIN查询可能会导致查询响应时间过长，甚至拖垮整个数据库系统的性能。因此，掌握JOIN连接查询的高效应用技巧和性能优化方法，对于提升数据库的整体性能和用户
多云迷宫突围：Karmada+ClusterAPI统一治理三大云 Star_Sea_77 云原生与DevOps工程实践云原生 Karmada Cluster
多云迷宫突围：Karmada+ClusterAPI统一治理三大云摘要本文针对多云环境下“云厂商配置差异大、手工维护YAML导致配置漂移、跨云运维效率低下”等痛点（某金融企业因此月均发生3-5次配置不一致事故），提出基于Karmada与ClusterAPI的多云统一治理方案。通过ClusterAPI实现跨云集群生命周期自动化（创建/销毁/升级），结合Karmada的应用跨云分发能力，解决“一套配置适
CentOS7之Dify部署 weifacai docker
CentOS安装时IP4设置成手动，DNS设置为8.8.8.8,8.8.4.4宝塔安装地址：宝塔面板下载，免费全能的服务器运维软件1.CentOS安装DockerDockerCE支持64位版本CentOS7，并且要求内核版本不低于3.10，CentOS7满足最低内核的要求，所以我们在CentOS7安装Docker。1.1.卸载（可选）如果之前安装过旧版本的Docker，可以使用下面命令卸载：yum
【宝塔Linux面板】在阿里云服务器安装孤独本就常态 linux 运维阿里云
文章目录一、宝塔Linux面板是什么？二、宝塔Linux面板安装步骤1.下载Xshell2.远程连接服务器3.进入宝塔官网4.安装面板5.安装成功三、总结一、宝塔Linux面板是什么？宝塔Linux面板是提升运维效率的服务器管理软件，支持一键LAMP/LNMP/集群/监控/网站/FTP/数据库/JAVA等100多项服务器管理功能。有30个人的专业团队研发及维护，经过200多个版本的迭代，功能全，少
AIOps助力AI研发平台的自我优化能力构建 TechVision大咖圈人工智能 AIOps 能力构建
关键词：AIOps在AI研发平台中的自我优化能力构建适用读者：AI平台架构师、研发效能团队、智能运维工程师阅读时长：约8分钟目录什么是AIOps？AI研发平台的挑战AIOps如何赋能AI研发平台自我优化能力的核心构建要素架构图与流程示意最佳实践案例写在最后什么是AIOps？AIOps，全称ArtificialIntelligenceforITOperations。别害怕这个“高大上”的名词，其实它
应用服务器监控方案：精准预警，快速响应 Simon丶XM 运维知识库 linux 自动化服务器运维网络
应用服务器监控方案：精准预警，快速响应背景在应用系统正式发布并投入运行后，系统可能会因多种潜在问题而遭遇宕机或陷入假死状态。特别是在生产环境中，一旦出现此类故障，若管理员未能迅速察觉并立即组织运维团队进行修复，将可能给客户带来不便，同时给公司造成重大经济损失及声誉损害。传统上，依赖人工实时监控应用系统虽为一种手段，但其高昂的成本及对监控人员专业技能的高要求，使得这一方法并非最优选择。鉴于此，探索并
python模拟内置函数reversed_Python内置函数reversed weixin_39594895
{"moduleinfo":{"card_count":[{"count_phone":1,"count":1}],"search_count":[{"count_phone":4,"count":4}]},"card":[{"des":"阿里技术人对外发布原创技术内容的最大平台；社区覆盖了云计算、大数据、人工智能、IoT、云原生、数据库、微服务、安全、开发与运维9大技术领域。","link1":
破解风电运维“百模大战”困局，机械版ChatGPT诞生？我不是哆啦A梦故障诊断机器学习信号处理人工智能运维 chatgpt 算法 python
面对风机87%的非计划停机，30多个专用模型为何束手无策？一套通用大模型如何实现轴承、齿轮、转子“一站式”健康管理？一、行业痛点：风机运维深陷“碎片化泥潭”1.187%停机故障由多部件引发齿轮断裂、轴承磨损、电机短路……风电故障如同“并发症”，而传统模型却是“专科医生”——仅能诊断单一部件。1.2华电电科院的运维困局华电电科院为206个风场、超1万台机组开发30多个专用模型，却因设备型号、工况差异
建筑设备监控与调控双管齐下，楼宇自控达成建筑环境全方位智慧化管理 ctrlworks 楼宇自控楼宇自控系统厂家 ba系统厂商建筑管理系统厂家 ibms系统厂家能耗监测系统厂家康沃思物联
在数字化与智能化技术深度渗透的当下，建筑行业正经历从传统运维向智慧管理的深刻变革。建筑设备作为维持建筑正常运行的“神经与脉络”，其管理效率直接影响建筑的能耗水平、安全性能与用户体验。传统建筑管理中，设备监控与调控常处于割裂状态，难以实现资源的最优配置。而通过将设备监控与调控有机结合、双管齐下，正成为实现建筑环境全方位智慧化管理的关键路径，为建筑的可持续发展注入新动能。一、精准监控：构筑建筑设备管理
构建量化交易系统核心技术栈详解：从数据到实盘的全链路实践（含代码） Natsume1710 python c++c语言 github mysql
1.引言量化交易系统是一个集数据处理、策略研究、高速执行、风险控制及系统运维于一体的复杂工程。本文旨在为读者提供一个从零开始构建量化交易系统的实践指南，详细阐述其核心技术栈，并通过具体的代码示例，帮助开发者深入理解每个模块的实现细节和技术选型考量。我们将系统分为五个核心层级进行讲解：数据层、策略研究与回测层、交易执行层、风险管理层，以及监控与运维层。每个层级都将探讨其主要功能、涉及的技术挑战及相应
【Java 面试八股学习自用版】MYSQL优化-------定位慢查询以及分析
定位慢查询以及分析导致慢查询的一些原因聚合查询多表查询表数据量过大查询深度分页查询此时的表现为：页面加载过慢接口压测响应时间过长（1s以上）。定位方法（定位哪一条）方法一开源工具调试工具Arthas运维工具prometheusSkywalkingMySql自带慢日志需要在配置文件中开启设置开启以及时间阈值（ps2s）注意：一般在调试阶段开启注意一般结合自己项目说！！！！！分析慢SQL语句的原因聚合
在Amazon EKS中应用Amazon Fargate的Serverless容器化实践 AWS官方合作商 serverless 云原生 aws
本文深度解析如何通过Fargate实现EKS集群的Serverless节点管理，大幅降低K8s运维复杂度一、为什么选择Fargate+EKS？AmazonEKS（ElasticKubernetesService）提供托管式K8s集群，而Fargate作为无服务器计算引擎，二者结合可解决以下痛点：运维简化无需管理WorkerNode（EC2实例）自动处理节点扩缩容/打补丁/安全加固成本优化按Pod资
Amazon Q Developer CLI + 飞书：打造对话式 AI Agent 智能运维平台 AWS官方合作商飞书运维 aws
当运维告警在凌晨响起，你不再需要挣扎着打开电脑输入命令。飞书上一条简单的消息：“@运维助手，查看服务器负载”，瞬间获得清晰的分析报告。告别复杂命令，迎接对话式智能运维时代。在传统运维模式下，工程师们常面临诸多痛点：告警风暴：海量告警信息难以快速定位关键问题操作门槛高：新手面对复杂CLI命令时束手无策响应延迟：夜间值班或移动办公场景响应效率低下知识孤岛：运维经验难以有效沉淀和共享现在，AmazonQ
Eureka服务注册中心可视化监控和运维详解一切皆有迹可循微服务注册中心分布式技术 eureka 运维云原生 java 分布式
前言在复杂的微服务生态中，作为服务注册与发现的中枢，Eureka的稳定运行至关重要。通过可视化监控，可直观掌握服务实例状态、流量分布等关键信息；科学的运维手段则能保障其持续高效运转。本文将深入介绍Eureka可视化监控工具的使用、运维策略及实战技巧，并结合具体代码示例，助力开发者提升Eureka的管理水平。一、Eureka可视化监控工具介绍1.1EurekaServer自带监控界面EurekaSe
Easy-excel监听器中对批量上传的工单做错误收集
Easy-excel监听器中对批量上传的工单做错误收集为什么要做"错误收集"?一、为什么要做“错误收集”？1.用户体验更好如果某一行数据出错就直接中断整个导入流程，用户需要反复上传才能排查所有问题。错误收集可以让用户一次性看到哪些行成功、哪些行失败、失败原因是什么。2.提升调试效率开发者或运维人员可以通过错误信息快速定位问题数据，比如：必填字段为空数据格式错误（如日期格式不正确）外键不存在（如设备
Java性能调优必修课：YourKit与VisualVM实战对比，从内存泄漏到CPU瓶颈的一站式解决
引言凌晨三点的运维群突然弹出告警：“服务器内存使用率98%！”，你顶着黑眼圈登录服务器，jstat显示GC频率飙升，jmap导出堆文件却像看天书——这种场景每个Java工程师都不陌生。性能问题就像程序里的"暗桩"，轻则让用户骂骂咧咧，重则导致系统崩溃。这时候，专业的性能分析工具就是我们的"照妖镜"。今天要聊的两位主角：JDK自带的VisualVM和商业旗舰YourKit，一个是"居家小能手"，一个
AIX 环境磁盘空间管理指南
AIX环境磁盘空间管理指南在AIX环境中，磁盘空间的监控、管理与扩展是运维人员必备的技能。本文通过实际案例，系统地介绍如何查询磁盘信息、卷组(VG)、逻辑卷(LV)信息，以及在磁盘空间不足时的扩容方案，帮助读者掌握磁盘空间管理的实操技能。一、AIX存储管理基础概念在深入实际操作前，首先明确以下概念以及它们之间的关系：物理卷(PV):物理卷是系统中一块物理硬盘或其分区的逻辑表示，是AIX存储结构的最
Dom 周华华 JavaScript html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
【Spark九十六】RDD API之combineByKey bit1129 spark
1. combineByKey函数的运行机制 RDD提供了很多针对元素类型为(K,V)的API，这些API封装在PairRDDFunctions类中，通过Scala隐式转换使用。这些API实现上是借助于combineByKey实现的。combineByKey函数本身也是RDD开放给Spark开发人员使用的API之一首先看一下combineByKey的方法说明：
msyql设置密码报错：ERROR 1372 (HY000): 解决方法详解 daizj mysql 设置密码
MySql给用户设置权限同时指定访问密码时，会提示如下错误： ERROR 1372 (HY000): Password hash should be a 41-digit hexadecimal number；问题原因：你输入的密码是明文。不允许这么输入。解决办法：用select password('你想输入的密码');查询出你的密码对应的字符串，然后
路漫漫其修远兮吾将上下而求索周凡杨学习思索
王国维在他的《人间词话》中曾经概括了为学的三种境界古今之成大事业、大学问者，罔不经过三种之境界。“昨夜西风凋碧树。独上高楼，望尽天涯路。”此第一境界也。“衣带渐宽终不悔，为伊消得人憔悴。”此第二境界也。“众里寻他千百度，蓦然回首，那人却在灯火阑珊处。”此第三境界也。学习技术，这也是你必须经历的三种境界。第一层境界是说，学习的路是漫漫的，你必须做好充分的思想准备，如果半途而废还不如不要开始。这里，注
Hadoop(二)对话单的操作朱辉辉33 hadoop
Debug： 1、 A = LOAD '/user/hue/task.txt' USING PigStorage(' ') AS (col1,col2,col3); DUMP A; //输出结果前几行示例： (>ggsnPDPRecord(21),,) (-->recordType(0),,) (-->networkInitiation(1),,)
web报表工具FineReport常用函数的用法总结（日期和时间函数）老A不折腾 finereport 报表工具 web开发
web报表工具FineReport常用函数的用法总结（日期和时间函数）说明：凡函数中以日期作为参数因子的，其中日期的形式都必须是yy/mm/dd。而且必须用英文环境下双引号(" ")引用。 DATE DATE(year,month,day):返回一个表示某一特定日期的系列数。 Year:代表年，可为一到四位数。 Month:代表月份。
c++ 宏定义中的##操作符墙头上一根草 C++
#与##在宏定义中的--宏展开 #include <stdio.h> #define f(a,b) a##b #define g(a) #a #define h(a) g(a) int main() { &nbs
分析Spring源代码之，DI的实现 aijuans spring DI 现源代码
(转) 分析Spring源代码之，DI的实现 2012/1/3 by tony 接着上次的讲，以下这个sample [java] view plain copy print
for循环的进化 alxw4616 JavaScript
// for循环的进化 // 菜鸟 for (var i = 0; i < Things.length ; i++) { // Things[i] } // 老鸟 for (var i = 0, len = Things.length; i < len; i++) { // Things[i] } // 大师 for (var i = Things.le
网络编程Socket和ServerSocket简单的使用百合不是茶网络编程基础 IP地址端口
网络编程;TCP/IP协议网络:实现计算机之间的信息共享,数据资源的交换协议:数据交换需要遵守的一种协议,按照约定的数据格式等写出去端口:用于计算机之间的通信每运行一个程序，系统会分配一个编号给该程序，作为和外界交换数据的唯一标识 0~65535 查看被使用的
JDK1.5 生产消费者 bijian1013 java thread 生产消费者 java多线程
ArrayBlockingQueue：一个由数组支持的有界阻塞队列。此队列按 FIFO（先进先出）原则对元素进行排序。队列的头部是在队列中存在时间最长的元素。队列的尾部是在队列中存在时间最短的元素。新元素插入到队列的尾部，队列检索操作则是从队列头部开始获得元素。 ArrayBlockingQueue的常用方法：
JAVA版身份证获取性别、出生日期及年龄 bijian1013 java 性别出生日期年龄
工作中需要根据身份证获取性别、出生日期及年龄，且要还要支持15位长度的身份证号码，网上搜索了一下，经过测试好像多少存在点问题，干脆自已写一个。 CertificateNo.java package com.bijian.study; import java.util.Calendar; import
【Java范型六】范型与枚举 bit1129 java
首先，枚举类型的定义不能带有类型参数，所以，不能把枚举类型定义为范型枚举类，例如下面的枚举类定义是有编译错的 public enum EnumGenerics<T> { //编译错，提示枚举不能带有范型参数 OK, ERROR; public <T> T get(T type) { return null;
【Nginx五】Nginx常用日志格式含义 bit1129 nginx
1. log_format 1.1 log_format指令用于指定日志的格式，格式： log_format name(格式名称) type(格式样式) 1.2 如下是一个常用的Nginx日志格式： log_format main '[$time_local]|$request_time|$status|$body_bytes
Lua 语言 15 分钟快速入门 ronin47 lua 基础
- - 单行注释 - - [[ [多行注释] - - ]] - - - - - - - - - - - 1. 变量 & 控制流 - - - - - - - - - - num = 23 - - 数字都是双精度 str = 'aspythonstring'
java-35.求一个矩阵中最大的二维矩阵 ( 元素和最大 ) bylijinnan java
the idea is from: http://blog.csdn.net/zhanxinhang/article/details/6731134 public class MaxSubMatrix { /**see http://blog.csdn.net/zhanxinhang/article/details/6731134 * Q35 求一个矩阵中最大的二维
mongoDB文档型数据库特点开窍的石头 mongoDB文档型数据库特点
MongoDD: 文档型数据库存储的是Bson文档-->json的二进制特点：内部是执行引擎是js解释器，把文档转成Bson结构，在查询时转换成js对象。 mongoDB传统型数据库对比传统类型数据库：结构化数据，定好了表结构后每一个内容符合表结构的。也就是说每一行每一列的数据都是一样的文档型数据库：不用定好数据结构，
[毕业季节]欢迎广大毕业生加入JAVA程序员的行列 comsci java
一年一度的毕业季来临了。。。。。。。。正在投简历的学弟学妹们。。。如果觉得学校推荐的单位和公司不适合自己的兴趣和专业，可以考虑来我们软件行业，做一名职业程序员。。。软件行业的开发工具中，对初学者最友好的就是JAVA语言了，网络上不仅仅有大量的
PHP操作Excel – PHPExcel 基本用法详解 cuiyadll PHP Excel
导出excel属性设置//Include classrequire_once('Classes/PHPExcel.php');require_once('Classes/PHPExcel/Writer/Excel2007.php');$objPHPExcel = new PHPExcel();//Set properties 设置文件属性$objPHPExcel->getProperties
IBM Webshpere MQ Client User Issue (MCAUSER) darrenzhu IBM jms user MQ MCAUSER
IBM MQ JMS Client去连接远端MQ Server的时候，需要提供User和Password吗？答案是根据情况而定，取决于所定义的Channel里面的属性Message channel agent user identifier (MCAUSER)的设置。 http://stackoverflow.com/questions/20209429/how-mca-user-i
网线的接法 dcj3sjt126com
一、PC连HUB (直连线)A端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。 B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。二、PC连PC （交叉线）A端：(568A)：白绿，绿，白橙，蓝，白蓝，橙，白棕，棕； B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。三、HUB连HUB&nb
Vimium插件让键盘党像操作Vim一样操作Chrome dcj3sjt126com chrome vim
什么是键盘党？键盘党是指尽可能将所有电脑操作用键盘来完成，而不去动鼠标的人。鼠标应该说是新手们的最爱，很直观，指哪点哪，很听话！不过常常使用电脑的人，如果一直使用鼠标的话，手会发酸，因为操作鼠标的时候，手臂不是在一个自然的状态，臂肌会处于绷紧状态。而使用键盘则双手是放松状态，只有手指在动。而且尽量少的从鼠标移动到键盘来回操作，也省不少事。在chrome里安装 vimium 插件
MongoDB查询（2）——数组查询[六] eksliang mongodb MongoDB查询数组
MongoDB查询数组转载请出自出处：http://eksliang.iteye.com/blog/2177292 一、概述 MongoDB查询数组与查询标量值是一样的，例如，有一个水果列表，如下所示： > db.food.find() { "_id" : "001", "fruits" : [ "苹
cordova读写文件（1） gundumw100 JavaScript Cordova
使用cordova可以很方便的在手机sdcard中读写文件。首先需要安装cordova插件：file 命令为： cordova plugin add org.apache.cordova.file 然后就可以读写文件了，这里我先是写入一个文件，具体的JS代码为： var datas=null;//datas need write var directory=&
HTML5 FormData 进行文件jquery ajax 上传到又拍云 ileson jquery Ajax html5 FormData
html5 新东西：FormData 可以提交二进制数据。页面test.html <!DOCTYPE> <html> <head> <title> formdata file jquery ajax upload</title> </head> <body> <
swift appearanceWhenContainedIn:(version1.2 xcode6.4) 啸笑天 version
swift1.2中没有oc中对应的方法： + (instancetype)appearanceWhenContainedIn:(Class <UIAppearanceContainer>)ContainerClass, ... NS_REQUIRES_NIL_TERMINATION; 解决方法：在swift项目中新建oc类如下： #import &
java实现SMTP邮件服务器 macroli java 编程
电子邮件传递可以由多种协议来实现。目前，在Internet 网上最流行的三种电子邮件协议是SMTP、POP3 和 IMAP，下面分别简单介绍。　　◆ SMTP 协议　　简单邮件传输协议(Simple Mail Transfer Protocol,SMTP)是一个运行在TCP/IP之上的协议，用它发送和接收电子邮件。SMTP 服务器在默认端口25上监听。SMTP客户使用一组简单的、基于文本的
mongodb group by having where 查询sql qiaolevip 每天进步一点点学习永无止境 mongo 纵观千象
SELECT cust_id, SUM(price) as total FROM orders WHERE status = 'A' GROUP BY cust_id HAVING total > 250 db.orders.aggregate( [ { $match: { status: 'A' } }, { $group: {
Struts2 Pojo（六） Luob. POJO strust2
注意：附件中有完整案例 1.采用POJO对象的方法进行赋值和传值 2.web配置 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee&q
struts2步骤 wuai struts
1、添加jar包 2、在web.xml中配置过滤器 <filter> <filter-name>struts2</filter-name> <filter-class>org.apache.st