非 root 用户在 AIX 7.1 上安装和部署 MPICH2 Cluster 环境

在测试过程中，需要在多平台进行环境搭建，而这些环境中最复杂的当属 AIX7.1 的环境。在 AIX7.1 系统平台上使用 MPICH2 搭建 Cluster 环境，从而实现在 Modeler 客户端完成对大数据的分析，比如与我们生活息息相关的电信客户数据。

众所周知，在我们的日常工作中，同一台 AIX 机器往往会有很多不同身份的用户，在这些用户中，大部分都是没有 root 权限的。鉴于 MPICH2 本身是支持非 root 用户部署 Cluster 环境的，所以我们在这里介绍一下如何使用非 root 用户来配置 MPICH2 Cluster 环境。

我们将从下面的这几个部分进行介绍：

为什么要在 AIX7.1 上安装 MPICH2 Cluster 环境
如何在 AIX7.1 上安装 MPICH2 Cluster 环境
在 Modeler 中搭建 SNA Cluster 环境的特殊配置
搭建中常见的问题

AIX7.1 简介

AIX 7 是基于开放标准的 UNIX 操作系统，其设计符合 The Open Group 的单一 UNIX 规范版本。

AIX 7 还包含有新的虚拟化功能，可以简化较旧的 AIX V5.2 环境的整合。此新功能需要采购“AIX 5.2 Workload Partitions for AIX 7”产品，旨在允许管理员简便地备份运行 AIX 5.2 的现有 LPAR，并将其还原至 AIX 7 工作负载分区。

MPICH2 简介

MPICH 是 MPI (Message-Passing Interface) 标准的一种最重要的实现，而 MPI 是为统一不同的 MPI 厂家的消息传递 API 而制定的工业标准。

MPICH2 是一种高性能，并且被广泛应用的便携式实现消息传递接口的标准，支持最新的 MPI-2 接口标准，是用于并行运算的工具，在程序设计语言上支持 C/C++ 和 Fortran。

MPICH2 提供进程管理与通信的分离。默认的运行环境由一系列的守护进程组成，在应用程序启动前建立所用机器之间的通讯，因而在通信不能建立出错时提供了清晰的画面，在并行任务启动时提供一种快速可度量的启动机制。

为什么要在 AIX7.1 上安装 MPICH2 Cluster 环境

AIX7.1 系统在处理大数据方面具有一定的性能优势。AIX 7 扩展了 AIX 操作系统的功能，将 AIX 的垂直可扩展性增强为带 256 个处理器内核和 1024 个线程的分区以便处理最大型的工作负载。为了能够为大型工作负载提供更高的性能，AIX 7 还包含有新的 TB 级段支持，可以充分利用旨在提高内存性能的 POWER7 处理器的内存管理功能。此 TB 级段功能也包含在了技术级别 6 的 AIX 6 中，但不会在 AIX 6 上自动启用。

在电信行业有一个概念叫流失，流失就表示客户终止与该公司的关系，而挽留客户的成本比取代他们的成本要低得多，因此我们就需要考虑为流失建模，来识别存在流失风险的客户。分析师通常使用一系列的关键绩效指标来描述客户，包括人口统计信息和每位个人客户的最近通话模式。基于这些字段的预测模型分析出来的结果，符合过去已流失的客户通话模式的变化，用以识别可能增加流失风险的人员。对于已经被识别为存在风险的客户，电信公司需要对他们采取一些挽留措施，比如，提供额外的客户服务或服务选项等。

我们就需要使用 MPICH2 来搭建 Cluster 环境，从而实现在 Modeler 客户端对电信行业的大数据进行分析，对存在流失风险的客户进行预测分析。

图 1 是我们通过 MPICH2 搭建的 Cluster 环境的工作示意图，简单的表示了 Cluster 环境的工作原理。

图 1. Cluster 环境工作示意图

回页首

如何在 AIX7.1 上安装 MPICH2 Cluster 环境

MPICH2 Cluster 环境搭建需要同时在 Server 端和各个 Worker 端分别进行配置。下面我们将分别介绍 Server 和 Worker 的配置。

配置 Server 环境

步骤 1 安装 Java 环境

安装 MPICH2 需要 Java 环境，所以我们需要先在 AIX7.1 上安装 Java 环境，推荐安装 Java 1.6.0 以上版本。

对于 Modeler Server，我们可以直接使用 Modeler 自带的 Java，就无需进行这一步骤了。

步骤 2 设置 Java 路径环境变量

把 Java 安装路径添加到此 AIX7.1 系统的 PATH 环境变量中，命令如下：

 export Java_HOME=JavaInstallPath/jre   export PATH=$Java_HOME/bin:$PATH

也可把上面两条命令写入 /etc/profile 文件，然后执行下面的命令：

 source /etc/profile

步骤 3 安装 MPICH2

我们需要取到 MPICH2 的安装包，由于 MPI（Message Passing Interface）是一个开源的软件，可以在相关的网站下载，下载地址请参考文章最后的参考资料。我们将 MPICH2 的安装包它下载到 AIX 平台上，解压安装即可。

步骤 4 在用户根目录下创建“mpd.hosts”文件

在用户的根目录下创建 mpd.hosts 文件，用来设置 Cluster 环境中的 Server 和 Worker。命令参考如下：

 sudo vi mpd.hosts //under /home/lye

在 mpd.hosts 文件里面依次写入 Server 和 Worker 的名字或者 IP。

步骤 5 在 /etc 目录下面创建“mpd.conf”和在用户目录下创建“.mpd.conf”文件

为了实现各个服务器之间的通信，需要在各台机器上设置相同的密钥。密钥可以设置为任何内容，只要保证各个服务器之间一样即可。

 sudo vi /etc/mpd.conf

将如下内容添加进 mpd.conf 文件：

 secretword=Password

完成之后，改变 mpd.conf 文件的权限：

 chmod 644 /etc/mpd.conf

根据 MPICH2 的说明，对于非 root 用户，即使使用 sudo 命令，仍然是在模拟 root 的一种模式，所以如果想要让 MPICH2 在外部表现出和 root 用户一样的状态运行，我们需要同时创建一个不可见文件 .mpd.conf，然后对 MPD_USE_ROOT_MPD 进行设置。

创建方法如下：

 cd $HOME   touch .mpd.conf   chmod 600 .mpd.conf   MPD_USE_ROOT_MPD=1

如果是单机环境，以上步骤完成之后，使用下面的命令可以启动 MPD 程序：

 sudo mpdboot -n 1 -f /userhome/bwei/mpd.hosts

我们可以通过下面这个命令来查看 MPD 程序是否启动成功。启动 MPD 成功之后，使用下面的命令应该输出这台机器的机器名称。

 mpdtrace –l

需要注意的是：在我们配置了 Server 后就启动 MPD 程序查看是有必要的。这样如果单个 Server 可以启动了，才能有机会在搭好 Cluster 后实现全网启动成功，所谓的步步为营。如果单个 Server 都启动不成功，那我们也能在第一时间发现问题。

对于 Cluster 环境，需要在添加并配置完所有 Worker 环境只后重启 MPD 程序：

 sudo mpdboot -n x -f /userhome/bwei/mpd.hosts

（其中，x 代表所要启动的机器数目，包含 Server 和 Worker。例如一个 Cluster 环境有一个 Server，4 个 Worker，那么 x 就是 5。关于这个的具体描述，可参考步骤 10。）

步骤 6 把 Worker 的机器名和 IP 加入 /etc/hosts 文件

为了使 Worker 正常工作，我们还需要把所有 Worker 的机器名和 IP 加入 /etc/hosts 文件。方法如下：

 sudo vi /etc/hosts

需要添加的内容如下 :

 # Do not remove the following line, or various programs   # that require network functionality will fail.     9.119.82.145   XIS3TM02.spss.com       XIS3TM02      127.0.0.1       XIS3TM02.spss.com       XIS3TM02   //  localhost   9.119.82.148    XIS3TM05.spss.com       XIS3TM05  // （Worker 的 IP 和机器名）  9.119.82.147    XIS3TM04.spss.com       XIS3TM04  //（另一台 Worker 的 IP 和机器名）

其中，9.119.82.148 和 9.119.82.147 表示 Worker 的 IP 和机器名。如果要添加更多的 Worker，只需依次将要添加的 Worker 和机器名写入这个文件。

另外，127.0.0.1 对应于本机，这是默认 Server 的 IP 和机器名。打开 /etc/hosts 文件时，第一行 IP 默认的是 127.0.0.1。如果我们只需要一个 Worker 工作，那么仅仅使用 Server 来工作就可以了，不需要添加添加额外的 Worker，也不需要改变这些机器名的顺序。但是如果我们要使用很多的 Worker 一起工作，也就是使用 Cluster 环境，那么就必须把 Server 的信息放到第一行。）

需要注意的是：对于有 Worker 的设置，一定要把 Server 的 IP 和机器名挪到第一行，也就是放到 127.0.0.1 这个默认 localhost 信息的前面，否则系统就会找不到 Server 的机器名，而导致配置失败。

步骤 7 添加硬盘

由于 MPICH2 没有自己的文件系统，所以在 Cluster 之间的文件传输读取，需要用到额外的文件系统。

我们这里以 NFS 文件系统为例，在 Server 上建立一个将要共享的文件夹，例如建立名为 /sna 的文件夹，然后把设备 sdb1 挂载到这个文件夹上。方法如下：

 mount -t ext3 /dev/sdb1 /sna   sudo mkdir /sna   [root@SNA_Server ~]#cat /etc/exports

然后把 NFS 的信息写入 /etc/exports 文件：

 /sna/   *(sync,rw,no_root_squash)   [root@SNA_Server ~]#service nfs start

最后在 pmlexec 和 tabi-loader 之间建立软连接，方法如下：

 ln -s /sna/tabibin/pmlexec /usr/bin/pmlexec   ln -s /sna/tabibin/tabi-loader /usr/bin/tabi-loader

步骤 8 取消在 Server 上输入 Worker 的密码

在构建 Cluster 环境时，每次在 Server 端启动 MPD 程序，都需要输入 Worker 端的 SSH 登录密码，而且由于 MPICH2 自身的规定，在输入密码后没有任何信息提示输入成功。如果 Worker 的数目太多，就很容易造成漏输入，进而导致 MPD 启动失败。所以我们需要一种方法来避免这样的情况发生，以提高我们的配置成功率。

在这里，我们仍然以 NFS 文件系统为例，介绍一种比较简单的免除在 Server 端输入 Worker 密码的方法。

我们需要在 Server 端，运行下面这两个命令：

 ssh-keygen -t rsa   ssh-copy-id -i ~/.ssh/id_rsa.pub root@snaw5

（其中，snaw5 表示某个 Worker 的名字。这个命令需要在 Server 端对每一个 Worker 依次执行一遍。）

步骤 9 重启 MPD 程序

如果已经把 MPD 命令所在地路径加入环境变量 $PATH 中，则可以直接用下面的命令重启 MPD。否则需要在 mpdboot 前面加上 MPD 命令所在的全路径。同样的道理，如果没有加入环境变量中，使用 mpd.hosts 时，前面也需要加上它的全路径。

 mpdboot -n 3 --maxbranch=200 -f /home/sxu/mpd.hosts  （上面的 maxbranch 是指控制 Worker 的最大数目，如果不加这一项来设置 Worker 的数目，默认 maxbranch 的值是 1。）  mpdboot -n 3 -f /home/sxu/mpd.hosts

完成上面所有步骤之后，我们可以使用命令 “mpdtrace -l” 来查看是否完成了 Cluster 的环境配置。如果能看到每个 Worker 的机器名和 IP 信息，那么就表明该 Cluster 环境已经配置成功：

 mpdtrace -l   XIS3TM02_43666 (9.119.82.145)   XIS3TM05_39633 (9.119.82.148)

这样，Server 的安装配置就全部完成了，下面我们来介绍 Worker 的安装配置。

配置 Worker 环境

步骤 1 在 Worker 机器上安装 MPICH2

与 Server 上的操作相同，下载并安装 MPICH2。

步骤 2 设置 NFS 文件系统

为了能够通过 Server 控制所有的 Worker，并且分配任务给每一个 Worker，我们需要将 Server 与 Worker 上的文件共享。

在 Worker 上使用如下命令实现：

 sudo mkdir /sna   chmod 777 /sna   sudo mount 9.119.82.145:/sna /sna   //（其中 9.119.82.145 是 Server 的 IP。）

步骤 3 把 Server IP 加进每一个 Worker 的 /etc/hosts 文件里

为了让所有的 Worker 都能找到 Server，我们需要将 Server 的 IP 写入每一个 Worker 的 hosts 文件中，命令如下：

 sudo vi 9.119.82.145 /etc/hosts   //（其中 9.119.82.145 是 Server 的 IP。）

如果想添加更多的 Worker 到 Cluster 环境当中，只需重复上面的添加 Worker 步骤即可。

至此，Server 和 Worker 的安装配置就以全部完成，也就构成了真正的 MPICH2 Cluster 系统。

回页首

在 Modeler 中搭建 SNA Cluster 环境的特殊配置

Server 端的配置

步骤 1 下载并安装 SNA Server

对于 SNA 测试环境 MPICH2 的搭建，因为 SNA Server 的安装包已经集成了 MPICH2 的安装包，所以我们只需要下载 SNA Server 的安装包即可，安装 SNA Server 的同时也就实现了 MPICH2 的安装。

AIX 平台的 SNA 安装包是：sna_server_installer_AIX64.bin

用二进制方式下载这个安装包，然后用如下命令进行安装：

sudo ./sna_server_installer_AIX64.bin

安装过程比较简单，类似于 Modeler Server 的安装，在这里我们不做过多介绍。

步骤 2 给批处理文件设置环境变量

SNA 运行时会生成一些临时文件，同时，也会生成一些工作文件供下一步的计算使用。所以我们要提前分别建立好一个临时文件夹和一个工作文件夹，并且这两个文件夹要有可读可写的权限。假设临时文件夹的名字是 tmpdir，工作文件夹的名字是 workdir。

 mkdir /tmp/tmpdir   mkdir /tmp/workdir

为了能够在 SNA 运行过程中向这两个文件夹读写数据，需要把它们的路径写入 Modeler 的启动文件 modelersrv.sh 中。这样一来，只要 Modeler 启动，就可以找到这两个文件夹的位置。

SNA 还提供指令 SNA_TRACE_LEVEL 来控制 SNA 的运行日志，如果把这一项也加入到 Modeler 启动文件中，SNA 运行时就会自动在 Modeler 的 data 文件夹中生成日志，便于查阅详细的运行信息，当运行出错时也能通过日志轻易的查询具体出错的模块。

另外 SNA 还提供了 SNA_NUMBER_OF_PROCESSES 指令来指定 SNA Cluster 的工作进程数，也就是 Cluster 环境中 Server 和 Worker 的总数。例如，一个 Cluster 系统，有一个 Server 和 3 个 Worker，那么 SNA_NUMBER_OF_PROCESSES 就应该设置为 4。

我们可以通过 vi 命令来添加相关的内容：

sudo vi modelersrv.sh

（modelersrv.sh 位于 Modeler 安装路径的名为“config”的文件夹中）

下面是 modelersrv.sh 文件中添加的相关内容：

 SNA_NUMBER_OF_PROCESSES=4   SNA_TEMP_DIR=/tmp/tmpdir   SNA_WORKING_DIR=/tmp/workdir   SNA_TRACE_LEVEL=600   export SNA_NUMBER_OF_PROCESSES   export SNA_TEMP_DIR   export SNA_WORKING_DIR   export SNA_TRACE_LEVE

步骤 3 重启 Modeler Server 和 MPD 程序

完成了 Server 端的所有配置之后，我们需要重启 Modeler Server 和 MPD 程序来使这些配置生效。

在 Modeler Server 的安装目录下重启 Modeler Server，命令如下：

 ./modelersrv.sh stop   ./modelersrv.sh start  （因为 Modeler Server 在安装后会自动启动的，所以我们需要先停止 Modeler Server，再重新启动。）

查看是否启动成功，使用 list 命令：

 ./modelersrv.sh list

如果输出如下面两行，就表示启动成功：

 PID        PPID     USER      VSZ      PCPU COMMAND   31687      1        lye      244816    0.0   modelersrv_14_2

Modeler Server 重启成功之后，还需要重启 MPD，重启 MPD 的具体步骤请参考 MPICH2 Cluster 环境配置的步骤 9。

其他步骤也请参考 MPICH2 Cluster 的 Server 环境配置。

Worker 端的配置

步骤 1 下载并安装 SNA Worker

类似于下载 SNA Server，我们只需要下载 AIX 平台的 SNA Worker 安装包即可，安装包是：

sna_worker_installer_AIX64.bin

用二进制方式下载这个安装包，然后用如下命令进行安装：

sudo ./ sna_worker_installer_AIX64.bin

步骤 2 重启 SNA Server

如果中途添加了 Worker，需要在加完 Worker 并且配置完之后，重启 SNA Server。

其他步骤请参考 MPICH2 Cluster 的 Worker 环境配置。

搭建中常见的问题

这里，我们再简单介绍一下使用 MPICH2 搭建 Cluster 环境的过程中常见的一些问题。

Python 问题导致 MPD 程序启动失败

对于多数 AIX7.1 机器，如果没有配置 Python 库信息，直接启动 MPD 程序会失败。

所以一旦出现 MPD 程序启动失败的情况，我们首先需要检查该机器上是否安装 Python，如果没有安装，需要先下载并安装 Python。对于应用于 SNA 的 Python 的安装版本要在 2.7.1 以上。

采用下面的命令来检查是否安装 Python：

 which python   unmame –a

如果显示已经安装了 Python，则需要进行如下的配置：

rmp -i *.rmp  /userhome/Python/2.7.1/aix7/bin  find -name python

例如，Python2.7.1 安装到这个目录下 /userhome/Python/2.7.1/aix7，我们需要建立如下的软连接来配置 Python 库信息：

 sudo ln -s /userhome/Python/2.7.1/aix7/lib/libpython2.7.so /lib/libpython2.7.so

这样 Python 库信息就已经配置成功了。

空间不足导致程序崩溃

程序崩溃有可能是因为 AIX7.1 机器上遗留的空间不够。

在 AIX7.1 平台，安装配置完 Cluster 环境后，运行极小的数据，比如数据文件只有几百 kb 的情况下，可以运行成功，而运行较大数据则有可能会出现程序崩溃。跟踪日志后发现系统默认的栈大小是有限制的，我们可以使用 ulimit 命令打开所有对栈的空间限制。

 $ulimit – a   time(seconds)        unlimited   file(blocks)         unlimited   data(kbytes)         unlimited   stack(kbytes)        4194304   memory(kbytes)       unlimited   coredump(blocks)     unlimited   nofiles(descriptors) unlimited   threads(per process) unlimited   processes(per user)  unlimited

如果遇到这样的情况，请使用下面的命令来释放空间：

 ulimit -s 4194304

库文件未加载失败导致程序崩溃

如果程序执行时报 libstdc++.so.6 错误，可能是不能加载 libstdc++.a(libstdc++.so.6) 库，此时我们需要把 libstdc++.so.6 所在的文件夹路径加到环境变量 LIBPATH 里面。

命令如下：

 export LIBPATH=$LIBPATH:/qatest/ModelerServer/15.0.0.37/bin  （其中，qatest/ModelerServer/15.0.0.37 是 Modeler Server 的安装路径。）

性能问题导致的程序崩溃

在 Modeler 里面，如果同时建立了多个 Stream，并且让这些 Stream 顺次跑下去，那么有可能会出现如下的错误：

 mpiexec 392): no msg recvd from mpd when expecting ack of request

这个错误是 MPICH2 报出的，因为当前的环境设置不能满足其性能的需求，需要对环境变量的设置进行改变，我们需要改动 MPIEXEC_RECV_TIMEOUT 的设置，它的默认值是 20，我们可以适当的改大，有如下的两种方法：

使用 vi 命令把 MPIEXEC_RECV_TIMEOUT=200 加入 mpd.conf 文件中，然后重启 MPICH2。
在环境里面添加 MPIEXEC_RECV_TIMEOUT：

export MPIEXEC_RECV_TIMEOUT=200

然后重启 Modeler Server 和 MPICH2。需要注意的是，这个方法只对当前打开的窗口有效。

总结

Modeler 产品中的 SNA 在 Cluster 环境中对处理电信行业的大数据有着非常强大的优势。有了这个 Modeler 结点，电信公司可以发现对于哪些用户是潜在的可能用户，哪些用户是高风险流失用户，从而制定出相应对策，以最小的损失保留最大利益。

这篇文章主要就是介绍了我们如何使用非 root 用户在 AIX7.1 系统里搭建 MPICH2 Cluster 环境，以及搭建 SNA Cluster 环境所需要做的一些特殊配置。同时对环境搭建中我们已经遇到并解决的问题做了总结，希望能够帮助到需要使用 MPICH2 Cluster 环境和需要使用 SNA 进行建模做大数据分析的读者。

你可能感兴趣的:(cluster)

Redis 集群架构妖怪兮诺‍ 数据库 redis 架构数据库
Redis集群是什么Redis集群是一种通过将多个Redis节点连接在一起以实现高可用性、数据分片和负载均衡的技术。它允许Redis在不同节点上同时提供服务，提高整体性能和可靠性。根据搭建的方式和集群的特点，Redis集群主要有三种模式：主从复制模式（Master-Slave）、哨兵模式（Sentinel）和Cluster模式Redis集群的作用和优势高可用性负载均衡容灾恢复数据分片易于拓展Mas
高可用系统：让服务永不中断的秘密爱吃青菜的大力水手 linux 运维服务器
高可用系统：让服务永不中断的秘密在数字化时代，系统的高可用性（HighAvailability,HA）至关重要。无论是电商平台还是金融服务，系统宕机都可能带来巨大损失。那么，什么是高可用系统？它又是如何实现的呢？本文将为您揭开高可用系统的神秘面纱，带您了解集群、节点、脑裂等核心概念，并推荐最经济实用的集群架构。什么是集群与节点？集群（Cluster）集群是一组协同工作的服务器，共同完成任务。它们就
Mysql回表查询：深入解析与实战应用需要重新演唱 mysql mysql 数据库
Mysql回表查询：深入解析与实战应用今天，我们将深入探讨Mysql中的回表查询。回表查询是Mysql索引机制中的一个重要概念，理解它的工作原理和优化方法，对于提升数据库查询性能至关重要。让我们一起揭开回表查询的神秘面纱。1.什么是回表查询？回表查询（LookupQuery）是指在使用非聚集索引（Non-ClusteredIndex）进行查询时，如果需要获取的数据不在索引页中，就需要根据索引页中的
高斯混合模型（Gaussian Mixture Model, GMM）不想秃头的程序神经网络语音识别人工智能深度学习网络
高斯混合模型（GaussianMixtureModel,GMM）是一种概率模型，用于表示数据点由多个高斯分布（GaussianDistribution）混合生成的过程。它广泛应用于聚类分析、密度估计、图像分割、语音识别等领域，尤其适合处理非球形簇或多模态数据。以下是GMM的详细介绍：一、核心思想GMM假设数据是由多个高斯分布混合生成的，每个高斯分布代表一个簇（Cluster），并引入隐变量（Lat
docker启动的rabbitmq搭建并集群和高可用黑皮爱学习 mq docker rabbitmq ruby
Docker搭建RabbitMQ集群步骤以下是使用Docker快速搭建RabbitMQ集群的详细步骤，包含配置文件、网络设置和集群组建过程。1.创建自定义网络首先创建一个Docker网络，使容器间可以通过名称互相访问：dockernetworkcreaterabbitmq-cluster2.准备配置文件创建一个配置目录（例如~/rabbitmq-config），并在其中创建以下文件：rabbitm
MySQL索引分类有哪些？ java1234_小锋 mysql mysql
大家好，我是锋哥。今天分享关于【MySQL索引分类有哪些？】面试题。希望对大家有帮助；MySQL索引分类有哪些？超硬核AI学习资料，现在永久免费了！MySQL中的索引可以根据不同的分类标准分为以下几种类型：1.根据存储方式分类聚集索引（ClusteredIndex）：表中的数据行会按照索引顺序存储，即数据的物理顺序和索引顺序一致。每个表最多只能有一个聚集索引。在InnoDB存储引擎中，主键就是聚集
《Redis高并发架构设计：从单机到Cluster的最佳实践》猕员桃 bootstrap 前端 html
Redis高并发架构设计：从单机到Cluster的最佳实践在互联网应用快速发展的当下，高并发场景日益普遍，数据的高效存储与读取成为系统性能的关键。Redis作为高性能的内存数据库，其架构设计对系统的可用性、扩展性和性能有着决定性影响。从单机模式到RedisCluster，不同的部署模型适用于不同阶段与需求。本文将系统地介绍Redis基础部署模型，深入剖析Cluster架构核心原理，探讨典型架构痛点
详解Redission分布式锁脑裂问题码上库利南 redis 分布式
Redisson在RedisCluster模式下实现的分布式锁（基于RedLock思想），理论上仍然存在脑裂（NetworkPartition）导致锁失效的风险。这是由其依赖的“多数派”（Quorum）机制和分布式系统的不可能三角（CAP）决定的。一、脑裂发生的核心场景：假设一个拥有5个主节点(A,B,C,D,E)的RedisCluster：网络分区发生：集群被分裂成两个独立且无法通信的子集：分区
Kafka 核心术语详解 showyoui Kafka kafka 分布式
文章目录1.集群架构层Cluster（集群）Broker（代理服务器）2.存储架构层Topic（主题）Partition（分区）Message（消息）3.副本机制Leader/FollowerISR(In-SyncReplicas)副本加入ISR的条件副本被移出ISR的条件Leader选举机制ISR维护机制4.客户端Producer（生产者）Consumer（消费者）ConsumerGroup（消
order、sort、distribute和cluster by（Spark/Hive）有数的编程笔记 Spark/Hive spark hive 大数据
1.abstractORDERBY：完整查询结果的全局行排序。与SORTBY、CLUSTERBY、DISTRIBUTEBY互斥，不能同时使用。示例SELECT*FROMtable_nameORDERBYcolumn_name;SORTBY：只在每个分区内排序，局部排序结果不是全局有序。与ORDERBY、CLUSTERBY互斥，不能同时指定。示例SELECT*FROMtable_nameSORTBY
mysql innodb和ndb的区别_InnoDB和NDB，MySQL群集和InnoDB群集之间有什么区别？ addytan mysql innodb和ndb的区别
像任何不断发展的成熟技术一样，MySQL积累了自己的术语。某些术语有时会引起混淆，尤其是当两个术语相似但实际上是指两个完全不同的事物时。对于两个存储引擎InnoDB和NDB(读音听起来很相似)，以及两个“群集”技术：InnoDBCluster和MySQLCluster尤其如此。让我们看看是否可以消除这种混乱。InnoDB是一种存储引擎-数据库用来读取，写入，更新和删除数据以及执行其他基本操作的软件
mysql引擎innodb与ndb比较_mysql存储引擎memory，ndb，innodb之选择甜品专家
mysql的innodb和cluster的NDB引擎都支持事务，在有共同的特性外，也有不同之处：以mysqlclusterNDB7.3和MySQL5.6之InnoDB为例：ndb7.3基于mysql5.6，包括支持innodb1.1，因此可以在cluster里使用innodb表，但这些表不是集群的。MySQLClusterNDB存储引擎用分布式,shared-nothing的架构实现，这使其和in
InnoDB Cluster 与 NDB Cluster 对比及部署指南中国lanwp mysql
InnoDBCluster与NDBCluster对比及部署指南一、核心区别对比特性InnoDBClusterNDBCluster存储引擎InnoDBNDB(内存优先)架构设计基于GroupReplication分布式架构(数据节点+管理节点+SQL节点)一致性模型最终一致性/强一致性强一致性数据持久化磁盘存储为主内存存储为主，定期快照适用场景通用OLTP高吞吐实时处理扩展性垂直扩展为主水平线性扩展
mysql innodb cluster集群部署教程火烧风 mysql adb 数据库
shell相关视频讲解：Linuxshell脚本编程入门详细讲解MySQLInnoDBCluster集群部署教程整体流程下面是部署MySQLInnoDBCluster集群的整个流程：步骤描述1.安装MySQLShell安装MySQLShell是连接MySQL数据库的客户端工具，可以用于执行各种管理任务。2.创建InnoDBCluster使用MySQLShell创建InnoDBCluster，将多个
MySQL 复制（Replication）、组复制（MGR）、InnoDB ReplicaSet、InnoDB Cluster与NDB Cluster的区别与联系 HD243608836 HA mysql tomcat mysql 高可用 cluster innodb 组复制
复制（Replication）是本文中所有MySQL技术的基础。包括：异步复制、半同步复制，增强半同步复制。InnoDB副本集（MySQLInnoDBReplicaSet）无缝衔接其他MySQL官方提供的应用程序（MySQLShell、MySQLRouter），提供了另一种易于使用的编程方式来处理复制，属于复制（Replication）的简易增强版。组复制（MySQLGroupReplicatio
【Kubernetes】CKA Simulator Kubernetes 1.31 陈陈CHENCHEN Kubernetes kubernetes 容器
最近为了准备CKA认证，整理了模拟题，期望能帮助到需要的小伙伴们！Question1|ContextsYouhaveaccesstomultipleclustersfromyourmainterminalthroughkubectlcontexts.Writeallthosecontextnamesinto/opt/course/1/contexts.Nextwriteacommandtodisp
MySQL 事务实现机制详解亲爱的非洲野猪 mysql 数据库
MySQL事务实现机制详解MySQL通过多种技术协同工作来实现事务的ACID特性（原子性、一致性、隔离性和持久性），以下是其核心实现机制：一、事务基础架构1.事务支持引擎InnoDB：MySQL默认支持事务的存储引擎NDBCluster：集群环境的事务支持其他引擎：如MyISAM不支持事务2.事务基本操作STARTTRANSACTION;--或BEGIN--执行SQL语句INSERTINTOacc
Redis面试题三（集群） os-lee go高级 redis 数据库缓存
目录1.Redis集群搭建有几种模式2.Redis主从复制的实现全量同步增量同步3.Redis的主从同步策略1.全量同步（FullResynchronization）2.增量同步（IncrementalReplication）4.Redis一致性hash基本原理节点动态管理虚拟节点客户端支持总结5.Cluster模式的原理6.Cluster的分片机制7.客户端如何路由8.Redis为什么是1638
十、HQL：排序、联合与 CTE 高级查询 IvanCodes Hive教程 hive 大数据
作者：IvanCodes日期：2025年5月15日专栏：Hive教程ApacheHive作为大数据领域主流的数据仓库解决方案，其查询语言HQL(HiveQueryLanguage)是数据分析师和工程师日常工作的核心。除了基础的SELECT-FROM-WHERE，HQL还提供了强大的排序、数据合并以及组织复杂查询的机制。本文将深入探讨HQL中的排序操作(SORTBY,ORDERBY,CLUSTERB
redis构建集群时出现[ERR] Node 127.0.0.1:7000 is not empty. Either the node already knows other nodes (check qqqweiweiqq redis redis 数据库 linux
直接把rm/opt/homebrew/var/db/redis/nodes-7003.conf7001.conf7002.conf7004.conf直接删除了还要删除这个rm./opt/homebrew/var/db/redis/dump.rdb但是删除之后还是报错了（可能是每删除干净）redis-cli--clustercreate127.0.0.1:7000127.0.0.1:7001127.
redis的部署方式详解 p-knowledge redis 数据库缓存
Redis是一个高性能的键值存储系统，广泛应用于缓存、消息队列、实时分析等场景。为了满足不同的业务需求，Redis提供了多种部署架构，包括主从（Master-Slave）、哨兵（Sentinel）和集群（Cluster）。以下是对这三种部署架构的原理、优缺点的详解。1.主从（Master-Slave）部署原理主从架构是Redis最基础的高可用性解决方案。该架构包括一个主节点（Master）和一个或
Task01. 时序数据与 PyPOTS 介绍三分梦~ python 机器学习时序数据库数据挖掘
Task01.时序数据与PyPOTS介绍Task01.时序数据与PyPOTS介绍1.时间序列数据介绍️举例：与i.i.d数据的区别示例：1.1时间序列数据的类型1.2常见时间序列数据示例1.3时间序列研究与应用方向主要任务：1.预测（Forecasting）2.分类（Classification）3.聚类（Clustering）4.异常检测（AnomalyDetection）5.时间序列生成（Ge
python scipy简介凤枭香 Python 图像处理 python scipy 开发语言图像处理
scipyscipy是一个python开源的数学计算库，可以应用于数学、科学以及工程领域，它是基于numpy的科学计算库。主要包含了统计学、最优化、线性代数、积分、傅里叶变换、信号处理和图像处理以及常微分方程的求解以及其他科学工程中所用到的计算。scipy模块介绍scipy主要通过下面这些包来实现数学算法和科学计算，后面对于scipy的讲解主要也是基于这些包来实现的cluster：包含聚类算法co
探秘kube-deploy：一键部署Kubernetes的社区宝典韦元歌Fedora
探秘kube-deploy：一键部署Kubernetes的社区宝典kube-deploy[EOL]Aplaceforclusterdeploymentautomation项目地址:https://gitcode.com/gh_mirrors/ku/kube-deploy在浩瀚的云原生世界中，kube-deploy犹如一位技艺高超的导航者，引领我们轻松穿越复杂的Kubernetes部署迷宫。它不仅是
redis cluster是AP还是CP 竹画雨 redis 数据库缓存
理解RedisCluster是AP还是CP在分布式系统中，我们常常面临CAP理论的挑战。CAP理论指出，在分布式系统中，无法同时满足一致性（Consistency）、可用性（Availability）和分区容错性（PartitionTolerance）这三者。在选择RedisCluster时，了解它的特性非常重要。RedisCluster设计上的目标是提供高可用性和分区容错性，因此在CAP理论中它
Eureka、Nacos、Zookeeper、Redis等应用是AP还是CP？全球潮人 eureka zookeeper redis
理解CAP是什么？CConsistency一致性有集群cluster，如果有客户端对cluster进行了写操作，改变了cluster中的数据，则后面的客户端请求再次访问请求时，cluster返回给客户端的是最新的数据。也可以理解为cluster中，每个节点都保存了一份数据副本，当有客户端对集群进行了写操作，或者因为其他原因，集群的状态改变了，这些写操作或者状态的改变，必须同步到cluster中的每
【K8S】详解NodePort 和 ClusterIP 量化投资和人工智能 kubernetes 人工智能开发语言 go kubernetes docker 云原生
NodePort和ClusterIP是Kubernetes中两种核心服务（Service）类型，它们在访问范围、实现机制和使用场景上有显著区别，但也存在紧密联系。以下是详细对比分析：一、核心区别特性ClusterIPNodePort访问范围仅限集群内部访问（通过虚拟IP）支持集群外部访问（通过节点IP+端口）暴露方式分配虚拟IP（ClusterIP），无节点端口暴露在每个节点开放固定端口（默认30
Datawhale组队学习 - 202505 - PyPOTS - Task01时序数据与PyPOTS 来两个炸鸡腿学习 python 人工智能
系列文章目录Task01-时序数据与PyPOTS文章目录系列文章目录前言1时间序列数据1.1时间序列数据的类型1.2时间序列数据示例1.3时间序列的研究与应用方向1.3.1预测Forecasting1.3.2分类Classification1.3.3聚类Clustering1.3.4异常监测AnomalyDetection1.3.5时间序列生成Generation1.3.6插补Imputation
kubesphere 单节点启动 etcd 报错 gs80140 各种问题 etcd kubesphere k8s
kubekey安装./kkcreatecluster-fconfig-sample.yaml--with-local-storage时报错etcdhealthcheckfailed:Failedtoexeccommand:sudo-E/bin/bash-c"exportETCDCTL_API=2;exportETCDCTL_CERT_FILE='/etc/ssl/etcd/ssl/admin-no
MySQL 8.0 OCP 英文题库解析（二十）进击的CJR mysql 开闭原则数据库
Oracle为庆祝MySQL30周年，截止到2025.07.31之前。所有人均可以免费考取原价245美元的MySQLOCP认证。从今天开始，将英文题库免费公布出来，并进行解析，帮助大家在一个月之内轻松通过OCP认证。本期公布试题181~190试题181:Choosethebestanswer.YouhaveconfiguredaworkingMySQLInnoDBClusterinsingle-p
HttpClient 4.3与4.3版本以下版本比较 spjich java httpclient
网上利用java发送http请求的代码很多，一搜一大把，有的利用的是java.net.*下的HttpURLConnection，有的用httpclient，而且发送的代码也分门别类。今天我们主要来说的是利用httpclient发送请求。 httpclient又可分为 httpclient3.x httpclient4.x到httpclient4.3以下 httpclient4.3
Essential Studio Enterprise Edition 2015 v1新功能体验 Axiba .net
概述：Essential Studio已全线升级至2015 v1版本了！新版本为JavaScript和ASP.NET MVC添加了新的文件资源管理器控件，还有其他一些控件功能升级，精彩不容错过，让我们一起来看看吧！ syncfusion公司是世界领先的Windows开发组件提供商，该公司正式对外发布Essential Studio Enterprise Edition 2015 v1版本。新版本
[宇宙与天文]微波背景辐射值与地球温度 comsci 背景
宇宙这个庞大,无边无际的空间是否存在某种确定的,变化的温度呢? 如果宇宙微波背景辐射值是表示宇宙空间温度的参数之一,那么测量这些数值,并观测周围的恒星能量输出值,我们是否获得地球的长期气候变化的情况呢? &nbs
lvs-server 男人50 server
#!/bin/bash # # LVS script for VS/DR # #./etc/rc.d/init.d/functions # VIP=10.10.6.252 RIP1=10.10.6.101 RIP2=10.10.6.13 PORT=80 case $1 in start) /sbin/ifconfig eth2:0 $VIP broadca
java的WebCollector爬虫框架 oloz 爬虫
WebCollector主页： https://github.com/CrawlScript/WebCollector 下载：webcollector-版本号-bin.zip将解压后文件夹中的所有jar包添加到工程既可。接下来看demo package org.spider.myspider; import cn.edu.hfut.dmic.webcollector.cra
jQuery append 与 after 的区别小猪猪08
1、after函数定义和用法： after() 方法在被选元素后插入指定的内容。语法： $(selector).after(content) 实例： <html> <head> <script type="text/javascript" src="/jquery/jquery.js"></scr
mysql知识充电香水浓 mysql
索引索引是在存储引擎中实现的，因此每种存储引擎的索引都不一定完全相同，并且每种存储引擎也不一定支持所有索引类型。根据存储引擎定义每个表的最大索引数和最大索引长度。所有存储引擎支持每个表至少16个索引，总索引长度至少为256字节。大多数存储引擎有更高的限制。MYSQL中索引的存储类型有两种：BTREE和HASH，具体和表的存储引擎相关； MYISAM和InnoDB存储引擎
我的架构经验系列文章索引 agevs 架构
下面是一些个人架构上的总结，本来想只在公司内部进行共享的，因此内容写的口语化一点，也没什么图示，所有内容没有查任何资料是脑子里面的东西吐出来的因此可能会不准确不全，希望抛砖引玉，大家互相讨论。要注意，我这些文章是一个总体的架构经验不针对具体的语言和平台，因此也不一定是适用所有的语言和平台的。（内容是前几天写的，现附上索引）前端架构 http://www.
Android so lib库远程http下载和动态注册 aijuans andorid
一、背景在开发Android应用程序的实现，有时候需要引入第三方so lib库，但第三方so库比较大，例如开源第三方播放组件ffmpeg库, 如果直接打包的apk包里面, 整个应用程序会大很多.经过查阅资料和实验，发现通过远程下载so文件，然后再动态注册so文件时可行的。主要需要解决下载so文件存放位置以及文件读写权限问题。二、主要
linux中svn配置出错 conf/svnserve.conf:12: Option expected 解决方法 baalwolf option
在客户端访问subversion版本库时出现这个错误： svnserve.conf:12: Option expected 为什么会出现这个错误呢，就是因为subversion读取配置文件svnserve.conf时，无法识别有前置空格的配置文件，如### This file controls the configuration of the svnserve daemon, if you##
MongoDB的连接池和连接管理 BigCat2013 mongodb
在关系型数据库中，我们总是需要关闭使用的数据库连接，不然大量的创建连接会导致资源的浪费甚至于数据库宕机。这篇文章主要想解释一下mongoDB的连接池以及连接管理机制，如果正对此有疑惑的朋友可以看一下。通常我们习惯于new 一个connection并且通常在finally语句中调用connection的close()方法将其关闭。正巧，mongoDB中当我们new一个Mongo的时候，会发现它也
AngularJS使用Socket.IO bijian1013 JavaScript AngularJS Socket.IO
目前，web应用普遍被要求是实时web应用，即服务端的数据更新之后，应用能立即更新。以前使用的技术（例如polling）存在一些局限性，而且有时我们需要在客户端打开一个socket，然后进行通信。 Socket.IO(http://socket.io/)是一个非常优秀的库，它可以帮你实
[Maven学习笔记四]Maven依赖特性 bit1129 maven
三个模块为了说明问题，以用户登陆小web应用为例。通常一个web应用分为三个模块，模型和数据持久化层user-core, 业务逻辑层user-service以及web展现层user-web， user-service依赖于user-core user-web依赖于user-core和user-service 依赖作用范围 Maven的dependency定义
【Akka一】Akka入门 bit1129 akka
什么是Akka Message-Driven Runtime is the Foundation to Reactive Applications In Akka, your business logic is driven through message-based communication patterns that are independent of physical locatio
zabbix_api之perl语言写法 ronin47 zabbix_api之perl
zabbix_api网上比较多的写法是python或curl。上次我用java－－http://bossr.iteye.com/blog/2195679，这次用perl。for example: #!/usr/bin/perl use 5.010 ; use strict ; use warnings ; use JSON :: RPC :: Client ; use
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ brotherlamp linux运维工程师 linux运维工程师教程 linux运维工程师视频 linux运维工程师资料 linux运维工程师自学
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ ----------------------------------------------------- 兄弟连Linux运维工程师课堂实录-计算机基础-1-课程体系介绍1 链接：http://pan.baidu.com/s/1i3GQtGL 密码：bl65 兄弟连Lin
bitmap求哈密顿距离-给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y( bylijinnan java
import java.util.Random; /** * 题目： * 给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y(y1,y2,y3,y4,y5)， * 使得他们的哈密顿距离（d=|x1-y1| + |x2-y2| + |x3-y3| + |x4-y4| + |x5-y5|）最大
map的三种遍历方法 chicony map
package com.test; import java.util.Collection; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Set; public class TestMap { public static v
Linux安装mysql的一些坑 chenchao051 linux
1、mysql不建议在root用户下运行 2、出现服务启动不了，111错误，注意要用chown来赋予权限，我在root用户下装的mysql，我就把usr/share/mysql/mysql.server复制到/etc/init.d/mysqld, (同时把my-huge.cnf复制/etc/my.cnf) chown -R cc /etc/init.d/mysql
Sublime Text 3 配置 daizj 配置 Sublime Text
Sublime Text 3 配置解释(默认){// 设置主题文件“color_scheme”: “Packages/Color Scheme – Default/Monokai.tmTheme”,// 设置字体和大小“font_face”: “Consolas”,“font_size”: 12,// 字体选项：no_bold不显示粗体字，no_italic不显示斜体字，no_antialias和
MySQL server has gone away 问题的解决方法 dcj3sjt126com SQL Server
MySQL server has gone away 问题解决方法，需要的朋友可以参考下。应用程序（比如PHP）长时间的执行批量的MYSQL语句。执行一个SQL，但SQL语句过大或者语句中含有BLOB或者longblob字段。比如，图片数据的处理。都容易引起MySQL server has gone away。今天遇到类似的情景，MySQL只是冷冷的说：MySQL server h
javascript/dom:固定居中效果 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&
使用 Spring 2.5 注释驱动的 IoC 功能 e200702084 spring bean 配置管理 IOC Office
使用 Spring 2.5 注释驱动的 IoC 功能 developerWorks 文档选项将打印机的版面设置成横向打印模式打印本页将此页作为电子邮件发送将此页作为电子邮件发送级别：初级陈雄华 ([email protected]), 技术总监, 宝宝淘网络科技有限公司 2008 年 2 月 28 日 &nb
MongoDB常用操作命令 geeksun mongodb
1. 基本操作 db.AddUser(username,password) 添加用户 db.auth(usrename,password) 设置数据库连接验证 db.cloneDataBase(fromhost)
php写守护进程（Daemon） hongtoushizi PHP
转载自： http://blog.csdn.net/tengzhaorong/article/details/9764655 守护进程（Daemon）是运行在后台的一种特殊进程。它独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。守护进程是一种很有用的进程。php也可以实现守护进程的功能。 1、基本概念 &nbs
spring整合mybatis,关于注入Dao对象出错问题 jonsvien DAO spring bean mybatis prototype
今天在公司测试功能时发现一问题：先进行代码说明： 1，controller配置了Scope="prototype"（表明每一次请求都是原子型） @resource/@autowired service对象都可以（两种注解都可以）。 2，service 配置了Scope="prototype"（表明每一次请求都是原子型）
对象关系行为模式之标识映射 home198979 PHP 架构企业应用对象关系标识映射
HELLO!架构一、概念 identity Map:通过在映射中保存每个已经加载的对象，确保每个对象只加载一次，当要访问对象的时候，通过映射来查找它们。其实在数据源架构模式之数据映射器代码中有提及到标识映射，Mapper类的getFromMap方法就是实现标识映射的实现。二、为什么要使用标识映射？在数据源架构模式之数据映射器中 //c
Linux下hosts文件详解 pda158 linux
　1、主机名：　　无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。　　公网：IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。　　局域网：每台机器都有一个主机名，用于主机与主机之间的便于区分，就可以为每台机器设置主机
nginx配置文件粗解 spjich java nginx
#运行用户#user nobody;#启动进程,通常设置成和cpu的数量相等worker_processes 2;#全局错误日志及PID文件#error_log logs/error.log;#error_log logs/error.log notice;#error_log logs/error.log inf
数学函数 w54653520 java
public class S { // 传入两个整数，进行比较，返回两个数中的最大值的方法。 public int get( int num1, int nu