潇锋

Moosefs分布式存储

Moosefs分布式存储

第一部分：原理讲解

首先，我们熟悉的百度网盘就是分布式文件系统的一个例子，百度用来做存储的。

MFS 特性：

1. Free(GPL )

2. 通用文件系统，不需要修改上层应用就可以使用

3. 可以在线扩容，体系架构可伸缩性极强。

4. 部署简单。

5. 高可用，可设置任意的文件冗余程度（提供比 raid1+0 更高的冗余级别，而绝对不会影响读或写的性能，只会加速！）

6. 可回收在指定时间内删除的文件（回收站提供的是系统级别的服务，不怕误操作了，提供类似 oralce 的闪回等高级 dbms 的即时回滚特性！）

7. 提供 netapp，emc，ibm 等商业存储的 snapshot 特性。（可以对整个文件甚至在正在写入的文件创建文件的快照）

8. google filesystem 的一个 c 实现。

9. 提供 web gui 监控接口。

10. 提高随机读或写的效率。 11. 提高海量小文件的读写效率。

可能的瓶颈：

1. master 本身的性能瓶颈。mfs系统 master 存在单点故障如何解决？moosefs+drbd+heartbeat 来保证 master 单点问题？不过在使用过程中不可能完全不关机和间歇性的网络中断！

2. 体系架构存储文件总数的可遇见的上限。(mfs 把文件系统的结构缓存到 master 的内存中，文件越多，master 的内存消耗越大，8g 对应 2500w 的文件数，2 亿文件就得 64GB 内存 )。

master 服务器 CPU 负载取决于操作的次数，内存的使用取决于文件和文件夹的个数。

MFS 文件系统结构:包含 4 种角色:

管理服务器 managing server (master)，这里不是存贮数据的地方，但是这里包含着存储的数据的权限，大小，分别存放在那些服务器上等信息.

元数据日志服务器MetaloggerserverMetalogger）

数据存储服务器 data servers chunkservers)

客户机挂载使用 client computers

各种角色作用:

1. 管理服务器：负责各个数据存储服务器的管理,文件读写调度,文件空间回收以及恢复.多节点拷贝。

2. 元数据日志服务器：负责备份 master 服务器的变化日志文件，文件类型为

changelog_ml.*.mfs，以便于在 master server 出问题的时候接替其进行工作。

3. 数据存储服务器：负责连接管理服务器,听从管理服务器调度,提供存储空间，并为客户提供数据传输。

4. 客户端：通过 fuse 内核接口挂接远程管理服务器上所管理的数据存储服务器,看起来共享的文件系统和本地 unix 文件系统使用一样的效果。

5. MFS 读写原理：

第二部分：MFS 部署：

主机环境：RHEL6.0

selinux and iptables disabled

Master:192.168.0.66

Metalogger: 192.168.0.77

Chunkserver: 192.168.0.1 192.168.0.2

Client: 192.168.0.3

^{软件下载：} www . moosefs . org

生成 rpm，便于部署：

# yum install gcc make rpm-build fuse-devel zlib-devel –y

# rpmbuild -tb mfs-1.6.26.tar.gz

# ls ~/rpmbuild/RPMS/x86_64

mfs-cgi-1.6.26-1.x86_64.rpm

mfs-master-1.6.26-1.x86_64.rpm

mfs-chunkserver-1.6.26-1.x86_64.rpm

mfs-metalogger-1.6.26-.x86_64.rpm mfs-client-1.6.26-1.x86_64.rpm

主控服务器 Master server 安装:

# yum localinstall -y mfs-master-1.6.26-1.x86_64.rpm mfs-cgi-1.6.26-1.x86_64.rpm

# cd /etc

# cp mfsmaster.cfg.dist mfsmaster.cfg

此文件中凡是用#注释掉的变量均使用其默认值，基本不需要就可以工作：

#WORKING_USER 和 WORKING_GROUP：是运行 master server 的用户和组；

#SYSLOG_IDENT：是 master server 在 syslog 中的标识；

#LOCK_MEMORY：是否执行 mlockall()以避免 mfsmaster 进程溢出（默认为 0）； #NICE_LEVE：运行的优先级(如果可以默认是 -19; 注意: 进程必须是用 root 启动)；

#EXPORTS_FILENAME：被挂接目录及其权限控制文件的存放位置

#TOPOLOGY_FILENAME : 定义 MFS 网络拓扑结构的文件位置

#DATA_PATH：数据存放路径，此目录下大致有三类文件，changelog，sessions 和 stats；

#BACK_LOGS：metadata的改变 log 文件数目(默认是 50) ;

#BACK_META_KEEP_PREVIOUS：保存以前 mfs元数据的文件数，默认值是 1；

#REPLICATIONS_DELAY_INIT：延迟复制的时间（默认是 300s）;

#REPLICATIONS_DELAY_DISCONNECT：chunkserver 断开的复制延迟（默认是 3600）；

# MATOML_LISTEN_HOST：metalogger 监听的 IP 地址(默认是*，代表任何 IP)；

# MATOML_LISTEN_PORT：metalogger 监听的端口地址(默认是 9419)；

# MATOCS_LISTEN_HOST：用于 chunkserver 连接的 IP 地址（默认是*，代表任何 IP）；

# MATOCS_LISTEN_PORT：用于 chunkserver 连接的端口地址（默认是 9420）；

# MATOCU_LISTEN_HOST/MATOCL_LISTEN_HOST：用于客户端挂接连接的 IP 地址(默认是*，代表任何 IP)；

# MATOCU_LISTEN_PORT/MATOCL_LISTEN_PORT：用于客户端挂接连接的端口地址（默认是 9421）；

#CHUNKS_LOOP_CPS：chunks 的回环每秒检查的块最大值，默认 100000；

# CHUNKS_LOOP_TIME ：chunks 的回环频率（默认是：300 秒）；

# CHUNKS_SOFT_DEL_LIMIT :一个 chunkserver 中可以删除 chunks 的最大数，软限 (默认：

10)

#CHUNKS_HARD_DEL_LIMIT：一个 chunkserver 中可以删除 chunks 的最大数，硬限 (默认：

25)

# REPLICATIONS_DELAY_DISCONNECT：chunkserver 断开后的复制延时（默认：3600 秒）

# CHUNKS_WRITE_REP_LIMIT：在一个循环里复制到一个 chunkserver 的最大 chunk 数目（默认是 2）

# CHUNKS_READ_REP_LIMIT ：在一个循环里从一个 chunkserver 复制的最大 chunk 数目（默认是 10）

# REJECT_OLD_CLIENTS：弹出低于 1.6.0的客户端挂接（0 或 1，默认是 0）

# deprecated:

# CHUNKS_DEL_LIMIT - use CHUNKS_SOFT_DEL_LIMIT instead

# LOCK_FILE - lock system has been changed, and this option is used only to search for old lockfile

# cp mfsexports.cfg.dist mfsexports.cfg

# vi mfsexports.cfg

192.168.0.0/24 / rw,alldirs,maproot=0

该文件每一个条目分为三部分：

第一部分：客户端的 ip 地址

第二部分：被挂接的目录

第三部分：客户端拥有的权限

地址可以指定的几种表现形式：

* 所有的 ip 地址

A.B.C.D 单个 ip 地址

A.B.C.D/BITS IP 网络地址/位数掩码 A.B.C.D/E.F.G.H IP 网络地址/子网掩码 A.B.C.D-E.F.G.H IP 地址范围

目录部分需要注意两点：

/ 标识 MooseFS 根;

. 表示 MFSMETA 文件系统

权限部分：

ro	只读模式共享
rw	读写方式共享

alldirs	许挂载任何指定的子目录
maproot	映射为 root，还是指定的用户

password

指定验证密码，客户端挂载时使用

# cd /var/lib/mfs

# cp metadata.mfs.empty metadata.mfs

# chown nobody /var/lib/mfs

修改/etc/hosts 文件,增加下面的行:

192.168.0.66 mfsmaster

# mfsmaster start 启动 master server

working directory: /var/lib/mfs lockfile created and locked initializing mfsmaster modules ... loading sessions ... file not found if it is not fresh installation then you have to restart all active mounts !!!

exports file has been loaded

mfstopology configuration file (/etc/mfstopology.cfg) not found - using defaults loading metadata ... create new empty filesystemmetadata file has been loaded

no charts data file - initializing empty charts master <-> metaloggers module: listen on *:9419 master <-> chunkservers module: listen on *:9420 main master server module: listen on *:9421 mfsmaster daemon initialized properly

此时进入/var/lib/mfs 可以看到 moosefs 所产生的数据：

.mfsmaster.lock 文件记录正在运行的 mfsmaster 的主进程 metadata.mfs, metadata.mfs.back MooseFS 文件系统的元数据 metadata的镜像

changelog.*.mfs是 MooseFS 文件系统元数据的改变日志（每一个小时合并到 metadata.mfs 中一次）

Metadata 文件的大小是取决于文件数的多少（而不是他们的大小）。changelog 日志的大小是取决于每小时操作的数目，但是这个时间长度（默认是按小时）是可配置的。

# mfscgiserv #启动 CGI 监控服务

lockfile created and locked starting simple cgi server (host: any , port: 9425 , rootpath: /usr/share/mfscgi)

# cd /usr/share/mfscgi/

# chmod +x chart.cgi mfs.cgi

在浏览器地址栏输入 http://192.168.0.66:9425 即可查看 master 的运行情况

元数据日志服务器 Metalogger server 安装：

# yum localinstall -y mfs-metalogger-1.6.26-1.x86_64.rpm

# cd /etc

# cp mfsmetalogger.cfg.dist mfsmetalogger.cfg 文件 mfsmetalogger.cfg 的修改是可选的：

# WORKING_USER = nobody

# WORKING_GROUP =

# SYSLOG_IDENT = mfsmetalogger

# LOCK_MEMORY = 0：是否执行 mlockall()以避免交换出 mfsmaster 进程(默认是 0,即 no);

# NICE_LEVEL = -19

# DATA_PATH = /var/lib/mfs

# BACK_LOGS = 50

# BACK_META_KEEP_PREVIOUS = 3

# META_DOWNLOAD_FREQ = 1

metadata 元数据下载间隔时间（默认是 24 小时，单位是小时，至多是 BACK_LOGS 的 1/2）

# MASTER_RECONNECTION_DELAY = 5 ：在失去连接之后延迟多少秒重新连接 master

# MASTER_HOST = mfsmaster：连接 MooseFS master 主机的地址(默认是 mfsmaster)

# MASTER_PORT = 9419：连接 MooseFS master 主机的端口(默认是 9420) ;

# MASTER_TIMEOUT = 60：连接 master 的超时时间(默认 60 秒) ;

# deprecated, to be removed in MooseFS 1.7

# LOCK_FILE = /var/run/mfs/mfsmetalogger.lock

# mkdir /var/lib/mfs

# chown nobody /var/lib/mfs

# vi /etc/hosts

192.168.0.66 mfsmaster

# mfsmetalogger start

在/var/lib/mfs 目录中可以看到从 master 上复制来的元数据

changelog_ml.*.mfs 是 MooseFS 文件系统的元数据的 changelog 日志（备份的 Master 的 Master 的 changelog 日志）

metadata_ml.mfs.back 是从 Master 主机上下载的最新的完整 metadata.mfs.back 的拷贝 sessions.ml.mfs 是从 master 下载的最新的 sessions.mfs 文件拷贝。

Mfsmetalogger 并不能完美的接管 master server，在实际生产环境中使用 HA 解决 master 的单点

故障。

存储块服务器 Chunk servers 安装:

# yum localinstall -y mfs-chunkserver-1.6.26-1.x86_64.rpm

# cd /etc/

# cp mfschunkserver.cfg.dist mfschunkserver.cfg

# WORKING_USER = nobody

# WORKING_GROUP =

# SYSLOG_IDENT = mfschunkserver

# LOCK_MEMORY = 0

# NICE_LEVEL = -19

# DATA_PATH = /var/lib/mfs

# MASTER_RECONNECTION_DELAY = 5：在失去连接之后延迟多少秒重新连接 master

# BIND_HOST = *：本地地址用于连接 mfsmaster（默认值是*，即默认的本地地址）

# MASTER_HOST = mfsmaster：master 服务器的主机名或是 ip 地址。

# MASTER_PORT = 9420

# MASTER_TIMEOUT = 60

# CSSERV_LISTEN_HOST = *：允许挂载的客户端连接的 IP 地址（*允许全部）

# CSSERV_LISTEN_PORT = 9422：允许挂载的客户端连接的端口

# HDD_CONF_FILENAME = /etc/mfshdd.cfg：分配给 MFS 使用的磁盘空间配置文件的位置

# HDD_TEST_FREQ = 10：块的测试期（单位为秒）

# deprecated, to be removed in MooseFS 1.7

# LOCK_FILE = /var/run/mfs/mfschunkserver.lock

# BACK_LOGS = 50

# CSSERV_TIMEOUT = 5

# cp mfshdd.cfg.dist mfshdd.cfg

# vi mfshdd.cfg 定义 mfs 共享点

/mnt/mfschunks1

/mnt/mfschunks2

# mount /dev/VolGroup/data1 /mnt/mfschunks1/

# mount /dev/VolGroup/data2 /mnt/mfschunks2/

# chown -R nobody:nobody /mnt/mfschunks1

# chown -R nobody:nobody /mnt/mfschunks2

修改/etc/hosts 文件,增加下面的行:

192.168.0.66 mfsmaster

mkdir /var/lib/mfs

chown nobody /var/lib/mfs

# mfschunkserver start

working directory: /var/lib/mfs lockfile created and locked initializing mfschunkserver modules ...

hdd space manager: path to scan: /mnt/mfschunks2/ hdd space manager: path to scan: /mnt/mfschunks1/hdd

space manager: start background hdd scanning (searching for available chunks) main server module: listen on *:9422 no charts data file - initializing empty charts mfschunkserver daemon initialized properly

现在再通过浏览器访问 http://192.168.0.66:9425/ 应该可以看见这个 MooseFS 系统的全部信息, 包括主控 master 和存储服务 chunkserver 。

客户端 client 安装:

# yum localinstall -y mfs-client-1.6.26-1.x86_64.rpm

# cd /etc

# cp mfsmount.cfg.dist mfsmount.cfg

# vi mfsmount.cfg 定义客户端默认挂载

mfsmaster=mfsmaster /mnt/mfs

# mfsmount

# df -h

...

mfsmaster:9421 2729728 0 2729728 0% /mnt/mfs

MFS 测试：

在 MFS 挂载点下创建两个目录，并设置其文件存储份数：

# cd /mnt/mfs

# mkdir dir1 dir2

# mfssetgoal -r 2 dir2/ 设置在 dir2 中文件存储份数为两个，默认是一个 dir2/:

inodes with goal changed: 1 inodes with goal not changed: 0 inodes with permission denied: 0

对一个目录设定“goal”，此目录下的新创建文件和子目录均会继承此目录的设定，但不会改变已经存在的文件及目录的 copy 份数。但使用-r 选项可以更改已经存在的 copy 份数。

拷贝同一个文件到两个目录

# cp /etc/passwd dir1

# cp /etc/passwd dir2

查看文件信息

# mfsfileinfo dir1/passwd dir1/passwd: chunk 0: 0000000000000001_00000001 / (id:1 ver:1)

copy 1: 192.168.0.2:9422 # mfsfileinfo dir2/passwd dir2/passwd: chunk 0: 0000000000000002_00000001 / (id:2 ver:1)

copy 1: 192.168.0.1:9422 copy 2: 192.168.0.2:9422

关闭 mfschunkserver2 后再查看文件信息

# mfsfileinfo dir1/passwd dir1/passwd: chunk 0: 0000000000000001_00000001 / (id:1 ver:1) no valid copies !!! # mfsfileinfo dir2/passwd dir2/passwd: chunk 0: 0000000000000002_00000001 / (id:2 ver:1) copy 1: 192.168.0.1:9422

启动 mfschunkserver2 后，文件回复正常。

恢复误删文件

# rm -f dir1/passwd # mfsgettrashtime dir1/ dir1/: 86400

文件删除后存放在“ 垃圾箱”中的时间称为隔离时间，这个时间可以用 mfsgettrashtime 命令来查看，用 mfssettrashtime 命令来设置，单位为秒，默认为 86400 秒。

# mkdir /mnt/mfsmeta

# mfsmount -m /mnt/mfsmeta/ -H mfsmaster

挂载 MFSMETA 文件系统，它包含目录 trash (包含仍然可以被还原的删除文件的信息)和 trash/undel (用于获取文件)。把删除的文件，移到/ trash/undel 下，就可以恢复此文件。

# cd /mnt/mfsmeta/trash

# mv 00000004 \|dir1\|passwd undel/

到 dir1 目录中可以看到 passwd 文件恢复

在 MFSMETA 的目录里，除了 trash 和 trash/undel 两个目录，还有第三个目录 reserved，该目

录内有已经删除的文件，但却被其他用户一直打开着。在用户关闭了这些被打开的文件后， reserved 目录中的文件将被删除，文件的数据也将被立即删除。此目录不能进行操作。

修改 linux 下最大文件描述符的限制：在进行大量小文件写时，可能会出现了一个严重错误，有可能和操作系统文件描述符有关。操作系统默认文件描述符为 1024.

1.6.26 版本默认为 100000 建议上线时，master 和 chunker 修改文件描述符系统级限制:它是限制所有用户打开文件描述符的总和，可以通过修改内核参数来更改该限制：

# vi /etc/sysctl.conf 添加

fs.file-max=102400 如果此值默认够大可以不用更改

# sysctl -p 命令使其生效。

用户级限制：只是修改用户级的最大文件描述符限制，也就是说每一个用户登录后执行的程序占

用文件描述符的总数不能超过这个限制。

# vi /etc/security/limits.conf

* - nofile 102400

保存退出后重新登录，其最大文件描述符已经被永久更改了。

与 file-max 参数相对应的还有 file-nr，这个参数是只读的，可以查看当前文件描述符的使用情况。

# sysctl -a|grep file fs.file-nr = 12800 0 782554 fs.file-max = 782554

在 kernel 2.6 之前的版本中，file-nr 中的值由三部分组成，分别为：1.已经分配的文件句柄数，2. 已经分配单没有使用的文件句柄数，3.最大文件句柄数。但在 kernel 2.6 版本中第二项的值总为 0，这并不是一个错误，它实际上意味着已经分配的文件句柄无一浪费的都已经被使用了，file-max 的值是 linux 内核可以分配的最大文件句柄数。如果你看到了很多关于打开文件数已经达到了最大值的错误信息，你可以试着增加该值的限制。file-max 的默认值大概是系统内存的 10 %（系统内存以 kb 计算)快照

MooseFS 系统的另一个特征是利用 mfsmakesnapshot 工具给文件或者是目录树做快照：

# mfsmakesnapshot source … destination

Mfsmakesnapshot 是在一次执行中整合了一个或是一组文件的拷贝，而且任何修改这些文件的源文件都不会影响到源文件的快照，就是说任何对源文件的操作,例如写入源文件，将不会修改副本(或反之亦然)。

文件快照可以用 mfsappendchunks，例如：

# mfsappendchunks destination-file source-file …

当有多个源文件时，它们的快照被加入到同一个目标文件中（每个 chunk 的最大量是 chunk）。

为了安全停止 MooseFS 集群,建议执行如下的步骤:

# umount -l /mnt/mfs	#客户端卸载 MooseFS 文件系统
# mfschunkserver stop	#停止 chunk server 进程

# mfsmetalogger stop	#停止 metalogger 进程
#mfsmaster stop 安全的启动 MooseFS 集群:	#停止主控 master server 进程
# mfsmaster start	#启动 master 进程
# mfschunkserver start	#启动 chunkserver 进程
# mfsmetalogger start	#启动 metalogger 进程
# mfsmount	#客户端挂载 MooseFS 文件系统

实际上无论如何顺序启动或关闭，未见任何异常，master 启动后，metalogger、chunker、client 三个元素都能自动与 master 建立连接。

故障测试:

Client 客户端断电、断网对 MFS 的体系不产生影响.

如果客户端误杀 killall -9 mfsmount 进程，需要先 umount /mnt/mfs，然后再 mfsmount。否则会提示：/mnt/mfs: Transport endpoint is not connected

chunkserver 端：

传输一个大文件，设置存储 2 份。传输过程中，关掉 chunker1，这样绝对会出现有部分块只存在 chunker2 上；启动 chunker1，关闭 chunker2，这样绝对会有部分块只存在 chunker1 上。把 chunker2 启动起来。整个过程中，客户端一直能够正常传输。使用 mfsfileinfo 查看此文件，发现有的块分布在 chunker1 上，有的块分布在 chunker2 上。使用 mfssetgoal -r 1 后，所有块都修改成 1 块了，再 mfssetgoal -r 2，所有块都修改成 2 份了。

# mfssetgoal -r 1 bigfile bigfile:

inodes with goal changed: 1 inodes with goal not changed: 0 inodes with permission denied: 0

# mfsfileinfo bigfile bigfile:

chunk 0: 0000000000000010_00000001 / (id:16 ver:1)

copy 1: 192.168.0.1:9422

chunk 1: 0000000000000011_00000002 / (id:17 ver:2)

copy 1: 192.168.0.2:9422

# mfssetgoal -r 2 bigfile bigfile:

inodes with goal changed: 1 inodes with goal not changed: 0 inodes with permission denied: 0

# mfsfileinfo bigfile bigfile:

chunk 0: 0000000000000010_00000001 / (id:16 ver:1)

copy 1: 192.168.0.1:9422 copy 2: 192.168.0.2:9422

chunk 1: 0000000000000011_00000002 / (id:17 ver:2)

copy 1: 192.168.0.1:9422 copy 2: 192.168.0.2:9422

断网、杀掉 mfschunkserver 程序对 MFS 系统无影响。断电：

#无文件传输时，对两个 chunker 都无影响；

#当有文件传输时，但是文件设置存储一份时，对文件的存储无影响。

#文件设置存储两份，数据传输过程中，关掉 chunker1，等待数据传输完毕后，启动 chunker1.chunker1 启动后，会自动从 chunker2 复制数据块。整个过程中文件访问不受影响。

#文件设置存储两份，数据传输过程中，关掉 chunker1，不等待数据传输完毕，开机启动chunker1.chunker1 启动后，client 端会向 chunker1 传输数据，同时 chunker1 也从 chunker2 复制缺失的块。只要不是两个 chunker 服务器同时挂掉的话，就不会影响文件的传输，也不会影响服务的使用。

master 端：

断网、杀掉 MFS 的 master 服务对 MFS 系统无影响。断电可能会出现以下的情况：

#当没有文件传输时，可在服务器重启之后，运行 mfsmetarestore –a 进行修复，之后执行 mfsmaster start 恢复 master 服务。

# mfsmetarestore -a

loading objects (files,directories,etc.) ... ok

loading names ... ok loading deletion timestamps ... ok loading chunks data ... ok checking filesystem consistency ... ok connecting files and chunks ... ok

store metadata into file: /var/lib/mfs/metadata.mfs

# mfsmaster start working directory: /var/lib/mfs lockfile created and locked initializing mfsmaster modules ... loading sessions ... ok sessions file has been loaded exports file has been loaded

mfstopology configuration file (/etc/mfstopology.cfg) not found - using defaults loading metadata ... loading objects (files,directories,etc.) ... ok

loading names ... ok loading deletion timestamps ... ok loading chunks data ... ok checking filesystem consistency ... ok connecting files and chunks ... ok all inodes: 5 directory inodes: 3

file inodes: 2 chunks: 2

metadata file has been loaded stats file has been loaded

master <-> metaloggers module: listen on *:9419 master <-> chunkservers module: listen on *:9420 main master server module: listen on *:9421 mfsmaster daemon initialized properly

#当有文件传输时，可能会在/usr/local/mfs/sbin/mfsmetarestore –a 进行修复时可能会出现：

# mfsmetarestore -a

loading objects (files,directories,etc.) ... ok

loading names ... ok loading deletion timestamps ... ok loading chunks data ... ok checking filesystem consistency ... ok connecting files and chunks ... ok

?S:115: error: 32 (Data mismatch)

此时无法修复也无法启动 master 服务，有个应急的办法是将metadata.mfs.back 复制成 metadata.mfs，然后再启动 master。这样将会丢失那些正在传输的数据。

mfsmaster 热备：

解决方案：drbd+corosync+pacemaker

drbd 配置:

# cat /etc/drbd.d/mfs.res resource mfsdata { meta-disk internal; device /dev/drbd1; syncer { verify-alg sha1;

}

on server89.example.com { disk /dev/vgdrbd/mfs;

address 192.168.0.189:7789;

}

on server87.example.com { disk /dev/vgdrbd/mfs;

address 192.168.0.187:7789;

}

corosync 配置:

# cat /etc/corosync/corosync.conf # Please read the corosync.conf.5 manual page compatibility: whitetank

totem { version: 2 secauth: off threads: 0 interface { ringnumber: 0 bindnetaddr: 192.168.0.0 mcastaddr: 226.94.2.1

mcastport: 5408

ttl: 1

}

logging {

fileline: off to_stderr: no to_logfile: yes to_syslog: yes logfile: /var/log/cluster/corosync.log debug: off timestamp: on logger_subsys { subsys: AMF debug: off

}

amf { mode: disabled

}

service { name: pacemaker

ver: 0 }

mfs 启动脚本：

# cat /etc/init.d/mfs

#!/bin/bash

# Init file for the MooseFS master service

# chkconfig: - 92 84

# description: MooseFS master

# processname: mfsmaster

# Source function library.

# Source networking configuration.

. /etc/init.d/functions

. /etc/sysconfig/network

# Source initialization configuration.

# Check that networking is up.

[ "${NETWORKING}" == "no" ] && exit 0

[ -x "/usr/sbin/mfsmaster" ] || exit 1

[ -r "/etc/mfsmaster.cfg" ] || exit 1

[ -r "/etc/mfsexports.cfg" ] || exit 1

RETVAL=0

prog="mfsmaster" datadir="/var/lib/mfs" mfsbin="/usr/sbin/mfsmaster" mfsrestore="/usr/sbin/mfsmetarestore"

start () {

echo -n $"Starting $prog: "

$mfsbin start >/dev/null 2>&1 if [ $? -ne 0 ];then

$mfsrestore -a >/dev/null 2>&1 && $mfsbin start >/dev/null 2>&1 fi

RETVAL=$?

echo

return $RETVAL

}

stop () {

echo -n $"Stopping $prog: "

$mfsbin -s >/dev/null 2>&1 || killall -9 $prog #>/dev/null 2>&1

RETVAL=$? echo

return $RETVAL

}

restart () { stop start }

reload () {

echo -n $"reload $prog: " $mfsbin reload >/dev/null 2>&1

RETVAL=$? echo

return $RETVAL

}

restore () {

echo -n $"restore $prog: " $mfsrestore -a > /dev/null 2>& 1

RETVAL=$? echo

return $RETVAL

}

case "$1" in start)

start

;;

stop) stop

;;

restart)

restart

;;

reload)

reload

;;

restore)

restore

;;

status) status $prog RETVAL=$?

;;

echo $"Usage: $0 {start|stop|restart|reload|restore|status}"

RETVAL=1 esac exit $RETVAL

pacemaker 配置：

node server87.example.com node server89.example.com

primitive MFSdata ocf:linbit:drbd params drbd_resource="mfsdata" primitive MFSfs ocf:heartbeat:Filesystem \

params device="/dev/drbd1" directory="/var/lib/mfs" fstype="ext4" primitive MFSmaster lsb:mfs op monitor interval="30s" primitive vip ocf:heartbeat:IPaddr2 \

params ip="192.168.0.163" cidr_netmask="24" \ op monitor interval="30s" \ group MFSgroup MFSfs vip MFSmaster ms MFSdataclone MFSdata \

meta master-max="1" master-node-max="1" clone-max="2" clone-node-max="1"

notify="true" target-role="Started" colocation mfs-with-drbd inf: MFSgroup MFSdataclone:Master order mfs-after-drbd inf: MFSdataclone:promote MFSgroup:start

property $id="cib-bootstrap-options" \ stonith-enabled="false" \

dc-version="1.1.6-3.el6-a02c0f19a00c1eb2527ad38f146ebc0834814558" cluster-infrastructure="openais" \ expected-quorum-votes="2" \ no-quorum-policy="ignore" \ start-failure-is-fatal="false"

第三部分：实验操作

实验环境：

实验主机：172.25.0.1（master）

172.25.0.2（chunkserver）

172.25.0.3（chunkserver）

172.25.0.251（client）

##下载mfs源码包，创建rpm包，在不同服务器上安装所需包

#命令rpmbiuld为系统命令，可以直接安装（yum install –y rpm-build）

#在创建rpmnn包过程中会有各种依赖关系，可以到pkgs.org上下载所需要的包

##在master端（节点1），进入刚刚创建的rpm包目录，安装master端包

##在chunkserver端（节点2,3），安装所需包，并且解决依赖性

##在客户端（节点251）安装client，当然，在部署中还需要元数据服务器，这里就不做累述，只需安装相应包，修改配置文件，指向master，开启就好了。

##在master端可以查看管理服务器的配置文件

##这里边注释掉的代表默认，需要注意的是和mfs相关的文件的用户只mfs，所以后面会修改文件的用户和组

##查看元数据配置文件，这里是允许所有人有读写权限

##master上数据存放目录，当没有medadata.mfs时，可以用*。*。empty来复制一份，当master启动后，会在后面加上.back，当没有数据传输时，关闭master，会变成.mfs，当正在传输数据，master异常掉线，回复不了时，可以将.back去掉，这样就可以恢复了

##然后就可以启动master了，没有启动脚本，只需要master就可以启动（没有路径限制）

##client监听master的9421端口，master监听chunkserver的9420端口，元数据日志服务器监听master的9419端口

#切换到/usr/share/mfscgi目录下，开启mfscgiserv这样就可以用图形界面来看整个分布式文件系统的动态情况了

##浏览器访问会出现下面的情况，找不到master，这是因为mfs文件系统是通过主机名来通信的，所以在所有主机的/etc/hosts中0.1对应的主机名加进

##在master的配置文件中有提示，指明需要将master所在主机的解析中加进去

##然后是存储端的配置

首先在两台主机上各增加一快磁盘，这里的磁盘可以直接做成标准的磁盘，也可以做成Lvm逻辑卷，都行，标准磁盘满后，可以加进磁盘，增加挂载点来继续工作，逻辑卷的话，就可以直接扩容，这里我们将节点2做成标准分区，将节点三做成逻辑卷

#节点2，创建分区n>>是新建，

#创建完成，退出之前，用p可以查看创建好的分区

##格式化

##挂载

##编辑配置文件，告诉

首先chunkserver的用户和组是mfs,需要修改数据存放目录的权限，包括/var/lib/mfs和磁盘挂载点/mnt/chunk1的权限

##实现磁盘的永久挂载

##配置文件中还指明了作为存贮服务器的主机名和本存储服务器制定的master服务器的主机名，只需要在解析中加进ip对应的mfsmaster就可以找到了，当然如果有dns服务器就可以省去这些麻烦了

##还指明了挂载点文件名

##将挂载点加进去

##然后开启存储服务器

##网页上就可以看到加进来的磁盘

##mfs以块存储，会将磁盘换份为256个大块，每个块的大小是64M

##节点3中做类似的步骤，唯一的区别就是将磁盘标签换成8e，

#创建逻辑卷

##然后就是将磁盘永久挂载，修改磁盘挂载点的权限，，告诉chunkserver挂载点在哪，做好解析，开启服务，最后就完成了

##在客户端，安装client软件，然后在配置文件中将自己的挂载目录放进去，做好解析，开启，就完成了

#这是安装完软件的结果

#在/mnt下创建目录，不必修改权限

#修改配置文件

#做好解析

##这样就真正完成了分布式文件系统的构建

##测试mfs

#在client，挂载目录下创建两个目录，

##将目录1中数据只存一份

##确实只放在了节点3中

##而节点2中就不同，会存两份

##这样当存储设备节点3坏坏掉之后（我们以手动停掉为例），client存放在目录2中的数据不会有影响，而目录一中的数据将会丢失

##将节点三的存储回复正常，client都又可以看到数据

##图形界面能够更清晰的看到各个节点的chunk（块）数

##需要注意的是对于空文件，mfs文件系统会记录块的个数，但是不会消耗存储空间

##一块64M，100M将会被分成两块

##再写进500M

##图形界面上显示了存储的块的个数以及写入的速度，但是，不会占用空间

##在存储节点上，挂载目录大小依然不变，但是每个块中确实有存储的信息

##这就是放进空文件的原因，下面我们在客户端往目录一中放一个镜像

##这次磁盘使用情况就会变化

##mfsinfo 镜像名字，就会看到镜像被均匀的分配在两个chunkserver上

##删除数据的恢复，例如百度云，在我们删除数据后，其实并不是完全删除，都会有一个防止误删机制，一般会保存3-5天，当然只要你愿意交钱，百度会为你保存更长的时间

##查看目录一中文件能够在垃圾箱中存放的时间，为一天（86400秒）

##挂载元数据目录

##在元数据目录中会有存放删除的文件的目录trash

##只要将我们不想删除的文件重新放进trash中的undel中就好了

##我们将目录一中的passwd删除

##用find命令找到passwd

##将其移动到undel中，这样就又可以在目录一中查看passwd了

##元数据服务器的作用是在master异常关闭后重启后恢复数据

##master作为整个分布式文件系统的瓶颈，我们可以用高可用实现高可用

以前我们用过几个高可用套件，其中drbd(网络raid)+heartbeat最简单

Pacemaker比较复杂，有资源监控，而heartbeat只是纯心跳

##这里我们以pacemaker+corosync+iscsi搭建master端的高可用，节点一盒节点四作为master实现高可用，iscsi作为HA集群的一部分，我们这里用251作为服务器（安装scsi）,节点一和节点四作为iscsi客户端安装iscsi

##在iscsi服务器端，安装完软件后，编辑配置文件，将磁盘和客户端ip加进来，记得磁盘必须是没有格式化的磁盘，只是做存储

##开启iscsi

##查看iscsi集群状态，要有新加进来的磁盘和ip

##在两个客户端，都安装iscsi，并且发现，加载iscsi磁盘

##这是用fdisk –l可以查看到可以用的磁盘，这里就包括iscsi磁盘

##挂载，这里是我们之前所做数据库时的iscsi，将里边的数据删除

##将mfs的数据存放进iscsi中

##当然在做这之前需要将master停掉，以防止数据丢失

##停掉后，这里我们将cp过来的数据删除，再进行cp，主要的区别就是.mfs 和.mfs.back区别

##对于要写进数据的目录和文件一定要记得改权限

##将iscsi挂载到master的数据目录下面，并开启master

##关闭

##写入mfs启动脚本

##当然，上面的脚本需要修改

##现在查看进程，master已经开启，然后关闭，将启动脚本cp给节点4

##当然也要在节点4上安装master软件包

##卸载

##发现加载

##挂载

##两边mfs用户的uid和gid要一样，这里节点一是498,499，节点四是497,498需要修改成一样的，节点一上的zabbix用户占据了498

##现在在251上可以看到iscsi状态

##然后，在节点1和4上安装pacemaker，需要配置yum源

##然后，在新配的yum源中能够发现7509个包

##然后安装pacemaker和上面下载的两个包，节点4上做相同的做法

##修改下面这一行，并在最后一行增加服务

##cp给节点4

##开启

##在真机上查看fence的key

##将key拷贝给节点1和4，没有目录，要先建立

##安装fence

##配置

##查看

##继续配置

##这时开启了（节点4中查看）

##增加虚拟ip

##查看

##节点2，3上关闭

##将VIP对应mfsmaster主机（在所有mfs节点上）

##将存储节点，客户端服务都打开

##写进大文件

##本来是节点4在作为master，现在让他靠边

##在节点1上查看

##节点1接管了

##再将节点4上线，会自动回切

#至此就完成了高可用部分。

你可能感兴趣的:(文件系统,分布式,mfs)

GitHub上克隆项目 bigbig猩猩 github
从GitHub上克隆项目是一个简单且直接的过程，它允许你将远程仓库中的项目复制到你的本地计算机上，以便进行进一步的开发、测试或学习。以下是一个详细的步骤指南，帮助你从GitHub上克隆项目。一、准备工作1.安装Git在克隆GitHub项目之前，你需要在你的计算机上安装Git工具。Git是一个开源的分布式版本控制系统，用于跟踪和管理代码变更。你可以从Git的官方网站（https://git-scm.
第六集如何安装CentOS7.0，3分钟学会centos7安装教程 date分享
从光盘引导系统按回车键继续进入引导程序安装界面，选择语言这里选择简体中文版点击继续选择桌面安装下面给系统分区选择磁盘，点击完成选择基本分区，点击加号swap分区,大小填内存的两倍在选择根分区，使用所有可用的磁盘空间选择文件系统ext4点击完成，点击开始安装设置root密码，点击完成设置普通用户和密码，点击完成整个过程持续八分钟左右根据个人配置不同，时间长短不同好，现在点击重启系统进入重启状态点击本
01-Git初识 Meereen Git git
01-Git初识概念：一个免费开源，分布式的代码版本控制系统，帮助开发团队维护代码作用：记录代码内容。切换代码版本，多人开发时高效合并代码内容如何学：个人本机使用：Git基础命令和概念多人共享使用：团队开发同一个项目的代码版本管理Git配置用户信息配置：用户名和邮箱，应用在每次提交代码版本时表明自己的身份命令：查看git版本号git-v配置用户名gitconfig--globaluser.name
docker igotyback eureka 云原生
Docker容器的文件系统是隔离的，但是可以通过挂载卷（Volumes）或绑定挂载（BindMounts）将宿主机的文件系统目录映射到容器内部。要查看Docker容器的映射路径，可以使用以下方法：查看容器配置：使用dockerinspect命令可以查看容器的详细配置信息，包括挂载的卷。例如：bashdockerinspect在输出的JSON格式中，查找"Mounts"部分，这里会列出所有的挂载信息
Kafka是如何保证数据的安全性、可靠性和分区的喜欢猪猪 kafka 分布式
Kafka作为一个高性能、可扩展的分布式流处理平台，通过多种机制来确保数据的安全性、可靠性和分区的有效管理。以下是关于Kafka如何保证数据安全性、可靠性和分区的详细解析：一、数据安全性SSL/TLS加密：Kafka支持SSL/TLS协议，通过配置SSL证书和密钥来加密数据传输，确保数据在传输过程中不会被窃取或篡改。这一机制有效防止了中间人攻击，保护了数据的安全性。SASL认证：Kafka支持多种
光盘文件系统 (iso9660) 格式解析穷人小水滴光盘文件系统 iso9660 deno GNU/Linux javascript
越简单的系统,越可靠,越不容易出问题.光盘文件系统(iso9660)十分简单,只需不到200行代码,即可实现定位读取其中的文件.参考资料:https://wiki.osdev.org/ISO_9660相关文章:《光盘防水嘛?DVD+R刻录光盘泡水实验》https://blog.csdn.net/secext2022/article/details/140583910《光驱的内部结构及日常使用》ht
Python多线程实现大规模数据集高效转移 sand&wich 网络 python 服务器
背景在处理大规模数据集时，通常需要在不同存储设备、不同服务器或文件夹之间高效地传输数据。如果采用单线程传输方式，当数据量非常大时，整个过程会非常耗时。因此，通过多线程并行处理可以大幅提升数据传输效率。本文将分享一个基于Python多线程实现的高效数据传输工具，通过遍历源文件夹中的所有文件，将它们移动到目标文件夹。工具和库这个数据集转移工具主要依赖于以下Python标准库：os：用于文件系统操作，如
WebMagic：强大的Java爬虫框架解析与实战 Aaron_945 Java java 爬虫开发语言
文章目录引言官网链接WebMagic原理概述基础使用1.添加依赖2.编写PageProcessor高级使用1.自定义Pipeline2.分布式抓取优点结论引言在大数据时代，网络爬虫作为数据收集的重要工具，扮演着不可或缺的角色。Java作为一门广泛使用的编程语言，在爬虫开发领域也有其独特的优势。WebMagic是一个开源的Java爬虫框架，它提供了简单灵活的API，支持多线程、分布式抓取，以及丰富的
华为云分布式缓存服务DCS 8月新特性发布华为云PaaS服务小智华为云分布式缓存
分布式缓存服务（DistributedCacheService，简称DCS）是华为云提供的一款兼容Redis的高速内存数据处理引擎，为您提供即开即用、安全可靠、弹性扩容、便捷管理的在线分布式缓存能力，满足用户高并发及数据快速访问的业务诉求。此次为大家带来DCS8月的特性更新内容，一起来看看吧！
浅谈MapReduce Android路上的人 Hadoop 分布式计算 mapreduce 分布式框架 hadoop
从今天开始，本人将会开始对另一项技术的学习，就是当下炙手可热的Hadoop分布式就算技术。目前国内外的诸多公司因为业务发展的需要，都纷纷用了此平台。国内的比如BAT啦，国外的在这方面走的更加的前面，就不一一列举了。但是Hadoop作为Apache的一个开源项目，在下面有非常多的子项目，比如HDFS，HBase,Hive，Pig,等等，要先彻底学习整个Hadoop，仅仅凭借一个的力量，是远远不够的。
KVM+GFS分布式存储系统构建KVM高可用 henan程序媛分布式 GFS 高可用 KVM
一、案列分析1.1案列概述本章案例主要使用之前章节所学的KVM及GlusterFs技术,结合起来从而实现KVM高可用。利用GlusterFs分布式复制卷，对KVM虚拟机文件进行分布存储和冗余。分布式复制卷主要用于需要冗余的情况下把一个文件存放在两个或两个以上的节点,当其中一个节点数据丢失或者损坏之后，KVM仍然能够通过卷组找到另一节点上存储的虚拟机文件，以保证虚拟机正常运行。当节点修复之后，Glu
Hadoop 傲雪凌霜，松柏长青后端大数据 hadoop 大数据分布式
ApacheHadoop是一个开源的分布式计算框架，主要用于处理海量数据集。它具有高度的可扩展性、容错性和高效的分布式存储与计算能力。Hadoop核心由四个主要模块组成，分别是HDFS（分布式文件系统）、MapReduce（分布式计算框架）、YARN（资源管理）和HadoopCommon（公共工具和库）。1.HDFS（HadoopDistributedFileSystem）HDFS是Hadoop生
大模型训练数据库Common Crawl WindyChanChan 数据集语言模型数据库
CommonCrawl介绍‌‌CommonCrawl是一个非营利组织，致力于通过大规模分布式爬虫系统定期抓取整个Web并将其存储在一个可公开访问的数据库中。CommonCrawl的数据收集和处理过程包括使用Python开源爬虫工具收集全球范围内的网站数据，并将其上传到‌CommonCrawl基金会的数据仓库中。该项目从2008年开始，至今已经积累了大量的原始网页数据、元数据和文本提取数据。这些数据
慢速连接攻击是什么？慢速连接攻击怎么防护？快快小毛毛网络 ddos 服务器
慢速连接攻击（SlowConnectionAttack），又称慢速攻击（SlowlorisAttack），是一种网络攻击技术，旨在通过占用服务器上的所有可用连接资源来使其无法响应正常请求。与传统的拒绝服务（DoS）和分布式拒绝服务（DDoS）攻击不同，慢速攻击并不依赖于发送大量数据包来消耗带宽，而是利用HTTP、TCP或SSL等协议的特性，通过发送大量不完整的请求或缓慢发送数据来占用服务器资源，使
分布式锁和spring事务管理暴躁的鱼锁及事务分布式 spring java
最近开发一个小程序遇到一个需求需要实现分布式事务管理业务需求用户在使用小程序的过程中可以查看景点，对景点地区或者城市标记是否想去，那么需要统计一个地点被标记的人数，以及记录某个用户对某个地点是否标记为想去，用两个表存储数据，一个地点表记录改地点被标记的次数，一个用户意向表记录某个用户对某个地点是否标记为想去。由于可能有多个用户同时标记一个地点，每个用户在前端点击想去按钮之后，后台接收到请求，从数据
Gobelieve 架构 weixin_34099526 数据库 golang json
Gobelievegithub地址声明:转简书JackieF的文章,为了自己方便copy了一份,加一些自己的东西.链接：https://www.jianshu.com/p/8121d6e85282IMCore主要分三大块:im客户连接服务器（可分布式部署，暂无负载均衡模块)imr路由查询服务器（主要解决im分布式部署的问题）ims存储服务器(主从部署)基础模块1.数据包协议包：header(12)
Kafka详细解析与应用分析芊言芊语 kafka 分布式
Kafka是一个开源的分布式事件流平台（EventStreamingPlatform），由LinkedIn公司最初采用Scala语言开发，并基于ZooKeeper协调管理。如今，Kafka已经被Apache基金会纳入其项目体系，广泛应用于大数据实时处理领域。Kafka凭借其高吞吐量、持久化、分布式和可靠性的特点，成为构建实时流数据管道和流处理应用程序的重要工具。Kafka架构Kafka的架构主要由
linux挂载文件夹小码快撩 linux
1.使用NFS（NetworkFileSystem）NFS是一种分布式文件系统协议，允许一个系统将其文件系统的一部分共享给其他系统。检查是否安装NFSrpm-qa|grepnfs2.启动和启用NFS服务假设服务名称为nfs-server.service，你可以使用以下命令启动和启用它：sudosystemctlstartnfs-server.servicesudosystemctlenablenf
Kafka 基础与架构理解 StaticKing KAFKA kafka
目录前言Kafka基础概念消息队列简介：Kafka与传统消息队列（如RabbitMQ、ActiveMQ）的对比Kafka的组件Kafka的工作原理：消息的生产、分发、消费流程Kafka系统架构Kafka的分布式架构设计Leader-Follower机制与数据复制Log-basedStorage和持久化Broker间通信协议Zookeeper在Kafka中的角色总结前言Kafka是一个分布式的消息系
Rides实现分布式锁，保障数据一致性,Redisson分布式事务处理朱杰jjj 缓存分布式
分布式环境下分布式锁有三种方式：基于数据库分布式锁基于Redis分布式锁基于zk分布式锁本帖只介绍Redis分布式锁为什么需要用到分布式锁？在单机环境下一个服务中多个线程对同一个事物或数据资源进行操作时，可以通过添加加锁方式（synchronized和lock）来解决数据一致性的问题。但是如果出现多个服务的情况下，这时候我们在通过synchronized和lock的方式来加锁会出现问题，因为多个服
机电综合管理系统架构小熊coder 机载系统系统架构
文章目录一、机电综合管理系统架构1.系统概述2.架构层次3.核心组件二、余度管理1.余度概述2.硬件冗余3.软件冗余4.通信冗余三、总线架构1.MIL-STD-1553B总线2.ARINC429总线3.ARINC629总线4.AFDX/ARINC664总线四、未来发展趋势1.分布式架构2.高速网络3.智能化与自动化结语机电综合管理系统（ElectromechanicalManagementSyst
华为云分布式缓存服务DCS与开源服务差异对比 hcinfo_18 redis使用华为云 Redis5.0 分布式缓存服务 Redis客户端
分布式缓存服务DCS提供单机、主备、集群等丰富的实例类型，满足用户高读写性能及快速数据访问的业务诉求。支持丰富的实例管理操作，帮助用户省去运维烦恼。用户可以聚焦于业务逻辑本身，而无需过多考虑部署、监控、扩容、安全、故障恢复等方面的问题。DCS基于开源Redis、Memcached向用户提供一定程度定制化的缓存服务，因此，除了拥有开源服务缓存数据库的优秀特性，DCS提供更多实用功能。一、与开源Red
Dubbo架构概览：服务注册与发现、远程调用、监控与管理木南曌 dubbo 架构
Dubbo是一个成熟的、高性能的、基于Java的微服务开发框架，它主要用于解决分布式系统中的服务治理问题，包括服务的注册与发现、远程过程调用（RPC）、服务监控与管理等多个关键环节。以下是Dubbo架构概览的详细介绍：服务注册与发现Dubbo的服务注册与发现机制是其核心功能之一，它依赖于注册中心来管理服务的生命周期和定位服务提供者。1.服务提供者（Provider）服务提供者是实际提供服务的节点，
nfs服务搭建 GHope
nfs是什么？基哥度娘网络文件系统(NFS)是sun微系统最初开发的分布式文件系统协议,[1]允许客户端计算机上的用户通过计算机网络访问文件很像本地存储被访问。NFS与许多其他协议一样,在开放网络计算远程过程调用(很久以前RPC)系统上建立。NFS是在请求注释(RFC)中定义的开放标准,允许任何人实现协议。NFSNFS优势：节省本地存储空间，将常用的数据存放在一台NFS服务器上且可以通过网络访问，
hbase介绍 CrazyL- 云计算+大数据 hbase
hbase是一个分布式的、多版本的、面向列的开源数据库hbase利用hadoophdfs作为其文件存储系统，提供高可靠性、高性能、列存储、可伸缩、实时读写、适用于非结构化数据存储的数据库系统hbase利用hadoopmapreduce来处理hbase、中的海量数据hbase利用zookeeper作为分布式系统服务特点：数据量大：一个表可以有上亿行，上百万列（列多时，插入变慢）面向列：面向列（族）的
Flume：大规模日志收集与数据传输的利器傲雪凌霜，松柏长青后端大数据 flume 大数据
Flume：大规模日志收集与数据传输的利器在大数据时代，随着各类应用的不断增长，产生了海量的日志和数据。这些数据不仅对业务的健康监控至关重要，还可以通过深入分析，帮助企业做出更好的决策。那么，如何高效地收集、传输和存储这些海量数据，成为了一项重要的挑战。今天我们将深入探讨ApacheFlume，它是如何帮助我们应对这些挑战的。一、Flume概述ApacheFlume是一个分布式、可靠、可扩展的日志
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构汤萌妮Margaret
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构scalable_agent项目地址:https://gitcode.com/gh_mirrors/sc/scalable_agent在当今的人工智能研究前沿，深度强化学习（DRL）因其在复杂任务中的卓越表现而备受瞩目。本文要介绍的是一个开源于GitHub的重量级项目：“ScalableDistributedDeep-RLwithImp
⭐Unity 安卓环境中正确地读取和处理 XML 文件惊鸿醉 Unity unity android xml
写了一个选择题Demo，电脑包和编辑器内无问题，但是打包安卓手机之后题目无法正常使用，想到的是安卓环境中正确地读取文件的问题改进方案：1.由于XmlDocument.Load方法在Android上的路径问题（由于文件位于APK内部，无法像在文件系统中那样直接访问），需要先使用UnityWebRequest来异步加载文件内容，然后再解析XML。2.异步处理：修改你的代码，以支持异步文件加载和处理，这
pnpm解說白总Server 服务器 kubernetes 网络运维云原生 python java
pnpm（PerformanceNodePackageManager）是一个高性能的Node.js包管理器，它旨在解决npm和yarn在处理依赖关系时可能遇到的一些问题，如重复安装相同版本的包、包的存储空间占用过大等。pnpm使用了一种称为“硬链接”和“符号链接”的文件系统技术，这使得它能够以更高效的方式存储和管理依赖项。关键特点：高效存储：pnpm使用一种称为内容可寻址存储（ContentAdd
等保测评中的关键技术挑战与应对策略亿林数据网络安全等保测评
在信息安全领域，等保测评（信息安全等级保护测评）作为确保信息系统安全性的重要手段，其过程中不可避免地会遇到一系列技术挑战。这些挑战不仅考验着企业的技术实力，也对其安全管理水平提出了更高要求。本文将深入探讨等保测评中的关键技术挑战，并提出相应的应对策略。一、等保测评中的关键技术挑战1.复杂系统架构的评估难度随着信息技术的快速发展，企业信息系统的架构日益复杂，包括分布式系统、微服务架构、云计算环境等。
LeetCode[Math] - #66 Plus One Cwind java LeetCode 题解 Algorithm Math
原题链接：#66 Plus One 要求：给定一个用数字数组表示的非负整数，如num1 = {1, 2, 3, 9}, num2 = {9, 9}等，给这个数加上1。注意： 1. 数字的较高位存在数组的头上，即num1表示数字1239 2. 每一位（数组中的每个元素）的取值范围为0~9 难度：简单分析：题目比较简单，只须从数组
JQuery中$.ajax()方法参数详解 AILIKES JavaScript jsonp jquery Ajax json
url: 要求为String类型的参数，（默认为当前页地址）发送请求的地址。 type: 要求为String类型的参数，请求方式（post或get）默认为get。注意其他http请求方法，例如put和 delete也可以使用，但仅部分浏览器支持。 timeout: 要求为Number类型的参数，设置请求超时时间（毫秒）。此设置将覆盖$.ajaxSetup()方法的全局
JConsole & JVisualVM远程监视Webphere服务器JVM Kai_Ge JVisualVM JConsole Webphere
JConsole是JDK里自带的一个工具，可以监测Java程序运行时所有对象的申请、释放等动作，将内存管理的所有信息进行统计、分析、可视化。我们可以根据这些信息判断程序是否有内存泄漏问题。　　使用JConsole工具来分析WAS的JVM问题，需要进行相关的配置。　　首先我们看WAS服务器端的配置. 　　1、登录was控制台https://10.4.119.18
自定义annotation 120153216 annotation
Java annotation 自定义注释@interface的用法一、什么是注释说起注释，得先提一提什么是元数据(metadata)。所谓元数据就是数据的数据。也就是说，元数据是描述数据的。就象数据表中的字段一样，每个字段描述了这个字段下的数据的含义。而J2SE5.0中提供的注释就是java源代码的元数据，也就是说注释是描述java源
CentOS 5/6.X 使用 EPEL YUM源 2002wmj centos
CentOS 6.X 安装使用EPEL YUM源1. 查看操作系统版本[root@node1 ~]# uname -a Linux node1.test.com 2.6.32-358.el6.x86_64 #1 SMP Fri Feb 22 00:31:26 UTC 2013 x86_64 x86_64 x86_64 GNU/Linux [root@node1 ~]#
在SQLSERVER中查找缺失和无用的索引SQL 357029540 SQL Server
--缺失的索引 SELECT avg_total_user_cost * avg_user_impact * ( user_scans + user_seeks ) AS PossibleImprovement , last_user_seek ,
Spring3 MVC 笔记（二） —json+rest优化 7454103 Spring3 MVC
接上次的 spring mvc 注解的一些详细信息！其实也是一些个人的学习笔记呵呵！
替换“\”的时候报错Unexpected internal error near index 1 \ ^ adminjun java “\替换”
发现还是有些东西没有刻子脑子里,,过段时间就没什么概念了,所以贴出来...以免再忘... 在拆分字符串时遇到通过 \ 来拆分，可是用所以想通过转义 \\ 来拆分的时候会报异常 public class Main { /*
POJ 1035 Spell checker(哈希表) aijuans 暴力求解--哈希表
/* 题意：输入字典，然后输入单词，判断字典中是否出现过该单词，或者是否进行删除、添加、替换操作，如果是，则输出对应的字典中的单词要求按照输入时候的排名输出题解：建立两个哈希表。一个存储字典和输入字典中单词的排名，一个进行最后输出的判重 */ #include <iostream> //#define using namespace std; const int HASH =
通过原型实现javascript Array的去重、最大值和最小值 ayaoxinchao JavaScript array prototype
用原型函数（prototype）可以定义一些很方便的自定义函数，实现各种自定义功能。本次主要是实现了Array的去重、获取最大值和最小值。实现代码如下： <script type="text/javascript"> Array.prototype.unique = function() { var a = {}; var le
UIWebView实现https双向认证请求 bewithme UIWebView https Objective-C
什么是HTTPS双向认证我已在先前的博文 ASIHTTPRequest实现https双向认证请求中有讲述，不理解的读者可以先复习一下。本文是用UIWebView来实现对需要客户端证书验证的服务请求，网上有些文章中有涉及到此内容，但都只言片语，没有讲完全，更没有完整的代码，让人困扰不已。但是此知
NoSQL数据库之Redis数据库管理(Redis高级应用之事务处理、持久化操作、pub_sub、虚拟内存) bijian1013 redis 数据库 NoSQL
3.事务处理 Redis对事务的支持目前不比较简单。Redis只能保证一个client发起的事务中的命令可以连续的执行，而中间不会插入其他client的命令。当一个client在一个连接中发出multi命令时，这个连接会进入一个事务上下文，该连接后续的命令不会立即执行，而是先放到一个队列中，当执行exec命令时，redis会顺序的执行队列中
各数据库分页sql备忘 bingyingao oracle sql 分页
ORACLE 下面这个效率很低 SELECT * FROM ( SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_FS_RETURN order by id desc) A ) WHERE RN <20; 下面这个效率很高 SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_
【Scala七】Scala核心一：函数 bit1129 scala
1. 如果函数体只有一行代码，则可以不用写{},比如 def print(x: Int) = println(x) 一行上的多条语句用分号隔开，则只有第一句属于方法体，例如 def printWithValue(x: Int) : String= println(x); "ABC" 上面的代码报错，因为，printWithValue的方法
了解GHC的factorial编译过程 bookjovi haskell
GHC相对其他主流语言的编译器或解释器还是比较复杂的，一部分原因是haskell本身的设计就不易于实现compiler，如lazy特性，static typed，类型推导等。关于GHC的内部实现有篇文章说的挺好，这里，文中在RTS一节中详细说了haskell的concurrent实现，里面提到了green thread，如果熟悉Go语言的话就会发现，ghc的concurrent实现和Go有点类
Java-Collections Framework学习与总结-LinkedHashMap BrokenDreams LinkedHashMap
前面总结了java.util.HashMap，了解了其内部由散列表实现，每个桶内是一个单向链表。那有没有双向链表的实现呢？双向链表的实现会具备什么特性呢？来看一下HashMap的一个子类——java.util.LinkedHashMap。
读《研磨设计模式》-代码笔记-抽象工厂模式-Abstract Factory bylijinnan abstract
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * Abstract Factory Pattern * 抽象工厂模式的目的是： * 通过在抽象工厂里面定义一组产品接口，方便地切换“产品簇” * 这些接口是相关或者相依赖的
压暗面部高光 cherishLC PS
方法一、压暗高光&重新着色当皮肤很油又使用闪光灯时，很容易在面部形成高光区域。下面讲一下我今天处理高光区域的心得：皮肤可以分为纹理和色彩两个属性。其中纹理主要由亮度通道（Lab模式的L通道）决定，色彩则由a、b通道确定。处理思路为在保持高光区域纹理的情况下，对高光区域着色。具体步骤为：降低高光区域的整体的亮度，再进行着色。如果想简化步骤，可以只进行着色（参看下面的步骤1
Java VisualVM监控远程JVM crabdave visualvm
Java VisualVM监控远程JVM JDK1.6开始自带的VisualVM就是不错的监控工具. 这个工具就在JAVA_HOME\bin\目录下的jvisualvm.exe, 双击这个文件就能看到界面通过JMX连接远程机器, 需要经过下面的配置: 1. 修改远程机器JDK配置文件 (我这里远程机器是linux).
Saiku去掉登录模块 daizj saiku 登录 olap BI
1、修改applicationContext-saiku-webapp.xml <security:intercept-url pattern="/rest/**" access="IS_AUTHENTICATED_ANONYMOUSLY" /> <security:intercept-url pattern=&qu
浅析 Flex中的Focus dsjt html Flex Flash
关键字：focus、 setFocus、 IFocusManager、KeyboardEvent 焦点、设置焦点、获得焦点、键盘事件一、无焦点的困扰——组件监听不到键盘事件原因：只有获得焦点的组件（确切说是InteractiveObject）才能监听到键盘事件的目标阶段；键盘事件（flash.events.KeyboardEvent）参与冒泡阶段，所以焦点组件的父项（以及它爸
Yii全局函数使用 dcj3sjt126com yii
由于YII致力于完美的整合第三方库，它并没有定义任何全局函数。yii中的每一个应用都需要全类别和对象范围。例如，Yii::app()->user;Yii::app()->params['name'];等等。我们可以自行设定全局函数，使得代码看起来更加简洁易用。(原文地址) 我们可以保存在globals.php在protected目录下。然后，在入口脚本index.php的，我们包括在
设计模式之单例模式二（解决无序写入的问题） come_for_dream 单例模式 volatile 乱序执行双重检验锁
在上篇文章中我们使用了双重检验锁的方式避免懒汉式单例模式下由于多线程造成的实例被多次创建的问题，但是因为由于JVM为了使得处理器内部的运算单元能充分利用，处理器可能会对输入代码进行乱序执行（Out Of Order Execute）优化，处理器会在计算之后将乱序执行的结果进行重组，保证该
程序员从初级到高级的蜕变 gcq511120594 框架工作 PHP android html5
软件开发是一个奇怪的行业，市场远远供不应求。这是一个已经存在多年的问题，而且随着时间的流逝，愈演愈烈。我们严重缺乏能够满足需求的人才。这个行业相当年轻。大多数软件项目是失败的。几乎所有的项目都会超出预算。我们解决问题的最佳指导方针可以归结为——“用一些通用方法去解决问题，当然这些方法常常不管用，于是，唯一能做的就是不断地尝试，逐个看看是否奏效”。现在我们把淫浸代码时间超过3年的开发人员称为
Reverse Linked List hcx2013 list
Reverse a singly linked list. /** * Definition for singly-linked list. * public class ListNode { * int val; * ListNode next; * ListNode(int x) { val = x; } * } */ p
Spring4.1新特性——数据库集成测试 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
C# Ajax上传图片同时生成微缩图(附Demo) liyonghui160com
1.Ajax无刷新上传图片,详情请阅我的这篇文章。（jquery + c# ashx） 2.C#位图处理 System.Drawing。 3.最新demo支持IE7,IE8,Fir
Java list三种遍历方法性能比较 pda158 java
从c/c++语言转向java开发，学习java语言list遍历的三种方法，顺便测试各种遍历方法的性能，测试方法为在ArrayList中插入1千万条记录，然后遍历ArrayList，发现了一个奇怪的现象，测试代码例如以下： package com.hisense.tiger.list; import java.util.ArrayList; import java.util.Iterator;
300个涵盖IT各方面的免费资源（上）——商业与市场篇 shoothao seo 商业与市场 IT资源免费资源
A.网站模板+logo+服务器主机+发票生成 HTML5 UP:响应式的HTML5和CSS3网站模板。 Bootswatch:免费的Bootstrap主题。 Templated:收集了845个免费的CSS和HTML5网站模板。 Wordpress.org|Wordpress.com:可免费创建你的新网站。 Strikingly:关注领域中免费无限的移动优
localStorage、sessionStorage uule localStorage
W3School 例子 HTML5 提供了两种在客户端存储数据的新方法： localStorage - 没有时间限制的数据存储 sessionStorage - 针对一个 session 的数据存储之前，这些都是由 cookie 完成的。但是 cookie 不适合大量数据的存储，因为它们由每个对服务器的请求来传递，这使得 cookie 速度很慢而且效率也不