倾城00

Hadoop笔记-生产调优篇

一：HDFS的核心参数
1.1NameNode生产环境内存
1.1NameNode心跳机制
- 1.3开启垃圾回收
二： HDFS的压测
2.1：测试HDFS的写性能压测
2.2：测试HDFS的读性能压测
2.3：测试HDFS的性能总结
三：HDFS多目录
- 3.1NameNode多目录配置
- 3.1DateNode多目录配置
四：HDFS的缩容和扩容
- 4.1 添加白名单
- 4.2 服役新数据节点
- 4.3 节点的数据平衡
- 4.4 黑名单退役节点
五：HDFS故障排除
- 5.1NameNode故障处理
- 5.2 集群安全模式&磁盘修复
- - 5.2.2 磁盘修复
- 5.3 慢磁盘监控
- 5.4 小文件归档
六：MapReduc的生产经验
- 6.1MapReduce生产跑的满的原因
- 6.2 MapReduce调优
- 6.3 MapReduce的数据倾斜
七：Yarn的生产经验
八：Hadoop的综合调优
- 8.1. Hadoop 小文件优化方法
- - 8.1.1 小文件的弊端
  - 8.1.2 小文件的处理办法
  - 8.1.3开启uber 模式
- 8.2. 测试MapReduce的压测
九：企业开发案例
- 9.1 HDFS 参数调优
- 9.2 MapReduce
- 9 .3 Yarn

一：HDFS的核心参数

1.1NameNode生产环境内存

(1)NameNode内存计算

每个文件块大概会占用150byte,一台服务器128为例：能存储多少个文件呢
128Gx1028（Mb)x1024(kb) x1024byte约等于9.1亿
在hadoop3.x中配置nameNode的内存
在hadoop-env.sh中

如果没有配置就是按照服务器的内存配置---->最大值
最小值也是这么配置的
接下来启动Hadoop
执行jps命令

datanode和NameNode获取的是相同的资源
问题1：NameNode是984，dataNode是984，但是如果都需要执行984，就会出现内存不够的情况，就会抢占Linux系统的资源，有可能会导致系统崩溃
推荐配置参考

nameNode是每增加1000000个数据块就增加1G内存
dataNode是内增加100000 0的副本就要增加1G内存

export HDFS_NAMENODE_OPTS="-Dhadoop.security.logger=INFO,RFAS -Xmx1024m"
export HDFS_DATANODE_OPTS="-Dhadoop.security.logger=ERROR,RFAS-Xmx1024m"

在配置文件中修改内存
修改保存将文件分发给另外两台服务器，然后重启集群，数据和配置的一样，修改成功

1.1NameNode心跳机制

集群中的DataNode要向NameNode去注册，

NameNode有一个工作线程池，用来处理不同的DataNode的并发心跳和元数据的操作，默认是10个线程

我们可以通过python来进行计算
导入函数库

-计算，3台服务器应该设置21
退出
修改vim hdfs-site.xml 进行配置
分发数据，在启动就会按照配置的进行执行了

1.3开启垃圾回收

开启垃圾回收功能，可以将删除的文件在不超时的情况下，将文件恢复回来，防止数据误删
默认值fs.trash.interval=0，表示禁用回收站，其他值表示设置回收站的存活时间
默认值fs.trash.checjpoint.interval=0回收站的间隔，如果为0则和上面的回收站存活时间相等
要走fs.trash.checjpoint.interval
配置垃圾回收的时间为2分钟
在 core-site.xml 中配置


 fs.trash.interval
 1

分发文件，重启集群
通过命令去删除集群上的文件

hadoop fs -rm /xxx -通过命令去删除文件，将会产生一个user命名的文件夹，里面存放的是你删除放进回收站的数据，等回收站时间一过，回收站的数据页会彻底消失

二： HDFS的压测

HDFS的读写性能主要受网络和磁盘的影响力比较大，为了更好演示将三台虚拟机设为100dps
–>右键虚拟机打开设置

将三台虚拟机都进行如下设置

这样可以通过ip地址+端口号进行下载，可以查看到下载的速度

2.1：测试HDFS的写性能压测

自己的每条虚拟机是4核的
上传文件的个数不能小于两台电脑电脑的核相加，我这个不能小于8

#进入到hadoop文件中
 hadoop jar /opt/module/hadoop-3.1.3/share/hadoop/mapreduce/hadoop-mapreduce-client-jobclient-3.1.3-tests.jar TestDFSIO -write -nrFiles 10 -fileSize 128M
# 测试写性能，测试1个文件，每个文件128MB

会发生错误，说你的内存需要2.4，但是你的虚拟内存只有2.1
原因：yarn的虚拟化内存中
假如：物理内存是4个G，虚拟内存是物理内存的2.1倍，那么他会虚拟出来8.1的内存因为你的linux会给java等等预留出5个G的内存，所以你实际获取到的内存会低于4个G，这内存就会产生浪费
所以，需要在yarn-site.xml中关掉虚拟内存


 yarn.nodemanager.vmem-check-enabled
 false

#配置完成之后，分发文件，在hadoop的目录执行sbin/stop-yarn.sh   sbin/start-yarn.sh    重启yarn

重新执行压测命令
我的是0.18m/s*20=3.6
网络的极限大概按照100来算，就是30m/s我的2.6和30相差很多
就可以通过固态硬盘，或者增加磁盘的个数

2.2：测试HDFS的读性能压测

读取的话就很快，因为是本地的读，按照就近原则

200多每秒，已经超过了网络的限制，因为没走网络，因为没走网络，所以这个数据就是和你的硬盘有关系了，和网络没关系

2.3：测试HDFS的性能总结

速度和网络磁盘有关系，网络的话就相办法提高网络
磁盘的话就想办法扩磁盘

三：HDFS多目录

3.1NameNode多目录配置

NameNode 多目录，增加数据的可靠性
之前配置的数据存储目录
在 hdfs-site.xml 中配置 ,然后分发文件


 dfs.namenode.name.dir
file://${hadoop.tmp.dir}/dfs/name1,file://${hadoop.tmp.
dir}/dfs/name2

因为重新配置了，需要将3台虚拟机上的数据格式化，不然会出错

rm -rf data/ logs/

在102上执行 hdfs namenode -format 格式化数据，然后其中hadoop集群
在data/dfs目录下就可以看到有两个NameNode 的路径了
两个NameNode的数据是一模一样的，这个因为是在一台集群上，所以不能算高可用，但是可以再另外一台在配置NameNode，实现高可用

3.1DateNode多目录配置

在hdfs-site.xml上配置


 dfs.datanode.data.dir
 
file://${hadoop.tmp.dir}/dfs/data1,file://${hadoop.tmp.
dir}/dfs/data2

分发数据

其他节点的data目录
在102上上传数据 hadoop fs -put wuguo.txt /
通过这二种方式去增加datanode相对的内存

四：HDFS的缩容和扩容

4.1 添加白名单

白名单：表名白名单的主机地址可以用来存储数据
企业中配置白名单可以防止黑客的恶意攻击和访问
配置白名单步骤如下
1.创建白名单
在/opt/module/hadoop-3.1.3/etc/hadoop新建whitelis文件
将我们需要进行配置白名单的联泰服务器放上去
继续创建 bldcklist文件
vim hdfs-site.xml中配置



 dfs.hosts
 /opt/module/hadoop-3.1.3/etc/hadoop/whitelis



 dfs.hosts.exclude
 /opt/module/hadoop-3.1.3/etc/hadoop/blacklist

将whitelist bldcklist hdfs-site.xml 这三个修改好的文件分发
如果是第一次添加白名单必须重启集群，如果不是第一次只需要刷新NameNode节点即可
冲洗启动发现只有两台服务器在跑
通过命令上传文件hadoop fs -put wuguo.txt /2

只有两台，现在是将104作为客户端，但是不会将数据存储在你这里
接下来在whitelis文件中将104也设置为可以访问，然后分发数据
通过hdfs dfsadmin -refreshNodes命令去刷新节点，就不用在重新启动了
重新查看恢复正常是3台
hadoop fs -put wuguo.txt /3 重新执行命令

4.2 服役新数据节点

1）随着公司业务的增长，数据量越来越大，原有的数据节点容量已经不能满足存储数据的需求，需要在原有的集群基础上动态添加新的数据节点，

克隆一台虚拟机 hapool105

vim /etc/sysconfig/network-scripts/ifcfg-ens33 
修改ip地址

vim /etc/hostname 
修改主机名称然后重启

- 在102上将hadoop和java拷贝到105上
- scp -r module/* 192.168.116.135:/opt/module/
- 拷贝环境变量
- sudo scp /etc/profile.d/my_env.sh  192.168.116.135:/etc/profile.d
- 在105上执行 source /etc/profile
- 然后再102-103-104上执行vim /etc/hosts，全部修改

- 在102上-103上-104上  配置ssh(普通用户)
- cd .ssh/
- ssh-copy-id hapool105
- 配置完毕之后在105上的hadoop下 rm -rf data/ logs/
- 在102上给白名单新增hapool105，然后分发 刷新  hdfs dfsadmin -refreshNodes

确保这4台集群上都有白名单，然后再105上启动
如果配置了还没生效就在102上继续刷新一次
在105上 hadoop fs -put wuguo.txt /78上传数据

4.3 节点的数据平衡

刚才服役了一台服务器
在开发中，如果经常在hapool10和hapool104上提交任务且副本数为2，由于数据本地性的原则就会导致hapool102和hapool104上的数据过多，hapool103的数据就会过少，
另一种情况就会导致新服役的服务器数据量比较少，就需要执行负载均衡的命令

[liuxingyu@hapool103 hadoop-3.1.3]$ sbin/start-balancer.sh -threshoud 10

对于参数10代表的是集群中各个节点的磁盘空间利用率不超过10%可根据实际情况调整
停止负载均衡的命令
sbin/start-balancer.sh

4.4 黑名单退役节点

上了黑名单的主机ip地址不可以用来存储数据

-编辑/opt/module/hadoop-3.1.3/etc/hadoop 目录下的 blacklis文件
添加需要进入黑名单的主机名称
hadoop105
需要在 hdfs-site.xml 配置文件中增加 dfs.hosts 配置参数


 dfs.hosts.exclude
 /opt/module/hadoop-3.1.3/etc/hadoop/blacklist

分发文件，重启服务器
在105上也进行同样的操作（只需要配置好）
服务器在退役的时候会将自己保存的数据备份给别的服务器，防止数据丢失
数据较多的话需要执行负载均衡

-最后执行命令，关闭105的节点即可
yarn --daemon stop nodemanager
hdfs --daemon stop datanode

服务器完全的退出是10分钟+30秒（默认的）

五：HDFS故障排除

5.1NameNode故障处理

将namenode的数据杀死

如果只是因为进程挂了用hdfs --daemon start namenode命令
接下来再次关掉进程，删除/opt/module/hadoop-3.1.3/data/dfs下的所有文件
-再次重新启动发现启动不起来
可以查看NameNode的日志
tail -n 100 hadoop-liuxingyu-namenode-hapool102.log

在104上也就是2nn上有个一namesecondary

执行拷贝

将2nn里面的数据拷贝到102的当前目录
重新执行hdfs --daemon start namenode
即可启动成功

5.2 集群安全模式&磁盘修复

集群在启动的时候会进入到安全模式

30s之后安全模式就会退出
1)安全模式：文件系统接受读数据请求：而不接受修改删除的请求
2）进入到安全模式的场景
NameNode在加载镜像文件和编辑日志期间处于安全模式
NameNode在接受DateNode注册时，处于安全模式
退出安全模式的条件

4）基本语法
集群处于安全模式，不能执行重要操作（写操作）集群启动完成后，自动退出安全模式
（1）bin/hdfs dfsadmin -safemode get （功能描述：查看安全模式状态）
（2）bin/hdfs dfsadmin -safemode enter （功能描述：进入安全模式状态）
（3）bin/hdfs dfsadmin -safemode leave（功能描述：离开安全模式状态）
（4）bin/hdfs dfsadmin -safemode wait （功能描述：等待安全模式状态）

5.2.2 磁盘修复

数据块村怀进入到安全模式，如何处理
102上
103上
在3台服务器上全部删除2个文件块

rm -rf blk_10737418255 blk_1073741825_1001.meta  blk_1073741826 blk_1073741826_1002.meta

NameNode是默认6个小时DateNode才会回报一次，所以现在NameNode是不知道文件损坏的，应该重启一下集群

看这里，大概讲的是这个快3个如果你在添加一个块就会达到这个0.999的标准了，以为总共块是5个，然后就会一直卡在这，一直离不开安全模式
解决办法：采用命令：
解决办法：1.找专业的人做磁盘修复
1. 如果数据不重要删除元数据
不然下次启动还是安全模式
删除元数据之后就不会再进入到安全模式了
模拟等待安全模式
如果集群进入了安全模式
然后执行了hdfs dfsadmin -safemode wait 并上换了一个文件
此时就会产生阻塞的状态，文件无法上传，需要执行离开安全模式的命令才会结束堵塞

5.3 慢磁盘监控

“慢磁盘”指的时写入数据非常慢的一类磁盘。其实慢性磁盘并不少见，当机器运行时
间长了，上面跑的任务多了，磁盘的读写性能自然会退化，严重时就会出现写入数据延时的
尚硅谷大数据技术之 Hadoop（生产调优手册）
如何发现慢磁盘？
正常在 HDFS 上创建一个目录，只需要不到 1s 的时间。如果你发现创建目录超过 1 分
钟及以上，而且这个现象并不是每次都有。只是偶尔慢了一下，就很有可能存在慢磁盘。
可以采用如下方法找出是哪块磁盘慢：
1. 跟NameNode通讯时间是不会超过2的，可是如果你的磁盘是慢磁盘他就会超过2
  
  -2 通过命令测试

#通过命令进行安装
sudo yum install -y fio

（1）顺序读测试

[atguigu@hadoop102 ~]# sudo yum install -y fio
[atguigu@hadoop102 ~]# sudo fio -
filename=/home/atguigu/test.log -direct=1 -iodepth 1 -thread -
rw=read -ioengine=psync -bs=16k -size=2G -numjobs=10 -
runtime=60 -group_reporting -name=test_r
Run status group 0 (all jobs):
 READ: bw=360MiB/s (378MB/s), 360MiB/s-360MiB/s (378MB/s-378MB/s), 
io=20.0GiB (21.5GB), run=56885-56885msec
结果显示，磁盘的总体顺序读速度为 360MiB/s。

（2）顺序写测试

[atguigu@hadoop102 ~]# sudo fio -
filename=/home/atguigu/test.log -direct=1 -iodepth 1 -thread -
rw=write -ioengine=psync -bs=16k -size=2G -numjobs=10 -
runtime=60 -group_reporting -name=test_w
Run status group 0 (all jobs):
 WRITE: bw=341MiB/s (357MB/s), 341MiB/s-341MiB/s (357MB/s357MB/s), io=19.0GiB (21.4GB), run=60001-60001msec
结果显示，磁盘的总体顺序写速度为 341MiB/s。

-（3）随机写测试

[atguigu@hadoop102 ~]# sudo fio -
filename=/home/atguigu/test.log -direct=1 -iodepth 1 -thread -
rw=randwrite -ioengine=psync -bs=16k -size=2G -numjobs=10 -
runtime=60 -group_reporting -name=test_randw
Run status group 0 (all jobs):
 WRITE: bw=309MiB/s (324MB/s), 309MiB/s-309MiB/s (324MB/s-324MB/s), 
io=18.1GiB (19.4GB), run=60001-60001msec
结果显示，磁盘的总体随机写速度为 309MiB/s。

（4）混合随机读写：

[atguigu@hadoop102 ~]# sudo fio -
filename=/home/atguigu/test.log -direct=1 -iodepth 1 -thread -
rw=randrw -rwmixread=70 -ioengine=psync -bs=16k -size=2G -
numjobs=10 -runtime=60 -group_reporting -name=test_r_w -
ioscheduler=noop
Run status group 0 (all jobs):
 READ: bw=220MiB/s (231MB/s), 220MiB/s-220MiB/s (231MB/s231MB/s), io=12.9GiB (13.9GB), run=60001-60001msec
WRITE: bw=94.6MiB/s (99.2MB/s), 94.6MiB/s-94.6MiB/s 
(99.2MB/s-99.2MB/s), io=5674MiB (5950MB), run=60001-60001mse

5.4 小文件归档

1） Hdfs存储小文件的弊端

每个文件均按块存储，每个块的元数据存储在 NameNode 的内存中，因此 HDFS 存储
小文件会非常低效。因为大量的小文件会耗尽 NameNode 中的大部分内存。但注意，存储小
文件所需要的磁盘容量和数据块的大小无关。例如，一个 1MB 的文件设置为 128MB 的块
存储，实际使用的是 1MB 的磁盘空间，而不是 128MB。
2）解决存储小文件办法之一
HDFS 存档文件或 HAR 文件，是一个更高效的文件存档工具，它将文件存入 HDFS 块，
在减少 NameNode 内存使用的同时，允许对文件进行透明的访问。具体说来，HDFS 存档文
件对内还是一个一个独立文件，对 NameNode 而言却是一个整体，减少了 NameNode 的内
存
将input的所有文件归档成一起
把/input 目录里面的所有文件归档成一个叫 input.har 的归档文件，并把归档后文件存储
到/output 路径下。

hadoop archive -archiveName  input.har -p /input /output
（3）查看归档
 hadoop fs -ls /output/input.har
 hadoop fs -ls har:///output/input.har
（4）解归档文件
 hadoop fs -cp har:///output/input.har /

六：MapReduc的生产经验

6.1MapReduce生产跑的满的原因

1）计算机的性能
CPU ,内存，磁盘速度，网络
2）
数据倾斜
Map运行时间太长，导致Reduce等待过久
小文件太多

6.2 MapReduce调优

6.3 MapReduce的数据倾斜

数据频率倾斜------某一个区域的数量要大于其他的区域
数据大小倾斜------部分记录的大小要远远大于平均值
2）减少数据倾斜的办法：
（1）检查是否空值过多导致数据倾斜
审查环境可以直接过滤掉空值，如果想保留空值那就自定义分区，将空值+随机数打散，在进行二次聚合
（2）在Map阶段提前处理，最好现在Map阶段处理，如：Combiner，MapJoin
（3）设置多个Reduce的个数
.

七：Yarn的生产经验

-------

八：Hadoop的综合调优

8.1. Hadoop 小文件优化方法

8.1.1 小文件的弊端

HDFS 上每个文件都要在 NameNode 上创建对应的元数据，这个元数据的大小约为
150byte，这样当小文件比较多的时候，就会产生很多的元数据文件，一方面会大量占用
NameNode 的内存空间，另一方面就是元数据文件过多，使得寻址索引速度变慢。
小文件过多，在进行 MR 计算时，会生成过多切片，需要启动过多的 MapTask。每个
MapTask 处理的数据量小，导致 MapTask 的处理时间比启动时间还小，白白消耗资源。

8.1.2 小文件的处理办法

1）在数据采集的时候，就将小文件或小批数据合成大文件再上传 HDFS（数据源头）
2）Hadoop Archive（存储方向）
是一个高效的将小文件放入 HDFS 块中的文件存档工具，能够将多个小文件打包成一
个 HAR 文件，从而达到减少 NameNode 的内存使用
3）CombineTextInputFormat（计算方向）
CombineTextInputFormat 用于将多个小文件在切片过程中生成一个单独的切片或者少
量的切片。
4）开启 uber 模式，实现 JVM 重用（计算方向）
默认情况下，每个 Task 任务都需要启动一个 JVM 来运行，如果 Task 任务计算的数据
量很小，我们可以让同一个 Job 的多个 Task 运行在一个 JVM 中，不必为每个 Task 都开启
一个 JVM。

# 执行任务发现uber 默认是关闭的
 hadoop jar  share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.3.jar  wordcount /input /output2

8.1.3开启uber 模式

（4）开启 uber 模式，在 mapred-site.xml 中添加如下配置



 mapreduce.job.ubertask.enable
 true

 

 mapreduce.job.ubertask.maxmaps
 9



 mapreduce.job.ubertask.maxreduces
 1



 mapreduce.job.ubertask.maxbytes

看一下数值的默认值
默认是关闭的
MapTask的个数，可向下修改
最大Reduce的个数
最大输入数据量，默认是Block大小（128）
修改完数据进行分发，不用重启
hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.3.jar wordcount /input /output3
重新执行
发现已经启动了
总共1个容器
为什么只有一个容器大家公用哪个一个容器，较少开关的时间，对小文件处理起来比较友好

8.2. 测试MapReduce的压测

九：企业开发案例

需求：从1个G的数据中，统计每个单词的出现的次数，服务器3台，每台配置4G内存，4核CPU，4线程
（1）需求：从 1G 数据中，统计每个单词出现次数。服务器 3 台，每台配置 4G 内存，
4 核 CPU，4 线程。
（2）需求分析：
1G / 128m = 8 个 MapTask；1 个 ReduceTask；1 个 mrAppMaster
平均每个节点运行 10 个 / 3 台 ≈ 3 个任务（4 3 3）

9.1 HDFS 参数调优

（1）修改：hadoop-env.sh

export HDFS_NAMENODE_OPTS="-Dhadoop.security.logger=INFO,RFAS -
Xmx1024m"
export HDFS_DATANODE_OPTS="-Dhadoop.security.logger=ERROR,RFAS
-Xmx1024m"

（2）修改 hdfs-site.xml



 dfs.namenode.handler.count
 21

（3）修改 core-site.xml



 fs.trash.interval
60

9.2 MapReduce

（1）修改 mapred-site.xml



 mapreduce.task.io.sort.mb
 100



 mapreduce.map.sort.spill.percent
 0.80



 mapreduce.task.io.sort.factor
 10



 mapreduce.map.memory.mb
 -1
 The amount of memory to request from the 
scheduler for each map task. If this is not specified or is 
non-positive, it is inferred from mapreduce.map.java.opts and 
mapreduce.job.heap.memory-mb.ratio. If java-opts are also not 
specified, we set it to 1024.
 



 mapreduce.map.cpu.vcores
 1



 mapreduce.map.maxattempts
 4



 mapreduce.reduce.shuffle.parallelcopies
 5



 mapreduce.reduce.shuffle.input.buffer.percent
 0.70



 mapreduce.reduce.shuffle.merge.percent
 0.66



 mapreduce.reduce.memory.mb
 -1
 The amount of memory to request from the 
scheduler for each reduce task. If this is not specified or 
is non-positive, it is inferred
 from mapreduce.reduce.java.opts and 
mapreduce.job.heap.memory-mb.ratio.
 If java-opts are also not specified, we set it to 1024.
 



 mapreduce.reduce.cpu.vcores
 2



 mapreduce.reduce.maxattempts
 4



 mapreduce.job.reduce.slowstart.completedmaps
 0.05



 mapreduce.task.timeout
 600000

9 .3 Yarn

（1）修改 yarn-site.xml 配置参数如下：



The class to use as the resource scheduler.
yarn.resourcemanager.scheduler.class
org.apache.hadoop.yarn.server.resourcemanager.scheduler.capaci
ty.CapacityScheduler



Number of threads to handle scheduler 
interface.
yarn.resourcemanager.scheduler.client.thread-count
8



Enable auto-detection of node capabilities such as
memory and CPU.

yarn.nodemanager.resource.detect-hardware-capabilities
false



Flag to determine if logical processors(such as
hyperthreads) should be counted as cores. Only applicable on Linux
when yarn.nodemanager.resource.cpu-vcores is set to -1 and
yarn.nodemanager.resource.detect-hardware-capabilities is true.

yarn.nodemanager.resource.count-logical-processors-ascores
false



Multiplier to determine how to convert phyiscal cores to
vcores. This value is used if yarn.nodemanager.resource.cpu-vcores
is set to -1(which implies auto-calculate vcores) and
yarn.nodemanager.resource.detect-hardware-capabilities is set to true. 
The number of vcores will be calculated as number of CPUs * multiplier.

yarn.nodemanager.resource.pcores-vcores-multiplier
1.0



Amount of physical memory, in MB, that can be allocated 
for containers. If set to -1 and
yarn.nodemanager.resource.detect-hardware-capabilities is true, it is
automatically calculated(in case of Windows and Linux).
In other cases, the default is 8192MB.

yarn.nodemanager.resource.memory-mb
4096



Number of vcores that can be allocated
for containers. This is used by the RM scheduler when allocating
resources for containers. This is not used to limit the number of
CPUs used by YARN containers. If it is set to -1 and
yarn.nodemanager.resource.detect-hardware-capabilities is true, it is
automatically determined from the hardware in case of Windows and Linux.
In other cases, number of vcores is 8 by default.
yarn.nodemanager.resource.cpu-vcores
4



The minimum allocation for every container request at the 
RM in MBs. Memory requests lower than this will be set to the value of 
this property. Additionally, a node manager that is configured to have 
less memory than this value will be shut down by the resource manager.

yarn.scheduler.minimum-allocation-mb
1024



The maximum allocation for every container request at the 
RM in MBs. Memory requests higher than this will throw an
InvalidResourceRequestException.

yarn.scheduler.maximum-allocation-mb
2048



The minimum allocation for every container request at the 
RM in terms of virtual CPU cores. Requests lower than this will be set to 
the value of this property. Additionally, a node manager that is configured 
to have fewer virtual cores than this value will be shut down by the 
resource manager.

yarn.scheduler.minimum-allocation-vcores
1



The maximum allocation for every container request at the 
RM in terms of virtual CPU cores. Requests higher than this will throw an
InvalidResourceRequestException.
yarn.scheduler.maximum-allocation-vcores
2



Whether virtual memory limits will be enforced for
containers.
yarn.nodemanager.vmem-check-enabled
false



Ratio between virtual memory to physical memory when
setting memory limits for containers. Container allocations are
expressed in terms of physical memory, and virtual memory usage is 
allowed to exceed this allocation by this ratio.

yarn.nodemanager.vmem-pmem-ratio
2.1

你可能感兴趣的:(Hadoop,hadoop,java,大数据)

Long类型前后端数据不一致 igotyback 前端
响应给前端的数据浏览器控制台中response中看到的Long类型的数据是正常的到前端数据不一致前后端数据类型不匹配是一个常见问题，尤其是当后端使用Java的Long类型（64位）与前端JavaScript的Number类型（最大安全整数为2^53-1，即16位）进行数据交互时，很容易出现精度丢失的问题。这是因为JavaScript中的Number类型无法安全地表示超过16位的整数。为了解决这个问
LocalDateTime 转 String igotyback java 开发语言
importjava.time.LocalDateTime;importjava.time.format.DateTimeFormatter;publicclassMain{publicstaticvoidmain(String[]args){//获取当前时间LocalDateTimenow=LocalDateTime.now();//定义日期格式化器DateTimeFormatterformat
Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
DIV+CSS+JavaScript技术制作网页（旅游主题网页设计与制作）云南大理 STU学生网页设计网页设计期末网页作业 html静态网页 html5期末大作业网页设计 web大作业
️精彩专栏推荐作者主页:【进入主页—获取更多源码】web前端期末大作业：【HTML5网页期末作业(1000套)】程序员有趣的告白方式：【HTML七夕情人节表白网页制作(110套)】文章目录二、网站介绍三、网站效果▶️1.视频演示2.图片演示四、网站代码HTML结构代码CSS样式代码五、更多源码二、网站介绍网站布局方面：计划采用目前主流的、能兼容各大主流浏览器、显示效果稳定的浮动网页布局结构。网站程
【华为OD机试真题2023B卷 JAVA&JS】We Are A Team 若博豆 java 算法华为 javascript
华为OD2023（B卷）机试题库全覆盖，刷题指南点这里WeAreATeam时间限制：1秒|内存限制：32768K|语言限制：不限题目描述：总共有n个人在机房，每个人有一个标号（1<=标号<=n），他们分成了多个团队，需要你根据收到的m条消息判定指定的两个人是否在一个团队中，具体的：1、消息构成为：abc，整数a、b分别代
关于城市旅游的HTML网页设计——(旅游风景云南 5页)HTML+CSS+JavaScript 二挡起步 web前端期末大作业 javascript html css 旅游风景
⛵源码获取文末联系✈Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业|游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作|HTML期末大学生网页设计作业，Web大学生网页HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScrip
HTML网页设计制作大作业（div+css）云南我的家乡旅游景点带文字滚动二挡起步 web前端期末大作业 web设计网页规划与设计 html css javascript dreamweaver 前端
Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线
node.js学习小猿L node.js node.js 学习 vim
node.js学习实操及笔记温故node.js，node.js学习实操过程及笔记~node.js学习视频node.js官网node.js中文网实操笔记githubcsdn笔记为什么学node.js可以让别人访问我们编写的网页为后续的框架学习打下基础，三大框架vuereactangular离不开node.jsnode.js是什么官网：node.js是一个开源的、跨平台的运行JavaScript的运行
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
Java 重写(Override)与重载(Overload) 叨唧唧的
Java重写(Override)与重载(Overload)重写(Override)重写是子类对父类的允许访问的方法的实现过程进行重新编写,返回值和形参都不能改变。即外壳不变，核心重写！重写的好处在于子类可以根据需要，定义特定于自己的行为。也就是说子类能够根据需要实现父类的方法。重写方法不能抛出新的检查异常或者比被重写方法申明更加宽泛的异常。例如：父类的一个方法申明了一个检查异常IOExceptio
简单了解 JVM 记得开心一点啊 jvm
目录♫什么是JVM♫JVM的运行流程♫JVM运行时数据区♪虚拟机栈♪本地方法栈♪堆♪程序计数器♪方法区/元数据区♫类加载的过程♫双亲委派模型♫垃圾回收机制♫什么是JVMJVM是JavaVirtualMachine的简称，意为Java虚拟机。虚拟机是指通过软件模拟的具有完整硬件功能的、运行在一个完全隔离的环境中的完整计算机系统（如：JVM、VMwave、VirtualBox）。JVM和其他两个虚拟机
1分钟解决 -bash: mvn: command not found，在Centos 7中安装Maven Energet!c 开发语言
1分钟解决-bash:mvn:commandnotfound，在Centos7中安装Maven检查Java环境1下载Maven2解压Maven3配置环境变量4验证安装5常见问题与注意事项6总结检查Java环境Maven依赖Java环境，请确保系统已经安装了Java并配置了环境变量。可以通过以下命令检查：java-version如果未安装，请先安装Java。1下载Maven从官网下载：前往Apach
Java企业面试题3 马龙强_ java
1.break和continue的作用(智*图)break：用于完全退出一个循环（如for,while）或一个switch语句。当在循环体内遇到break语句时，程序会立即跳出当前循环体，继续执行循环之后的代码。continue：用于跳过当前循环体中剩余的部分，并开始下一次循环。如果是在for循环中使用continue，则会直接进行条件判断以决定是否执行下一轮循环。2.if分支语句和switch分
JVM、JRE和 JDK：理解Java开发的三大核心组件 Y雨何时停T Java java
Java是一门跨平台的编程语言，它的成功离不开背后强大的运行环境与开发工具的支持。在Java的生态中，JVM（Java虚拟机）、JRE（Java运行时环境）和JDK（Java开发工具包）是三个至关重要的核心组件。本文将探讨JVM、JDK和JRE的区别，帮助你更好地理解Java的运行机制。1.JVM：Java虚拟机（JavaVirtualMachine）什么是JVM？JVM，即Java虚拟机，是Ja
Java面试题精选：消息队列(二) 芒果不是芒 Java面试题精选 java kafka
一、Kafka的特性1.消息持久化：消息存储在磁盘，所以消息不会丢失2.高吞吐量：可以轻松实现单机百万级别的并发3.扩展性：扩展性强，还是动态扩展4.多客户端支持：支持多种语言（Java、C、C++、GO、）5.KafkaStreams（一个天生的流处理）:在双十一或者销售大屏就会用到这种流处理。使用KafkaStreams可以快速的把销售额统计出来6.安全机制：Kafka进行生产或者消费的时候会
白骑士的Java教学基础篇 2.5 控制流语句白骑士所长 Java 教学 java 开发语言
欢迎继续学习Java编程的基础篇！在前面的章节中，我们了解了Java的变量、数据类型和运算符。接下来，我们将探讨Java中的控制流语句。控制流语句用于控制程序的执行顺序，使我们能够根据特定条件执行不同的代码块，或重复执行某段代码。这是编写复杂程序的基础。通过学习这一节内容，你将掌握如何使用条件语句和循环语句来编写更加灵活和高效的代码。条件语句条件语句用于根据条件的真假来执行不同的代码块。if语句‘
python语法——三目运算符 HappyRocking python python 三目运算符
在java中，有三目运算符，如：intc=(a>b)?a:b表示c取两者中的较大值。但是在python，不能直接这样使用，估计是因为冒号在python有分行的关键作用。那么在python中，如何实现类似功能呢？可以使用ifelse语句，也是一行可以完成，格式为：aifbelsec表示如果b为True，则表达式等于a，否则等于c。如：c=(aif(a>b)elseb)同样是完成了取最大值的功能。
ArrayList 源码解析程序猿进阶 Java基础 ArrayList List java 面试性能优化架构设计 idea
ArrayList是Java集合框架中的一个动态数组实现，提供了可变大小的数组功能。它继承自AbstractList并实现了List接口，是顺序容器，即元素存放的数据与放进去的顺序相同，允许放入null元素，底层通过数组实现。除该类未实现同步外，其余跟Vector大致相同。每个ArrayList都有一个容量capacity，表示底层数组的实际大小，容器内存储元素的个数不能多于当前容量。当向容器中添
Java爬虫框架（一）--架构设计狼图腾-狼之传说 java 框架 java 任务 html解析器存储电子商务
一、架构图那里搜网络爬虫框架主要针对电子商务网站进行数据爬取，分析，存储，索引。爬虫：爬虫负责爬取，解析，处理电子商务网站的网页的内容数据库：存储商品信息索引：商品的全文搜索索引Task队列：需要爬取的网页列表Visited表：已经爬取过的网页列表爬虫监控平台：web平台可以启动，停止爬虫，管理爬虫，task队列，visited表。二、爬虫1.流程1)Scheduler启动爬虫器，TaskMast
Java：爬虫框架 dingcho Java java 爬虫
一、ApacheNutch2【参考地址】Nutch是一个开源Java实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。Nutch致力于让每个人能很容易,同时花费很少就可以配置世界一流的Web搜索引擎.为了完成这一宏伟的目标,Nutch必须能够做到:每个月取几十亿网页为这些网页维护一个索引对索引文件进行每秒上千次的搜索提供高质量的搜索结果简单来说Nutch支持分
python怎么将png转为tif_png转tif weixin_39977276
发国外的文章要求图片是tif，cmyk色彩空间的。大小尺寸还有要求。比如网上大神多，找到了一段代码，感谢！https://www.jianshu.com/p/ec2af4311f56https://github.com/KevinZc007/image2Tifimportjava.awt.image.BufferedImage;importjava.io.File;importjava.io.Fi
JavaScript 中，深拷贝（Deep Copy）和浅拷贝（Shallow Copy）跳房子的前端前端面试 javascript 开发语言 ecmascript
在JavaScript中，深拷贝（DeepCopy）和浅拷贝（ShallowCopy）是用于复制对象或数组的两种不同方法。了解它们的区别和应用场景对于避免潜在的bugs和高效地处理数据非常重要。以下是对深拷贝和浅拷贝的详细解释，包括它们的概念、用途、优缺点以及实现方式。1.浅拷贝（ShallowCopy）概念定义：浅拷贝是指创建一个新的对象或数组，其中包含了原对象或数组的基本数据类型的值和对引用数
JAVA·一个简单的登录窗口 MortalTom java 开发语言学习
文章目录概要整体架构流程技术名词解释技术细节资源概要JavaSwing是Java基础类库的一部分，主要用于开发图形用户界面（GUI）程序整体架构流程新建项目，导入sql.jar包（链接放在了文末），编译项目并运行技术名词解释一、特点丰富的组件提供了多种可视化组件，如按钮（JButton）、文本框（JTextField）、标签（JLabel）、下拉列表（JComboBox）等，可以满足不同的界面设计
WebMagic：强大的Java爬虫框架解析与实战 Aaron_945 Java java 爬虫开发语言
文章目录引言官网链接WebMagic原理概述基础使用1.添加依赖2.编写PageProcessor高级使用1.自定义Pipeline2.分布式抓取优点结论引言在大数据时代，网络爬虫作为数据收集的重要工具，扮演着不可或缺的角色。Java作为一门广泛使用的编程语言，在爬虫开发领域也有其独特的优势。WebMagic是一个开源的Java爬虫框架，它提供了简单灵活的API，支持多线程、分布式抓取，以及丰富的
博客网站制作教程 2401_85194651 java maven
首先就是技术框架：后端：Java+SpringBoot数据库：MySQL前端：Vue.js数据库连接：JPA(JavaPersistenceAPI)1.项目结构blog-app/├──backend/│├──src/main/java/com/example/blogapp/││├──BlogApplication.java││├──config/│││└──DatabaseConfig.java
00. 这里整理了最全的爬虫框架（Java + Python）有一只柴犬爬虫系列爬虫 java python
目录1、前言2、什么是网络爬虫3、常见的爬虫框架3.1、java框架3.1.1、WebMagic3.1.2、Jsoup3.1.3、HttpClient3.1.4、Crawler4j3.1.5、HtmlUnit3.1.6、Selenium3.2、Python框架3.2.1、Scrapy3.2.2、BeautifulSoup+Requests3.2.3、Selenium3.2.4、PyQuery3.2
JAVA学习笔记之23种设计模式学习 victorfreedom Java技术设计模式 android java 常用设计模式
博主最近买了《设计模式》这本书来学习，无奈这本书是以C++语言为基础进行说明，整个学习流程下来效率不是很高，虽然有的设计模式通俗易懂，但感觉还是没有充分的掌握了所有的设计模式。于是博主百度了一番，发现有大神写过了这方面的问题，于是博主迅速拿来学习。一、设计模式的分类总体来说设计模式分为三大类：创建型模式，共五种：工厂方法模式、抽象工厂模式、单例模式、建造者模式、原型模式。结构型模式，共七种：适配器
JavaScript `Map` 和 `WeakMap`详细解释跳房子的前端 JavaScript 原生方法 javascript 前端开发语言
在JavaScript中，Map和WeakMap都是用于存储键值对的数据结构，但它们有一些关键的不同之处。MapMap是一种可以存储任意类型的键值对的集合。它保持了键值对的插入顺序，并且可以通过键快速查找对应的值。Map提供了一些非常有用的方法和属性来操作这些数据对：set(key,value):将一个键值对添加到Map中。如果键已经存在，则更新其对应的值。get(key):获取指定键的值。如果键
免费的GPT可在线直接使用（一键收藏） kkai人工智能 gpt
1、LuminAI（https://kk.zlrxjh.top）LuminAI标志着一款融合了星辰大数据模型与文脉深度模型的先进知识增强型语言处理系统，旨在自然语言处理（NLP）的技术开发领域发光发热。此系统展现了卓越的语义把握与内容生成能力，轻松驾驭多样化的自然语言处理任务。VisionAI在NLP界的应用领域广泛，能够胜任从机器翻译、文本概要撰写、情绪分析到问答等众多任务。通过对大量文本数据的
HQL之投影查询归来朝歌 HQL Hibernate 查询语句投影查询
在HQL查询中，常常面临这样一个场景，对于多表查询，是要将一个表的对象查出来还是要只需要每个表中的几个字段，最后放在一起显示？针对上面的场景，如果需要将一个对象查出来： HQL语句写“from 对象”即可 Session session = HibernateUtil.openSession();
Spring整合redis bylijinnan redis
pom.xml <dependencies>  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redi
org.hibernate.NonUniqueResultException: query did not return a unique result: 2 0624chenhong Hibernate
参考：http://blog.csdn.net/qingfeilee/article/details/7052736 org.hibernate.NonUniqueResultException: query did not return a unique result: 2 在项目中出现了org.hiber
android动画效果不懂事的小屁孩 android动画
前几天弄alertdialog和popupwindow的时候，用到了android的动画效果，今天专门研究了一下关于android的动画效果，列出来，方便以后使用。 Android 平台提供了两类动画。一类是Tween动画，就是对场景里的对象不断的进行图像变化来产生动画效果（旋转、平移、放缩和渐变）。第二类就是 Frame动画，即顺序的播放事先做好的图像，与gif图片原理类似。
js delete 删除机理以及它的内存泄露问题的解决方案换个号韩国红果果 JavaScript
delete删除属性时只是解除了属性与对象的绑定，故当属性值为一个对象时，删除时会造成内存泄露（其实还未删除）举例： var person={name:{firstname:'bob'}} var p=person.name delete person.name p.firstname -->'bob' // 依然可以访问p.firstname，存在内存泄露
Oracle将零干预分析加入网络即服务计划蓝儿唯美 oracle
由Oracle通信技术部门主导的演示项目并没有在本月较早前法国南斯举行的行业集团TM论坛大会中获得嘉奖。但是，Oracle通信官员解雇致力于打造一个支持零干预分配和编制功能的网络即服务（NaaS）平台，帮助企业以更灵活和更适合云的方式实现通信服务提供商（CSP）的连接产品。这个Oracle主导的项目属于TM Forum Live!活动上展示的Catalyst计划的19个项目之一。Catalyst计
spring学习——springmvc（二） a-john springMVC
Spring MVC提供了非常方便的文件上传功能。 1，配置Spring支持文件上传： DispatcherServlet本身并不知道如何处理multipart的表单数据，需要一个multipart解析器把POST请求的multipart数据中抽取出来，这样DispatcherServlet就能将其传递给我们的控制器了。为了在Spring中注册multipart解析器，需要声明一个实现了Mul
POJ-2828-Buy Tickets aijuans ACM_POJ
POJ-2828-Buy Tickets http://poj.org/problem?id=2828 线段树，逆序插入 #include<iostream>#include<cstdio>#include<cstring>#include<cstdlib>using namespace std;#define N 200010struct
Java Ant build.xml详解 asia007 build.xml
1,什么是antant是构建工具2,什么是构建概念到处可查到，形象来说，你要把代码从某个地方拿来，编译，再拷贝到某个地方去等等操作，当然不仅与此，但是主要用来干这个3,ant的好处跨平台 --因为ant是使用java实现的，所以它跨平台使用简单--与ant的兄弟make比起来语法清晰--同样是和make相比功能强大--ant能做的事情很多，可能你用了很久，你仍然不知道它能有
android按钮监听器的四种技术百合不是茶 android xml配置监听器实现接口
android开发中经常会用到各种各样的监听器,android监听器的写法与java又有不同的地方; 1,activity中使用内部类实现接口 ,创建内部类实例使用add方法与java类似创建监听器的实例 myLis lis = new myLis(); 使用add方法给按钮添加监听器
软件架构师不等同于资深程序员 bijian1013 程序员架构师架构设计
本文的作者Armel Nene是ETAPIX Global公司的首席架构师，他居住在伦敦，他参与过的开源项目包括 Apache Lucene,，Apache Nutch， Liferay 和 Pentaho等。如今很多的公司
TeamForge Wiki Syntax & CollabNet User Information Center sunjing TeamForge How do Attachement Anchor Wiki Syntax
the CollabNet user information center http://help.collab.net/ How do I create a new Wiki page? A CollabNet TeamForge project can have any number of Wiki pages. All Wiki pages are linked, and
【Redis四】Redis数据类型 bit1129 redis
概述 Redis是一个高性能的数据结构服务器，称之为数据结构服务器的原因是，它提供了丰富的数据类型以满足不同的应用场景，本文对Redis的数据类型以及对这些类型可能的操作进行总结。 Redis常用的数据类型包括string、set、list、hash以及sorted set.Redis本身是K/V系统，这里的数据类型指的是value的类型，而不是key的类型，key的类型只有一种即string
SSH2整合-附源码白糖_ eclipse spring tomcat Hibernate Google
今天用eclipse终于整合出了struts2+hibernate+spring框架。我创建的是tomcat项目，需要有tomcat插件。导入项目以后，鼠标右键选择属性，然后再找到“tomcat”项，勾选一下“Is a tomcat project”即可。具体方法见源码里的jsp图片，sql也在源码里。补充1：项目中部分jar包不是最新版的，可能导
[转]开源项目代码的学习方法 braveCS 学习方法
转自： http://blog.sina.com.cn/s/blog_693458530100lk5m.html http://www.cnblogs.com/west-link/archive/2011/06/07/2074466.html 1）阅读features。以此来搞清楚该项目有哪些特性2）思考。想想如果自己来做有这些features的项目该如何构架3）下载并安装d
编程之美-子数组的最大和（二维） bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; import java.util.Random; public class MaxSubArraySum2 { /** * 编程之美子数组之和的最大值（二维） */ private static final int ROW = 5; private stat
读书笔记-3 chengxuyuancsdn jquery笔记 resultMap配置 ibatis一对多配置
1、resultMap配置 2、ibatis一对多配置 3、jquery笔记 1、resultMap配置当<select resultMap="topic_data"> <resultMap id="topic_data">必须一一对应。 (1)<resultMap class="tblTopic&q
[物理与天文]物理学新进展 comsci
如果我们必须获得某种地球上没有的矿石,才能够进行某些能量输出装置的设计和建造,而要获得这种矿石,又必须首先进行深空探测,而要进行深空探测,又必须获得这种能量输出装置,这个矛盾的循环,会导致地球联盟在与宇宙文明建立关系的时候,陷入困境怎么办呢?
Oracle 11g新特性:Automatic Diagnostic Repository daizj oracle ADR
Oracle Database 11g的FDI（Fault Diagnosability Infrastructure）是自动化诊断方面的又一增强。 FDI的一个关键组件是自动诊断库（Automatic Diagnostic Repository-ADR）。在oracle 11g中，alert文件的信息是以xml的文件格式存在的，另外提供了普通文本格式的alert文件。这两份log文
简单排序:选择排序 dieslrae 选择排序
public void selectSort(int[] array){ int select; for(int i=0;i<array.length;i++){ select = i; for(int k=i+1;k<array.leng
C语言学习六指针的经典程序，互换两个数字 dcj3sjt126com c
示例程序，swap_1和swap_2都是错误的，推理从1开始推到2，2没完成，推到3就完成了 # include <stdio.h> void swap_1(int, int); void swap_2(int *, int *); void swap_3(int *, int *); int main(void) { int a = 3; int b =
php 5.4中php-fpm 的重启、终止操作命令 dcj3sjt126com PHP
php 5.4中php-fpm 的重启、终止操作命令: 查看php运行目录命令：which php/usr/bin/php 查看php-fpm进程数：ps aux | grep -c php-fpm 查看运行内存/usr/bin/php -i|grep mem 重启php-fpm/etc/init.d/php-fpm restart 在phpinfo()输出内容可以看到php
线程同步工具类 shuizhaosi888 同步工具类
同步工具类包括信号量（Semaphore）、栅栏（barrier）、闭锁（CountDownLatch）闭锁（CountDownLatch） public class RunMain { public long timeTasks(int nThreads, final Runnable task) throws InterruptedException { fin
bleeding edge是什么意思 haojinghua DI
不止一次，看到很多讲技术的文章里面出现过这个词语。今天终于弄懂了——通过朋友给的浏览软件，上了wiki。我再一次感到，没有辞典能像WiKi一样，给出这样体贴人心、一清二楚的解释了。为了表达我对WiKi的喜爱，只好在此一一中英对照，给大家上次课。 In computer science, bleeding edge is a term that
c中实现utf8和gbk的互转 jimmee c iconv utf8&gbk编码
#include <iconv.h> #include <stdlib.h> #include <stdio.h> #include <unistd.h> #include <fcntl.h> #include <string.h> #include <sys/stat.h> int code_c
大型分布式网站架构设计与实践 lilin530 应用服务器搜索引擎
1.大型网站软件系统的特点？ a.高并发，大流量。 b.高可用。 c.海量数据。 d.用户分布广泛，网络情况复杂。 e.安全环境恶劣。 f.需求快速变更，发布频繁。 g.渐进式发展。 2.大型网站架构演化发展历程？ a.初始阶段的网站架构。应用程序，数据库，文件等所有的资源都在一台服务器上。 b.应用服务器和数据服务器分离。 c.使用缓存改善网站性能。 d.使用应用
在代码中获取Android theme中的attr属性值 OliveExcel android theme
Android的Theme是由各种attr组合而成, 每个attr对应了这个属性的一个引用, 这个引用又可以是各种东西. 在某些情况下, 我们需要获取非自定义的主题下某个属性的内容 (比如拿到系统默认的配色colorAccent), 操作方式举例一则: int defaultColor = 0xFF000000; int[] attrsArray = { andorid.r.
基于Zookeeper的分布式共享锁 roadrunners zookeeper 分布式共享锁
首先，说说我们的场景，订单服务是做成集群的，当两个以上结点同时收到一个相同订单的创建指令，这时并发就产生了，系统就会重复创建订单。等等......场景。这时，分布式共享锁就闪亮登场了。共享锁在同一个进程中是很容易实现的，但在跨进程或者在不同Server之间就不好实现了。Zookeeper就很容易实现。具体的实现原理官网和其它网站也有翻译，这里就不在赘述了。官
两个容易被忽略的MySQL知识 tomcat_oracle mysql
1、varchar(5)可以存储多少个汉字，多少个字母数字？　　相信有好多人应该跟我一样，对这个已经很熟悉了，根据经验我们能很快的做出决定，比如说用varchar(200)去存储url等等，但是，即使你用了很多次也很熟悉了，也有可能对上面的问题做出错误的回答。　　这个问题我查了好多资料，有的人说是可以存储5个字符，2.5个汉字（每个汉字占用两个字节的话），有的人说这个要区分版本，5.0
zoj 3827 Information Entropy(水题) 阿尔萨斯 format
题目链接：zoj 3827 Information Entropy 题目大意：三种底，计算和。解题思路：调用库函数就可以直接算了，不过要注意Pi = 0的时候，不过它题目里居然也讲了。。。limp→0+plogb(p)=0，因为p是logp的高阶。 #include <cstdio> #include <cstring> #include <cmath&

Hadoop笔记-生产调优篇