zhu_9527

Hadoop-2.2.0集群安装配置实践

Hadoop 2.x和1.x已经大不相同了，应该说对于存储计算都更加通用了。Hadoop 2.x实现了用来管理集群资源的YARN框架，可以面向任何需要使用基于HDFS存储来计算的需要，当然MapReduce现在已经作为外围的插件式的计算框架，你可以根据需要开发或者选择合适的计算框架。目前，貌似对MapReduce支持还是比较好的，毕竟MapReduce框架已经还算成熟。其他一些基于YARN框架的标准也在开发中。
YARN框架的核心是资源的管理和分配调度，它比Hadoop 1.x中的资源分配的粒度更细了，也更加灵活了，它的前景应该不错。由于极大地灵活性，所以在使用过程中由于这些配置的灵活性，可能使用的难度也加大了一些。另外，我个人觉得，YARN毕竟还在发展之中，也有很多不成熟的地方，各种问题频频出现，资料也相对较少，官方文档有时更新也不是很及时，如果我选择做海量数据处理，可能YARN还不能满足生产环境的需要。如果完全使用MapReduce来做计算，还是选择相对更加成熟的Hadoop 1.x版本用于生产环境。
下面使用4台机器，操作系统为CentOS 6.4 64位，一台做主节点，另外三台做从节点，实践集群的安装配置。

主机配置规划

修改/etc/hosts文件，增加如下地址映射：
1	10.95.3.48     m1
2	10.95.3.54     s1
3	10.95.3.59     s2
4	10.95.3.66     s3

每台机器配置对应的hostname，修改/etc/sysconfig/network文件，例如s1节点内容配置为：
1	NETWORKING=yes
2	HOSTNAME=s1

m1为集群主节点，s1、s2、s3为集群从节点。
关于主机资源的配置，我们这里面使用VMWare工具，创建了4个虚拟机，具体置情况如下所示：

    一个主节点有1个核（core）
    一个主节点内存1G
    每个从节点有1个核（core）
    每个从节点内存2G

目录规划

Hadoop程序存放目录为/home/shirdrn/cloud/programs/hadoop-2.2.0，相关的数据目录，包括日志、存储等指定为/home/shirdrn/cloud/storage/hadoop-2.2.0。将程序和数据目录分开，可以更加方便的进行配置的同步。
具体目录的准备与配置如下所示：

    在每个节点上创建程序存储目录/home/shirdrn/cloud/programs/hadoop-2.2.0，用来存放Hadoop程序文件
    在每个节点上创建数据存储目录/home/shirdrn/cloud/storage/hadoop-2.2.0/hdfs，用来存放集群数据
    在主节点m1上创建目录/home/shirdrn/cloud/storage/hadoop-2.2.0/hdfs/name，用来存放文件系统元数据
    在每个从节点上创建目录/home/shirdrn/cloud/storage/hadoop-2.2.0/hdfs/data，用来存放真正的数据
    所有节点上的日志目录为/home/shirdrn/cloud/storage/hadoop-2.2.0/logs
    所有节点上的临时目录为/home/shirdrn/cloud/storage/hadoop-2.2.0/tmp

下面配置涉及到的目录，都参照这里的目录规划。

环境变量配置

首先，使用Sun的JDK，修改~/.bashrc文件，配置如下：
01	export JAVA_HOME=/usr/java/jdk1.6.0_45/
02	export PATH=$PATH:$JAVA_HOME/bin
03	export CLASSPATH=$JAVA_HOME/lib/*.jar:$JAVA_HOME/jre/lib/*.jar
04	1
05	然后配置Hadoop安装目录，相关环境变量：
06	1
07	export HADOOP_HOME=/home/shirdrn/cloud/programs/hadoop-2.2.0
08	export PATH=$PATH:$HADOOP_HOME/bin
09	export PATH=$PATH:$HADOOP_HOME/sbin
10	export HADOOP_LOG_DIR=/home/shirdrn/cloud/storage/hadoop-2.2.0/logs
11	export YARN_LOG_DIR=$HADOOP_LOG_DIR

免密码登录配置

在每各节点上，执行如下命令：
1	ssh-keygen

然后点击回车一直下去即可。
在主节点m1上，执行命令：
1	ssh m1

保证不需要密码即可登录本机m1节点。
将m1的公钥，添加到s1、s2、s3的~/.ssh/authorized_keys文件中，并且需要查看~/.ssh/authorized_keys的权限，不能对同组用户具有写权限，如果有，则执行下面命令：
1	chmod g-w ~/.ssh/authorized_keys

这时，在m1节点上，应该保证执行如下命令不需要输入密码：
1	ssh s1
2	ssh s2
3	ssh s3

Hadoop配置文件

配置文件所在目录为/home/shirdrn/programs/hadoop-2.2.0/etc/hadoop，可以修改对应的配置文件。

    配置文件core-site.xml内容

01	<?xml version="1.0" encoding="UTF-8"?>
02	<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
03	 
04	<configuration>
05	        <property>
06	                <name>fs.defaultFS</name>
07	                <value>hdfs://m1:9000/</value>
08	                <description>The name of the default file system. A URI whose scheme
09	                        and authority determine the FileSystem implementation. The uri's
10	                        scheme determines the config property (fs.SCHEME.impl) naming the
11	                        FileSystem implementation class. The uri's authority is used to
12	                        determine the host, port, etc. for a filesystem.</description>
13	        </property>
14	        <property>
15	                <name>dfs.replication</name>
16	                <value>3</value>
17	        </property>
18	        <property>
19	                <name>hadoop.tmp.dir</name>
20	                <value>/home/shirdrn/cloud/storage/hadoop-2.2.0/tmp/hadoop-${user.name}</value>
21	                <description>A base for other temporary directories.</description>
22	        </property>
23	</configuration>

    配置文件hdfs-site.xml内容

01	<?xml version="1.0" encoding="UTF-8"?>
02	<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
03	 
04	<configuration>
05	        <property>
06	                <name>dfs.namenode.name.dir</name>
07	                <value>/home/shirdrn/cloud/storage/hadoop-2.2.0/hdfs/name</value>
08	                <description>Path on the local filesystem where the NameNode stores
09	                        the namespace and transactions logs persistently.</description>
10	        </property>
11	        <property>
12	                <name>dfs.datanode.data.dir</name>
13	                <value>/home/shirdrn/cloud/storage/hadoop-2.2.0/hdfs/data</value>
14	                <description>Comma separated list of paths on the local filesystem of a DataNode where it should store its blocks.</description>
15	        </property>
16	        <property>
17	                <name>dfs.permissions</name>
18	                <value>false</value>
19	        </property>
20	</configuration>

    配置文件yarn-site.xml内容

01	<?xml version="1.0"?>
02	 
03	<configuration>
04	        <property>
05	                <name>yarn.resourcemanager.resource-tracker.address</name>
06	                <value>m1:8031</value>
07	                <description>host is the hostname of the resource manager and
08	                        port is the port on which the NodeManagers contact the Resource Manager.
09	                </description>
10	        </property>
11	        <property>
12	                <name>yarn.resourcemanager.scheduler.address</name>
13	                <value>m1:8030</value>
14	                <description>host is the hostname of the resourcemanager and port is
15	                        the port
16	                        on which the Applications in the cluster talk to the Resource Manager.
17	                </description>
18	        </property>
19	        <property>
20	                <name>yarn.resourcemanager.scheduler.class</name>
21	                <value>org.apache.hadoop.yarn.server.resourcemanager.scheduler.capacity.CapacityScheduler</value>
22	                <description>In case you do not want to use the default scheduler</description>
23	        </property>
24	        <property>
25	                <name>yarn.resourcemanager.address</name>
26	                <value>m1:8032</value>
27	                <description>the host is the hostname of the ResourceManager and the
28	                        port is the port on
29	                        which the clients can talk to the Resource Manager.
30	                </description>
31	        </property>
32	        <property>
33	                <name>yarn.nodemanager.local-dirs</name>
34	                <value>${hadoop.tmp.dir}/nodemanager/local</value>
35	                <description>the local directories used by the nodemanager</description>
36	        </property>
37	        <property>
38	                <name>yarn.nodemanager.address</name>
39	                <value>0.0.0.0:8034</value>
40	                <description>the nodemanagers bind to this port</description>
41	        </property>
42	        <property>
43	                <name>yarn.nodemanager.resource.cpu-vcores</name>
44	                <value>1</value>
45	                <description></description>
46	        </property>
47	        <property>
48	                <name>yarn.nodemanager.resource.memory-mb</name>
49	                <value>2048</value>
50	                <description>Defines total available resources on the NodeManager to be made available to running containers</description>
51	        </property>
52	        <property>
53	                <name>yarn.nodemanager.remote-app-log-dir</name>
54	                <value>${hadoop.tmp.dir}/nodemanager/remote</value>
55	                <description>directory on hdfs where the application logs are moved to </description>
56	        </property>
57	        <property>
58	                <name>yarn.nodemanager.log-dirs</name>
59	                <value>${hadoop.tmp.dir}/nodemanager/logs</value>
60	                <description>the directories used by Nodemanagers as log directories</description>
61	        </property>
62	        <property>
63	                <name>yarn.application.classpath</name>
64	                <value>$HADOOP_HOME,$HADOOP_HOME/share/hadoop/common/*,
65	               $HADOOP_HOME/share/hadoop/common/lib/*,
66	               $HADOOP_HOME/share/hadoop/hdfs/*,$HADOOP_HOME/share/hadoop/hdfs/lib/*,
67	               $HADOOP_HOME/share/hadoop/yarn/*,$HADOOP_HOME/share/hadoop/yarn/lib/*,
68	               $HADOOP_HOME/share/hadoop/mapreduce/*,$HADOOP_HOME/share/hadoop/mapreduce/lib/*</value>
69	                <description>Classpath for typical applications.</description>
70	        </property>
71	        <!-- Use mapreduce_shuffle instead of mapreduce.suffle (YARN-1229)-->
72	        <property>
73	                <name>yarn.nodemanager.aux-services</name>
74	                <value>mapreduce_shuffle</value>
75	                <description>shuffle service that needs to be set for Map Reduce to run </description>
76	        </property>
77	     <property>
78	            <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
79	            <value>org.apache.hadoop.mapred.ShuffleHandler</value>
80	     </property>
81	     <property>
82	            <name>yarn.scheduler.minimum-allocation-mb</name>
83	            <value>256</value>
84	     </property>
85	     <property>
86	            <name>yarn.scheduler.maximum-allocation-mb</name>
87	            <value>6144</value>
88	     </property>
89	     <property>
90	            <name>yarn.scheduler.minimum-allocation-vcores</name>
91	            <value>1</value>
92	     </property>
93	     <property>
94	            <name>yarn.scheduler.maximum-allocation-vcores</name>
95	            <value>3</value>
96	     </property>
97	</configuration>

    配置mapred-site.xml文件

01	<?xml version="1.0"?>
02	<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
03	 
04	<configuration>
05	     <property>
06	          <name>mapreduce.framework.name</name>
07	          <value>yarn</value>
08	          <description>Execution framework set to Hadoop YARN.</description>
09	     </property>
10	     <property>
11	          <name>mapreduce.map.memory.mb</name>
12	          <value>512</value>
13	          <description>Larger resource limit for maps. default 1024M</description>
14	     </property>
15	     <property>
16	          <name>mapreduce.map.cpu.vcores</name>
17	          <value>1</value>
18	          <description></description>
19	     </property>
20	     <property>
21	          <name>mapreduce.reduce.memory.mb</name>
22	          <value>512</value>
23	          <description>Larger resource limit for reduces.</description>
24	     </property>
25	     <property>
26	          <name>mapreduce.reduce.shuffle.parallelcopies</name>
27	          <value>5</value>
28	          <description>Higher number of parallel copies run by reduces to fetch outputs from very large number of maps.</description>
29	     </property>
30	     <property>
31	          <name>mapreduce.jobhistory.address</name>
32	          <value>m1:10020</value>
33	          <description>MapReduce JobHistory Server host:port, default port is 10020.</description>
34	     </property>
35	     <property>
36	          <name>mapreduce.jobhistory.webapp.address</name>
37	          <value>m1:19888</value>
38	          <description>MapReduce JobHistory Server Web UI host:port, default port is 19888.</description>
39	     </property>
40	</configuration>

    配置hadoop-env.sh、yarn-env.sh、mapred-env.sh脚本文件

修改每个脚本文件的JAVA_HOME变量即可，如下所示：
1	export JAVA_HOME=/usr/java/jdk1.6.0_45/

    配置slaves文件

1	s1
2	s2
3	s3

同步分发程序文件
在主节点m1上将上面配置好的程序文件，复制分发到各个从节点上：
1	scp -r /home/shirdrn/cloud/programs/hadoop-2.2.0 shirdrn@s1:/home/shirdrn/cloud/programs/
2	scp -r /home/shirdrn/cloud/programs/hadoop-2.2.0 shirdrn@s2:/home/shirdrn/cloud/programs/
3	scp -r /home/shirdrn/cloud/programs/hadoop-2.2.0 shirdrn@s3:/home/shirdrn/cloud/programs/

启动HDFS集群

经过上面配置以后，可以启动HDFS集群。
为了保证集群启动过程中不会出现问题，需要手动关闭每个节点上的防火墙，执行如下命令：
1	sudo service iptables stop
2	1
3	或者永久关闭防火墙：
4	1
5	sudo chkconfig iptables off
6	sudo chkconfig ip6tables off

在主节点m1上，首先进行文件系统格式化操作，执行如下命令：
1	hadoop namenode -format

然后，可以启动HDFS集群，执行如下命令：
1	start-dfs.sh

可以查看启动日志，确认HDFS集群启动是否成功：
1	tail -100f /home/shirdrn/cloud/storage/hadoop-2.2.0/logs/hadoop-shirdrn-namenode-m1.log
2	tail -100f /home/shirdrn/cloud/storage/hadoop-2.2.0/logs/hadoop-shirdrn-secondarynamenode-m1.log
3	tail -100f /home/shirdrn/cloud/storage/hadoop-2.2.0/logs/hadoop-shirdrn-datanode-s1.log
4	tail -100f /home/shirdrn/cloud/storage/hadoop-2.2.0/logs/hadoop-shirdrn-datanode-s2.log
5	tail -100f /home/shirdrn/cloud/storage/hadoop-2.2.0/logs/hadoop-shirdrn-datanode-s3.log

或者，查看对应的进程情况：
1	jps

可以通过登录Web控制台，查看HDFS集群状态，访问如下地址：
1	http://m1:50070/

启动YARN集群

在主节点m1上，执行如下命令：
1	start-yarn.sh

可以查看启动日志，确认YARN集群启动是否成功：
1	tail -100f /home/shirdrn/cloud/storage/hadoop-2.2.0/logs/yarn-shirdrn-resourcemanager-m1.log
2	tail -100f /home/shirdrn/cloud/storage/hadoop-2.2.0/logs/yarn-shirdrn-nodemanager-s1.log
3	tail -100f /home/shirdrn/cloud/storage/hadoop-2.2.0/logs/yarn-shirdrn-nodemanager-s2.log
4	tail -100f /home/shirdrn/cloud/storage/hadoop-2.2.0/logs/yarn-shirdrn-nodemanager-s3.log

或者，查看对应的进程情况：
1	jps

另外，ResourceManager运行在主节点m1上，可以Web控制台查看状态：
1	http://m1:8088/

NodeManager运行在从节点上，可以通过Web控制台查看对应节点的资源状态，例如节点s1：
1	http://s1:8042/

管理JobHistory Server

启动可以JobHistory Server，能够通过Web控制台查看集群计算的任务的信息，执行如下命令：
1	mr-jobhistory-daemon.sh start historyserver

默认使用19888端口。
通过访问http://m1:19888/查看任务执行历史信息。
终止JobHistory Server，执行如下命令：
1	mr-jobhistory-daemon.sh stop historyserver

集群验证

我们使用Hadoop自带的WordCount例子进行验证。
先在HDFS创建几个数据目录：
1	hadoop fs -mkdir -p /data/wordcount
2	hadoop fs -mkdir -p /output/

目录/data/wordcount用来存放Hadoop自带的WordCount例子的数据文件，运行这个MapReduce任务的结果输出到/output/wordcount目录中。
将本地文件上传到HDFS中：
1	hadoop fs -put /home/shirdrn/cloud/programs/hadoop-2.2.0/etc/hadoop/*.xml /data/wordcount/

可以查看上传后的文件情况，执行如下命令：
1	hadoop fs -ls /data/wordcount

可以看到上传到HDFS中的文件。
下面，运行WordCount例子，执行如下命令：
1	hadoop jar /home/shirdrn/cloud/programs/hadoop-2.2.0/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.2.0.jar wordcount /data/wordcount /output/wordcount

可以看到控制台输出程序运行的信息：
01	[shirdrn@m1 hadoop-2.2.0]$ hadoop jar /home/shirdrn/cloud/programs/hadoop-2.2.0/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.2.0.jar wordcount /data/wordcount /output/wordcount
02	13/12/25 22:38:02 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
03	13/12/25 22:38:03 INFO client.RMProxy: Connecting to ResourceManager at m1/10.95.3.48:8032
04	13/12/25 22:38:04 INFO input.FileInputFormat: Total input paths to process : 7
05	13/12/25 22:38:04 INFO mapreduce.JobSubmitter: number of splits:7
06	13/12/25 22:38:04 INFO Configuration.deprecation: user.name is deprecated. Instead, use mapreduce.job.user.name
07	13/12/25 22:38:04 INFO Configuration.deprecation: mapred.jar is deprecated. Instead, use mapreduce.job.jar
08	13/12/25 22:38:04 INFO Configuration.deprecation: mapred.output.value.class is deprecated. Instead, use mapreduce.job.output.value.class
09	13/12/25 22:38:04 INFO Configuration.deprecation: mapreduce.combine.class is deprecated. Instead, use mapreduce.job.combine.class
10	13/12/25 22:38:04 INFO Configuration.deprecation: mapreduce.map.class is deprecated. Instead, use mapreduce.job.map.class
11	13/12/25 22:38:04 INFO Configuration.deprecation: mapred.job.name is deprecated. Instead, use mapreduce.job.name
12	13/12/25 22:38:04 INFO Configuration.deprecation: mapreduce.reduce.class is deprecated. Instead, use mapreduce.job.reduce.class
13	13/12/25 22:38:04 INFO Configuration.deprecation: mapred.input.dir is deprecated. Instead, use mapreduce.input.fileinputformat.inputdir
14	13/12/25 22:38:04 INFO Configuration.deprecation: mapred.output.dir is deprecated. Instead, use mapreduce.output.fileoutputformat.outputdir
15	13/12/25 22:38:04 INFO Configuration.deprecation: mapred.map.tasks is deprecated. Instead, use mapreduce.job.maps
16	13/12/25 22:38:04 INFO Configuration.deprecation: mapred.output.key.class is deprecated. Instead, use mapreduce.job.output.key.class
17	13/12/25 22:38:04 INFO Configuration.deprecation: mapred.working.dir is deprecated. Instead, use mapreduce.job.working.dir
18	13/12/25 22:38:04 INFO mapreduce.JobSubmitter: Submitting tokens for job: job_1388039619930_0002
19	13/12/25 22:38:05 INFO impl.YarnClientImpl: Submitted application application_1388039619930_0002 to ResourceManager at m1/10.95.3.48:8032
20	13/12/25 22:38:05 INFO mapreduce.Job: The url to track the job: http://m1:8088/proxy/application_1388039619930_0002/
21	13/12/25 22:38:05 INFO mapreduce.Job: Running job: job_1388039619930_0002
22	13/12/25 22:38:14 INFO mapreduce.Job: Job job_1388039619930_0002 running in uber mode : false
23	13/12/25 22:38:14 INFO mapreduce.Job:  map 0% reduce 0%
24	13/12/25 22:38:22 INFO mapreduce.Job:  map 14% reduce 0%
25	13/12/25 22:38:42 INFO mapreduce.Job:  map 29% reduce 5%
26	13/12/25 22:38:43 INFO mapreduce.Job:  map 43% reduce 5%
27	13/12/25 22:38:45 INFO mapreduce.Job:  map 43% reduce 14%
28	13/12/25 22:38:54 INFO mapreduce.Job:  map 57% reduce 14%
29	13/12/25 22:38:55 INFO mapreduce.Job:  map 71% reduce 19%
30	13/12/25 22:38:56 INFO mapreduce.Job:  map 100% reduce 19%
31	13/12/25 22:38:57 INFO mapreduce.Job:  map 100% reduce 100%
32	13/12/25 22:38:58 INFO mapreduce.Job: Job job_1388039619930_0002 completed successfully
33	13/12/25 22:38:58 INFO mapreduce.Job: Counters: 44
34	     File System Counters
35	          FILE: Number of bytes read=15339
36	          FILE: Number of bytes written=667303
37	          FILE: Number of read operations=0
38	          FILE: Number of large read operations=0
39	          FILE: Number of write operations=0
40	          HDFS: Number of bytes read=21904
41	          HDFS: Number of bytes written=9717
42	          HDFS: Number of read operations=24
43	          HDFS: Number of large read operations=0
44	          HDFS: Number of write operations=2
45	     Job Counters
46	          Killed map tasks=2
47	          Launched map tasks=9
48	          Launched reduce tasks=1
49	          Data-local map tasks=9
50	          Total time spent by all maps in occupied slots (ms)=457338
51	          Total time spent by all reduces in occupied slots (ms)=65832
52	     Map-Reduce Framework
53	          Map input records=532
54	          Map output records=1923
55	          Map output bytes=26222
56	          Map output materialized bytes=15375
57	          Input split bytes=773
58	          Combine input records=1923
59	          Combine output records=770
60	          Reduce input groups=511
61	          Reduce shuffle bytes=15375
62	          Reduce input records=770
63	          Reduce output records=511
64	          Spilled Records=1540
65	          Shuffled Maps =7
66	          Failed Shuffles=0
67	          Merged Map outputs=7
68	          GC time elapsed (ms)=3951
69	          CPU time spent (ms)=22610
70	          Physical memory (bytes) snapshot=1598832640
71	          Virtual memory (bytes) snapshot=6564274176
72	          Total committed heap usage (bytes)=971993088
73	     Shuffle Errors
74	          BAD_ID=0
75	          CONNECTION=0
76	          IO_ERROR=0
77	          WRONG_LENGTH=0
78	          WRONG_MAP=0
79	          WRONG_REDUCE=0
80	     File Input Format Counters
81	          Bytes Read=21131
82	     File Output Format Counters
83	          Bytes Written=9717

查看结果，执行如下命令：
1	hadoop fs -cat /output/wordcount/part-r-00000 | head

结果数据示例如下：
01	[shirdrn@m1 hadoop-2.2.0]$ hadoop fs -cat /output/wordcount/part-r-00000 | head
02	13/12/25 22:58:55 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
03	"*"     17
04	"AS     3
05	"License");     3
06	"alice,bob     17
07	$HADOOP_HOME/share/hadoop/common/lib/*,     1
08	$HADOOP_HOME/share/hadoop/hdfs/*,$HADOOP_HOME/share/hadoop/hdfs/lib/*,     1
09	$HADOOP_HOME/share/hadoop/mapreduce/*,$HADOOP_HOME/share/hadoop/mapreduce/lib/*</value>     1
10	$HADOOP_HOME/share/hadoop/yarn/*,$HADOOP_HOME/share/hadoop/yarn/lib/*,     1
11	(ASF)     1
12	(YARN-1229)-->     1
13	cat: Unable to write to output stream.

登录到Web控制台，访问链接http://m1:8088/可以看到任务记录情况。
可见，我们的HDFS能够存储数据，而YARN集群也能够运行MapReduce任务。

问题及总结

    需要知道的默认配置

在Hadoop 2.2.0中，YARN框架有很多默认的参数值，如果你是在机器资源比较不足的情况下，需要修改这些默认值，来满足一些任务需要。
NodeManager和ResourceManager都是在yarn-site.xml文件中配置的，而运行MapReduce任务时，是在mapred-site.xml中进行配置的。
下面看一下相关的参数及其默认值情况：
参数名称 	默认值 	进程名称 	配置文件 	含义说明
yarn.nodemanager.resource.memory-mb 	8192 	NodeManager 	yarn-site.xml 	从节点所在物理主机的可用物理内存总量
yarn.nodemanager.resource.cpu-vcores 	8 	NodeManager 	yarn-site.xml 	节点所在物理主机的可用虚拟CPU资源总数（core）
yarn.nodemanager.vmem-pmem-ratio 	2.1 	NodeManager 	yarn-site.xml 	使用1M物理内存，最多可以使用的虚拟内存数量
yarn.scheduler.minimum-allocation-mb 	1024 	ResourceManager 	yarn-site.xml 	一次申请分配内存资源的最小数量
yarn.scheduler.maximum-allocation-mb 	8192 	ResourceManager 	yarn-site.xml 	一次申请分配内存资源的最大数量
yarn.scheduler.minimum-allocation-vcores 	1 	ResourceManager 	yarn-site.xml 	一次申请分配虚拟CPU资源最小数量
yarn.scheduler.maximum-allocation-vcores 	8 	ResourceManager 	yarn-site.xml 	一次申请分配虚拟CPU资源最大数量
mapreduce.framework.name 	local 	MapReduce 	mapred-site.xml 	取值local、classic或yarn其中之一，如果不是yarn，则不会使用YARN集群来实现资源的分配
mapreduce.map.memory.mb 	1024 	MapReduce 	mapred-site.xml 	每个MapReduce作业的map任务可以申请的内存资源数量
mapreduce.map.cpu.vcores 	1 	MapReduce 	mapred-site.xml 	每个MapReduce作业的map任务可以申请的虚拟CPU资源的数量
mapreduce.reduce.memory.mb 	1024 	MapReduce 	mapred-site.xml 	每个MapReduce作业的reduce任务可以申请的内存资源数量
yarn.nodemanager.resource.cpu-vcores 	8 	MapReduce 	mapred-site.xml 	每个MapReduce作业的reduce任务可以申请的虚拟CPU资源的数量

    异常java.io.IOException: Bad connect ack with firstBadLink as 10.95.3.66:50010

详细异常信息，如下所示：
01	[shirdrn@m1 hadoop-2.2.0]$ hadoop fs -put /home/shirdrn/cloud/programs/hadoop-2.2.0/etc/hadoop/*.xml /data/wordcount/
02	13/12/25 21:29:45 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
03	13/12/25 21:29:46 INFO hdfs.DFSClient: Exception in createBlockOutputStream
04	java.io.IOException: Bad connect ack with firstBadLink as 10.95.3.66:50010
05	     at org.apache.hadoop.hdfs.DFSOutputStream$DataStreamer.createBlockOutputStream(DFSOutputStream.java:1166)
06	     at org.apache.hadoop.hdfs.DFSOutputStream$DataStreamer.nextBlockOutputStream(DFSOutputStream.java:1088)
07	     at org.apache.hadoop.hdfs.DFSOutputStream$DataStreamer.run(DFSOutputStream.java:514)
08	13/12/25 21:29:46 INFO hdfs.DFSClient: Abandoning BP-1906424073-10.95.3.48-1388035628061:blk_1073741825_1001
09	13/12/25 21:29:46 INFO hdfs.DFSClient: Excluding datanode 10.95.3.66:50010
10	13/12/25 21:29:46 INFO hdfs.DFSClient: Exception in createBlockOutputStream
11	java.io.IOException: Bad connect ack with firstBadLink as 10.95.3.59:50010
12	     at org.apache.hadoop.hdfs.DFSOutputStream$DataStreamer.createBlockOutputStream(DFSOutputStream.java:1166)
13	     at org.apache.hadoop.hdfs.DFSOutputStream$DataStreamer.nextBlockOutputStream(DFSOutputStream.java:1088)
14	     at org.apache.hadoop.hdfs.DFSOutputStream$DataStreamer.run(DFSOutputStream.java:514)
15	13/12/25 21:29:46 INFO hdfs.DFSClient: Abandoning BP-1906424073-10.95.3.48-1388035628061:blk_1073741826_1002
16	13/12/25 21:29:46 INFO hdfs.DFSClient: Excluding datanode 10.95.3.59:50010
17	13/12/25 21:29:46 INFO hdfs.DFSClient: Exception in createBlockOutputStream
18	java.net.NoRouteToHostException: No route to host
19	     at sun.nio.ch.SocketChannelImpl.checkConnect(Native Method)
20	     at sun.nio.ch.SocketChannelImpl.finishConnect(SocketChannelImpl.java:599)
21	     at org.apache.hadoop.net.SocketIOWithTimeout.connect(SocketIOWithTimeout.java:206)
22	     at org.apache.hadoop.net.NetUtils.connect(NetUtils.java:529)
23	     at org.apache.hadoop.hdfs.DFSOutputStream.createSocketForPipeline(DFSOutputStream.java:1305)
24	     at org.apache.hadoop.hdfs.DFSOutputStream$DataStreamer.createBlockOutputStream(DFSOutputStream.java:1128)
25	     at org.apache.hadoop.hdfs.DFSOutputStream$DataStreamer.nextBlockOutputStream(DFSOutputStream.java:1088)
26	     at org.apache.hadoop.hdfs.DFSOutputStream$DataStreamer.run(DFSOutputStream.java:514)
27	13/12/25 21:29:46 INFO hdfs.DFSClient: Abandoning BP-1906424073-10.95.3.48-1388035628061:blk_1073741828_1004
28	13/12/25 21:29:46 INFO hdfs.DFSClient: Excluding datanode 10.95.3.59:50010
29	13/12/25 21:29:46 INFO hdfs.DFSClient: Exception in createBlockOutputStream

主要是由于Hadoop集群内某些节点的防火墙没有关闭，导致无法访问集群内节点。

npm 命令使用文档喆星时瑜安装部署前端 npm 前端 node.js
目录简介安装与配置基础命令依赖管理版本控制脚本管理包发布高级命令配置管理最佳实践常见问题1.简介npm(NodePackageManager)是Node.js的官方包管理工具，提供：130万+开源包的注册表访问依赖解析与版本管理项目脚本自动化私有包管理能力完整的包生命周期管理2.安装与配置2.1安装Node.js#通过官方安装包https://nodejs.org#验证安装node-vnpm-v2
Java编程：从入门到实践 AR新视野 Java Scanner类分隔符增量开发字符串操作
背景简介本文将深入探讨Java编程中的标准类使用，特别是Scanner类的实用性和灵活性。通过实例和代码分析，我们将展示如何更有效地使用Scanner类进行用户输入处理，以及如何通过设置分隔符来接收用户输入的完整数据。此外，文章还将介绍增量开发技术在软件开发中的应用，并通过一个简单的Java程序实例，讨论如何设计和实现程序，以及如何在开发过程中考虑到用户体验。使用Scanner类获取用户输入Jav
CentOS7 平滑升级 MariaDB 5.5 到 10.x 新版本实践 weixin_34318272 运维数据库
前言自从CentOS7开始，自带的数据库就变成MariaDB了，yum安装之后的默认版本是5.5，但是这个数据版本已经比较老了，无论是安装全新的Percona还是升级MariaDB第一步始终是不要忘记备份。CentOS7平滑升级MariaDB5.5到10.x新版本实践更新历史2018年11月14日-初稿阅读原文-https://wsgzao.github.io/post...扩展阅读MariaDB
Python 网络爬虫：从入门到实践一ge科研小菜菜编程语言 Python python
个人主页：一ge科研小菜鸡-CSDN博客期待您的关注网络爬虫是一种自动化的程序，用于从互联网上抓取数据。Python以其强大的库和简单的语法，是开发网络爬虫的绝佳选择。本文将详细介绍Python网络爬虫的基本原理、开发工具、常用框架以及实践案例。一、网络爬虫的基本原理网络爬虫的工作流程通常包括以下步骤：发送请求：向目标网站发送HTTP请求，获取网页内容。解析内容：提取需要的数据，可以是HTML标签
模拟退火算法：原理、应用与优化策略尹清雅算法
摘要模拟退火算法是一种基于物理退火过程的随机搜索算法，在解决复杂优化问题上表现出独特优势。本文详细阐述模拟退火算法的原理，深入分析其核心要素，通过案例展示在函数优化、旅行商问题中的应用，并探讨算法的优化策略与拓展方向，为解决复杂优化问题提供全面的理论与实践指导，助力该算法在多领域的高效应用与创新发展。一、引言在现代科学与工程领域，复杂优化问题无处不在，如资源分配、路径规划、机器学习模型参数调优等。
如何通过Python实现自动化任务：从入门到实践小弟有话说1.0 python 自动化开发语言
在当今快节奏的数字化时代，自动化技术正逐渐成为提高工作效率的利器。无论是处理重复性任务，还是管理复杂的工作流程，自动化都能为我们节省大量时间和精力。本文将以Python为例，带你从零开始学习如何实现自动化任务，并通过一个实际案例展示其强大功能。一、为什么选择Python实现自动化？Python作为一种简单易学、功能强大的编程语言，已经成为自动化领域的首选工具。以下是Python在自动化中的几大优势
基于ASP.NET Core的JsonApiDotNetCore框架详解与实践 MCPlayer542
本文还有配套的精品资源，点击获取简介：JsonApiDotNetCore是一个用于.NETCoreASP.NETCore应用程序的JSONAPI框架，它简化了JSONAPI的构建过程，特别是排序、过滤和分页等常见功能。这个框架支持JSONAPI规范，旨在减少开发者编写重复样板代码的工作量，利用.NETCore的依赖注入特性提供高度的可扩展性。开发者可以通过自定义服务和组件来扩展业务逻辑，并实现版本
FPGA基带平台射频数据处理装置及验证系统设计与方法 BE东欲
本文还有配套的精品资源，点击获取简介：FPGA在射频数据处理领域拥有灵活性和高性能，广泛用于通信、雷达、卫星导航等。本资料包重点介绍FPGA基带平台在数字信号处理中的应用，包括调制解调、滤波和FFT等任务。涵盖射频数据处理装置结构，验证系统设计和实施，以及相关工具的使用方法。为学习者提供实践经验和理论知识，助力开发高效可靠的通信系统。1.FPGA在射频数据处理中的应用数字信号处理（DSP）是现代电
PyTorch深度学习框架60天进阶学习计划 - 第28天：多模态模型实践（二）凡人的AI工具箱深度学习 pytorch 学习 AI编程人工智能 python
PyTorch深度学习框架60天进阶学习计划-第28天：多模态模型实践（二）5.跨模态检索系统应用场景5.1图文匹配系统的实际应用应用领域具体场景优势电子商务商品图像搜索、视觉购物用户可以上传图片查找相似商品或使用文本描述查找商品智能媒体内容推荐、图片库搜索通过内容的语义理解提供更精准的推荐和搜索社交网络基于内容的帖子推荐理解用户兴趣，提供更相关的内容推荐教育技术多模态教学资源检索教师和学生可以更
PyTorch深度学习框架60天进阶学习计划 - 第28天：多模态模型实践（一）凡人的AI工具箱深度学习 pytorch 学习 AI编程人工智能 python
PyTorch深度学习框架60天进阶学习计划-第28天：多模态模型实践（一）引言：跨越感知的边界欢迎来到我们的PyTorch学习旅程第28天！今天我们将步入AI世界中最激动人心的领域之一：多模态学习。想象一下，如果你的模型既能"看"又能"读"，并且能够理解图像与文字之间的联系，这将为我们打开怎样的可能性？今天我们将专注于构建图文匹配系统，学习如何使用CLIP（ContrastiveLanguage
知识蒸馏：让大模型“瘦身“而不失智慧的魔术一休哥助手人工智能人工智能
引言：当AI模型需要"减肥"在人工智能领域，一个有趣的悖论正在上演：大模型的参数规模每年以10倍速度增长，而移动设备的算力却始终受限。GPT-4的1750亿参数需要价值500万美元的GPU集群运行，但现实中的智能设备可能只有指甲盖大小。这种矛盾催生了一项神奇的技术——知识蒸馏（KnowledgeDistillation），它就像给AI模型进行"脑外科手术"，将庞然大物的智慧浓缩到轻量模型中。第一章
通过ITIL4课程助力业务创新，提升IT服务管理 - ITIL认证 itil
在全球数字化转型的浪潮中，IT服务管理（ITSM）已成为每个企业不可或缺的核心组成部分。无论是优化现有IT流程，还是推动技术创新，ITIL4（InformationTechnologyInfrastructureLibrary4）都为企业提供了一套完整的最佳实践框架。通过ITIL4，企业能够提升服务质量，降低运营成本，并推动业务增长。对于个人而言，掌握ITIL4框架不仅能提升技术能力，还能助力其职
YashanDB恢复数据库
本文内容来自YashanDB官网，原文内容请见https://doc.yashandb.com/yashandb/23.3/zh/%E6%95%B0%E6%8D%AE%...操作说明使用本方式执行恢复时，要求当前数据库实例处于NOMOUNT状态。执行恢复操作的数据库版本需与生成备份集的数据库版本完全一致。共享集群部署中，只能在主集群上执行恢复操作（即其角色必须为MASTER\_ROLE，可查询视图
YashanDB SQL命令备份恢复数据库
本文内容来自YashanDB官网，原文内容请见https://doc.yashandb.com/yashandb/23.3/zh/%E6%95%B0%E6%8D%AE%...SQL命令方式的备份恢复操作适用于单机/共享集群部署的数据库。操作示例以下为对单机部署的数据库执行备份恢复的模拟场景：1.通过yasql连接数据库，将数据库切换到归档模式，归档模式必须在数据库MOUNT状态下才能开启。$yas
SSRF 攻击与防御：从原理到落地实践花千树-010 架构设计网络安全运维容器网络安全 docker
1.什么是SSRF？SSRF（Server-SideRequestForgery）是一种常见的Web安全漏洞。当服务器提供了某种对外请求的功能，如“URL参数直接转发请求”，攻击者就可以通过精心构造的URL，让服务器“自己”去访问特定的地址，从而达到以下目的：扫描内网：探测企业内网中未暴露在公网的资产，如数据库、私有API等。获取云元数据：例如访问http://169.254.169.254/la
C#电子相册：面向对象设计与架构实践金融先生-Frank
本文还有配套的精品资源，点击获取简介：C#电子相册是一个使用高级编程语言C#开发的Windows平台应用程序。该项目采用面向对象编程方法，将对象如照片和相册封装、继承和多态地组织起来。它可能采用了MVC、MVVM或MVP架构模式，并使用.NETFramework或.NETCore以及VisualStudio作为开发环境。数据库管理部分涉及SQL数据库，支持相册数据的存储与检索。文件列表中的"eri
亿级分布式系统架构演进实战（一）- 总体概要 power-辰南 java技术架构师成长专栏高并发分布式系统微服务架构设计 springcloud
前言不说废话，这次分享是某500强企业真实亿级流量业务中台技术架构演进过程实战。核心目标构建一个兼具高性能、高可用、强一致性的分布式系统，支撑亿级流量场景下的稳定运行。演进路线大纲阶段一：横向扩展（应对万级QPS）核心目标：突破单机性能瓶颈，建立弹性基础[Nginx]/|\[App1][App2][App3]←无状态服务集群\|/[DBProxy]←读写分离中间件/\[Master]←写节点[Sl
时间序列分析的军火库：AutoTS、Darts、Kats、PaddleTS、tfts 和 FancyTS解析赛卡大数据人工智能深度学习 python 概率论数学建模
引言：时间序列分析的现代挑战时间序列分析在多个领域中扮演着关键角色，包括工程、金融、气象、工业预测等。随着开源工具的快速发展，开发者可以通过多种库快速实现时间序列预测与分析。本文将对AutoTS、Darts、Kats、PaddleTS、tfts和FancyTS六大主流库进行详细解析，并提供代码示例，帮助你根据实际需求选择最佳工具。核心库技术解析与场景化实践1.AutoTS：自动化时间序列预测技术亮
【数据治理】数据湖治理实践：腾讯云数据湖元数据实践指南菜鸟蜀黍数据治理大数据
最近数据湖非常的火，但是一旦没弄好，就会变成“数据沼泽”。如何避免“数据湖”变成“数据沼泽”呢？最好的办法就是治理先行。本文的内容主要包括四部分：1、数据湖背景概述，介绍腾讯数据湖的整体架构；2、数据湖统一元数据模块的详细架构实现；3、介绍腾讯云上元数据多租户的设计模式；4、介绍统一元数据的两大核心能力：在线数据目录和离线数据治理的功能。01什么是数据湖随着Snowflake公司股价高歌猛进和各大
【赵渝强老师】达梦数据库MPP集群的架构数据库信创
为了支持海量数据存储和处理等方面的需求，为高端数据仓库提供解决方案，达梦数据库提供了大规模并行处理MPP架构，以极低的成本代价，提供高性能的并行计算。通过使用MPP可以解决以下问题：需要较高的系统性能支持以支持大量的复杂查询操作硬件束缚对数据库响应能力的影响降低数据库成本视频讲解如下：https://www.bilibili.com/video/BV1dBftYoEkk/?aid=11386961
Java Web开发技术解析：从基础到实践的全栈指南以恒1 java 前端开发语言
JavaWeb开发技术解析：从基础到实践的全栈指南在互联网技术演进中，JavaWeb凭借其跨平台特性、成熟的生态系统和强大的企业级服务能力，成为构建动态Web应用的核心技术栈。本文从技术组成、开发工具、实战应用三个维度，全面解析JavaWeb的完整技术体系，并结合最新行业实践探讨其演进方向。一、JavaWeb的核心技术组成JavaWeb开发以Servlet和JSP为基石，通过分层架构实现动态网页生
优化Apache Spark性能之JVM参数配置指南 weixin_30777913 jvm spark 大数据开发语言性能优化
ApacheSpark运行在JVM之上，JVM的垃圾回收（GC）、内存管理以及堆外内存使用情况，会直接对Spark任务的执行效率产生影响。因此，合理配置JVM参数是优化Spark性能的关键步骤，以下将详细介绍优化策略和配置建议。通过以下优化方法，可以显著减少GC停顿时间、提升内存利用率，进而提高Spark作业吞吐量和数据处理效率。同时，要根据具体的工作负载和集群配置进行调整，并定期监控Spark应
从 0 到 1 构建 Python 分布式爬虫，实现搜索引擎全攻略七七知享 Python python 分布式爬虫搜索引擎算法程序人生网络爬虫
从0到1构建Python分布式爬虫，实现搜索引擎全攻略在大数据与信息爆炸的时代，搜索引擎已然成为人们获取信息的关键入口。你是否好奇，像百度、谷歌这般强大的搜索引擎，背后是如何精准且高效地抓取海量网页数据的？本文将带你一探究竟，以Python为工具，打造属于自己的分布式爬虫，进而搭建一个简易搜索引擎，完整呈现从底层代码编写到系统搭建的全过程。通过本文的实践，我们成功打造了Python分布式爬虫，并以
第三十篇维度建模：从理论到落地的企业级实践随缘而动，随遇而安数据库 sql 数据仓库大数据数据库架构
目录一、维度建模核心理论体系1.1Kimball方法论四大支柱1.2关键概念对比矩阵二、四步建模法全流程解析2.1选择业务过程（以电商为例）2.2声明原子粒度（订单案例）2.3维度设计规范时间维度（含财年逻辑）SCDType2完整实现（Hudi）2.4事实表类型与设计三、企业级建模实战：电商用户分析3.1业务矩阵分析3.2模型实现代码四、高级建模技巧4.1多星型模式关联4.2大数据场景优化五、性能
生成式对抗网络在人工智能艺术创作中的应用与创新研究辛迎蕌人工智能
摘要本文深入探究生成式对抗网络（GAN）在人工智能艺术创作领域的应用与创新。通过剖析GAN核心原理，阐述其在图像、音乐、文学等艺术创作中的实践，分析面临的挑战与创新方向，呈现GAN对艺术创作模式的变革，为理解人工智能与艺术融合发展提供全面视角。一、引言在人工智能与艺术深度融合的时代浪潮中，生成式对抗网络（GAN）作为一项突破性技术，为艺术创作带来了全新的可能性。它打破传统创作边界，以独特的对抗学习
【Kafka高级】Kafka性能优化与调优实践全栈追梦人 kafka 性能优化 linq
在大规模数据处理和实时消息传递场景中，Kafka的性能优化至关重要。本文将从生产者性能优化、消费者性能优化以及集群性能调优三个方面展开，结合实际代码示例和配置参数，帮助读者更好地理解和应用Kafka性能优化策略。一、生产者性能优化Kafka生产者的性能直接影响消息发送的效率和系统的吞吐量。以下是一些关键优化策略：1.1批量发送生产者会将消息批量发送到Kafka，减少网络请求次数。以下参数对批量发送
使用Nginx实现后端负载均衡海上彼尚 node.js nginx 负载均衡运维 node.js
目录引言一、负载均衡的核心作用二、基础配置三步曲1.定义后端服务器组（upstream）2.配置代理转发规则3.重载配置生效三、六大负载均衡算法详解四、高级配置技巧1.健康检查机制2.会话保持方案3.SSL终止优化五、实战场景配置案例案例1：WebSocket负载均衡案例2：多级地域分发案例3：连接池优化六、最佳实践与陷阱规避结语引言在现代高并发场景下，单一服务器难以支撑海量请求的处理。Nginx
【K8S】ImagePullBackOff状态问题排查。执键行天涯 K8s kubernetes 容器云原生
ImagePullBackOff是在使用Kubernetes（K8s）时经常遇到的一种错误状态，下面为你详细介绍其含义、可能的原因及解决办法。含义当你在K8s集群中创建一个Pod时，Kubelet会尝试从指定的镜像仓库拉取所需的容器镜像。如果拉取镜像失败，Kubelet会进行重试。随着重试次数的增加，重试的间隔时间会逐渐变长，这就是所谓的“指数退避”策略。当Kubelet多次尝试拉取镜像都失败后，
helm安装kubernetes-dashboard(2，Linux运维开发技巧 2401_83974783 2024年程序员学习 kubernetes linux 运维开发
当前k8s集群版本1.23.61.1添加repo[root@masterhelm]#helmrepoaddkubernetes-dashboardhttps://kubernetes.github.io/dashboard/[root@masterhelm]#helmsearchrepokubernetes-dashboard/kubernetes-dashboardNAMECHARTVERSIO
RabbitMQ 与 Kafka：消息中间件的终极对比与选型指南海上彼尚 node.js rabbitmq kafka 分布式 node.js
引言在分布式系统架构中，消息中间件是异步通信的核心组件。RabbitMQ和Kafka作为两大主流技术，常被开发者拿来比较。本文深入解析两者的设计哲学、性能差异和典型场景，助你做出精准技术选型。目录引言一、核心设计差异1.定位与数据模型二、性能与架构对比1.吞吐量与延迟2.集群与扩展三、功能特性对决1.消息可靠性2.消息路由四、典型场景与选型决策1.优先选择Kafka的场景2.优先选择RabbitM
HttpClient 4.3与4.3版本以下版本比较 spjich java httpclient
网上利用java发送http请求的代码很多，一搜一大把，有的利用的是java.net.*下的HttpURLConnection，有的用httpclient，而且发送的代码也分门别类。今天我们主要来说的是利用httpclient发送请求。 httpclient又可分为 httpclient3.x httpclient4.x到httpclient4.3以下 httpclient4.3
Essential Studio Enterprise Edition 2015 v1新功能体验 Axiba .net
概述：Essential Studio已全线升级至2015 v1版本了！新版本为JavaScript和ASP.NET MVC添加了新的文件资源管理器控件，还有其他一些控件功能升级，精彩不容错过，让我们一起来看看吧！ syncfusion公司是世界领先的Windows开发组件提供商，该公司正式对外发布Essential Studio Enterprise Edition 2015 v1版本。新版本
[宇宙与天文]微波背景辐射值与地球温度 comsci 背景
宇宙这个庞大,无边无际的空间是否存在某种确定的,变化的温度呢? 如果宇宙微波背景辐射值是表示宇宙空间温度的参数之一,那么测量这些数值,并观测周围的恒星能量输出值,我们是否获得地球的长期气候变化的情况呢? &nbs
lvs-server 男人50 server
#!/bin/bash # # LVS script for VS/DR # #./etc/rc.d/init.d/functions # VIP=10.10.6.252 RIP1=10.10.6.101 RIP2=10.10.6.13 PORT=80 case $1 in start) /sbin/ifconfig eth2:0 $VIP broadca
java的WebCollector爬虫框架 oloz 爬虫
WebCollector主页： https://github.com/CrawlScript/WebCollector 下载：webcollector-版本号-bin.zip将解压后文件夹中的所有jar包添加到工程既可。接下来看demo package org.spider.myspider; import cn.edu.hfut.dmic.webcollector.cra
jQuery append 与 after 的区别小猪猪08
1、after函数定义和用法： after() 方法在被选元素后插入指定的内容。语法： $(selector).after(content) 实例： <html> <head> <script type="text/javascript" src="/jquery/jquery.js"></scr
mysql知识充电香水浓 mysql
索引索引是在存储引擎中实现的，因此每种存储引擎的索引都不一定完全相同，并且每种存储引擎也不一定支持所有索引类型。根据存储引擎定义每个表的最大索引数和最大索引长度。所有存储引擎支持每个表至少16个索引，总索引长度至少为256字节。大多数存储引擎有更高的限制。MYSQL中索引的存储类型有两种：BTREE和HASH，具体和表的存储引擎相关； MYISAM和InnoDB存储引擎
我的架构经验系列文章索引 agevs 架构
下面是一些个人架构上的总结，本来想只在公司内部进行共享的，因此内容写的口语化一点，也没什么图示，所有内容没有查任何资料是脑子里面的东西吐出来的因此可能会不准确不全，希望抛砖引玉，大家互相讨论。要注意，我这些文章是一个总体的架构经验不针对具体的语言和平台，因此也不一定是适用所有的语言和平台的。（内容是前几天写的，现附上索引）前端架构 http://www.
Android so lib库远程http下载和动态注册 aijuans andorid
一、背景在开发Android应用程序的实现，有时候需要引入第三方so lib库，但第三方so库比较大，例如开源第三方播放组件ffmpeg库, 如果直接打包的apk包里面, 整个应用程序会大很多.经过查阅资料和实验，发现通过远程下载so文件，然后再动态注册so文件时可行的。主要需要解决下载so文件存放位置以及文件读写权限问题。二、主要
linux中svn配置出错 conf/svnserve.conf:12: Option expected 解决方法 baalwolf option
在客户端访问subversion版本库时出现这个错误： svnserve.conf:12: Option expected 为什么会出现这个错误呢，就是因为subversion读取配置文件svnserve.conf时，无法识别有前置空格的配置文件，如### This file controls the configuration of the svnserve daemon, if you##
MongoDB的连接池和连接管理 BigCat2013 mongodb
在关系型数据库中，我们总是需要关闭使用的数据库连接，不然大量的创建连接会导致资源的浪费甚至于数据库宕机。这篇文章主要想解释一下mongoDB的连接池以及连接管理机制，如果正对此有疑惑的朋友可以看一下。通常我们习惯于new 一个connection并且通常在finally语句中调用connection的close()方法将其关闭。正巧，mongoDB中当我们new一个Mongo的时候，会发现它也
AngularJS使用Socket.IO bijian1013 JavaScript AngularJS Socket.IO
目前，web应用普遍被要求是实时web应用，即服务端的数据更新之后，应用能立即更新。以前使用的技术（例如polling）存在一些局限性，而且有时我们需要在客户端打开一个socket，然后进行通信。 Socket.IO(http://socket.io/)是一个非常优秀的库，它可以帮你实
[Maven学习笔记四]Maven依赖特性 bit1129 maven
三个模块为了说明问题，以用户登陆小web应用为例。通常一个web应用分为三个模块，模型和数据持久化层user-core, 业务逻辑层user-service以及web展现层user-web， user-service依赖于user-core user-web依赖于user-core和user-service 依赖作用范围 Maven的dependency定义
【Akka一】Akka入门 bit1129 akka
什么是Akka Message-Driven Runtime is the Foundation to Reactive Applications In Akka, your business logic is driven through message-based communication patterns that are independent of physical locatio
zabbix_api之perl语言写法 ronin47 zabbix_api之perl
zabbix_api网上比较多的写法是python或curl。上次我用java－－http://bossr.iteye.com/blog/2195679，这次用perl。for example: #!/usr/bin/perl use 5.010 ; use strict ; use warnings ; use JSON :: RPC :: Client ; use
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ brotherlamp linux运维工程师 linux运维工程师教程 linux运维工程师视频 linux运维工程师资料 linux运维工程师自学
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ ----------------------------------------------------- 兄弟连Linux运维工程师课堂实录-计算机基础-1-课程体系介绍1 链接：http://pan.baidu.com/s/1i3GQtGL 密码：bl65 兄弟连Lin
bitmap求哈密顿距离-给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y( bylijinnan java
import java.util.Random; /** * 题目： * 给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y(y1,y2,y3,y4,y5)， * 使得他们的哈密顿距离（d=|x1-y1| + |x2-y2| + |x3-y3| + |x4-y4| + |x5-y5|）最大
map的三种遍历方法 chicony map
package com.test; import java.util.Collection; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Set; public class TestMap { public static v
Linux安装mysql的一些坑 chenchao051 linux
1、mysql不建议在root用户下运行 2、出现服务启动不了，111错误，注意要用chown来赋予权限，我在root用户下装的mysql，我就把usr/share/mysql/mysql.server复制到/etc/init.d/mysqld, (同时把my-huge.cnf复制/etc/my.cnf) chown -R cc /etc/init.d/mysql
Sublime Text 3 配置 daizj 配置 Sublime Text
Sublime Text 3 配置解释(默认){// 设置主题文件“color_scheme”: “Packages/Color Scheme – Default/Monokai.tmTheme”,// 设置字体和大小“font_face”: “Consolas”,“font_size”: 12,// 字体选项：no_bold不显示粗体字，no_italic不显示斜体字，no_antialias和
MySQL server has gone away 问题的解决方法 dcj3sjt126com SQL Server
MySQL server has gone away 问题解决方法，需要的朋友可以参考下。应用程序（比如PHP）长时间的执行批量的MYSQL语句。执行一个SQL，但SQL语句过大或者语句中含有BLOB或者longblob字段。比如，图片数据的处理。都容易引起MySQL server has gone away。今天遇到类似的情景，MySQL只是冷冷的说：MySQL server h
javascript/dom:固定居中效果 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&
使用 Spring 2.5 注释驱动的 IoC 功能 e200702084 spring bean 配置管理 IOC Office
使用 Spring 2.5 注释驱动的 IoC 功能 developerWorks 文档选项将打印机的版面设置成横向打印模式打印本页将此页作为电子邮件发送将此页作为电子邮件发送级别：初级陈雄华 (quickselect@163.com), 技术总监, 宝宝淘网络科技有限公司 2008 年 2 月 28 日 &nb
MongoDB常用操作命令 geeksun mongodb
1. 基本操作 db.AddUser(username,password) 添加用户 db.auth(usrename,password) 设置数据库连接验证 db.cloneDataBase(fromhost)
php写守护进程（Daemon） hongtoushizi PHP
转载自： http://blog.csdn.net/tengzhaorong/article/details/9764655 守护进程（Daemon）是运行在后台的一种特殊进程。它独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。守护进程是一种很有用的进程。php也可以实现守护进程的功能。 1、基本概念 &nbs
spring整合mybatis,关于注入Dao对象出错问题 jonsvien DAO spring bean mybatis prototype
今天在公司测试功能时发现一问题：先进行代码说明： 1，controller配置了Scope="prototype"（表明每一次请求都是原子型） @resource/@autowired service对象都可以（两种注解都可以）。 2，service 配置了Scope="prototype"（表明每一次请求都是原子型）
对象关系行为模式之标识映射 home198979 PHP 架构企业应用对象关系标识映射
HELLO!架构一、概念 identity Map:通过在映射中保存每个已经加载的对象，确保每个对象只加载一次，当要访问对象的时候，通过映射来查找它们。其实在数据源架构模式之数据映射器代码中有提及到标识映射，Mapper类的getFromMap方法就是实现标识映射的实现。二、为什么要使用标识映射？在数据源架构模式之数据映射器中 //c
Linux下hosts文件详解 pda158 linux
　1、主机名：　　无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。　　公网：IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。　　局域网：每台机器都有一个主机名，用于主机与主机之间的便于区分，就可以为每台机器设置主机
nginx配置文件粗解 spjich java nginx
#运行用户#user nobody;#启动进程,通常设置成和cpu的数量相等worker_processes 2;#全局错误日志及PID文件#error_log logs/error.log;#error_log logs/error.log notice;#error_log logs/error.log inf
数学函数 w54653520 java
public class S { // 传入两个整数，进行比较，返回两个数中的最大值的方法。 public int get( int num1, int nu

Hadoop-2.2.0集群安装配置实践

你可能感兴趣的:(Hadoop-2.2.0集群安装配置实践)