qq_2368521029

Hadoop-MapReduce-Yarn集群搭建

搭建的部署节点图如下：

hdfs和yarn是两个不同概念，两者搭建不会冲突。注意一点是DataNode和NodeManager必须要部署在同一台机器，它们的比例是1比1关系的。否则DataNode只能存储，不能做相应的计算处理。

通过官网搭建：hadoop.apache.org/docs/r2.6.5/hadoop-project-dist/hadoop-common/SingleCluster.html

主要涉及到两个配置文件: mapred-site.xml 、yarn-site.xml

一、MapReduce on Yarn单节点搭建

修改hadoop目录下的etc/hadoop/mapred-site.xml文件：

    <configuration>
        <property>
            <name>mapreduce.framework.namename>
            <value>yarnvalue>
        property>
    configuration>

修改etc/hadoop/yarn-site.xml文件：

    <configuration>
        <property>
            <name>yarn.nodemanager.aux-servicesname>
            <value>mapreduce_shufflevalue>
        property>
    configuration>

yarn里面配置nodemanager的一个服务叫做mapreduce_shuffle，shuffle又叫”洗牌“，就像你打牌，把相同花色的牌放在一块。而在mapReduce中，reduce按分区号拉取map处理好的记录，相当于洗牌这一操作，把相同分区的放在一个reduce里。shuffle就是mapReduce中map到reduce之间集成的东西。为什么要在nodemanager配置mapReduce的shuffle呢，主要是要让nodemanager来协调shuffle从map拉取数据到reduce之间的一个过程。

上面配置好了之后，就可以直接使用下面命令启动yarn（单点的）

  $ sbin/start-yarn.sh

使用下面命令停止yarn

      $ sbin/stop-yarn.sh

这里配置的是单节点的yarn，并不是集群模式，不是HA高可用的，我们下面来配置HA模式，当然HA模式的配置要依赖上面两个配置文件的内容。

二、搭建高可用的yarn

yarn HA搭建官网地址：https://hadoop.apache.org/docs/r2.6.5/hadoop-yarn/hadoop-yarn-site/ResourceManagerHA.html

下面是yarn HA模式的架构图：

上图出现了2个ResourceManager，也是主备模式。可能你有个疑问，为什么yarn的ha不像hdfs中的HA模式，使用个新增角色ZKFC来协调主备切换呢？

其实在hadoop2.x中，yarn并不是像hdfs的ha一样新增角色来检测切换主备节点，而是直接在RM进程中增加了HA的模块。不过这个yarn的ha模块默认是关闭的，需要手动在配置文件开启。

yarn这样做有个好处，就是RM的状态很明确，要么就是活着，要么就是宕机，不会像hdfs中的一样，可能会存在一个中间态(当ZKFC宕机，而NN存活，此时要为这个NN做降级操作) 。

1、在配置文件配置yarn HA

在node1中，cd到$HADOOP_HOME/etc/hadoop目录下

    [root@node1 hadoop]# cp mapred-site.xml.template mapred-site.xml
    [root@node1 hadoop]# vim mapred-site.xml

然后修改mapred-site.xml加入配置：

    <configuration>
        <property>
            <name>mapreduce.framework.namename>
            <value>yarnvalue>
        property>
    configuration>

然后修改yarn-site.xml

    [root@node1 hadoop]# vim yarn-site.xml

加入下面的配置

    <property>
       <name>yarn.nodemanager.aux-servicesname>
       <value>mapreduce_shufflevalue>
     property>
    <property>
       <name>yarn.resourcemanager.ha.enabledname>
       <value>truevalue>
     property>
     <property>
       <name>yarn.resourcemanager.zk-addressname>
       <value>node1:2181,node2:2181,node3:2181value>
     property>
    
     <property>
       <name>yarn.resourcemanager.cluster-idname>
       <value>yarncluster1value>
     property>
     <property>
       <name>yarn.resourcemanager.ha.rm-idsname>
       <value>rm1,rm2value>
     property>
     <property>
       <name>yarn.resourcemanager.hostname.rm1name>
       <value>node2value>
     property>
     <property>
       <name>yarn.resourcemanager.hostname.rm2name>
       <value>node3value>
     property>

yarn.resourcemanager.ha.enabled：开启yarn的HA模式，默认是false

yarn.resourcemanager.zk-address ： yarn的RM连接ZK的地址

yarn.resourcemanager.cluster-id： yarn的集群id，值可以自定义。因为ZK集群是可以被多个集群复用的，那么不同的集群在使用zk做分布式锁控制时，实际上会根据这个配置项里的值在zk生成一个目录，这样相同集群的机器就在这个目录上争抢创建锁，不会影响到其他的集群。

yarn.resourcemanager.ha.rm-ids: yarn中RM的主机逻辑名

yarn.resourcemanager.hostname.rm2 : yarn中RM主机逻辑名对应的具体物理主机配置。

至此yarn的HA就配置完成了。
分发上面的配置文件

    [root@node1 hadoop]# scp mapred-site.xml yarn-site.xml node2:`pwd`
    mapred-site.xml                               100%  863   401.2KB/s   00:00    
    yarn-site.xml                                 100% 1416   453.9KB/s   00:00    
    [root@node1 hadoop]# scp mapred-site.xml yarn-site.xml node3:`pwd`
    mapred-site.xml                               100%  863   588.9KB/s   00:00    
    yarn-site.xml                                 100% 1416     1.4MB/s   00:00

注意yarn中的nodeManager实际上就在etc/hadoop目录的slaves文件下，和datanode一样，不用做修改。

[root@node1 hadoop]# vi slaves 
node2
node3

2、启动yarn

    [root@node1 hadoop]# start-yarn.sh
    starting yarn daemons
    starting resourcemanager, logging to /opt/bigdata/hadoop-2.6.5/logs/yarn-root-resourcemanager-node1.out
    node3: starting nodemanager, logging to /opt/bigdata/hadoop-2.6.5/logs/yarn-root-nodemanager-node3.out
    node2: starting nodemanager, logging to /opt/bigdata/hadoop-2.6.5/logs/yarn-root-nodemanager-node2.out

实际上这个命令可以很好的为我们正确的在对应的机器上启动nodeManager,但是我们并没有正确的启动RM，你可以看到使用这条命令启动的RM是在node1上的，确切来讲，node1上也没有启动RM，因为node1启动RM的时候，会去查yarn-site.xml文件，发现RM并没有配置在node1这条机器上，故此会将启动的RM进程杀死，这条命令只是为我们正确的启动了NodeManager。

我们必须要使用手动的方式在node2、node3启动ResourceManager

[root@node2 ~]#  yarn-daemon.sh start resourcemanager
starting resourcemanager, logging to /opt/bigdata/hadoop-2.6.5/logs/yarn-root-resourcemanager-node2.out

启动了之后，可以在node1中使用zk观察到多了一个目录yarn-leader-election

[zk: localhost:2181(CONNECTED) 0] ls /
[zookeeper, yarn-leader-election, hadoop-ha]

我们进入到yarn-leader-election中，查看

    [zk: localhost:2181(CONNECTED) 2] ls /yarn-leader-election 
    [yarncluster1]

发现就是我们在配置文件中yarn.resourcemanager.cluster-id指定的cluster-id。

[zk: localhost:2181(CONNECTED) 7] get /yarn-leader-election/yarncluster1/ActiveStandbyElectorLock 
yarncluster1rm2
cZxid = 0xd00000011
ctime = Sat May 23 11:20:03 CST 2020
mZxid = 0xd00000011
mtime = Sat May 23 11:20:03 CST 2020
pZxid = 0xd00000011
cversion = 0
dataVersion = 0
aclVersion = 0
ephemeralOwner = 0x2000038b7af0001
dataLength = 19
numChildren = 0

通过查看当前yarn集群哪个节点抢到了锁，发现yarncluster1rm2抢到了锁，其中rm2对应的物理节点是node3机器上的RM，故此node3的RM为master节点，node2中的是slaver

可以通过访问node2:8088 和node3:8088 更直观的看到RM运行状态及信息

当我们访问node2:8088 提示：

This is standby RM. Redirecting to the current active RM: http://node3:8088/

当我们访问node3：8088

就可以进入上面的图形界面监控了。注意，当我们点击About就可以看到这个RM节点的详细信息：

在这个界面的链接上，我们改下node2对应的主机地址，就可以看到node2节点的RM信息:

我们还可以点击Nodes，查看RM所管辖的NodeManager节点状态

以上NM都是使用的默认配置，以后需要做修改。

3、MapReduce WordCount实战

首先生成一个文件，里面行格式为hello hadoop $i

[root@node1 ~]# for i in `seq 100000`;do echo "hello hadoop $i" >> data.txt;done

然后在hdfs中生成一个目录

    [root@node1 ~]# hdfs dfs -mkdir -p /data/wc/input

然后上传这个data.txt

    [root@node1 ~]# hdfs dfs -D dfs.blocksize=1048576 -put data.txt /data/wc/input

此时观测到hdfs中的集群是否存在这个文件

然后cd到下面的目录

    [root@node1 mapreduce]# cd
    /opt/bigdata/hadoop-2.6.5/share/hadoop/mapreduce

mapReduce的jar包都在这里。我们看下这个目录的官方提供的mapreduce的案例jar包大小

[root@node1 mapreduce]# ll -h hadoop-mapreduce-examples-2.6.5.jar
-rw-rw-r-- 1 god haizhang 286K Oct  3  2016 hadoop-mapreduce-examples-2.6.5.jar

发现总共大小是286KB，这里面肯定是个分布式程序，比我们期望的大小是不是小很多？这是因为这个案例依赖的很多第三方jar包并不囊括在里面，因为它们已经在hadoop上的每个节点的这个目录下，都已经部署到这些需要依赖的第三方jar包了。故此这个案例的jar包只包含了计算业务逻辑（最终移动的是计算而不是数据，计算jar包小，才移动的快），当然可以很小。如果你还要将第三方jar包一起打包上传，那肯定会很大。

如何在hadoop启动上面官方提供的mapreduce计算程序呢？

可以使用hadoop jar命令，我们看下它的使用格式

[root@node1 mapreduce]# hadoop jar
RunJar jarFile [mainClass] args...

其中mainClass是jarFile里面主程序类，作为一个入口。而args则是传递给主程序类的参数，最常见的就是mapreduce输入（map读取数据文件）路径，输出（reduce输出的文件）路径。注意输出路径一定要是一个hdfs中没有的目录，否则命令启动将报错（为了数据安全，以免reduce输出结果覆盖已有的结果导致其他mapReduce程序报错）。

我们以官方提供的hadoop-mapreduce-examples-2.6.5.jar 中的wordcount应用案例，做一个单词统计的程序运行，来测试mapReduce的工作流程.

键入下面的命令启动mapReduce来运行wordcount计算程序

[root@node1 mapreduce]# hadoop jar hadoop-mapreduce-examples-2.6.5.jar wordcount /data/wc/input /data/wc/output

注意，这里以/data/wc/input作为wordcount程序读取数据的路径，因为/data/wc/input是个目录，将会读取这个目录下的所有一级文件（不会读取这个目录的子目录里的文件）。

而/data/wc/output则为wordcount程序输出结果的目录，需要在hdfs中不存在！

执行命令后，可以看到任务的进展（Progress）以及状态（State）

任务执行完成后：

可以看到运行时的状态，包括：

运行的任务ID
启动这次计算任务的用户（User = root）
行计算程序的名称（Name=wordcount）
计算程序的类型（ApplicationType=MAPREDUCE ,未来也可能是Spark等）
默认的任务队列Queue
任务的启动时间（StarTime）
任务的终止时间（FinishTime）
任务状态（State）
任务最终的执行状态（FinalStatus=SUCCEEDED）

除此之外，命令行也为我们提供了这次任务运行的结果：

查看任务报告

[root@node2 bin]# yarn application -status application_1593950330559_0001
Application Report : 
        Application-Id : application_1593950330559_0001
        Application-Name : mywordcount
        Application-Type : MAPREDUCE
        User : root
        Queue : default
        Start-Time : 1593951525053
        Finish-Time : 1593951633293
        Progress : 100%
        State : FINISHED
        Final-State : SUCCEEDED
        Tracking-URL : http://node3:19888/jobhistory/job/job_1593950330559_0001
        RPC Port : 38515
        AM Host : node3
        Aggregate Resource Allocation : 284829 MB-seconds, 161 vcore-seconds
        Diagnostics :

查看mapreduce log日志

    20/05/23 12:06:24 INFO client.ConfiguredRMFailoverProxyProvider: Failing over to rm2
    20/05/23 12:06:25 INFO input.FileInputFormat: Total input paths to process : 1
    20/05/23 12:06:26 INFO mapreduce.JobSubmitter: number of splits:2
    20/05/23 12:06:26 INFO mapreduce.JobSubmitter: Submitting tokens for job: job_1590204003504_0001
    #yarn客户端向yarn集群提交了个计算任务，任务id为application_1590204003504_0001
    20/05/23 12:06:27 INFO impl.YarnClientImpl: Submitted application application_1590204003504_0001
    #可以根据http://node3:8088/proxy/application_1590204003504_0001/ 追溯这次任务执行流程
    20/05/23 12:06:27 INFO mapreduce.Job: The url to track the job: 
    http://node3:8088/proxy/application_1590204003504_0001/
    20/05/23 12:06:27 INFO mapreduce.Job: Running job: job_1590204003504_0001
    20/05/23 12:06:44 INFO mapreduce.Job: Job job_1590204003504_0001 running in uber mode : false
    # 这里是map在运行时和reduce运行时的进度，发现它们时串行执行的
    20/05/23 12:06:44 INFO mapreduce.Job:  map 0% reduce 0%
    20/05/23 12:07:00 INFO mapreduce.Job:  map 50% reduce 0%
    20/05/23 12:07:04 INFO mapreduce.Job:  map 100% reduce 0%
    20/05/23 12:07:16 INFO mapreduce.Job:  map 100% reduce 100%
    #打印出了这次job任务的执行状态，成功执行。
    20/05/23 12:07:16 INFO mapreduce.Job: Job job_1590204003504_0001 completed successfully
    20/05/23 12:07:16 INFO mapreduce.Job: Counters: 49
    #文件系统的使用情况
            File System Counters
                    FILE: Number of bytes read=1188951
                    FILE: Number of bytes written=2707028
                    FILE: Number of read operations=0
                    FILE: Number of large read operations=0
                    FILE: Number of write operations=0
                    HDFS: Number of bytes read=1893199
                    HDFS: Number of bytes written=788922
                    HDFS: Number of read operations=9
                    HDFS: Number of large read operations=0
                    HDFS: Number of write operations=2
       # 任务运行情况
            Job Counters 
            #使用了2个map程序运行计算分组
                    Launched map tasks=2
                    #使用了1个reduce进行分组数据统计
                    Launched reduce tasks=1
                    Data-local map tasks=2
                    Total time spent by all maps in occupied slots (ms)=30383
                    Total time spent by all reduces in occupied slots (ms)=13508
                    Total time spent by all map tasks (ms)=30383
                    Total time spent by all reduce tasks (ms)=13508
                    Total vcore-milliseconds taken by all map tasks=30383
                    Total vcore-milliseconds taken by all reduce tasks=13508
                    Total megabyte-milliseconds taken by all map tasks=31112192
                    Total megabyte-milliseconds taken by all reduce tasks=13832192
                    # mapReduce框架的一些数据统计
            Map-Reduce Framework
            #map读取的记录条数
                    Map input records=100000
                    #map输出的记录条数
                    Map output records=300000
                    Map output bytes=3088895
                    Map output materialized bytes=1188957
                    Input split bytes=208
                    Combine input records=300000
                    Combine output records=100004
                    Reduce input groups=100002
                    Reduce shuffle bytes=1188957
                    Reduce input records=100004
                    Reduce output records=100002
                    Spilled Records=200008
                    Shuffled Maps =2
                    Failed Shuffles=0
                    Merged Map outputs=2
                    GC time elapsed (ms)=2107
                    CPU time spent (ms)=6220
                    Physical memory (bytes) snapshot=698986496
                    Virtual memory (bytes) snapshot=6448164864
                    Total committed heap usage (bytes)=472907776
                    
                    #mapReduce 拉取执行任务过程中的的异常信息
            Shuffle Errors
                    BAD_ID=0
                    CONNECTION=0
                    IO_ERROR=0
                    WRONG_LENGTH=0
                    WRONG_MAP=0
                    WRONG_REDUCE=0
            File Input Format Counters 
                    Bytes Read=1892991
            File Output Format Counters 
                    Bytes Written=788922

我们查看下mapReduce生成的结果文件

    [root@node1 ~]# hdfs dfs -ls /data/wc/output
    Found 2 items
    -rw-r--r--   2 root supergroup          0 2020-05-23 12:07 /data/wc/output/_SUCCESS
    -rw-r--r--   2 root supergroup     788922 2020-05-23 12:07 /data/wc/output/part-r-00000

发现里面有两个文件，_SUCCESS文件是标志这次任务成功的。

其中part-r-00000 这个文件包含一个”r“ 表示reduce生成的输出文件，当然，也可以只有map输出的文件，如果最终只是map输出的话，这个r就会变成m（也即是part-m-00000）。后面的00000标志着这个是0号reduce输出的文件，如果存在两个reduce，就会分别为它们生成的文件生成对应的序号标志00000、000001 以此类推。

我们查看下/data/wc/output/part-r-00000 文件输出的部分结果:

99985   1
99986   1
99987   1
99988   1
99989   1
9999    1
99990   1
99991   1
99992   1
99993   1
99994   1
99995   1
99996   1
99997   1
99998   1
99999   1
hadoop  100000
hello   100000

源文件中hello 和hadoop是以一个空格隔开，总共有10w行，每行有1个唯一数字，上面的reduce统计结果计算准确。注意，之前我们上传data.txt文件时，是被hdfs以文件块切开两份，数据存储的时候是严格按照字节切分，末尾行和开投行可能出现不完整。但是计算层框架则将不完整的行重新组合成完成的行，再进行计算，往后会介绍如何实现的。

三、使用代码实战mapReduce案例

导入pom依赖

       <dependency>
                <groupId>org.apache.hadoopgroupId>
                <artifactId>hadoop-clientartifactId>
                <version>2.6.5version>
            dependency>

创建mapReduce启动类

    package com.haizhang.hadoop.mapredcue;
    
    import org.apache.hadoop.conf.Configuration;
    import org.apache.hadoop.fs.FileSystem;
    import org.apache.hadoop.fs.Path;
    import org.apache.hadoop.io.IntWritable;
    import org.apache.hadoop.io.Text;
    import org.apache.hadoop.mapreduce.Job;
    import org.apache.hadoop.mapreduce.lib.input.TextInputFormat;
    import org.apache.hadoop.mapreduce.lib.output.TextOutputFormat;
    import java.io.IOException;
    
    public class MyWordCount {
    
        public static void main(String[] args) throws IOException, ClassNotFoundException, InterruptedException {
            Configuration conf = new Configuration(true);
            //获取Job实例，用于提交任务
            Job job = Job.getInstance(conf);
            //必写！这里会根据反射机制来得知你的这个jar包要如何找到入口类，写当前程序的启动类
            job.setJarByClass(MyWordCount.class);
            //随意写，这里标志任务的名称
            job.setJobName("mywordcount");
    
           /* 这两种填写map输入输出文件路径的方式已经淘汰，因为参数固定死只能传path
              不方便于扩展
            job.setInputPath(new Path("in"));
            job.setOutputPath(new Path("out"));
            */
           //传入map的文件路径
            Path in = new Path("/data/wc/input");
            //可以接收多个Path路径，也就是map可以接收多个输入文件来源
            TextInputFormat.addInputPath(job,in);
    //        TextInputFormat.addInputPath(job,in2);
            Path out = new Path("/data/wc/output");
            //注意mapReduce的输出，要求输出目录不存在任何数据，所以先检查是否存在目录，如果存在则递归删除即可。
            FileSystem fs = out.getFileSystem(conf);
            if(fs.exists(out)) fs.delete(out,true);
            TextOutputFormat.setOutputPath(job,out);
    
            //以下配置Map执行程序的逻辑的类
            job.setMapperClass(MyMapper.class);
            //这一要告知map输出给reduce的Key/Vlaue的类型，reduce需要用这个类型进行返程成具体的对象，然后再进行反序列化为该对象赋值
            job.setMapOutputKeyClass(Text.class);
            job.setMapOutputValueClass(IntWritable.class);
            //以下配置Reduce执行程序的逻辑类
            job.setReducerClass(MyReducer.class);
            // Submit the job, then poll for progress until the job is complete
            job.waitForCompletion(true);
        }
    }

还要创建MapReduce中的Map处理类

    package com.haizhang.hadoop.mapredcue;
    import org.apache.hadoop.io.IntWritable;
    import org.apache.hadoop.io.Text;
    import org.apache.hadoop.mapreduce.Reducer;
    import java.io.IOException;
    /**
     * 这个Mapper就是wordCount的实现逻辑
     */
    public class MyMapper extends Mapper<Object, Text, Text, IntWritable> {
    
        /**
         * hadoop框架中，对我们平常用的变量都进行了封装，实现了自己的序列化接口，和比较器接口
         * 比如 int--> IntWritable
         *       String -- > Text
         * hadoop有自己一套可以序列化、反序列化的机制,我们可以自定义类型，不过要实现hadoop提供的
         * 序列化接口（Writable）和比较器接口（Comparable） 也就是  WritableComparable接口。
         **/
        private final static IntWritable one = new IntWritable(1);
        private Text word = new Text();
    
        /**
         *
         * @param key 每行字符串自己第一个字节面向源文件的偏移量,假设文件如下“
         *            hello hadoop 1
         *            hello hadoop 2
         *            则第一行的key为1，第二行的key为16（第一行字符串+空格+换行符+第二行的第一个h）
         * @param value 每行数据
         * @param context 上下文
         * @throws IOException
         * @throws InterruptedException
         */
        public void map(Object key, Text value, Context context) throws IOException, InterruptedException {
            //StringTokenizer使用正则表达式，按照空格/制表符/换行符为分割符，匹配单词。比如hello hadoop 1 则调用
            //itr.nextToken()先得到hello；再次调用  nextToken则得到hadoop 依次类推。
            StringTokenizer itr = new StringTokenizer(value.toString());
            while (itr.hasMoreTokens()) {
                //设置当前匹配到的单词
                word.set(itr.nextToken());
                //往map输出文件写键值对key/value
                context.write(word, one);
            }
        }
    }

最后创建一个MapReduce中的Reduce处理类

    package com.haizhang.hadoop.mapredcue;
    
    import org.apache.hadoop.io.IntWritable;
    import org.apache.hadoop.io.Text;
    import org.apache.hadoop.mapreduce.Mapper;
    
    import java.io.IOException;
    import java.util.StringTokenizer;
    public class MyReducer extends Reducer<Text, IntWritable, Text, IntWritable> {
        //每组key统计的结果是IntWritable类型。表示单词对应的统计总数
        private IntWritable result = new IntWritable();
    
        /**
         * reduce计算方法
         * @param key  map文件输出的Key，也就是分组key
         *             例如reduce计算拉取的分组如下
         *              hello 1
         *              hello 1
         *              hello 1
         *              hello 1
         *              hello 1
         *             则Key就是hello，以hello为分组
         * @param values  每个分组所对应的value列表，如上的列子，values=[1,1,1,1,1] 当然values是个迭代器。
         * @param context 上下文，做最终key/value对的记录输出
         * @throws IOException
         * @throws InterruptedException
         */
        public void reduce(Text key, Iterable<IntWritable>values,
                           Context context) throws IOException, InterruptedException {
            int sum = 0;
            for (IntWritable val : values) {
                sum += val.get();
            }
            result.set(sum);
            context.write(key, result);
        }
    }

上面的注解已经写的很清楚了，这就实现了使用mapReduce进行wordCount计算的小列子。

当所有工作代码写完后，我们就可以使用mvn打jar包

E:\idea代码\hdfs>mvn clean install -Dmaven.test.skip=true

然后将jar上传到node1节点上。并使用下面的命令运行

    [root@node1 ~]# hadoop jar hdfs-1.0-SNAPSHOT.jar com.haizhang.hadoop.mapredcue.MyWordCount

这里不需要附带输入文件输出文件的地址，因为程序jar已经写死了，当然我们可以修改jar，让它接收用户传入的地址

运行完成之后，同样可以用下面命令查看输出的结果是否和预期一样

[root@node1 ~]# hdfs dfs -ls /data/wc/output
Found 2 items
-rw-r--r--   2 root supergroup          0 2020-05-23 19:14 /data/wc/output/_SUCCESS
-rw-r--r--   2 root supergroup     788922 2020-05-23 19:14 /data/wc/output/part-r-00000
[root@node1 ~]# date
Sat May 23 19:16:24 CST 2020
[root@node1 ~]# hdfs dfs -cat /data/wc/output/part-r-00000 | tail -10
99992   1
99993   1
99994   1
99995   1
99996   1
99997   1
99998   1
99999   1
hadoop  100000
hello   100000

经过校验，数据正确！

你可能感兴趣的:(Hadoop-MapReduce-Yarn集群搭建)

面试运维没工作经验怎么办？_没有运维经验去面试运维岗位慕烟疏雨面试运维职场和发展网络安全 web安全网络程序员
面试运维没工作经验怎么办大家都知道面试，都是需要工作经验，刚转行或者刚毕业哪里有什么经验呢？面试时候基本都是被拒之门外怎么办：今天我分享下我的经验：面试简历方面：一定要对自己的简历很熟悉，简历写得技能一定能说出一二，因为面试官很多问题都是挑的你的简历你写得问的，比如你写了熟练mysql主从同步原理集群搭建，一般肯定会问你，主从同步原理呀，如果你写了都说不出来，面试官咋样，肯定回家等通知了如果面试官
Rabbitmq从入门到精通 XJzz3 消息中间件 rabbitmq
文章目录1.RabbitMQ简介1.2组件介绍1.1消息队列的选择1.2Docker安装rabbitmq1.4消息应答机制2.1交换机类型2.1direct2.2fanout2.3topic：2.4header3RabbitMQ集群搭建3.1docker搭建rabbitmq集群4死信队列4.1ttl消息过期：生产者添加延迟生产4.2队列最大长度4.35.延迟队列6.发布确认机制6.1发布确认原理1
ZooKeeper的初识（Zookeeper基本知识，ZooKeeper shell，ZooKeeper数据模型，ZooKeeper Watcher 监听机制，ZooKeeper选举机制） kismetG Azkaban Zookeeper基本知识 ZooKeeper shell ZooKeeper数据模型 ZooKeeper Watcher 监听机制 ZooKeeper选举机制
Zookeeper基本知识Zookeeper集群搭建Zookeeper集群搭建指的是ZooKeeper分布式模式安装。通常由2n+1台servers组成。这是因为为了保证Leader选举（基于Paxos算法的实现）能过得到多数的支持，所以ZooKeeper集群的数量一般为奇数。Zookeeper运行需要java环境，所以需要提前安装jdk。对于安装leader+follower模式的集群，大致过程
Kubernetes Secret的创建与使用 Hadoop_Liang K8S kubernetes 容器云原生
前提条件拥有Kubernetes集群环境，可参考：Kubernetes集群搭建理解Kubernetes部署知识，可参考：使用Kubernetes部署第一个应用、Deloyment控制器Secret简介KubernetesSecret是一种用于存储敏感信息（如密码、令牌、密钥等）的对象。它可以让你将敏感数据以加密的方式存储在Kubernetes集群中，避免在配置文件或容器镜像中以明文形式暴露这些信息
rabbit@node2‘ thinks it‘s clustered with node ‘rabbit@node1‘, but ‘rabbit@node1‘ disagrees yangguosheng rabbitmq rabbitmq cluster forget 节点集群
两个rabbitmq节点rabbit@node1,rabbit@node2。集群搭建完成后，下线rabbit@node2,node2上执行rabbitmqctlstop停止该节点上的服务。node1上执行rabbitmqctlforget_cluster_noderabbit@node2。之后尝试启动rabbit@node2时，报错rabbit@node2'thinksit'sclusteredw
ZooKeeper集群部署实验出现Error contacting service. It is probably not running. IT_linux zookeeper linux 分布式
原因:三个节点,仅启动了一个节点的zookeeper,最少启动两个节点的zookeeper。前提:基础环境配置完成,ZooKeeper集群搭建完成1.启动ZooKeeper服务(切换到/root/zookeeper-3.4.14/bin目录下,我的zookeeper-3.4.14上传到了/root/目录下)切换目录[root@z1bin]#cd[root@z1~]#cd/root/zookeepe
GaussDB 学习实战指南：从部署到高并发优化的全流程解析 Jan123. gaussdb 学习
引言GaussDB作为华为推出的高性能分布式数据库，凭借其分布式架构、高可用性、云原生支持等特性，成为企业级应用的核心选择。本文将以实战操作为核心，覆盖集群部署、数据分片、性能调优、容灾备份、云上迁移五大场景，通过真实案例与代码示例，助你快速掌握GaussDB的实战技能，解决企业级应用中的复杂问题！一、GaussDB分布式集群部署实战1.本地多节点集群搭建（以openGauss为例）环境准备硬件要
2.部署kafka:9092 AustinCien kafka zookeeper elk
官方文档：http://kafka.apache.org/documentation.html(虽然kafka中集成了zookeeper,但还是建议使用独立的zk集群)Kafka3台集群搭建环境：操作系统:centos7防火墙：全关3台zookeeper集群内的机器，1台logstash软件版本:zookeeper-3.4.12.tar.gz软件版本kafka_2.12-2.1.0.tgz安装软件
K8S集群搭建(kubeadm+calico) kubernetes
准备阶段环境显卡：4060ti系统：ubuntu22.041.安装docker官网安装步骤：#AddDocker'sofficialGPGkey:sudoapt-getupdatesudoapt-getinstallca-certificatescurlsudoinstall-m0755-d/etc/apt/keyringssudocurl-fsSLhttps://download.docker.
RabbitMQ集群搭建：使用HAProxy和Keepalived实现RabbitMQ的高可用负载均衡 EvktJava rabbitmq 负载均衡 ruby
在本文中，我们将探讨如何使用HAProxy和Keepalived来搭建RabbitMQ的高可用负载均衡集群。我们还将介绍如何将SpringBoot与RabbitMQ集成，以便在应用程序中使用消息队列。搭建RabbitMQ集群首先，我们需要搭建一个RabbitMQ集群。在集群中，我们将有多个节点来处理消息队列的请求。每个节点都是独立的，但它们之间会相互通信以保持数据的同步。为了简化安装过程，我们将使
RocketMq学习笔记花开不识君 java 中间件 rocketmq
RocketMq学习笔记本文记录作者基于RocketMq4.9x版本对RocketMq部分功能特性的学习，并尝试从源码角度分析其实现原理。相关文章RocketMq5.0proxy的引入:https://juejin.cn/post/7293788137662758946RocketMqDocker集群搭建:https://www.cnblogs.com/xiao987334176/p/167718
clickhouse集群搭建 fusugongzi clickhouse 服务器 linux
准备三台机器，192.168.20.7，192.168.20.8，192.168.20.10用于搭建clickhouse集群。本次搭建的集群，为三副本的，即一份数据会在三台机器上分别存储，搭建集群只是为了容灾。1.在192.168.20.7上操作在clickhouseconfig.d目录下新建cluster.xml，内容如下91811/data/clickhouse/coordination/lo
nats集群搭建 fusugongzi 网络服务器运维
本次使用三台机器搭建nats集群，ip分别为192.168.20.7、192.168.20.8、192.168.20.10，预先在三台机器上装好nats，版本为0.0.35。1.在192.168.20.7机器上操作，配置server.conf#为节点设置唯一的名称server_name:node1port:4222#供客户端连接的监听端口net:0.0.0.0#监听的网络地址http_port:8
LVS-DR集群搭建 afei00123 Linux
目录1.LVS-DR实验拓扑2.实验环境3.配置LVS3.1IP配置3.2生成ens37:1配置文件3.3配置LVS-DR规则4.配置RealServer4.1配置IP，生成lo:1文件4.2安装httpd服务，编写测试页面4.3关闭ARP转发5.测试6.LVS的多种调度模式1.LVS-DR实验拓扑afeiLVS-DR的特点：（1）NAT模式效率太低；（2）LVS-DR基于2层的数据报文的转发，要
如何安装Hadoop 薇晶晶 hadoop 大数据分布式
Hadoop入门(一)——CentOS7下载+VM上安装（手动分区）Hadoop入门(二)——VMware虚拟网络设置+Windows10的IP地址配置+CentOS静态IP设置Hadoop入门(三)——XSHELL7远程访问工具+XFTP7文件传输Hadoop入门(四)——模板虚拟机环境准备Hadoop入门(五)——Hadoop集群搭建-克隆三台虚拟机Hadoop入门(六)——JDK安装Hado
mongodb分片集群搭建不会写诗的程序猿 mongodb 数据库大数据
环境准备操作系统：centos6.5mongodb版本：v3.6.23三台阿里云服务器：10.168.2.138、10.168.4.204、10.168.4.205搭建目标两个分片复制集（ShardedReplicaSet）分片集群1:（10.168.2.138:27011、10.168.4.204:27011、10.168.4.205:27011）分片集群2:(10.168.2.138:2701
MongoDB分片集群搭建及扩容老虎大人
准备工作在CentOS7上安装MongoDB分片集群6Servers代表：6台服务器上都要操作.环境准备On6Servers给虚拟机设置静态IPvi/etc/sysconfig/network-scripts/ifcfg-enp0s3修改以下#BOOTPROTO=“dhcp”BOOTPROTO=“static”IPADDR=“.xx.xx.xx.xx”NETMASK=“255.255.255.0”
ubuntu安装k8s qq_41369135 ubuntu kubernetes linux
centos：centos：K8Sv1.28.2集群搭建-docker版-一毛丶丶-博客园centos：Kubernetes详细安装教程_kubernetes安装-CSDN博客准备工作：1、主机名解析：确保每台机器的主机名能够被解析（可以通过/etc/hosts或DNS）。#三台机子分别执行sudohostnamectlset-hostnamek8s-mastersudohostnamectlse
Elasticsearch-API命令行相关操作手册少儿频道 elasticsearch 中间件 elasticsearch 运维
系列文章目录第一章es集群搭建文章目录系列文章目录前言esApi操作总结前言通过第一章学习es集群搭建流程及es基本概念后，在本章内容中，我们主要对es的基本命令行操作进行一次基本学习,来源于工作中的整理。esApi操作1.查看没有配置密码的es集群节点curl-XGEThttp://ip:9200/_cat/nodes?v2.查看配置了密码的es集群节点(关于es集群配置认证密码将在下章讲)cu
MySQL 运维篇 -- 主从集群搭建 L小Ray想有腮 MySQL mysql 运维数据库
文章目录主从复制主从复制原理主从故障处理延时从库主从GTID复制主从GR复制*****搭建组复制观察组复制主从复制主从同步过程（1）主丛复制基于binlog来实现的（2）主库发生新的操作，都会记录binlog（3）从库取得主库的binlog进行回放（4）主从复制是异步的准备主从的初始MySQL环境（YUM安装）[root@master~]#hostnamemaster[root@master~]#
ClickHouse集群搭建（CENTOS7环境） huaxia2002 大数据常用框架入门
ClickHouse集群搭建（CENTOS7环境）1.rpm包下载下载的rpm包版本-rw-r--r--1rootroot1342545月2817:07clickhouse-client-20.3.9.70-2.noarch.rpm-rw-r--r--1rootroot1169243615月2817:07clickhouse-common-static-20.3.9.70-2.x86_64.rpm
从0到1带大家搭建spring cloud alibaba 微服务大型应用框架（九）文件服务篇（1）：minio 单机与集群搭建峡谷电光马仔 spring cloud minio alibaba 分布式文件
为什么需分布式文件服务单机时代初创时期由于时间紧迫，在各种资源有限的情况下，通常就直接在项目目录下建立静态文件夹，用于用户存放项目中的文件资源。如果按不同类型再细分，可以在项目目录下再建立不同的子目录来区分。例如：resources\static\file、resources\static\image等。优点：这样做比较便利，项目直接引用就行，实现起来也简单，无需任何复杂技术，保存数据库记录和访问
Sealos的k8s高可用集群搭建 da pai ge kubernetes 容器云原生
Sealos介绍](https://sealos.io/zh-Hans/docs/Intro)Sealos是一个Go语言开发的简单干净且轻量的Kubernetes集群部署工具，能很好的支持在生产环境中部署高可用的Kubernetes集群。Sealos特性与优势支持离线安装，工具与部署资源包分离，方便不同版本间快速升级。证书有效期默认延期至99年。工具使用非常简单。支持使用自定义配置文件，可灵活完成
k8s第一章：kubeadm集群搭建琴剑诗酒 kubernetes 容器云原生
开源容器应用自动化部署技术KubernetesKubernetes这个单词来自于希腊语，含义是舵手或领航员；生产环境级别的容器编排编排是什么意思:1.按照一定的目的依次排列；2.调配、安排；Kubernetes，也称为K8S，其中8是代表中间“ubernete”的8个字符，是Google在2014年开源的一个容器编排引擎，用于自动化容器化应用程序的部署、规划、扩展和管理，它将组成应用程序的容器分组
ELK系列（二）Kafka集群3.4.0搭建诉光海 ELK elk java 服务器 kafka
ELK系列传送门ELK系列（一）ElasticSearch8.9.2集群搭建ELK系列（二）Kafka集群3.4.0搭建ELK数据流规划ELK接入nginx-acces日志数据流规划数据流向filebeat------->kafka---->logstash---->ES-------->kibana收集mq处理日志存储、搜索展示、分析||elastalert2---钉钉告警ES集群搭建已完成可见
Elasticsearch 7 集群搭建问题排查：常见故障解决方案与优化技巧程序员的开发手册运维教程 Elasticsearch elasticsearch 集群搭建问题排查常见故障解决方案
引言Elasticsearch作为一种强大的分布式搜索引擎，已被广泛应用于各种场景，特别是在日志聚合、数据分析等领域中。然而，在实际部署中，尤其是集群搭建阶段，许多用户都会遇到配置问题，导致集群无法成功建立。在本文中，我们将通过一个实际的案例，详细分析和排查Elasticsearch集群搭建中的常见故障，帮助你快速解决问题，顺利完成集群的搭建。背景介绍在我们的案例中，用户在尝试搭建一个简单的Ela
安装mysql的MGR集群秋天枫叶35 安装中间件 mysql 数据库 MGR集群运维 linux
说明1、mysql数据库主从宕机，会影响到正常业务访问，并且要手动进行切换。2、MHA高可用搭建复杂，代码已停止更新。3、MGR集群搭建方便，master故障会自动进行切换，不影响业务正常访问。一、环境准备1、主机说明IP地址主机名端口操作系统数据库版本172.16.1.20db013306centos7.95.7.40172.16.1.21db023306centos7.95.7.40172.1
三、大数据之Zookeeper完全分布式集群搭建尘.埃大数据生态框架搭建 zookeeper 大数据
目录Zookeeper简介：（1）集群部署规划（2）安装Zookeeper（3）配置zook.cfg文件（4）配置服务器编号（5）配置Zookeeper环境变量（6）配置文件分发（7）集群启动（8）zookeeper群启脚本（9）Zookeeper官方文档说明：Zookeeper安装包Zookeeper简介：Zookeeper是一个开源的分布式的，为分布式应用提供协调服务的Apache项目。Zoo
【大数据入门核心技术-Flume】（二）Flume安装部署 forest_long 大数据技术入门到21天通关 big data hadoop 大数据 hbase flume
目录一、准备工作1、基本Hadoop环境安装2、下载安装包二、安装1、解压2、修改环境变量3、修改并配置flume-env.sh文件4、验证是否安装成功一、准备工作1、基本Hadoop环境安装参考Hadoop安装【大数据入门核心技术-Hadoop】（五）Hadoop3.2.1非高可用集群搭建【大数据入门核心技术-Hadoop】（六）Hadoop3.2.1高可用集群搭建2、下载安装包官方网址：
大数据集群搭建基础：Hadoop完全分布式搭建学习指南！！初次知晓大数据分布式 hadoop
Hadoop完全分布式搭建学习指南Hadoop版本：Hadoop2.XJDK版本：JDK1.8一、准备工作设置主机名和IP在三台CentOS7.4机器上分别设置主机名和IP：node1:192.168.14.10node2:192.168.14.20node3:192.168.14.30修改主机名（以node1为例）：hostnamectlset-hostnamenode1配置网络（依据具体网络环
关于旗正规则引擎规则中的上传和下载问题何必如此文件下载压缩 jsp 文件上传
文件的上传下载都是数据流的输入输出，大致流程都是一样的。一、文件打包下载 1.文件写入压缩包 string mainPath="D:\upload\"; 下载路径 string tmpfileName=jar.zip; &n
【Spark九十九】Spark Streaming的batch interval时间内的数据流转源码分析 bit1129 Stream
以如下代码为例（SocketInputDStream）： Spark Streaming从Socket读取数据的代码是在SocketReceiver的receive方法中，撇开异常情况不谈(Receiver有重连机制，restart方法，默认情况下在Receiver挂了之后，间隔两秒钟重新建立Socket连接)，读取到的数据通过调用store(textRead)方法进行存储。数据
spark master web ui 端口8080被占用解决方法 daizj 8080 端口占用 spark master web ui
spark master web ui 默认端口为8080，当系统有其它程序也在使用该接口时，启动master时也不会报错，spark自己会改用其它端口，自动端口号加1，但为了可以控制到指定的端口，我们可以自行设置，修改方法： 1、cd SPARK_HOME/sbin 2、vi start-master.sh 3、定位到下面部分
oracle_执行计划_谓词信息和数据获取周凡杨 oracle 执行计划
oracle_执行计划_谓词信息和数据获取(上) 一：简要说明在查看执行计划的信息中，经常会看到两个谓词filter和access，它们的区别是什么，理解了这两个词对我们解读Oracle的执行计划信息会有所帮助。简单说，执行计划如果显示是access，就表示这个谓词条件的值将会影响数据的访问路径（表还是索引），而filter表示谓词条件的值并不会影响数据访问路径，只起到
spring中datasource配置 g21121 dataSource
datasource配置有很多种，我介绍的一种是采用c3p0的，它的百科地址是： http://baike.baidu.com/view/920062.htm  <bean name="propertiesConfig" class="org.springframework.b
web报表工具FineReport使用中遇到的常见报错及解决办法（三）老A不折腾 finereport FAQ 报表软件
这里写点抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、repeated column width is largerthan paper width：这个看这段话应该是很好理解的。比如做的模板页面宽度只能放
mysql 用户管理墙头上一根草 linux mysql user
1.新建用户 //登录MYSQL@>mysql -u root -p@>密码//创建用户mysql> insert into mysql.user(Host,User,Password) values(‘localhost’,'jeecn’,password(‘jeecn’));//刷新系统权限表mysql>flush privileges;这样就创建了一个名为：
关于使用Spring导致c3p0数据库死锁问题 aijuans spring Spring 入门 Spring 实例 Spring3 Spring 教程
这个问题我实在是为整个 springsource 的员工蒙羞如果大家使用 spring 控制事务，使用 Open Session In View 模式， com.mchange.v2.resourcepool.TimeoutException: A client timed out while waiting to acquire a resource from com.mchange.
百度词库联想 annan211 百度
<!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"> <title>RunJS</title&g
int数据与byte之间的相互转换实现代码百合不是茶位移 int转byte byte转int 基本数据类型的实现
在BMP文件和文件压缩时需要用到的int与byte转换,现将理解的贴出来; 主要是要理解;位移等概念 http://baihe747.iteye.com/blog/2078029 int转byte; byte转int; /** * 字节转成int,int转成字节 * @author Administrator *
简单模拟实现数据库连接池 bijian1013 java thread java多线程简单模拟实现数据库连接池
简单模拟实现数据库连接池实例1： package com.bijian.thread; public class DB { //private static final int MAX_COUNT = 10; private static final DB instance = new DB(); private int count = 0; private i
一种基于Weblogic容器的鉴权设计 bijian1013 java weblogic
服务器对请求的鉴权可以在请求头中加Authorization之类的key，将用户名、密码保存到此key对应的value中，当然对于用户名、密码这种高机密的信息，应该对其进行加砂加密等，最简单的方法如下： String vuser_id = "weblogic"; String vuse
【RPC框架Hessian二】Hessian 对象序列化和反序列化 bit1129 hessian
任何一个对象从一个JVM传输到另一个JVM，都要经过序列化为二进制数据(或者字符串等其他格式，比如JSON)，然后在反序列化为Java对象，这最后都是通过二进制的数据在不同的JVM之间传输(一般是通过Socket和二进制的数据传输)，本文定义一个比较符合工作中。 1. 定义三个POJO Person类 package com.tom.hes
【Hadoop十四】Hadoop提供的脚本的功能 bit1129 hadoop
1. hadoop-daemon.sh 1.1 启动HDFS ./hadoop-daemon.sh start namenode ./hadoop-daemon.sh start datanode 通过这种逐步启动的方式，比start-all.sh方式少了一个SecondaryNameNode进程，这不影响Hadoop的使用，其实在 Hadoop2.0中，SecondaryNa
中国互联网走在“灰度”上 ronin47 管理灰度
中国互联网走在“灰度”上（转）文/孕峰第一次听说灰度这个词，是任正非说新型管理者所需要的素质。第二次听说是来自马化腾。似乎其他人包括马云也用不同的语言说过类似的意思。灰度这个词所包含的意义和视野是广远的。要理解这个词，可能同样要用“灰度”的心态。灰度的反面，是规规矩矩，清清楚楚，泾渭分明，严谨条理，是决不妥协，不转弯，认死理。黑白分明不是灰度，像彩虹那样
java-51-输入一个矩阵，按照从外向里以顺时针的顺序依次打印出每一个数字。 bylijinnan java
public class PrintMatrixClockwisely { /** * Q51.输入一个矩阵，按照从外向里以顺时针的顺序依次打印出每一个数字。例如：如果输入如下矩阵： 1 2 3 4 5 6 7 8 9
mongoDB 用户管理开窍的石头 mongoDB用户管理
1:添加用户第一次设置用户需要进入admin数据库下设置超级用户（use admin） db.addUsr({user:'useName',pwd:'111111',roles:[readWrite,dbAdmin]}); 第一个参数用户的名字第二个参数
[游戏与生活]玩暗黑破坏神3的一些问题 comsci 生活
暗黑破坏神3是有史以来最让人激动的游戏。。。。但是有几个问题需要我们注意玩这个游戏的时间，每天不要超过一个小时，且每次玩游戏最好在白天结束游戏之后，最好在太阳下面来晒一下身上的暗黑气息，让自己恢复人的生气 &nb
java 二维数组如何存入数据库 cuiyadll java
using System; using System.Linq; using System.Text; using System.Windows.Forms; using System.Xml; using System.Xml.Serialization; using System.IO; namespace WindowsFormsApplication1 {
本地事务和全局事务Local Transaction and Global Transaction(JTA) darrenzhu java spring local global transaction
Configuring Spring and JTA without full Java EE http://spring.io/blog/2011/08/15/configuring-spring-and-jta-without-full-java-ee/ Spring doc -Transaction Management http://docs.spring.io/spri
Linux命令之alias - 设置命令的别名，让 Linux 命令更简练 dcj3sjt126com linux alias
用途说明设置命令的别名。在linux系统中如果命令太长又不符合用户的习惯，那么我们可以为它指定一个别名。虽然可以为命令建立“链接”解决长文件名的问题，但对于带命令行参数的命令，链接就无能为力了。而指定别名则可以解决此类所有问题【1】。常用别名来简化ssh登录【见示例三】，使长命令变短，使常用的长命令行变短，强制执行命令时询问等。常用参数格式：alias 格式：ali
yii2 restful web服务[格式响应] dcj3sjt126com PHP yii2
响应格式当处理一个 RESTful API 请求时，一个应用程序通常需要如下步骤来处理响应格式：确定可能影响响应格式的各种因素，例如媒介类型，语言，版本，等等。这个过程也被称为 content negotiation。资源对象转换为数组，如在 Resources 部分中所描述的。通过 [[yii\rest\Serializer]]
MongoDB索引调优（2）——[十] eksliang mongodb MongoDB索引优化
转载请出自出处：http://eksliang.iteye.com/blog/2178555 一、概述上一篇文档中也说明了，MongoDB的索引几乎与关系型数据库的索引一模一样，优化关系型数据库的技巧通用适合MongoDB，所有这里只讲MongoDB需要注意的地方二、索引内嵌文档可以在嵌套文档的键上建立索引，方式与正常
当滑动到顶部和底部时，实现Item的分离效果的ListView gundumw100 android
拉动ListView，Item之间的间距会变大，释放后恢复原样； package cn.tangdada.tangbang.widget; import android.annotation.TargetApi; import android.content.Context; import android.content.res.TypedArray; import andr
程序员用HTML5制作的爱心树表白动画 ini JavaScript jquery Web html5 css
体验效果：http://keleyi.com/keleyi/phtml/html5/31.htmHTML代码如下： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"><head><meta charset="UTF-8" > <ti
预装windows 8 系统GPT模式的ThinkPad T440改装64位 windows 7旗舰版 kakajw ThinkPad 预装改装 windows 7 windows 8
该教程具有普遍参考性，特别适用于联想的机器，其他品牌机器的处理过程也大同小异。该教程是个人多次尝试和总结的结果，实用性强，推荐给需要的人！缘由小弟最近入手笔记本ThinkPad T440，但是特别不能习惯笔记本出厂预装的Windows 8系统，而且厂商自作聪明地预装了一堆没用的应用软件，消耗不少的系统资源（本本的内存为4G，系统启动完成时，物理内存占用比
Nginx学习笔记 mcj8089 nginx
一、安装nginx 1、在nginx官方网站下载一个包，下载地址是： http://nginx.org/download/nginx-1.4.2.tar.gz 2、WinSCP(ftp上传工
mongodb 聚合查询每天论坛链接点击次数 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
/* 18 */ { "_id" : ObjectId("5596414cbe4d73a327e50274"), "msgType" : "text", "sendTime" : ISODate("2015-07-03T08:01:16.000Z"
java术语（PO/POJO/VO/BO/DAO/DTO） Luob. DAO POJO DTO po VO BO
PO(persistant object) 持久对象在o/r 映射的时候出现的概念,如果没有o/r映射,就没有这个概念存在了.通常对应数据模型(数据库),本身还有部分业务逻辑的处理.可以看成是与数据库中的表相映射的java对象.最简单的PO就是对应数据库中某个表中的一条记录,多个记录可以用PO的集合.PO中应该不包含任何对数据库的操作. VO(value object) 值对象通
算法复杂度 Wuaner Algorithm
Time Complexity & Big-O： http://stackoverflow.com/questions/487258/plain-english-explanation-of-big-o http://bigocheatsheet.com/ http://www.sitepoint.com/time-complexity-algorithms/

Hadoop-MapReduce-Yarn集群搭建

一 、MapReduce on Yarn单节点搭建

二、搭建高可用的yarn

三、使用代码实战mapReduce案例

你可能感兴趣的:(Hadoop-MapReduce-Yarn集群搭建)

一、MapReduce on Yarn单节点搭建