终极菜鸡

大数据学习笔记——Hadoop编程实战之Mapreduce

Hadoop编程实战——Mapreduce基本功能实现

此篇博客承接上一篇总结的HDFS编程实战，将会详细地对mapreduce的各种数据分析功能进行一个整理，由于实际工作中并不会过多地涉及原理，因此，掌握好mapreduce框架将会有助于了解sql语句在大数据场景下的底层实现原理，从而能够帮助开发人员优化sql语句，提高查询速度，废话不多说，现在正式开始吧！

1. Mapreduce入门——word count实现

一个基本的mapreduce程序一般要写三个类，Mapper类，Reducer类，以及一个APP类，Mapper类按行读取数据同时可以进行数据清洗，Reducer类负责按照某种逻辑对value进行聚合，而APP类中需要写一个入口函数并且对配置文件进行一些必要的设置，具体代码如下：

APP类：

package mapreduce.wc;
/*
    写一个简单的word count的编程入门，注意，所有需要导入的包都要使用mapreduce而不是mapred!!!
 */
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

public class WCApp {
    public static void main(String[] args) throws Exception {
        //首先需要进行设置从而让系统识别root用户
        //System.setProperty("HADOOP_USER_NAME", "root");
        Configuration conf = new Configuration();
        //配置文件的默认设置是使用HDFS分布式文件系统，因此需要将conf对象临时设置成本地模式
        conf.set("fs.defaultFS", "file:///");
        FileSystem fs = FileSystem.get(conf);
        //使用Job类的静态方法并将配置文件传入实例化一个对象
        //使用到了java的单例设计模式
        Job job = Job.getInstance(conf);
        //设置作业的名称
        job.setJobName("word count");
        //设置本类的class，以及Mapper和Reducer的class
        job.setJarByClass(WCApp.class);
        job.setMapperClass(WCMapper.class);
        job.setReducerClass(WCReducer.class);
        //设置Mapper的输出KV的class
        job.setMapOutputKeyClass(Text.class);
        job.setMapOutputValueClass(IntWritable.class);
        //设置Reducer的输出KV的class，如果Mapper和Reducer的输出相一致，只需要写一个即可
        job.setOutputKeyClass(Text.class);
        job.setMapOutputValueClass(IntWritable.class);
        //设置输入和输出的文件路径
        Path outPath = new Path("file:///d:/out");
        FileInputFormat.addInputPath(job, new Path("file:///d:/wc.txt"));
        FileOutputFormat.setOutputPath(job, outPath);
        //如果文件存在，则要先删除，否则就会出现报错
        if(fs.exists(outPath)){
            fs.delete(outPath,true);
        }
        //开始执行程序
        job.waitForCompletion(true);
    }
}

Mapper类：

package mapreduce.wc;

import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Mapper;

import java.io.IOException;

public class WCMapper extends Mapper {
    @Override
    protected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {
        //首先获取到每一行数据
        String line = value.toString();
        //对每一行数据进行处理
        String[] arr = line.split(" ");
        //遍历arr，使用context上下文对象将KV对写出去
        for (String s : arr) {
            context.write(new Text(s), new IntWritable(1));
        }
    }
}

Reducer类：

package mapreduce.wc;

import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Reducer;

import java.io.IOException;

public class WCReducer extends Reducer {
    @Override
    protected void reduce(Text key, Iterable values, Context context) throws IOException, InterruptedException {
        //对每个reduce循环中出现的重复的key对应的value实现某种聚合逻辑
        int sum = 0;
        for (IntWritable value : values) {
            sum += value.get();
        }
        context.write(key, new IntWritable(sum));
    }
}

2. Mapreduce综合演练——最高，最低，平均气温统计 + Combiner

Combiner的作用相当于先在map端进行了一次聚合，这样在后面使用Reducer进行Shuffle的时候，数据量就会明显地变小，从而提高运算所需要耗费的时间，设置Combiner非常简单，只需要先写好Combiner类，然后在APP端设置setCombinerClass即可，具体代码如下：

APP类：

package mapreduce.temp;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

/*
    统计气温数据的最高最低平均值
 */
public class TempApp {
    public static void main(String[] args) throws Exception {
        Configuration conf = new Configuration();
        conf.set("fs.defaultFS", "file:///");
        FileSystem fs = FileSystem.get(conf);
        Job job = Job.getInstance(conf);
        job.setJobName("temp");
        job.setJarByClass(TempApp.class);
        job.setMapperClass(TempMapper.class);
        job.setReducerClass(TempReducer.class);
        //需要加一个Combiner的class
        job.setCombinerClass(TempCombiner.class);
        //设置Mapper的输出KV的class
        job.setMapOutputKeyClass(Text.class);
        job.setMapOutputValueClass(Text.class);
        //设置Reducer的输出KV的class，如果Mapper和Reducer的输出相一致，只需要写一个即可
        job.setOutputKeyClass(Text.class);
        job.setOutputValueClass(Text.class);
        //设置输入和输出的文件路径
        Path outPath = new Path("file:///d:/out");
        FileInputFormat.addInputPath(job, new Path("file:///d:/Temp"));
        FileOutputFormat.setOutputPath(job, outPath);
        //如果文件存在，则要先删除，否则就会出现报错
        if(fs.exists(outPath)){
            fs.delete(outPath,true);
        }
        //开始执行程序
        job.waitForCompletion(true);
    }
}

Mapper类：

package mapreduce.temp;

import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Mapper;

import java.io.IOException;

public class TempMapper extends Mapper {
    @Override
    protected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {
        String line = value.toString();
        //获取到年份以及温度字段
        String year = line.substring(15, 19);
        String temp = line.substring(87, 92);
        //脏数据处理
        if(Integer.parseInt(temp) != 9999){
            context.write(new Text(year), new Text(temp));
        }
    }
}

Combiner类：

package mapreduce.temp;
/*
    Combiner相当于map端的Reducer，可以对数据进行一次预聚合，从而减少数据量
 */
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Reducer;

import java.io.IOException;

public class TempCombiner extends Reducer {
    @Override
    protected void reduce(Text key, Iterable values, Context context) throws IOException, InterruptedException {
        int max = Integer.MIN_VALUE;
        int min = Integer.MAX_VALUE;
        int sum = 0;
        int count = 0;
        for (Text value : values) {
            int i = Integer.parseInt(value.toString());
            max = Math.max(max, i);
            min = Math.min(min, i);
            sum += i;
            count += 1;
        }
        context.write(key, new Text("" + max + "\t" + min + "\t" + sum + "\t" + count));
    }
}

Reducer类：

package mapreduce.temp;

import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Reducer;

import java.io.IOException;

public class TempReducer extends Reducer {
    @Override
    protected void reduce(Text key, Iterable values, Context context) throws IOException, InterruptedException {
        int max = Integer.MIN_VALUE;
        int min = Integer.MAX_VALUE;
        int sum = 0;
        int count = 0;
        for (Text value : values) {
            //需要先对Combiner中传过来的value进行一波解析
            String[] arr = value.toString().split("\t");
            int max_tmp = Integer.parseInt(arr[0]);
            int min_tmp = Integer.parseInt(arr[1]);
            int sum_tmp = Integer.parseInt(arr[2]);
            int count_tmp = Integer.parseInt(arr[3]);
            max = Math.max(max, max_tmp);
            min = Math.min(min, min_tmp);
            sum += sum_tmp;
            count += count_tmp;
        }
        context.write(key, new Text("" + max + "\t" + min + "\t" + sum / count));
    }
}

3. 两种方式解决大数据场景下的数据倾斜问题

用户在使用setNumReduceTasks方法时可以设置多个分区，从而可以达到防止大量数据涌向一个节点而导致该节点崩溃的情况发生，具体使用方法是在APP类中加入一句话：

//设置reduce的个数
job.setNumReduceTasks(3);

用户进行了如上设置就可以实现数据分三个分区进行输出的效果，若没有自定义一个类继承Partitioner类，系统默认使用的是HashPartitioner类，该类的源代码如下所示：

public class HashPartitioner extends Partitioner {

  /** Use {@link Object#hashCode()} to partition. */
  public int getPartition(K key, V value,
                          int numReduceTasks) {
    return (key.hashCode() & Integer.MAX_VALUE) % numReduceTasks;
  }

}

从return语句可以看出，实际上getPartition方法就是通过调用key的hashCode的方法来实现的，即先计算出key的哈希值，然后再对用户自定义的分区数进行取余操作，但是，如果有大量的key都是相同的话(比如双十一的促销活动)，那么它们除以分区个数取到的余数肯定也就是相同的了，那么这样的话等于说并没有真正解决数据倾斜的问题，为此，我们就需要自己设计方案让数据尽可能地分布均匀了，由于很多情况下解决数据倾斜问题需要结合企业实际的业务场景，因此这里提供的是最为常见的解决方案，即重新设计key，在key后面加上一个随机数，以及随机分区法，下面将会介绍这两种方法：

重新设计key法

首先APP类需要用到二次作业，即分好区之后得到的并不是最终结果，因此还需要再进行一次作业来处理中间结果

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

public class WCApp {

    public static void main(String[] args) throws Exception {
        System.setProperty("HADOOP_USER_NAME", "centos");
        //初始化作业
        Configuration conf = new Configuration();

        conf.set("fs.defaultFS", "file:///");

        FileSystem fs = FileSystem.get(conf);

        Job job = Job.getInstance(conf);

        //作业设置名称
        job.setJobName("WC");

        //设置入口函数所在的类
        job.setJarByClass(WCApp.class);

        //设置map和reduce类
        job.setMapperClass(WCMapper.class);
        job.setReducerClass(WCReducer.class);

        //设置map的输出k-v类型
        job.setMapOutputKeyClass(Text.class);
        job.setMapOutputValueClass(IntWritable.class);

        //设置reduce的输出k-v类型
        job.setOutputKeyClass(Text.class);
        job.setOutputValueClass(IntWritable.class);


        Path outPath = new Path("D:/out");

        //设置输入输出路径
        FileInputFormat.addInputPath(job, new Path("D:/1.txt"));
        FileOutputFormat.setOutputPath(job, outPath);
        if (fs.exists(outPath)) {
            fs.delete(outPath, true);
        }

        job.setNumReduceTasks(4);

        //开始执行
        boolean b = job.waitForCompletion(true);

        if (b) {
            Job job2 = Job.getInstance(conf);

            //作业设置名称
            job2.setJobName("WC2");

            //设置入口函数所在的类
            job2.setJarByClass(WCApp.class);

            //设置map和reduce类
            job2.setMapperClass(WCMapper2.class);
            job2.setReducerClass(WCReducer.class);

            //设置map的输出k-v类型
            job2.setMapOutputKeyClass(Text.class);
            job2.setMapOutputValueClass(IntWritable.class);

            //设置reduce的输出k-v类型
            job2.setOutputKeyClass(Text.class);
            job2.setOutputValueClass(IntWritable.class);


            Path outPath2 = new Path("D:/out2");

            //设置输入输出路径
            FileInputFormat.addInputPath(job2, new Path("D:/out"));
            FileOutputFormat.setOutputPath(job2, outPath2);
            if (fs.exists(outPath2)) {
                fs.delete(outPath2, true);
            }
            //开始执行
            job2.waitForCompletion(true);
        }
    }
}

在编写Mapper类时，需要注意的是在定义Random对象时，应该只初始化对象一次才对，因此考虑将新建对象的过程放在setup方法中，然后在每一个key后面拼接上这个随机数即可，具体代码如下：

import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Mapper;

import java.io.IOException;
import java.util.Random;

public class WCMapper extends Mapper {

    int num;
    Random r;

    @Override
    protected void setup(Context context) throws IOException, InterruptedException {
        num = context.getNumReduceTasks();
        r = new Random();

    }

    @Override
    protected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {
        String line = value.toString();
        String[] arr = line.split(" ");
        for (String word : arr) {
            context.write(new Text(word + "_" + r.nextInt(num)), new IntWritable(1));
        }
    }
}

需要注意的是，还需要编写一个Mapper类将key再用-拆分开来

import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Mapper;

import java.io.IOException;
import java.util.Random;

public class WCMapper2 extends Mapper {

    @Override
    protected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {

        String[] arr = value.toString().split("\t");
        String word = arr[0].split("_")[0];
        String count = arr[1];

        context.write(new Text(word),new IntWritable(Integer.parseInt(count)));

    }
}

重新分区法

此方法的实现方式是不考虑key是如何的，而是在每读取一条数据的时候，让它随机地进入到某一个分区，需要自定义分区函数，关键代码如下：

import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Partitioner;

import java.util.Random;

public class RandomPartition extends Partitioner {

    Random r = new Random();

    @Override
    public int getPartition(Text text, IntWritable intWritable, int numPartitions) {
        return r.nextInt(numPartitions);
    }
}

并且不要忘了还要在APP类中设置Partitioner类的class：

//设置自定义的Partitioner类所在的class
job.setPartitionerClass(RandomPartition.class);

说明：两种方法都能解决数据倾斜的问题，但是相对来说，第二种方式，即随即分区法更为优化，原因一是因为该方法代码更为简洁，而是因为第一种方式由于需要在每个key后再加一个字符串，增加了网络间数据传输的压力，因此不推荐使用，实际场景下更推荐从分区的角度考虑解决数据倾斜的问题

4. 输入输出格式设置

用户可在APP类中设置各种不同的输入格式，如果不指定系统默认使用的就是TextInputFormat，除此之外，还有SequenceFileInputFormat，KeyValueTextInputFormat(一般在处理二次作业时使用较多，因为mapreduce的默认输出格式的KV对就是以"\t"进行分隔的)，以及DBInputFormat，当然，输出格式也可以由用户来指定

//设置成序列文件格式
job.setInputFormatClass(SequenceFileInputFormat.class);
//设置成KV对文件格式
job.setInputFormatClass(KeyValueTextInputFormat.class);

这里将会重点讲解DBInputFormat格式，因为它在关系型数据库与大数据框架之间的ETL即数据的导入导出中起到非常重要的作用

首先是两个自定义的DBWritable类，一个用来从数据库抓取数据，一个用于导出数据到数据库

package mapreduce.db;

import org.apache.hadoop.io.Writable;
import org.apache.hadoop.mapreduce.lib.db.DBWritable;

import java.io.DataInput;
import java.io.DataOutput;
import java.io.IOException;
import java.sql.PreparedStatement;
import java.sql.ResultSet;
import java.sql.SQLException;

/*
    自定义一个DBWritable类需要实现Writable接口以及DBWritable接口
    注意，此类用作从数据库中读取数据即FileInputFormat
 */
public class MyDBWritable implements Writable, DBWritable {

    //定义的成员变量分别是mysql数据库中的两个字段
    int id;
    String line;

    //设置一系列的get，set方法，构造方法，toString方法等等


    public MyDBWritable(int id, String line) {
        this.id = id;
        this.line = line;
    }

    public MyDBWritable() {
    }

    public int getId() {
        return id;
    }

    public void setId(int id) {
        this.id = id;
    }

    public String getLine() {
        return line;
    }

    public void setLine(String line) {
        this.line = line;
    }

    @Override
    public String toString() {
        return "MyDBWritable{" +
                "id=" + id +
                ", line='" + line + '\'' +
                '}';
    }

    public void write(DataOutput out) throws IOException {
        out.writeInt(id);
        out.writeUTF(line);
    }

    public void readFields(DataInput in) throws IOException {
        id = in.readInt();
        line = in.readUTF();
    }

    public void write(PreparedStatement ppst) throws SQLException {
        //注意到参数是PreparedStatement对象，因此可以使用set方法
        ppst.setInt(1, id);
        ppst.setString(2, line);
    }

    public void readFields(ResultSet rs) throws SQLException {
        id = rs.getInt(1);
        line = rs.getString(2);
    }
}

package mapreduce.db;
/*
    此DBWritable用于将处理好了的数据导出到数据库中去
 */
import org.apache.hadoop.io.Writable;
import org.apache.hadoop.mapreduce.lib.db.DBWritable;

import java.io.DataInput;
import java.io.DataOutput;
import java.io.IOException;
import java.sql.PreparedStatement;
import java.sql.ResultSet;
import java.sql.SQLException;

public class MyDBWritable2 implements Writable, DBWritable {

    String word;
    int count;

    public MyDBWritable2(String word, int count) {
        this.word = word;
        this.count = count;
    }

    public MyDBWritable2() {
    }

    public String getWord() {
        return word;
    }

    public void setWord(String word) {
        this.word = word;
    }

    public int getCount() {
        return count;
    }

    public void setCount(int count) {
        this.count = count;
    }

    @Override
    public String toString() {
        return "MyDBWritable2{" +
                "word='" + word + '\'' +
                ", count=" + count +
                '}';
    }

    public void write(DataOutput out) throws IOException {
        out.writeUTF(word);
        out.writeInt(count);
    }

    public void readFields(DataInput in) throws IOException {
        word = in.readUTF();
        count = in.readInt();
    }

    public void write(PreparedStatement ppst) throws SQLException {
        ppst.setString(1, word);
        ppst.setInt(2, count);
    }

    public void readFields(ResultSet rs) throws SQLException {
        word = rs.getString(1);
        count = rs.getInt(2);
    }
}

APP类：

package mapreduce.db;
/*
    此APP的功能为从关系型数据库中读取数据，使用mapreduce框架处理完毕后再将数据导出至关系型数据库
 */

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.db.DBConfiguration;
import org.apache.hadoop.mapreduce.lib.db.DBInputFormat;
import org.apache.hadoop.mapreduce.lib.db.DBOutputFormat;

public class DBApp {
    public static void main(String[] args) throws Exception {
        Configuration conf = new Configuration();
        conf.set("fs.defaultFS","file:///");
        Job job = Job.getInstance(conf);

        job.setJobName("DBinput");

        job.setJarByClass(DBApp.class);
        job.setMapperClass(DBMapper.class);
        job.setReducerClass(DBReducer.class);

        job.setInputFormatClass(DBInputFormat.class);
        DBInputFormat.setInput(job,MyDBWritable.class,"select * from test","select count(*) from test");
        DBOutputFormat.setOutput(job,"wc",2);
        //使用下面的方式来使用连接数据库的四大工具，驱动，URL，username以及password
        DBConfiguration.configureDB(job.getConfiguration(),"com.mysql.jdbc.Driver","jdbc:mysql://s201:3306/big14","root","root");

        //设置reduce的输出k-v类型
        job.setOutputKeyClass(MyDBWritable2.class);
        job.setOutputValueClass(NullWritable.class);

        job.setMapOutputKeyClass(Text.class);
        job.setMapOutputValueClass(IntWritable.class);

        //开始执行
        job.waitForCompletion(true);
    }
}

Mapper类：

package mapreduce.db;

import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Mapper;

import java.io.IOException;

public class DBMapper extends Mapper {
    @Override
    protected void map(LongWritable key, MyDBWritable value, Context context) throws IOException, InterruptedException {
        //首先从MyDBWritable中获取到一行数据
        String line = value.getLine();
        String[] arr = line.split(" ");
        for (String s : arr) {
            context.write(new Text(s), new IntWritable(1));
        }
    }
}

Reducer类：

package mapreduce.db;
/*
    注意：该Reducer类的输出value可以为空，即NullWritable
 */
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Reducer;

import java.io.IOException;

public class DBReducer extends Reducer {
    @Override
    protected void reduce(Text key, Iterable values, Context context) throws IOException, InterruptedException {
        int sum = 0;
        for (IntWritable value : values) {
            sum += value.get();
        }
        //将key和sum的值封装到MyDBWritable2中去
        MyDBWritable2 mydb = new MyDBWritable2(key.toString(), sum);
        context.write(mydb, NullWritable.get());
    }
}

5. 二次排序

分析人员在使用sql语句进行某项查询的时候，往往会遇到二次排序的场景，即先按某字段进行排序，当某字段的值出现相同的情况时，再按另一字段进行排序，在编写mapreduce程序的时候可以在底层实现二次排序的原理，具体实现时需要注意这几个知识点：

1. 首先需要自定义Writable类实现WritableComparable接口，在compareTo方法中实现二次排序的逻辑

2. 需要重写分组对比器，WritableComparator，用来让系统判断应该让什么样的key作为不重复的key

3. 还需要重写hashCode方法，使得在对数据进行分区时可以将正确的key分到一个分区里去

以下是具体的代码实现：

组合键的类：

package mapreduce.secondsort;

import org.apache.hadoop.io.WritableComparable;

import java.io.DataInput;
import java.io.DataOutput;
import java.io.IOException;

public class Compkey implements WritableComparable {

    //先定义两个成员变量
    int year;
    int temp;

    public Compkey(int year, int temp) {
        this.year = year;
        this.temp = temp;
    }

    public Compkey() {
    }

    public int getYear() {
        return year;
    }

    public void setYear(int year) {
        this.year = year;
    }

    public int getTemp() {
        return temp;
    }

    public void setTemp(int temp) {
        this.temp = temp;
    }

    public int compareTo(Compkey o) {
        //在这里实现二次排序的逻辑
        if(this.getYear() == o.getYear()){
            return o.getTemp() - this.getTemp();
        }else{
            return this.getYear() - o.getYear();
        }
    }

    public void write(DataOutput out) throws IOException {
        out.writeInt(year);
        out.writeInt(temp);
    }

    public void readFields(DataInput in) throws IOException {
        year = in.readInt();
        temp = in.readInt();
    }
}

分组对比器类：

package mapreduce.secondsort;

import org.apache.hadoop.io.WritableComparable;
import org.apache.hadoop.io.WritableComparator;

public class MyGroupingComparator extends WritableComparator {
    //需要重写构造方法来使对象实例化
    public MyGroupingComparator() {
        super(Compkey.class, true);
    }
    //重写compare方法

    @Override
    public int compare(WritableComparable a, WritableComparable b) {
        return ((Compkey) a).getYear() - ((Compkey) b).getYear();
    }
}

APP类：

package mapreduce.secondsort;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

/*
    此app的功能为对天气数据先对年份再对气温做一个二次排序，并且气温是倒排序
 */
public class SecondApp {
    public static void main(String[] args) throws Exception {
        Configuration conf = new Configuration();
        conf.set("fs.defaultFS", "file:///");
        FileSystem fs = FileSystem.get(conf);
        Job job = Job.getInstance(conf);
        job.setJobName("secondsort");
        job.setJarByClass(SecondApp.class);
        job.setMapperClass(SecondMapper.class);
        job.setReducerClass(SecondReducer.class);
        //设置Mapper的输出KV的class
        job.setMapOutputKeyClass(Compkey.class);
        job.setMapOutputValueClass(NullWritable.class);
        //设置Reducer的输出KV的class，如果Mapper和Reducer的输出相一致，只需要写一个即可
        job.setOutputKeyClass(IntWritable.class);
        job.setOutputValueClass(IntWritable.class);
        //设置输入和输出的文件路径
        Path outPath = new Path("file:///d:/out");
        FileInputFormat.addInputPath(job, new Path("file:///d:/Temp"));
        FileOutputFormat.setOutputPath(job, outPath);
        //如果文件存在，则要先删除，否则就会出现报错
        if(fs.exists(outPath)){
            fs.delete(outPath,true);
        }
        //开始执行程序
        job.waitForCompletion(true);
    }
}

Mapper类：

package mapreduce.secondsort;

import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Mapper;

import java.io.IOException;

public class SecondMapper extends Mapper {
    @Override
    protected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {
        String line = value.toString();
        int year = Integer.parseInt(line.substring(15, 19));
        int temp = Integer.parseInt(line.substring(87, 92));
        if(year != 9999){
            context.write(new Compkey(year, temp), NullWritable.get());
        }
    }
}

Reducer类：

package mapreduce.secondsort;

import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.mapreduce.Reducer;

import java.io.IOException;

public class SecondReducer extends Reducer {
    @Override
    protected void reduce(Compkey key, Iterable values, Context context) throws IOException, InterruptedException {
        //在这个Reducer类中不需要写聚合的方法，因此只需要在for循环中将最终结果写出即可
        for (NullWritable value : values) {
            context.write(new IntWritable(key.getYear()), new IntWritable(key.getTemp()));
        }
    }
}

6. mapreduce实现Join操作

分析人员在写sql语句时，连表也就是join操作可以说是非常常见的了，常用的join操作有内连接，左外连接，右外连接，全外连接等等，使用mapreduce在底层实现这些连接有助于在之后写这些sql语句时知道如何才能进行优化从而提高查询效率，join操作一共有两种实现方式，map端join和reduce端join

map端join

map端join非常好理解，现在手头上有两张表，一张表看成是小表，另一张表看作是大表，在大表读取数据之前，先将小表加载至内存，可以使用map的数据结构，然后在读取大表数据时与内存中的数据进行一个拼串的操作即可，具体代码实现如下：

APP类：

package mapreduce.mapjoin;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

/*
    此App的功能时实现map端的join，对应的两张表分别是订单表和客户信息表
 */
public class MapJoinApp {
    public static void main(String[] args) throws Exception {
        Configuration conf = new Configuration();
        conf.set("fs.defaultFS", "file:///");
        //在这里还需要设置小表所在的路径
        conf.set("small.file.name", "d:/mapjoin/customers.txt");
        FileSystem fs = FileSystem.get(conf);
        Job job = Job.getInstance(conf);
        job.setJobName("mapjoin");
        job.setJarByClass(MapJoinApp.class);
        job.setMapperClass(MapJoinMapper.class);

        job.setOutputKeyClass(Text.class);
        job.setOutputValueClass(NullWritable.class);
        //设置输入和输出的文件路径
        Path outPath = new Path("file:///d:/out");
        FileInputFormat.addInputPath(job, new Path("d:/mapjoin/orders.txt"));
        FileOutputFormat.setOutputPath(job, outPath);
        //如果文件存在，则要先删除，否则就会出现报错
        if(fs.exists(outPath)){
            fs.delete(outPath,true);
        }
        //开始执行程序
        job.waitForCompletion(true);
    }
}

Mapper类：

package mapreduce.mapjoin;

import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Mapper;

import java.io.BufferedReader;
import java.io.FileReader;
import java.io.IOException;
import java.util.HashMap;

public class MapJoinMapper extends Mapper {

    //使用map来装数据
    HashMap map;

    //首先需要在setup方法中将小表的数据加载至内存，需要使用上下文的getConfiguration方法获取到小表的路径
    @Override
    protected void setup(Context context) throws IOException, InterruptedException {
        String small_table = context.getConfiguration().get("small.file.name");
        map = new HashMap();
        //使用BufferedReader按行读取小表数据
        BufferedReader br = new BufferedReader(new FileReader(small_table));
        String line = null;
        while((line = br.readLine()) != null){
            String cid = line.split("\t")[0];
            map.put(cid, line);
        }
        br.close();
    }

    @Override
    protected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {
        String line = value.toString();
        String oid = line.split("\t")[3];
        //对map进行一个判断，如果不存在就不连接，实现的是内连接
        if(map.containsKey(oid)){
            context.write(new Text(value.toString() + map.get(oid)), NullWritable.get());
        }
    }
}

reduce端join

上述情况对应的场景是一张大表和一张小表的情况，那么，如果两张表都是大表的情况该怎么办呢？很显然，将一张表看成小表将不再适用，因为这样做很有可能会消耗大量内存资源，因此在这种情况下一般使用reduce端join的方式，具体原理如下：将两张表值相等的字段看成是reduce中需要做聚合的key，再将key对应的value也就是一行数据进行拼串的操作，那么这样就要涉及到一个问题，如何使得拼串时一张表的数据总在上面而另一张表的数据总在下面呢？这就需要对表名做一个数字标识，然后使用一个二次排序，使得两个表的顺序固定下来即可，具体代码实现如下：

进行reduce端join的五个步骤：

1. 通过不同的文件名，设立不同的标记位

2. 重写WritableComparable即组合键(Compkey)将两个成员变量序列化

3. 需要将相同id的Compkey放到一个reduce循环中，需要重写WritableComparator

4. 重写compareTo方法，将这两个不同的标记位进行排序，使得其中一个总是在另一个上方位置

5. 重写hashCode方法

组合键的类：

package mapreduce.reducejoin;

import org.apache.hadoop.io.WritableComparable;
import java.io.DataInput;
import java.io.DataOutput;
import java.io.IOException;

public class Compkey implements WritableComparable {

    int cid;
    int flag;

    public int compareTo(Compkey o) {
        if(cid == o.cid){
            return o.flag - flag;
        }
        else {
            return cid - o.cid;
        }
    }

    public void write(DataOutput out) throws IOException {
        out.writeInt(cid);
        out.writeInt(flag);
    }

    public void readFields(DataInput in) throws IOException {
        cid = in.readInt();
        flag = in.readInt();
    }

    public int getCid() {
        return cid;
    }

    public void setCid(int cid) {
        this.cid = cid;
    }

    public int getFlag() {
        return flag;
    }

    public void setFlag(int flag) {
        this.flag = flag;
    }

    public Compkey(int cid, int flag) {
        this.cid = cid;
        this.flag = flag;
    }

    public Compkey() {
    }

    @Override
    public String toString() {
        return "CompKey{" +
                "cid=" + cid +
                ", flag=" + flag +
                '}';
    }

    @Override
    public int hashCode() {
        return cid;
    }
}

分组对比器：

package mapreduce.reducejoin;

import org.apache.hadoop.io.WritableComparable;
import org.apache.hadoop.io.WritableComparator;

public class MyGroupingComparator extends WritableComparator {
    public MyGroupingComparator() {
        super(Compkey.class, true);
    }

    @Override
    public int compare(WritableComparable a, WritableComparable b) {
        return ((Compkey) a).cid - ((Compkey) b).cid;
    }
}

APP类：

package mapreduce.reducejoin;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

/*
    此APP的功能是实现mapreduce的reduce端join操作
 */
public class ReduceJoinApp {
    public static void main(String[] args) throws Exception {
        Configuration conf = new Configuration();
        conf.set("fs.defaultFS", "file:///");

        FileSystem fs = FileSystem.get(conf);

        Job job = Job.getInstance(conf);

        //作业设置名称
        job.setJobName("reduce join");

        //设置入口函数所在的类
        job.setJarByClass(ReduceJoinApp.class);

        //设置map类
        job.setMapperClass(ReduceJoinMapper.class);

        job.setReducerClass(ReduceJoinReducer.class);

        job.setGroupingComparatorClass(MyGroupingComparator.class);


        //设置map的输出k-v类型
        job.setMapOutputKeyClass(Compkey.class);
        job.setMapOutputValueClass(Text.class);

        job.setOutputKeyClass(Text.class);
        job.setOutputValueClass(NullWritable.class);


        Path outPath = new Path("d:/out");

        //设置输入输出路径
        FileInputFormat.addInputPath(job, new Path("d:/reducejoin"));
        FileOutputFormat.setOutputPath(job, outPath);
        if (fs.exists(outPath)) {
            fs.delete(outPath, true);
        }

        job.setNumReduceTasks(3);

        //开始执行
        job.waitForCompletion(true);
    }
}

Mapper类：

package mapreduce.reducejoin;

import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.lib.input.FileSplit;

import java.io.IOException;

public class ReduceJoinMapper extends Mapper {

    String path;

    //需要在setup方法中从输入的文件获取到文件名
    @Override
    protected void setup(Context context) throws IOException, InterruptedException {
        path = ((FileSplit) context.getInputSplit()).getPath().toString();
    }

    @Override
    protected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {
        String[] arr = value.toString().split("\t");
        Compkey ck;
        if(path.contains("customers")){
            int cid = Integer.parseInt(arr[0]);
            ck = new Compkey(cid, 1);
        }
        else{
            int cid = Integer.parseInt(arr[3]);
            ck = new Compkey(cid, 0);
        }
        context.write(ck, value);
    }
}

Reducer类：

package mapreduce.reducejoin;

import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Reducer;

import java.io.IOException;
import java.util.Iterator;

public class ReduceJoinReducer extends Reducer {
    @Override
    protected void reduce(Compkey key, Iterable values, Context context) throws IOException, InterruptedException {
        Iterator it = values.iterator();
        //直接获取第一条数据(customer)
        Text cusLine = it.next();
        String line = cusLine.toString();

        while (it.hasNext()) {
            //获取orders数据
            Text orderLine = it.next();

            //拼串
            String line2 = orderLine.toString();
            String[] cusArr = line.split("\t");
            String[] orderArr = line2.split("\t");
            //              cid            name
            String out = cusArr[0] + "\t" + cusArr[1] + "\t" + orderArr[1] + "\t" + orderArr[2];

            context.write(new Text(out), NullWritable.get());
        }
    }
}

7. TopN算法实现

在日常的数据分析需求中，先将数据用某个key做聚合，然后再将value的结果倒序输出以求得最高的N项结果，这样的需求十分普遍，在大数据场景下，这样的需求很明显需要使用到二次作业，在第二次作业中，需要使用到组合键，并重写compareTo方法，然而，如果在第二次作业中使用reduce的话会造成大量网络间数据传输，因此，比较优化的解决方案是将输出环节只放在Mapper端中进行，这样避免了Shuffle的过程，因此能够极大地提升计算效率，具体实现只需要在Mapper端使用一个能够进行排序的数据结构，如TreeSet即可，代码如下所示：

组合键类：

import org.apache.hadoop.io.WritableComparable;

import java.io.DataInput;
import java.io.DataOutput;
import java.io.IOException;

public class CompKey implements WritableComparable {

    String pass;
    int count;

    public int compareTo(CompKey o) {
        if(o.count == count){
            return pass.compareTo(o.pass);
        }
        return o.count - count;
    }

    public void write(DataOutput out) throws IOException {
        out.writeUTF(pass);
        out.writeInt(count);
    }

    public void readFields(DataInput in) throws IOException {
        pass= in.readUTF();
        count = in.readInt();

    }

    public CompKey(String pass, int count) {
        this.pass = pass;
        this.count = count;
    }

    public CompKey() {
    }

    public String getPass() {
        return pass;
    }

    public void setPass(String pass) {
        this.pass = pass;
    }

    public int getCount() {
        return count;
    }

    public void setCount(int count) {
        this.count = count;
    }
}

APP类：

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

public class TopApp {

    public static void main(String[] args) throws Exception {

        //初始化作业
        Configuration conf = new Configuration();
        //设置成本地模式,注意不要写在初始化文件系统之后
        conf.set("fs.defaultFS","file:///");

        FileSystem fs = FileSystem.get(conf);
        Job job = Job.getInstance(conf);

        //作业设置名称
        job.setJobName("WORDCOUNT");

        //设置入口函数所在的类
        job.setJarByClass(TopApp.class);
        //设置map和reduce类
        job.setMapperClass(TopMapper.class);
        job.setReducerClass(TopReducer.class);
        job.setCombinerClass(TopReducer.class);

        //设置map的输出k-v类型
        job.setMapOutputKeyClass(Text.class);
        job.setMapOutputValueClass(IntWritable.class);

        //设置reduce的输出k-v类型
        job.setOutputKeyClass(Text.class);
        job.setOutputValueClass(IntWritable.class);

        Path outPath = new Path("D:/wc/out");

        //设置输入输出路径
        FileInputFormat.addInputPath(job,new Path("D:/wc/duowan_user.txt"));
        FileOutputFormat.setOutputPath(job,outPath);
        if(fs.exists(outPath)){
            fs.delete(outPath,true);
        }


        job.setNumReduceTasks(4);

        //开始执行
        boolean b = job.waitForCompletion(true);

    }
}

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.input.KeyValueTextInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

public class TopApp2 {

    public static void main(String[] args) throws Exception {

        //初始化作业
        Configuration conf = new Configuration();
        //设置成本地模式,注意不要写在初始化文件系统之后
        conf.set("fs.defaultFS","file:///");
        conf.set("topN",args[0]);

        FileSystem fs = FileSystem.get(conf);
        Job job = Job.getInstance(conf);

        //作业设置名称
        job.setJobName("WORDCOUNT");

        //设置入口函数所在的类
        job.setJarByClass(TopApp2.class);
        //设置map和reduce类
        job.setMapperClass(TopMapper2.class);
        job.setReducerClass(TopReducer2.class);

        //设置map的输出k-v类型
        job.setMapOutputKeyClass(CompKey.class);
        job.setMapOutputValueClass(NullWritable.class);

        //设置reduce的输出k-v类型
        job.setOutputKeyClass(Text.class);
        job.setOutputValueClass(IntWritable.class);

        job.setInputFormatClass(KeyValueTextInputFormat.class);

        Path outPath = new Path("D:/wc/out2");

        //设置输入输出路径
        FileInputFormat.addInputPath(job,new Path("D:/wc/out"));
        FileOutputFormat.setOutputPath(job,outPath);
        if(fs.exists(outPath)){
            fs.delete(outPath,true);
        }


        job.setNumReduceTasks(1);

        //开始执行
        boolean b = job.waitForCompletion(true);

    }
}

第一个Mapper类：

import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Mapper;

import java.io.IOException;

public class TopMapper extends Mapper {

    @Override
    protected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {

        String line = value.toString();
        String[] arr = line.split("\t");

        //脏数据处理
        if(arr.length >= 3 && !arr[2].equals("")){
            context.write(new Text(arr[2]), new IntWritable(1));
        }
    }
}

第二个Mapper类：

import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Mapper;

import java.io.IOException;
import java.util.TreeSet;

public class TopMapper2 extends Mapper {

    TreeSet ts;
    int topN;

    @Override
    protected void setup(Context context) throws IOException, InterruptedException {
        ts = new TreeSet();
        topN = Integer.parseInt(context.getConfiguration().get("topN"));

    }

    @Override
    protected void map(Text key, Text value, Context context) throws IOException, InterruptedException {

        String pass = key.toString();
        int count = Integer.parseInt(value.toString());

        CompKey ck = new CompKey(pass,count);

        ts.add(ck);

        if(ts.size() > topN){
            ts.remove(ts.last());
        }

    }

    @Override
    protected void cleanup(Context context) throws IOException, InterruptedException {

        for (CompKey t : ts) {
            context.write(t,NullWritable.get());
        }
    }
}

Reducer类(只需要一个即可)：

import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Reducer;

import java.io.IOException;

public class TopReducer extends Reducer {

    @Override
    protected void reduce(Text key, Iterable values, Context context) throws IOException, InterruptedException {
        int sum = 0;
        for (IntWritable value : values) {
            sum += value.get();
        }
        context.write(key,new IntWritable(sum));
    }
}

8. Mapreduce框架计算任务执行流程图说明

上图基本将整个Mapreduce从选择文件格式到最后输出的过程描绘了出来，可以做出如下的总结：

1. InputFormat进行文件格式选型的时候，应该结合实际情况，如果涉及二次作业，最好就要用到KeyValueInputFormat，如果需要做数据库的ETL工作，就要使用到DBInputFormat

2. 数据进行切片时，首先会判断该文件能否被切割，如果非压缩格式，都可切割，如果是压缩格式，只有bzip2和带索引的lzo两种格式是可切割的，切勿使用不支持切割的文件格式作为输入，因为这样会导致数据不本地化，造成大量不必要的网络间IO

3. 分区的过程先于排序，默认使用的哈希分区，如果遇到数据倾斜，需要用户自己定义分区算法

4. 使用Combiner可以在后期Shuffle大幅度减少数据量，建议使用

5. Reduce的过程其实就是进行数据混洗，也就是网络间数据传输的过程，因为此过程需要将存放在不同节点上的数据汇总到某一个节点上去，mapreduce中80%的时间都耗费在了网络间的IO上

你可能感兴趣的:(大数据学习笔记——Hadoop编程实战之Mapreduce)

扫地机类清洁产品之直流无刷电机控制悟空胆好小清洁服务机器人单片机人工智能
扫地机类清洁产品之直流无刷电机控制1.1前言扫地机产品有很多的电机控制，滚刷电机1个，边刷电机1-2个，清水泵电机，风机一个，部分中高端产品支持抹布功能，也就是存在抹布盘电机，还有追觅科沃斯石头等边刷抬升电机，滚刷抬升电机等的，这些电机有直流有刷电机，直接无刷电机，步进电机，电磁阀，挪动泵等不同类型。电机的原理，驱动控制方式也不行。接下来一段时间的几个文章会作个专题分析分享。直流有刷电机会自动持续
2018-07-23-催眠日作业-#不一样的31天#-66小鹿小鹿_33
预言日：人总是在逃避命运的路上，与之不期而遇。心理学上有个著名的名词，叫做自证预言；经济学上也有一个很著名的定律叫做，墨菲定律；在灵修派上，还有一个很著名的法则，叫做吸引力法则。这3个领域的词，虽然看起来不太一样，但是他们都在告诉人们一个现象：你越担心什么，就越有可能会发生什么。同样的道理，你越想得到什么，就应该要积极地去创造什么。无论是自证预言，墨菲定律还是吸引力法则，对人都有正反2个维度的影响
《大清方方案》| 第二话谁佐清欢
和珅究竟说了些什么？竟能令堂堂九五之尊龙颜失色！此处暂且按下不表；单说这位乾隆皇帝，果真不愧是康熙从小带过的，一旦决定了要做的事，便杀伐决断毫不含糊。他当即亲自拟旨，着令和珅为钦差大臣，全权负责处理方方事件，并钦赐尚方宝剑，遇急则三品以下官员可先斩后奏。和珅身负皇上重托，岂敢有半点怠慢，当夜即率领相关人等，马不停蹄杀奔江汉。这一路上，和珅的几位幕僚一直在商讨方方事件的处置方案。有位年轻幕僚建议快刀
《庄子.达生9》钱江潮369
【原文】孔子观于吕梁，县水三十仞，流沫四十里，鼋鼍鱼鳖之所不能游也。见一丈夫游之，以为有苦而欲死也，使弟子并流而拯之。数百步而出，被发行歌而游于塘下。孔子从而问焉，曰：“吾以子为鬼，察子则人也。请问，‘蹈水有道乎’”曰：“亡，吾无道。吾始乎故，长乎性，成乎命。与齐俱入，与汩偕出，从水之道而不为私焉。此吾所以蹈之也。”孔子曰：“何谓始乎故，长乎性，成乎命？”曰：“吾生于陵而安于陵，故也；长于水而安于
高端密码学院笔记285 柚子_b4b4
高端幸福密码学院（高级班）幸福使者：李华第（598）期《幸福》之回归内在深层生命原动力基础篇——揭秘“激励”成长的喜悦心理案例分析主讲：刘莉一，知识扩充:成功=艰苦劳动+正确方法+少说空话。贪图省力的船夫，目标永远下游。智者的梦再美，也不如愚人实干的脚印。幸福早课堂2020.10.16星期五一笔记:1，重视和珍惜的前提是知道它的价值非常重要，当你珍惜了，你就真正定下来，真正的学到身上。2，大家需要
2020-04-12每天三百字之连接与替代冷眼看潮
不知道是不是好为人师，有时候还真想和别人分享一下我对某些现象的看法或者解释。人类社会不断发展进步的过程，就是不断连接与替代的过程。人类发现了火并应用火以后，告别了茹毛饮血的野兽般的原始生活（火烧、烹饪替代了生食）人类用石器代替了完全手工，工具的使用使人类进步一大步。类似这样的替代还有很多，随着科技的发展，有更多的原始的事物被替代，代之以更高效、更先进的技术。在近现代，汽车替代了马车，高速公路和铁路
东南林氏之九牧林候选父系祖缘树TheYtree
渊源介绍东晋初年晋安林始祖林禄公入闽，传十世隋右丞林茂，由晋安迁居莆田北螺村。又五世而至林万宠，唐开元间任高平太守，生三子：韬、披、昌。韬公之孙攒，唐德宗立双阙以旌表其孝，时号"阙下林家"。昌公字茂吉，乃万宠公第三子，官兵部司马，配宋氏，生一子名萍。萍于唐贞元间明经及第，官沣洲司马(后追赠中宪大夫)。唐太和年间归隐后，迁居仙游游洋，世称“游洋林”；其后裔居游洋后迁移漳州漳浦路下，由路下林第四房平和
大伟说成语之唉声叹气求索大伟
＊大伟说成语＊【唉声叹气】叹气：因心里不痛快或不如意而吐出长气，发出声音。因为痛苦、憋闷或感伤而发出叹息的声音。【大伟说】情绪外露，非人类所特有，动物亦有情绪，悲哀和欢乐所表示的情绪亦是不一样的，会嗷嗷大叫也会低吟痛哭。不同的是，人类的情绪更复杂，更多样，更丰富。唉声叹气，可以说是最基础的情绪，因为无奈而举足无措，不知该如何如何化解，只有独自一人慢慢承受，长吁短叹不知如何是好，其实是无能无力的表现
libyuv之linux编译 jaronho Linux linux 运维服务器
文章目录一、下载源码二、编译源码三、注意事项1、银河麒麟系统（aarch64）（1）解决armv8-a+dotprod+i8mm指令集支持问题（2）解决armv9-a+sve2指令集支持问题一、下载源码到GitHub网站下载https://github.com/lemenkov/libyuv源码，或者用直接用git克隆到本地，如：gitclonehttps://github.com/lemenko
怎么做淘客赚钱(2022最新免费淘客盈利的方法) 高省_飞智666600
很多人都不知道什么是淘宝客，今天小编为大家解答一下吧。淘宝客，现在简称淘客，是时下比较流行的一个词语，特质为淘宝店推广商品获取提成的人，这些人没有自己的产品，只是在淘宝里面选择适合自己的产品，在自己比较熟悉的领域推广，把产品卖出去之后，会从淘宝店家那里获得百分之五到百分之五十左右的佣金。淘宝客付出的是什么呢？时间。你需要花时间去选适合自己推广的产品，需要花时间去选自己的推广方法，如果你打算自己做个
Python爬虫解析工具之xpath使用详解 eqa11 python 爬虫开发语言
文章目录Python爬虫解析工具之xpath使用详解一、引言二、环境准备1、插件安装2、依赖库安装三、xpath语法详解1、路径表达式2、通配符3、谓语4、常用函数四、xpath在Python代码中的使用1、文档树的创建2、使用xpath表达式3、获取元素内容和属性五、总结Python爬虫解析工具之xpath使用详解一、引言在Python爬虫开发中，数据提取是一个至关重要的环节。xpath作为一门
锁之缘尘缘诗词原创作品
是谁追寻梦的足迹，是谁在偷偷的哭泣，日月隔离在黑白天地情感在心中蔓延的痕迹天与地的距离有多远流失的星晨落入哪片空间不要让泪水模糊双眼心牢中一样充满温暖谁说爱情没有永远白娘子又为何爱许仙蝴蝶墓地展翅翩翩轻歌慢舞袖卷人间传奇千古留爱万年…………月落星飞徘徊是选择不去问自已为合舍不得寂寞本就是痛苦的不在追寻梦中的痕迹才不会失去真实的自已
ARM驱动学习之基础小知识 JT灬新一 ARM 嵌入式 arm开发学习
ARM驱动学习之基础小知识•sch原理图工程师工作内容–方案–元器件选型–采购（能不能买到，价格）–原理图（涉及到稳定性）•layout画板工程师–layout（封装、布局，布线，log）（涉及到稳定性）–焊接的一部分工作（调试阶段板子的焊接）•驱动工程师–驱动，原理图，layout三部分的交集容易发生矛盾•PCB研发流程介绍–方案，原理图(网表)–layout工程师（gerber文件）–PCB板
ARM驱动学习之5 LEDS驱动 JT灬新一嵌入式 C 底层 arm开发学习单片机
ARM驱动学习之5LEDS驱动知识点：•linuxGPIO申请函数和赋值函数–gpio_request–gpio_set_value•三星平台配置GPIO函数–s3c_gpio_cfgpin•GPIO配置输出模式的宏变量–S3C_GPIO_OUTPUT注意点：DRIVER_NAME和DEVICE_NAME匹配。实现步骤：1.加入需要的头文件：//Linux平台的gpio头文件#include//三
ARM驱动学习之4小结 JT灬新一嵌入式 C++arm开发学习 linux
ARM驱动学习之4小结#include#include#include#include#include#defineDEVICE_NAME"hello_ctl123"MODULE_LICENSE("DualBSD/GPL");MODULE_AUTHOR("TOPEET");staticlonghello_ioctl(structfile*file,unsignedintcmd,unsignedlo
C++ | Leetcode C++题解之第409题最长回文串 Ddddddd_158 经验分享 C++Leetcode 题解
题目：题解：classSolution{public:intlongestPalindrome(strings){unordered_mapcount;intans=0;for(charc:s)++count[c];for(autop:count){intv=p.second;ans+=v/2*2;if(v%2==1andans%2==0)++ans;}returnans;}};
2020-12-24 我和我的天使们
阅读《老子的心事》391—403“将欲取之，必固与之”：想要得到什么，首先就要送出什么。我常常对孩子们说，你希望别人怎样对你你就怎样对待别人。想要得到别人的尊重，首先要尊重别人。我希望她们可以不迟到，因为不迟到是对别人的尊重，我就自己就先做到不迟到。哪怕是约朋友逛街，我尽量准时赴约。我严格要求孩子们，也同样严格要求自己，我跟孩子们一起把好的品格变成习惯。“是谓微明”：这就是微妙的智慧。看起来很少很
18、架构-可观测性之聚合度量大树~~ 架构 java python 后端架构
聚合度量聚合度量是指对系统运行时产生的各种指标数据进行收集、聚合和分析，以了解系统的健康状况和性能表现。聚合度量是可观测性的关键组成部分，通过对度量数据的分析，可以及时发现系统中的异常和瓶颈。以下是对聚合度量各个方面的详细解析，并结合具体的数据案例和技术支撑。指标收集收集系统运行时产生的各种指标数据是聚合度量的基础。常见的指标包括CPU使用率、内存使用率、请求处理时间、请求数、错误率等。以下是指标
学习“论语”-第59天春峰轩
12.14子张问政。子曰：“居之无倦，行之以忠。”子张问为政之道。孔子说：“在位尽职不懈怠，执行政令要忠诚。”12.15子曰：“博学于文，约之以礼，亦可以弗畔矣夫！”孔子说：“君子广泛地学习文献，并且用礼节约束自己，也就不会离经叛道了。”12.16子曰：“君子成人之美，不成人之恶。小人反是。”孔子说：“君子成全别人的好事，而不助长别人的坏处。小人则与此相反行事。”知识点:“成人之美，不成人之恶”贯
2021-11-15 宙火
我给宋小姐写了首诗，是我在课上因思恋宋小姐而写的。“自古多情是唐宋，从来双飞归巢燕。邻家小女相聘婷，常使春意荡漾我。不知单思可为爱，惟愿一心付之汝。”我拿给宋小姐看了，她说我写得很棒。我很开心，但又不是那么开心。宋小姐是回复我了，但也只是说我写得很棒，对我诗句中蕴藏的真切感情，不知道是真的没发现，还是装作没发现。但我不深究，只是这样，我就很开心了。我答应宋小姐，一天给她写一首诗。
《我的青葱岁月之缘来是你》第二章迎新晚会思源思缘思怨
“怎么你也来了这里？”我愉快的问到，想着这是上天给的缘分吗？我还没去找他竟然就相遇了。那个让我开心的老乡。“你好，我也是舞蹈社的新人啊！”他说，笑起来回答我，眼睛弯弯的。“这么巧，我叫吴倩，你叫啥？”“我叫韩欢，你也是B市人吧，c中毕业的？”“我不是，我是f中的，不然肯定会认识你的”“是吗？以后多多关照了”他还冲我眨了眨眼睛。内心一阵悸动，这是……回到寝室，我兴奋的告诉我的室友这个事情，我再次觉得
数据结构之哈希表 X同学的开始数据结构数据结构散列表
哈希表(散列表)出现的原因在顺序表中查找时，需要从表头开始，依次遍历比较a[i]与key的值是否相等，直到相等才返回索引i；在有序表中查找时，我们经常使用的是二分查找，通过比较key与a[i]的大小来折半查找，直到相等时才返回索引i。最终通过索引找到我们要找的元素。但是，这两种方法的效率都依赖于查找中比较的次数。我们有一种想法，能不能不经过比较，而是直接通过关键字key一次得到所要的结果呢？这时，
厦门自由行之第一天: 大苏子在广漂
厦门三人行之杂记出发前一天:12️28日下午15:00从广州粗发，来深圳集合！但是中间发生一个小插曲，验票时候发现车票不见了，或许也是一场恶作剧，对于不排队的人，忍不住说了一下，接下来就发现车票不见了，已经是拿在手上！不过还好，可以凭借购票订单查看到信息，所以有惊无险，顺利进站！晚上三个人一起去吃了柠檬鱼，说实话，那会，感觉美吃饱，啊哈哈！晚上回来，两个人又开始彻夜长谈，发现身边优秀的人，一大把，
“这才好”麻辣香锅能够增加人身体的免疫能力小补文知
我就来介绍一种香锅，那就是“这才好”麻辣香锅，它产出于著名的蜀地文化，具有悠久的历史土家风味，麻辣鲜香，健康安全。采用传统秘制麻辣香锅油辣子，还有贴心加料“孜然包”满足人们的不同口味需求，香锅底料辣椒，微辣且香，含有丰富微量元素和维生素，具有辣而不躁，味道纯正，醇厚温和。花椒采用历史悠久，被列为宫廷供品的“贡椒”的汉源花椒。我们还挑选了“川菜之魂”郫县豆瓣的鼻祖品牌豆瓣，保留最原始的郫县豆瓣味道，
《太虚游》第六十二章。玄牝之威。古楼臭道士
“好好好，流云这孩子深得我心，想必长爻知道是你的话定然会惊喜不已的。”白玄牝听得风流云应了下来，脸色慈和，伸手在他头顶轻轻抚了抚，如同抚在怀中九尾小狐一样自然，极其温柔。身后的四位青丘长老同时一怔，嘴角微动，似要开口劝阻。风流云只感到一道霞光瑞气如有实质一般顺着头顶百会大穴直沉在下丹田内，随后这股气息又逐渐凝聚，似乎给自己吃了什么东西一般。啊喔不好，这祖奶奶该不会是看中我这肉身，像人魔一样，要给她
生命如花坦释空
每个人的心中都有一株妙莲花。这是禅家语。禅家总是站在理性的高处，以超越红尘的洒脱来参悟人生和自省生命。那么，凡俗中人呢？生如夏花之绚丽，死如秋叶之静美。这是诗人语。多少人在赞美：姑娘好像花一样！又有多少人在咏歌：花儿与少年。的确，人生如花。花一样的生命，理应自诞生之日起，就一瓣一瓣地绽放她的美丽与清香，使这个原本死寂荒凉的世界五彩缤纷，充满快乐。事实上，人类自诞生起，就一代一代地做着这方面的努力，
二婚到底是领证好还是不领证好？孟妃青
伟人讲过，不以结婚为目的的谈恋爱，都是耍流氓！离婚了，再找对象，感情到了一定程度，领证结婚是水到渠成的事，再说我中华泱泱大国，有礼仪之邦的称谓，领证更是体现了尊重男女双方的行为。如果认为二婚就没必要领证了，只能说明，男女之间都暗藏心思，心不往一处走，日子过不好的。即便他们感情再深，都不是合法夫妻，只是名不正言不顺的同居关系。假如不要二人共同的孩子还好，就怕有了孩子，没领证，到时给孩子上户口都成问题
《华杉讲透王阳明传习录》微微微微神
〔5〕希渊问：“圣人可学而至。然伯夷伊尹于孔子，才力终不同。其同谓之圣者安在”？先生曰，“圣人之所以为圣，只是其心纯乎天理，而无人欲之杂。犹精金之所以为精，但以其成色足而无铜铅之杂也。人到纯乎天理方是圣。金到足色方是精。然圣人之才力，亦有大小不同。犹金之分两有轻重。尧舜犹万镒。文王孔子犹九千镒。禹汤武王犹七八千镒。伯夷伊尹犹四五千镒。才力不同，而纯乎天理则同。皆可谓之圣人。犹分两虽不同，而足色则同
“日舍一物”之42——活在当下，并向前看記二十一
这件衣服已经有十五、六年了（突然发现我可真是能囤东西啊）。这原本是一件我非常喜欢的衣服，无论是样子，还是质地。照片拍的比较渣，但其实，白色棉质衣料中，尚织有银色的丝线，在阳光或灯光下，会闪亮，不晃眼，但很漂亮。或许正是因为太喜欢了，所以一直保留着，尽管很多年都没有再穿过了。因为不合适了。首先是随着年龄的增长，尽管体重总量没有太多变化（哦，其实还是涨了）。但是体型还是和十几年前不一样了，最明显的就是
语文主题教学学习笔记之87 东哥杂谈
“语文主题教学”学习笔记之八十七（0125）今天继续学习小学语文主题教学的实践样态。板块三：教学中体现“书艺”味道。作为四大名著之一的《水浒传》，堪称我国文学宝库之经典。对从《水浒传》中摘选的单元，教师就要了解其原生态，即评书体特点。这也要求教师要了解一些常用的评书行话术语，然后在教学时适时地加入一些，让学生体味其文本中原有的特色。学生也要尽可能地通过朗读的方式，而不单是分析讲解的方式进行学习。细
Linux的Initrd机制被触发 linux
Linux 的 initrd 技术是一个非常普遍使用的机制，linux2.6 内核的 initrd 的文件格式由原来的文件系统镜像文件转变成了 cpio 格式，变化不仅反映在文件格式上， linux 内核对这两种格式的 initrd 的处理有着截然的不同。本文首先介绍了什么是 initrd 技术，然后分别介绍了 Linux2.4 内核和 2.6 内核的 initrd 的处理流程。最后通过对 Lin
maven本地仓库路径修改 bitcarter maven
默认maven本地仓库路径：C:\Users\Administrator\.m2 修改maven本地仓库路径方法： 1.打开E:\maven\apache-maven-2.2.1\conf\settings.xml 2.找到
XSD和XML中的命名空间 darrenzhu xml xsd schema namespace 命名空间
http://www.360doc.com/content/12/0418/10/9437165_204585479.shtml http://blog.csdn.net/wanghuan203/article/details/9203621 http://blog.csdn.net/wanghuan203/article/details/9204337 http://www.cn
Java 求素数运算周凡杨 java 算法素数
网络上对求素数之解数不胜数，我在此总结归纳一下，同时对一些编码，加以改进，效率有成倍热提高。第一种：原理: 6N(+-)1法任何一个自然数，总可以表示成为如下的形式之一： 6N，6N+1，6N+2，6N+3，6N+4，6N+5 (N=0，1，2，…)
java 单例模式 g21121 java
想必单例模式大家都不会陌生，有如下两种方式来实现单例模式： class Singleton { private static Singleton instance=new Singleton(); private Singleton(){} static Singleton getInstance() { return instance; }
Linux下Mysql源码安装 510888780 mysql
1.假设已经有mysql-5.6.23-linux-glibc2.5-x86_64.tar.gz (1)创建mysql的安装目录及数据库存放目录解压缩下载的源码包，目录结构，特殊指定的目录除外：
32位和64位操作系统墙头上一根草 32位和64位操作系统
32位和64位操作系统是指：CPU一次处理数据的能力是32位还是64位。现在市场上的CPU一般都是64位的，但是这些CPU并不是真正意义上的64 位CPU，里面依然保留了大部分32位的技术，只是进行了部分64位的改进。32位和64位的区别还涉及了内存的寻址方面，32位系统的最大寻址空间是2 的32次方= 4294967296（bit）= 4（GB）左右，而64位系统的最大寻址空间的寻址空间则达到了
我的spring学习笔记10-轻量级_Spring框架 aijuans Spring 3
一、问题提问： → 请简单介绍一下什么是轻量级？轻量级（Leightweight）是相对于一些重量级的容器来说的，比如Spring的核心是一个轻量级的容器，Spring的核心包在文件容量上只有不到1M大小，使用Spring核心包所需要的资源也是很少的，您甚至可以在小型设备中使用Spring。
mongodb 环境搭建及简单CURD antlove Web Install curd NoSQL mongo
一搭建mongodb环境 1. 在mongo官网下载mongodb 2. 在本地创建目录 "D:\Program Files\mongodb-win32-i386-2.6.4\data\db" 3. 运行mongodb服务 [mongod.exe --dbpath "D:\Program Files\mongodb-win32-i386-2.6.4\data\
数据字典和动态视图百合不是茶 oracle 数据字典动态视图系统和对象权限
数据字典（data dictionary）是 Oracle 数据库的一个重要组成部分，这是一组用于记录数据库信息的只读（read-only）表。随着数据库的启动而启动,数据库关闭时数据字典也关闭数据字典中包含数据库中所有方案对象（schema object）的定义(包括表，视图，索引，簇，同义词，序列，过程，函数，包，触发器等等) 数据库为一
多线程编程一般规则 bijian1013 java thread 多线程 java多线程
如果两个工两个以上的线程都修改一个对象，那么把执行修改的方法定义为被同步的，如果对象更新影响到只读方法，那么只读方法也要定义成同步的。不要滥用同步。如果在一个对象内的不同的方法访问的不是同一个数据，就不要将方法设置为synchronized的。
将文件或目录拷贝到另一个Linux系统的命令scp bijian1013 linux unix scp
一.功能说明 scp就是security copy，用于将文件或者目录从一个Linux系统拷贝到另一个Linux系统下。scp传输数据用的是SSH协议，保证了数据传输的安全，其格式如下： scp 远程用户名@IP地址：文件的绝对路径
【持久化框架MyBatis3五】MyBatis3一对多关联查询 bit1129 Mybatis3
以教员和课程为例介绍一对多关联关系，在这里认为一个教员可以叫多门课程，而一门课程只有1个教员教，这种关系在实际中不太常见，通过教员和课程是多对多的关系。示例数据：地址表： CREATE TABLE ADDRESSES ( ADDR_ID INT(11) NOT NULL AUTO_INCREMENT, STREET VAR
cookie状态判断引发的查找问题 bitcarter form cgi
先说一下我们的业务背景： 1.前台将图片和文本通过form表单提交到后台，图片我们都做了base64的编码，并且前台图片进行了压缩 2.form中action是一个cgi服务 3.后台cgi服务同时供PC，H5，APP 4.后台cgi中调用公共的cookie状态判断方法（公共的，大家都用，几年了没有问题）问题：（折腾两天。。。。） 1.PC端cgi服务正常调用，cookie判断没
通过Nginx,Tomcat访问日志(access log)记录请求耗时 ronin47
一、Nginx通过$upstream_response_time $request_time统计请求和后台服务响应时间 nginx.conf使用配置方式： log_format main '$remote_addr - $remote_user [$time_local] "$request" ''$status $body_bytes_sent "$http_r
java-67- n个骰子的点数。把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 bylijinnan java
public class ProbabilityOfDice { /** * Q67 n个骰子的点数 * 把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 * 在以下求解过程中，我们把骰子看作是有序的。 * 例如当n=2时，我们认为（1，2）和（2，1）是两种不同的情况 */ private stati
看别人的博客，觉得心情很好 Cb123456 博客心情
以为写博客，就是总结，就和日记一样吧，同时也在督促自己。今天看了好长时间博客: 职业规划: http://www.iteye.com/blogs/subjects/zhiyeguihua android学习: 1.http://byandby.i
[JWFD开源工作流]尝试用原生代码引擎实现循环反馈拓扑分析 comsci 工作流
我们已经不满足于仅仅跳跃一次，通过对引擎的升级，今天我测试了一下循环反馈模式，大概跑了200圈，引擎报一个溢出错误在一个流程图的结束节点中嵌入一段方程，每次引擎运行到这个节点的时候，通过实时编译器GM模块，计算这个方程，计算结果与预设值进行比较，符合条件则跳跃到开始节点，继续新一轮拓扑分析，直到遇到
JS常用的事件及方法 cwqcwqmax9 js
事件描述 onactivate 当对象设置为活动元素时触发。 onafterupdate 当成功更新数据源对象中的关联对象后在数据绑定对象上触发。 onbeforeactivate 对象要被设置为当前元素前立即触发。 onbeforecut 当选中区从文档中删除之前在源对象触发。 onbeforedeactivate 在 activeElement 从当前对象变为父文档其它对象之前立即
正则表达式验证日期格式 dashuaifu 正则表达式 IT其它 java其它
正则表达式验证日期格式 function isDate(d){ var v = d.match(/^(\d{4})-(\d{1,2})-(\d{1,2})$/i); if(!v) { this.focus(); return false; } } <input value="2000-8-8" onblu
Yii CModel.rules() 方法、validate预定义完整列表、以及说说验证 dcj3sjt126com yii
public array rules () {return} array 要调用 validate() 时应用的有效性规则。返回属性的有效性规则。声明验证规则，应重写此方法。每个规则是数组具有以下结构：array('attribute list', 'validator name', 'on'=>'scenario name', ...validation
UITextAttributeTextColor = deprecated in iOS 7.0 dcj3sjt126com ios
In this lesson we used the key "UITextAttributeTextColor" to change the color of the UINavigationBar appearance to white. This prompts a warning "first deprecated in iOS 7.0." Ins
判断一个数是质数的几种方法 EmmaZhao Math python
质数也叫素数，是只能被1和它本身整除的正整数，最小的质数是2，目前发现的最大的质数是p=2^57885161-1【注1】。判断一个数是质数的最简单的方法如下： def isPrime1(n): for i in range(2, n): if n % i == 0: return False return True 但是在上面的方法中有一些冗余的计算，所以
SpringSecurity工作原理小解读坏我一锅粥 SpringSecurity
SecurityContextPersistenceFilter ConcurrentSessionFilter WebAsyncManagerIntegrationFilter HeaderWriterFilter CsrfFilter LogoutFilter Use
JS实现自适应宽度的Tag切换 ini JavaScript html Web css html5
效果体验：http://hovertree.com/texiao/js/3.htm 该效果使用纯JavaScript代码，实现TAB页切换效果，TAB标签根据内容自适应宽度，点击TAB标签切换内容页。 HTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"
Hbase Rest API : 数据查询 kane_xie REST hbase
hbase（hadoop）是用java编写的，有些语言（例如python）能够对它提供良好的支持，但也有很多语言使用起来并不是那么方便，比如c#只能通过thrift访问。Rest就能很好的解决这个问题。Hbase的org.apache.hadoop.hbase.rest包提供了rest接口，它内嵌了jetty作为servlet容器。启动命令：./bin/hbase rest s
JQuery实现鼠标拖动元素移动位置（源码+注释）明子健 jquery js 源码拖动鼠标
欢迎讨论指正！ print.html代码： <!DOCTYPE html> <html> <head> <meta http-equiv=Content-Type content="text/html;charset=utf-8"> <title>发票打印</title> &l
Postgresql 连表更新字段语法 update qifeifei PostgreSQL
下面这段sql本来目的是想更新条件下的数据，可是这段sql却更新了整个表的数据。sql如下： UPDATE tops_visa.visa_order SET op_audit_abort_pass_date = now() FROM tops_visa.visa_order as t1 INNER JOIN tops_visa.visa_visitor as t2 ON t1.
将redis,memcache结合使用的方案? tcrct redis cache
公司架构上使用了阿里云的服务，由于阿里的kvstore收费相当高，打算自建，自建后就需要自己维护，所以就有了一个想法，针对kvstore(redis)及ocs(memcache)的特点，想自己开发一个cache层，将需要用到list，set，map等redis方法的继续使用redis来完成，将整条记录放在memcache下，即findbyid，save等时就memcache，其它就对应使用redi
开发中遇到的诡异的bug wudixiaotie bug
今天我们服务器组遇到个问题：我们的服务是从Kafka里面取出数据，然后把offset存储到ssdb中，每个topic和partition都对应ssdb中不同的key，服务启动之后，每次kafka数据更新我们这边收到消息，然后存储之后就发现ssdb的值偶尔是-2,这就奇怪了，最开始我们是在代码中打印存储的日志，发现没什么问题，后来去查看ssdb的日志，才发现里面每次set的时候都会对同一个key