翔飞天宇

Hadoop2.6.0 mapreduce 例子

1. Wordcount

[java] view plain copy

import java.io.IOException;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
import org.apache.hadoop.util.GenericOptionsParser;
//Administrator
public class WordCountExample {
private static class WordCountMapper extends Mapper{
@Override
protected void map(Object key, Text value, Context context)
throws IOException, InterruptedException {
String str=value.toString();
String []strArray=str.split(" ");
for(String s:strArray){
context.write(new Text(s), new IntWritable(1));
}
}
}
private static class WordCountReducer extends Reducer{
@Override
protected void reduce(Text key, Iterable values,
Context context)
throws IOException, InterruptedException {
int sum=0;
for(IntWritable count:values){
sum+=count.get();
}
context.write(key, new IntWritable(sum));
}
}
/**
* @param args
*/
public static void main(String[] args) throws Exception{
Configuration conf=new Configuration();
String []argArray=new GenericOptionsParser(conf,args).getRemainingArgs();
if(argArray.length!=2){
System.out.println("需要两个参数");
System.exit(1);
}
Job job=Job.getInstance(conf,"wordcount");
job.setJarByClass(WordCountExample.class);
job.setMapperClass(WordCountMapper.class);
job.setMapOutputKeyClass(Text.class);
job.setMapOutputValueClass(IntWritable.class);
job.setOutputKeyClass(Text.class);
job.setOutputValueClass(IntWritable.class);
job.setReducerClass(WordCountReducer.class);
FileInputFormat.addInputPath(job, new Path(argArray[0]));
FileOutputFormat.setOutputPath(job, new Path(argArray[1]));
System.exit(job.waitForCompletion(true)?0:1);
}
}

2. 去重

[java] view plain copy

import java.io.IOException;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
import org.apache.hadoop.util.GenericOptionsParser;
//Administrator
public class DeleteRepeatExample {
private static class DeleteRepeatMapper extends Mapper{
@Override
protected void map(Object key, Text value, Context context)
throws IOException, InterruptedException {
context.write(value, new IntWritable(0));
}
}
private static class DeleteRepeatReducer extends Reducer{
@Override
protected void reduce(Text key, Iterable values,
Context context)
throws IOException, InterruptedException {
context.write(key, null);
}
}
/**
* @param args
*/
public static void main(String[] args) throws Exception{
Configuration conf=new Configuration();
String[]argArray=new GenericOptionsParser(conf, args).getRemainingArgs();
if(argArray.length!=2){
System.out.println("请提供两个参数");
System.exit(1);
}
Job job=Job.getInstance(conf,"delete repeat");
job.setJarByClass(DeleteRepeatExample.class);
job.setMapperClass(DeleteRepeatMapper.class);
job.setMapOutputKeyClass(Text.class);
job.setMapOutputValueClass(IntWritable.class);
job.setReducerClass(DeleteRepeatReducer.class);
job.setOutputKeyClass(Text.class);
job.setOutputValueClass(Object.class);
FileInputFormat.addInputPath(job, new Path(argArray[0]));
FileOutputFormat.setOutputPath(job,new Path(argArray[1]));
System.exit(job.waitForCompletion(true)?0:1);
}
}

" 数据去重"主要是为了掌握和利用 并行化思想来对数据进行 有意义的筛选。 统计大数据集上的数据种类个数、 从网站日志中计算访问地等这些看似庞杂的任务都会涉及数据去重。下面就进入这个实例的MapReduce程序设计。

实例描述

　　对数据文件中的数据进行去重。数据文件中的每行都是一个数据。

　　样例输入如下所示：

1）file1：

2012-3-1 a

2012-3-2 b

2012-3-3 c

2012-3-4 d

2012-3-5 a

2012-3-6 b

2012-3-7 c

2012-3-3 c

2）file2：

2012-3-1 b

2012-3-2 a

2012-3-3 b

2012-3-4 d

2012-3-5 a

2012-3-6 c

2012-3-7 d

2012-3-3 c

样例输出如下所示：

2012-3-1 a

2012-3-1 b

2012-3-2 a

2012-3-2 b

2012-3-3 b

2012-3-3 c

2012-3-4 d

2012-3-5 a

2012-3-6 b

2012-3-6 c

2012-3-7 c

2012-3-7 d

设计思路

　　数据去重的最终目标是让原始数据中出现次数超过一次的数据在输出文件中只出现一次。我们自然而然会想到将同一个数据的所有记录都交给一台reduce机器，无论这个数据出现多少次，只要在最终结果中输出一次就可以了。具体就是reduce的输入应该以数据作为key，而对value-list则没有要求。当reduce接收到一个时就直接将key复制到输出的key中，并将value设置成空值。

　　在MapReduce流程中，map的输出经过shuffle过程聚集成后会交给reduce。所以从设计好的reduce输入可以反推出map的输出key应为数据，value任意。继续反推，map输出数据的key为数据，而在这个实例中每个数据代表输入文件中的一行内容，所以map阶段要完成的任务就是在采用Hadoop默认的作业输入方式之后，将 value设置为key，并直接输出（输出中的value任意）。map中的结果经过shuffle过程之后交给reduce。reduce阶段不会管每个key有多少个value，它直接将输入的key复制为输出的key，并输出就可以了（输出中的value被设置成空了）。

3. 排序

"数据排序"是许多实际任务执行时要完成的第一项工作，比如学生成绩评比、数据建立索引等。这个实例和数据去重类似，都是先对原始数据进行初步处理，为进一步的数据操作打好基础。下面进入这个示例。

实例描述

对输入文件中数据进行排序。输入文件中的每行内容均为一个数字，即一个数据。要求在输出中每行有两个间隔的数字，其中，第一个代表原始数据在原始数据集中的位次，第二个代表原始数据。

样例输入：

1）file1：

2

32

654

32

15

756

65223

2）file2：

5956

22

650

92

3）file3：

26

54

6

样例输出：

1    2

2    6

3    15

4    22

5    26

6    32

7    32

8    54

9    92

10    650

11    654

12    756

13    5956

14    65223

设计思路

　　这个实例仅仅要求对输入数据进行排序，熟悉MapReduce过程的读者会很快想到在MapReduce过程中就有排序，是否可以利用这个默认的排序，而不需要自己再实现具体的排序呢？答案是肯定的。

　　但是在使用之前首先需要了解它的默认排序规则。它是按照key值进行排序的，如果key为封装int的IntWritable类型，那么MapReduce按照数字大小对key排序，如果key为封装为String的Text类型，那么MapReduce按照字典顺序对字符串排序。

　　了解了这个细节，我们就知道应该使用封装int的IntWritable型数据结构了。也就是在map中将读入的数据转化成 IntWritable型，然后作为key值输出（value任意）。reduce拿到之后，将输入的 key作为value输出，并根据value-list中元素的个数决定输出的次数。输出的key（即代码中的linenum）是一个全局变量，它统计当前key的位次。需要注意的是这个程序中没有配置Combiner，也就是在MapReduce过程中不使用Combiner。这主要是因为使用map和reduce就已经能够完成任务了。

[java] view plain copy

import java.io.IOException;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
import org.apache.hadoop.util.GenericOptionsParser;
//Administrator
public class SortExample {
private static class SortMapper extends Mapper{
@Override
protected void map(Object key, Text value, Context context)
throws IOException, InterruptedException {
context.write(new IntWritable(Integer.parseInt(value.toString().trim())), new IntWritable(0));
}
}
private static class SortReducer extends Reducer{
private int index=0;
@Override
protected void reduce(IntWritable key, Iterable values,
Context context)
throws IOException, InterruptedException {
for(IntWritable i:values){
index++;
context.write(new Text(index+""),new Text(key.get()+""));
}
}
}
/**
* @param args
*/
public static void main(String[] args) throws Exception{
Configuration conf=new Configuration();
String[]argArray=new GenericOptionsParser(conf, args).getRemainingArgs();
if(argArray.length!=2){
System.out.println("请输入两个参数");
System.exit(1);
}
Job job=Job.getInstance(conf,"sort");
job.setJarByClass(SortExample.class);
job.setMapperClass(SortMapper.class);
job.setMapOutputKeyClass(IntWritable.class);
job.setMapOutputValueClass(IntWritable.class);
job.setReducerClass(SortReducer.class);
job.setOutputKeyClass(Text.class);
job.setOutputValueClass(Text.class);
FileInputFormat.addInputPath(job, new Path(argArray[0]));
FileOutputFormat.setOutputPath(job, new Path(argArray[1]));
System.exit(job.waitForCompletion(true)?0:1);
}
}

4. 单表连接

[java] view plaincopy

package demo;
import java.io.File;
import java.io.IOException;
import java.util.ArrayList;
import java.util.List;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapred.JobConf;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
import org.apache.hadoop.util.GenericOptionsParser;
import org.apache.hadoop.vod.Ejob;
public class SelfJoin {
private static class SelfJoinMapper extends Mapper{
@Override
protected void map(Object key, Text value, Context context)
throws IOException, InterruptedException {
String str=value.toString();
String[] nameArray=str.split(" ");
context.write(new Text(nameArray[1]), new Text("1-"+nameArray[0]+"-"+nameArray[1]));
context.write(new Text(nameArray[0]), new Text("2-"+nameArray[0]+"-"+nameArray[1]));
}
}
private static class SelfJoinReducer extends Reducer{
@Override
protected void reduce(Text key, Iterable values,
Context context)
throws IOException, InterruptedException {
List outKey=new ArrayList();
List outValue=new ArrayList();
/*for(Text value:values){
context.write(NullWritable.get(), value);
}
context.write(NullWritable.get(), new Text("---------"));*/
for(Text value:values){
String[] relationArray=value.toString().split("-");
if(relationArray[0].equals("1")){
outKey.add(relationArray[1]);
}else if(relationArray[0].equals("2")){
outValue.add(relationArray[2]);
}
}
for(String k:outKey){
for(int i=0;i
context.write(new Text(k), new Text(outValue.get(i)));
}
}
}
}
public static void main(String[] args) throws Exception{
File jarFile = Ejob.createTempJar("bin");
//Ejob.addClasspath("/opt/hadoop/conf");
ClassLoader classLoader = Ejob.getClassLoader();
Thread.currentThread().setContextClassLoader(classLoader);
Configuration conf=new Configuration();
String [] argArray=new GenericOptionsParser(conf, args).getRemainingArgs();
if(argArray.length!=2){
System.out.println("参数错误");
System.exit(1);
}
JobConf jobConf=new JobConf(conf);
jobConf.setJar(jarFile.toString());
Job job=Job.getInstance(jobConf,"self join");
job.setJarByClass(SelfJoin.class);
job.setMapperClass(SelfJoinMapper.class);
job.setMapOutputKeyClass(Text.class);
job.setMapOutputValueClass(Text.class);
job.setReducerClass(SelfJoinReducer.class);
job.setOutputKeyClass(Text.class);
job.setOutputValueClass(Text.class);
FileInputFormat.addInputPath(job, new Path(argArray[0]));
FileOutputFormat.setOutputPath(job, new Path(argArray[1]));
System.exit(job.waitForCompletion(true)?0:1);
}
}

单表关联

前面的实例都是在数据上进行一些简单的处理，为进一步的操作打基础。"单表关联"这个实例要求从给出的数据中寻找所关心的数据，它是对原始数据所包含信息的挖掘。下面进入这个实例。

实例描述

实例中给出child-parent（孩子——父母）表，要求输出grandchild-grandparent（孙子——爷奶）表。

样例输入如下所示。

file：

child        parent

Tom        Lucy

Tom        Jack

Jone        Lucy

Jone        Jack

Lucy        Mary

Lucy        Ben

Jack        Alice

Jack        Jesse

Terry        Alice

Terry        Jesse

Philip        Terry

Philip        Alma

Mark        Terry

Mark        Alma

样例输出如下所示。

file：

grandchild        grandparent

Tom            　　Alice

Tom            　　Jesse

Jone            　　Alice

Jone           　　 Jesse

Tom            　　Mary

Tom            　　Ben

Jone           　　 Mary

Jone           　　 Ben

Philip          　　 Alice

Philip            　　Jesse

Mark           　　 Alice

Mark           　　 Jesse

实例描述

实例中给出child-parent（孩子——父母）表，要求输出grandchild-grandparent（孙子——爷奶）表。

设计思路

分析这个实例，显然需要进行单表连接，连接的是左表的parent列和右表的child列，且左表和右表是同一个表。

　　连接结果中除去连接的两列就是所需要的结果——"grandchild--grandparent"表。要用MapReduce解决这个实例，首先应该考虑如何实现表的自连接；其次就是连接列的设置；最后是结果的整理。

考虑到MapReduce的shuffle过程会将相同的key会连接在一起，所以可以将map结果的key设置成待连接的列，然后列中相同的值就自然会连接在一起了。再与最开始的分析联系起来：

　　要连接的是左表的parent列和右表的child列，且左表和右表是同一个表，所以在map阶段将读入数据分割成child和parent之后，会将parent设置成key，child设置成value进行输出，并作为左表；再将同一对child和parent中的child设置成key，parent设置成value进行输出，作为右表。为了区分输出中的左右表，需要在输出的value中再加上左右表的信息，比如在value的String最开始处加上字符1表示左表，加上字符2表示右表。这样在map的结果中就形成了左表和右表，然后在shuffle过程中完成连接。reduce接收到连接的结果，其中每个key的value-list就包含了"grandchild--grandparent"关系。取出每个key的value-list进行解析，将左表中的child放入一个数组，右表中的parent放入一个数组，然后对两个数组求笛卡尔积就是最后的结果了。

自连接运行详解

（1）Map处理：

map函数输出结果如下所示。

child        parent                àà                    忽略此行

Tom        Lucy                   àà

                                            　　　　　　　　

Tom        Jack                    àà

                                            　　　　　　　　

Jone        Lucy                　àà

                                            　　　　　　　　

Jone        Jack                    àà

                                            　　　　　　　　

Lucy        Mary                   àà

                                            　　　　　　　　

Lucy        Ben                    àà

                                            　　　　　　　　　

Jack        Alice                    àà

                                            　　　　　　　　　　

Jack        Jesse                   àà

                                            　　　　　　　　　　

Terry        Alice                   àà

                                            　　　　　　　　　　

Terry        Jesse                  àà

                                            　　　　　　　　　　

Philip        Terry                  àà

                                            　　　　　　　　　　

Philip        Alma                   àà

                                            　　　　　　　　　　

Mark        Terry                   àà

                                            　　　　　　　　　　

Mark        Alma                　àà

                                            　　　　　　　　　　

（2）Shuffle处理

在shuffle过程中完成连接。

map函数输出

排序结果

shuffle连接

，1+Tom+Lucy>

，2+Tom+Lucy>

，1+Tom+Jack>

，2+Tom+Jack>

，1+Jone+Lucy>

，2+Jone+Lucy>

，1+Jone+Jack>

，2+Jone+Jack>

，1+Lucy+Mary>

，2+Lucy+Mary>

，1+Lucy+Ben>

，2+Lucy+Ben>

，1+Jack+Alice>

，2+Jack+Alice>

，1+Jack+Jesse>

，2+Jack+Jesse>

，1+Terry+Alice>

，2+Terry+Alice>

，1+Terry+Jesse>

，2+Terry+Jesse>

，1+Philip+Terry>

，2+Philip+Terry>

，1+Philip+Alma>

，2+Philip+Alma>

，1+Mark+Terry>

，2+Mark+Terry>

，1+Mark+Alma>

，2+Mark+Alma>

，1+Jack+Alice>

，1+Terry+Alice>

，1+Philip+Alma>

，1+Mark+Alma>

，1+Lucy+Ben>

，1+Tom+Jack>

，1+Jone+Jack>

，2+Jack+Alice>

，2+Jack+Jesse>

，1+Jack+Jesse>

，1+Terry+Jesse>

，2+Jone+Lucy>

，2+Jone+Jack>

，1+Tom+Lucy>

，1+Jone+Lucy>

，2+Lucy+Mary>

，2+Lucy+Ben>

，1+Lucy+Mary>

，2+Mark+Terry>

，2+Mark+Alma>

，2+Philip+Terry>

，2+Philip+Alma>

，2+Terry+Alice>

，2+Terry+Jesse>

，1+Philip+Terry>

，1+Mark+Terry>

，2+Tom+Lucy>

，2+Tom+Jack>

，1+Jack+Alice，

1+Terry+Alice，

1+Philip+Alma，

1+Mark+Alma >

，1+Lucy+Ben>

，1+Tom+Jack，

1+Jone+Jack，

2+Jack+Alice，

2+Jack+Jesse >

，1+Jack+Jesse，

1+Terry+Jesse >

，2+Jone+Lucy，

2+Jone+Jack>

，1+Tom+Lucy，

1+Jone+Lucy，

2+Lucy+Mary，

2+Lucy+Ben>

，1+Lucy+Mary，

2+Mark+Terry，

2+Mark+Alma>

，2+Philip+Terry，

2+Philip+Alma>

，2+Terry+Alice，

2+Terry+Jesse，

1+Philip+Terry，

1+Mark+Terry>

，2+Tom+Lucy，

2+Tom+Jack>

（3）Reduce处理

首先由语句"0 != grandchildnum && 0 != grandparentnum"得知，只要在"value-list"中没有左表或者右表，则不会做处理，可以根据这条规则去除无效的shuffle连接。

无效的shuffle连接

有效的shuffle连接

，1+Jack+Alice，

1+Terry+Alice，

1+Philip+Alma，

1+Mark+Alma >

，1+Lucy+Ben>

，1+Jack+Jesse，

1+Terry+Jesse >

，2+Jone+Lucy，

2+Jone+Jack>

，1+Lucy+Mary，

2+Mark+Terry，

2+Mark+Alma>

，2+Philip+Terry，

2+Philip+Alma>

，2+Tom+Lucy，

2+Tom+Jack>

，1+Tom+Jack，

1+Jone+Jack，

2+Jack+Alice，

2+Jack+Jesse >

，1+Tom+Lucy，

1+Jone+Lucy，

2+Lucy+Mary，

2+Lucy+Ben>

，2+Terry+Alice，

2+Terry+Jesse，

1+Philip+Terry，

1+Mark+Terry>

然后根据下面语句进一步对有效的shuffle连接做处理。

// 左表，取出child放入grandchildren

if ('1' == relationtype) {

    grandchild[grandchildnum] = childname;

    grandchildnum++;

}

// 右表，取出parent放入grandparent

if ('2' == relationtype) {

    grandparent[grandparentnum] = parentname;

    grandparentnum++;

}

针对一条数据进行分析：

        1+Jone+Jack，

        2+Jack+Alice，

        2+Jack+Jesse >

分析结果：左表用"字符1"表示，右表用"字符2"表示，上面的中的"key"表示左表与右表的连接键。而"value-list"表示以"key"连接的左表与右表的相关数据。

根据上面针对左表与右表不同的处理规则，取得两个数组的数据如下所示：

grandchild	Tom、Jone（grandchild[grandchildnum] = childname;）
grandparent	Alice、Jesse（grandparent[grandparentnum] = parentname;）

然后根据下面语句进行处理。

for (int m = 0; m < grandchildnum; m++) {

    for (int n = 0; n < grandparentnum; n++) {

        context.write(new Text(grandchild[m]), new Text(grandparent[n]));

    }

}

处理结果如下面所示：

Tom Jesse

Tom Alice

Jone Jesse

Jone Alice

其他的有效shuffle连接处理都是如此。

数据：

[java] view plain copy

Tom Lucy
Tom Jack
Jone Lucy
Jone Jack
Lucy Mary
Lucy Ben
Jack Alice
Jack Jesse
Terry Alice
Terry Jesse
Philip Terry
Philip Alma
Mark Terry
Mark Alma

结果：

[java] view plain copy

Tom Alice
Tom Jesse
Jone Alice
Jone Jesse
Tom Mary
Tom Ben
Jone Mary
Jone Ben
Philip Alice
Philip Jesse
Mark Alice
Mark Jesse

5. 多表连接

[java] view plain copy

package demo;
import java.io.File;
import java.io.IOException;
import java.util.ArrayList;
import java.util.List;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapred.JobConf;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
import org.apache.hadoop.util.GenericOptionsParser;
import org.apache.hadoop.vod.Ejob;
public class MultiTableJoin {
private static class MultiTableMapper extends Mapper{
@Override
protected void map(Object key, Text value, Context context)
throws IOException, InterruptedException {
String str=value.toString();
if(str.charAt(0)>'0'&&str.charAt(0)<'9'){
context.write(new Text(str.charAt(0)+""), new Text("2-"+str.substring(1).trim()));
}else{
context.write(new Text(str.substring(str.length()-1)), new Text("1-"+str.substring(0, str.length()-1).trim()));
}
}
}
private static class MultiTableReducer extends Reducer{
@Override
protected void reduce(Text key, Iterable values,
Context context)
throws IOException, InterruptedException {
ListkeyList=new ArrayList();
ListvalueList=new ArrayList();
for(Text value:values){
String str=value.toString();
String []strArray=str.split("-");
if(strArray[0].equals("1")){
keyList.add(strArray[1]);
}else if(strArray[0].equals("2")){
valueList.add(strArray[1]);
}
}
for(String skey:keyList){
for(String svalue:valueList){
context.write(new Text(skey), new Text(svalue));
}
}
}
}
public static void main(String[] args) throws Exception{
File jarFile=Ejob.createTempJar("bin");
ClassLoader classLoader=Ejob.getClassLoader();
Thread.currentThread().setContextClassLoader(classLoader);
Configuration conf=new Configuration();
String [] argArray=new GenericOptionsParser(conf, args).getRemainingArgs();
if(argArray.length!=2){
System.out.println("参数错误");
System.exit(1);
}
JobConf jobConf=new JobConf(conf);
jobConf.setJar(jarFile.toString());
Job job=Job.getInstance(jobConf,"multiTalbe join");
job.setMapperClass(MultiTableMapper.class);
job.setMapOutputKeyClass(Text.class);
job.setMapOutputValueClass(Text.class);
job.setReducerClass(MultiTableReducer.class);
job.setOutputKeyClass(Text.class);
job.setOutputValueClass(Text.class);
FileInputFormat.addInputPath(job, new Path(argArray[0]));
FileOutputFormat.setOutputPath(job, new Path(argArray[1]));
System.exit(job.waitForCompletion(true)?0:1);
}
}

多表关联

多表关联和单表关联类似，它也是通过对原始数据进行一定的处理，从其中挖掘出关心的信息。下面进入这个实例。

实例描述

输入是两个文件，一个代表工厂表，包含工厂名列和地址编号列；另一个代表地址表，包含地址名列和地址编号列。要求从输入数据中找出工厂名和地址名的对应关系，输出"工厂名——地址名"表。

样例输入如下所示。

1）factory：

factoryname                　　　　addressed

Beijing Red Star                　　　　1

Shenzhen Thunder            　　　　3

Guangzhou Honda            　　　　2

Beijing Rising                   　　　　1

Guangzhou Development Bank      2

Tencent                　　　　　　　　3

Back of Beijing                　　　　 1

2）address：

addressID    addressname

1        　　　　Beijing

2        　　　　Guangzhou

3        　　　　Shenzhen

4        　　　　Xian

样例输出如下所示。

factoryname                    　　　　addressname

Back of Beijing                    　　　　 Beijing

Beijing Red Star                    　　　　Beijing

Beijing Rising                    　　　　　 Beijing

Guangzhou Development Bank          Guangzhou

Guangzhou Honda                　　　　Guangzhou

Shenzhen Thunder                　　　　Shenzhen

Tencent                    　　　　　　　　Shenzhen

设计思路

多表关联和单表关联相似，都类似于数据库中的自然连接。相比单表关联，多表关联的左右表和连接列更加清楚。所以可以采用和单表关联的相同的处理方式，map识别出输入的行属于哪个表之后，对其进行分割，将连接的列值保存在key中，另一列和左右表标识保存在value中，然后输出。reduce拿到连接结果之后，解析value内容，根据标志将左右表内容分开存放，然后求笛卡尔积，最后直接输出。

6. 平均成绩

"平均成绩"主要目的还是在重温经典"WordCount"例子，可以说是在基础上的微变化版，该实例主要就是实现一个计算学生平均成绩的例子。

实例描述

　　对输入文件中数据进行就算学生平均成绩。输入文件中的每行内容均为一个学生的姓名和他相应的成绩，如果有多门学科，则每门学科为一个文件。要求在输出中每行有两个间隔的数据，其中，第一个代表学生的姓名，第二个代表其平均成绩。

样本输入：

1）math：

张三    88

李四    99

王五    66

赵六    77

2）china：

张三    78

李四    89

王五    96

赵六    67

3）english：

张三    80

李四    82

王五    84

赵六    86

样本输出：

张三    82

李四    90

王五    82

赵六    76

设计思路

计算学生平均成绩是一个仿"WordCount"例子，用来重温一下开发MapReduce程序的流程。程序包括两部分的内容：Map部分和Reduce部分，分别实现了map和reduce的功能。

Map处理的是一个纯文本文件，文件中存放的数据时每一行表示一个学生的姓名和他相应一科成绩。Mapper处理的数据是由InputFormat分解过的数据集，其中InputFormat的作用是将数据集切割成小数据集InputSplit，每一个InputSlit将由一个Mapper负责处理。此外，InputFormat中还提供了一个RecordReader的实现，并将一个InputSplit解析成对提供给了map函数。InputFormat的默认值是TextInputFormat，它针对文本文件，按行将文本切割成InputSlit，并用LineRecordReader将InputSplit解析成对，key是行在文本中的位置，value是文件中的一行。

Map的结果会通过partion分发到Reducer，Reducer做完Reduce操作后，将通过以格式OutputFormat输出。

Mapper最终处理的结果对，会送到Reducer中进行合并，合并的时候，有相同key的键/值对则送到同一个Reducer上。Reducer是所有用户定制Reducer类地基础，它的输入是key和这个key对应的所有value的一个迭代器，同时还有Reducer的上下文。Reduce的结果由Reducer.Context的write方法输出到文件中。

代码输出：

import java.io.IOException;
import java.util.Iterator;
import java.util.StringTokenizer;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.input.TextInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
import org.apache.hadoop.mapreduce.lib.output.TextOutputFormat;
import org.apache.hadoop.util.GenericOptionsParser;

public class Score {
        public static class Map extends
                Mapper {
            // 实现map函数
            public void map(LongWritable key, Text value, Context context)
                    throws IOException, InterruptedException {
                // 将输入的纯文本文件的数据转化成String
                String line = value.toString();
                // 将输入的数据首先按行进行分割
                StringTokenizer tokenizerArticle = new StringTokenizer(line, "\n");
                // 分别对每一行进行处理

                while (tokenizerArticle.hasMoreElements()) {

                    // 每行按空格划分

                    StringTokenizer tokenizerLine = new StringTokenizer(tokenizerArticle.nextToken());
                    String strName = tokenizerLine.nextToken();// 学生姓名部分
                    String strScore = tokenizerLine.nextToken();// 成绩部分
                    Text name = new Text(strName);
                    int scoreInt = Integer.parseInt(strScore);
                    // 输出姓名和成绩
                   context.write(name, new IntWritable(scoreInt));
                }
            }
        }

        public static class Reduce extends
                Reducer {
            // 实现reduce函数
            public void reduce(Text key, Iterable values,
                 Context context) throws IOException, InterruptedException {
                int sum = 0;
                int count = 0;
                Iterator iterator = values.iterator();
                while (iterator.hasNext()) {
                    sum += iterator.next().get();// 计算总分
                    count++;// 统计总的科目数
                }
                int average = (int) sum / count;// 计算平均成绩
                context.write(key, new IntWritable(average));
            }
        }

        public static void main(String[] args) throws Exception {
            Configuration conf = new Configuration();



          // String[] ioArgs = new String[] { "score_in", "score_out" };

            String[] otherArgs = new GenericOptionsParser(conf, args1).getRemainingArgs();

            if (otherArgs.length != 2) {

                System.err.println("Usage: Score Average ");

                System.exit(2);

            }



            Job job =Job.getInstance(conf, "Score Average");

            job.setJarByClass(Score.class);



            // 设置Map、Combine和Reduce处理类

            job.setMapperClass(Map.class);

            job.setCombinerClass(Reduce.class);

            job.setReducerClass(Reduce.class);



            // 设置输出类型

            job.setOutputKeyClass(Text.class);

            job.setOutputValueClass(IntWritable.class);

            // 将输入的数据集分割成小数据块splites，提供一个RecordReder的实现

            job.setInputFormatClass(TextInputFormat.class);

            // 提供一个RecordWriter的实现，负责数据输出

            job.setOutputFormatClass(TextOutputFormat.class);
            // 设置输入和输出目录

            FileInputFormat.addInputPath(job, new Path(otherArgs[0]));

            FileOutputFormat.setOutputPath(job, new Path(otherArgs[1]));

            System.exit(job.waitForCompletion(true) ? 0 : 1);

        }
}

7. 倒排索引

" 倒排索引"是 文档检索系统中 最常用的 数据结构，被广泛地应用于 全文搜索引擎。它主要是用来存储某个 单词（或词组）在一个文档或一组文档中的 存储位置的映射，即提供了一种 根据内容来查找文档的方式。由于不是根据文档来确定文档所包含的内容，而是进行相反的操作，因而称为倒排索引（Inverted Index）。

实例描述

通常情况下，倒排索引由一个单词（或词组）以及相关的文档列表组成，文档列表中的文档或者是标识文档的ID号，或者是指文档所在位置的URL，如下图所示。

倒排索引结构

从图中可以看出，单词1出现在{文档1，文档4，文档13，……}中，单词2出现在{文档3，文档5，文档15，……}中，而单词3出现在{文档1，文档8，文档20，……}中。在实际应用中，还需要给每个文档添加一个权值，用来指出每个文档与搜索内容的相关度，如下图所示。

添加权重的倒排索引

最常用的是使用词频作为权重，即记录单词在文档中出现的次数。以英文为例，如下图所示，索引文件中的"MapReduce"一行表示："MapReduce"这个单词在文本T0中出现过1次，T1中出现过1次，T2中出现过2次。当搜索条件为"MapReduce"、"is"、"Simple"时，对应的集合为：{T0，T1，T2}∩{T0，T1}∩{T0，T1}={T0，T1}，即文档T0和T1包含了所要索引的单词，而且只有T0是连续的。

倒排索引示例

更复杂的权重还可能要记录单词在多少个文档中出现过，以实现TF-IDF（Term Frequency-Inverse Document Frequency）算法，或者考虑单词在文档中的位置信息（单词是否出现在标题中，反映了单词在文档中的重要性）等。

样例输入如下所示。

1）file1：

MapReduce is simple

2）file2：

MapReduce is powerful is simple

3）file3：

Hello MapReduce bye MapReduce

样例输出如下所示。

MapReduce      file1.txt:1;file2.txt:1;file3.txt:2;

is        　　　　file1.txt:1;file2.txt:2;

simple        　 file1.txt:1;file2.txt:1;

powerful   　　 file2.txt:1;

Hello       　　 file3.txt:1;

bye       　　   file3.txt:1;

设计思路

实现"倒排索引"只要关注的信息为：单词、文档URL及词频，如图中所示。但是在实现过程中，索引文件的格式与倒排索引示例有所不同，以避免重写OutPutFormat类。下面根据MapReduce的处理过程给出倒排索引的设计思路。

1）Map过程

首先使用默认的TextInputFormat类对输入文件进行处理，得到文本中每行的偏移量及其内容。显然，Map过程首先必须分析输入的对，得到倒排索引中需要的三个信息：单词、文档URL和词频，如下图所示。

Map过程输入/输出

　　这里存在两个问题：第一，对只能有两个值，在不使用Hadoop自定义数据类型的情况下，需要根据情况将其中两个值合并成一个值，作为key或value值；第二，通过一个Reduce过程无法同时完成词频统计和生成文档列表，所以必须增加一个Combine过程完成词频统计。

这里讲单词和URL组成key值（如"MapReduce：file1.txt"），将词频作为value，这样做的好处是可以利用MapReduce框架自带的Map端排序，将同一文档的相同单词的词频组成列表，传递给Combine过程，实现类似于WordCount的功能。

2）Combine过程

经过map方法处理后，Combine过程将key值相同的value值累加，得到一个单词在文档在文档中的词频，如下图所示。如果直接将 Combine过程输入/输出图的输出作为Reduce过程的输入，在Shuffle过程时将面临一个问题：所有具有相同单词的记录（由单词、URL和词频组成）应该交由同一个Reducer处理，但当前的key值无法保证这一点，所以必须修改key值和value值。这次将单词作为key值，URL和词频组成value值（如"file1.txt：1"）。这样做的好处是可以利用MapReduce框架默认的HashPartitioner类完成Shuffle过程，将相同单词的所有记录发送给同一个Reducer进行处理。

Combine过程输入/输出

3）Reduce过程

经过上述两个过程后，Reduce过程只需将相同key值的value值组合成倒排索引文件所需的格式即可，剩下的事情就可以直接交给MapReduce框架进行处理了。如Reduce过程输入/输出图所示。索引文件的内容除分隔符外与倒排索引示例图解释相同。

4）需要解决的问题

本实例设计的倒排索引在文件数目上没有限制，但是单词文件不宜过大（具体值与默认HDFS块大小及相关配置有关），要保证每个文件对应一个split。否则，由于Reduce过程没有进一步统计词频，最终结果可能会出现词频未统计完全的单词。可以通过重写InputFormat类将每个文件为一个split，避免上述情况。或者执行两次MapReduce，第一次MapReduce用于统计词频，第二次MapReduce用于生成倒排索引。除此之外，还可以利用复合键值对等实现包含更多信息的倒排索引。

Reduce过程输入/输出

程序代码

import java.io.IOException;

import java.util.StringTokenizer;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.io.IntWritable;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapreduce.Job;

import org.apache.hadoop.mapreduce.Mapper;

import org.apache.hadoop.mapreduce.Reducer;

import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;

import org.apache.hadoop.mapreduce.lib.input.FileSplit;

import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

import org.apache.hadoop.util.GenericOptionsParser;

public class InvertedIndex {

    public static class Map extends Mapper {

        private Text keyInfo = new Text(); // 存储单词和URL组合
        private Text valueInfo = new Text(); // 存储词频
        private FileSplit split; // 存储Split对象
        // 实现map函数
        public void map(Object key, Text value, Context context)
                throws IOException, InterruptedException {

            // 获得对所属的FileSplit对象

            split = (FileSplit) context.getInputSplit();

            StringTokenizer itr = new StringTokenizer(value.toString());

            while (itr.hasMoreTokens()) {

                // key值由单词和URL组成，如"MapReduce：file1.txt"

                // 获取文件的完整路径

                // keyInfo.set(itr.nextToken()+":"+split.getPath().toString());

                // 这里为了好看，只获取文件的名称。

                int splitIndex = split.getPath().toString().indexOf("file");

                keyInfo.set(itr.nextToken() + ":"

                    + split.getPath().toString().substring(splitIndex));

                // 词频初始化为1

                valueInfo.set("1");

                System.out.println(keyInfo);

                System.out.println(valueInfo);
                context.write(keyInfo, valueInfo);

            }

        }

    }

    public static class Combine extends Reducer {

        private Text info = new Text();

        // 实现reduce函数

        public void reduce(Text key, Iterable values, Context context)

                throws IOException, InterruptedException {

            // 统计词频

            int sum = 0;

            for (Text value : values) {

                sum += Integer.parseInt(value.toString());

            }

            int splitIndex = key.toString().indexOf(":");

            // 重新设置value值由URL和词频组成

            info.set(key.toString().substring(splitIndex + 1) + ":" + sum);

            // 重新设置key值为单词

            key.set(key.toString().substring(0, splitIndex));

            context.write(key, info);

        }

    }

    public static class Reduce extends Reducer {

        private Text result = new Text();

        // 实现reduce函数

        public void reduce(Text key, Iterable values, Context context)

                throws IOException, InterruptedException {

            // 生成文档列表

            String fileList = new String();

            for (Text value : values) {

                fileList += value.toString() + ";";

            }

            result.set(fileList);

            context.write(key, result);

        }

    }

    public static void main(String[] args) throws Exception {

        Configuration conf = new Configuration();


      String[] args1=args0;

// String[] ioArgs = new String[] { "index_in", "index_out" };

        String[] otherArgs = new GenericOptionsParser(conf, args1)

                .getRemainingArgs();

        if (otherArgs.length != 2) {

            System.err.println("Usage: Inverted Index ");

            System.exit(2);

        }

        Job job = Job.getInstance(conf, "Inverted Index");

        job.setJarByClass(InvertedIndex.class);

        // 设置Map、Combine和Reduce处理类

        job.setMapperClass(Map.class);

        job.setCombinerClass(Combine.class);

        job.setReducerClass(Reduce.class);

        // 设置Map输出类型

        job.setMapOutputKeyClass(Text.class);

        job.setMapOutputValueClass(Text.class);

        // 设置Reduce输出类型

        job.setOutputKeyClass(Text.class);

        job.setOutputValueClass(Text.class);

        // 设置输入和输出目录

        FileInputFormat.addInputPath(job, new Path(otherArgs[0]));

        FileOutputFormat.setOutputPath(job, new Path(otherArgs[1]));

        System.exit(job.waitForCompletion(true) ? 0 : 1);

    }

}

你可能感兴趣的:(分布式集群/Hadoop,hadoop,java)

第三篇：字符串的有效长度JavaScript Shirley~~ javascript
这是一个求有效字符串长度的题目，在此之前复习一个简单的正则表达式正则表达式:用来定义一个字符串的规则；计算机可根据表达式来判断一个字符串是否符合规则，也可以将符合内容的字符串从一段内容中提取出来。^字符串的开头$字符串的结尾[a-zA-Z]任意字母[a-z]任意小写字母[0-9]任意数字[^]除了[^0-9]除了0-9test()用来检查一个字符串是否符合规则具体代码letstr='abcbgtd
使用 Hadoop 实现大数据的高效存储与查询王子良. 经验分享大数据 hadoop 分布式
欢迎来到我的博客！非常高兴能在这里与您相遇。在这里，您不仅能获得有趣的技术分享，还能感受到轻松愉快的氛围。无论您是编程新手，还是资深开发者，都能在这里找到属于您的知识宝藏，学习和成长。博客内容包括：Java核心技术与微服务：涵盖Java基础、JVM、并发编程、Redis、Kafka、Spring等，帮助您全面掌握企业级开发技术。大数据技术：涵盖Hadoop（HDFS）、Hive、Spark、Fli
5分钟搞定Spring AI支持SpringBoot快速构建人工智能AI应用_springai_springboot_AI应用 web17886480312 spring 人工智能 spring boot
通过阅读这篇文章，你将了解SpringAI，它是一个借鉴了langchain的设计理念，并结合Java的优势，为开发者提供易于替换实现的统一接口。此外，文章还基于SpringAI的模型调用和Prompt模板，构建一个可操作的示例，让你可以快速的了解具体怎么在springboot的环境下使用springai来构建人工智能AI的应用SpringAI：简化Java大模型集成的统一框架在Java调用大模型
高级java每日一道面试题-2025年01月17日-JDBC篇-JDBC 编程有哪些步骤? java我跟你拼了 java每日一道面试题 java 加载驱动程序建立数据库连接创建SQL 语句调用执行查询或更新处理结果集关闭资源
如果有遗漏,评论区告诉我进行补充面试官:JDBC编程有哪些步骤?我回答:在Java高级面试中，关于JDBC（JavaDatabaseConnectivity）编程的讨论通常会围绕如何使用JDBC进行数据库操作以及最佳实践展开。以下是JDBC编程的基本步骤及其详解：1.加载驱动程序为了与特定类型的数据库通信，首先需要加载相应的JDBC驱动程序。这是通过调用Class.forName()方法来实现的，
JAVA 18 新特性详解沉浮yu大海 Java18
Java18是Java语言的一次重要更新，引入了一系列新特性和改进，使开发者能够编写更高效、更安全的代码。本文将详细介绍Java18中的一些主要新特性，并提供相应的代码示例，以帮助开发者更好地理解和使用这些新特性。1.简介Java18的发布标志着Java语言在性能、安全性和开发效率方面的又一次飞跃。本次更新不仅带来了新的语言特性，还包括了一些实验性功能和工具的改进。下面，我们将依次介绍这些新特性。
Java 8 新特性详解及应用示例艾利克斯冰 Java 开发语言 java
Java8是Java发展历程中的一个重大里程碑，它引入了许多革命性的新特性，极大地提高了开发效率，增强了语言的表达力，并为函数式编程风格提供了支持。以下是Java8主要新特性的详解及其应用示例。1.Lambda表达式Lambda表达式允许你以更简洁的方式传递行为给方法，替代了传统的匿名内部类。Lambda特别适合集合操作和事件处理等场景。示例:Listnames=Arrays.asList("Al
[2847]基于JAVA的蜂蜜销售智慧管理系统的设计与实现阿鑫学长【毕设工场】 java 开发语言毕业设计课程设计
毕业设计（论文）开题报告表姓名学院专业班级题目基于JAVA的蜂蜜销售智慧管理系统的设计与实现指导老师（一）选题的背景和意义在当前信息化高速发展的时代，企业管理方式也在不断更新和进步。其中，企业销售管理是企业运营管理的重要环节，对于企业的持续发展具有重要的影响。传统的销售管理模式已经不能满足现代企业的需求，因此，基于Java的蜂蜜销售智慧管理系统的设计与实现应运而生。首先，从背景上来看，随着信息技术
WebClient和RestTemplate的差异 master_chenchengg 能力提升面试宝典技术 IT信息化
WebClient和RestTemplate的差异引言RestTemplate的历史背景与适用场景WebClient的诞生背景及其优势编程模型对比错误处理机制的区别性能考量未来发展方向实际应用案例分享引言在当今互联网时代，服务间的通信是构建分布式系统不可或缺的一部分。Spring框架作为Java生态系统中最受欢迎的企业级开发框架之一，提供了多种工具来简化HTTP请求的处理。其中，WebClient
探索Java中的事件驱动架构（EDA）微赚淘客机器人开发者联盟@聚娃科技 java 架构 python
探索Java中的事件驱动架构（EDA）大家好，我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编，也是冬天不穿秋裤，天冷也要风度的程序猿！今天，我想和大家分享一下Java中的事件驱动架构（Event-DrivenArchitecture，EDA），希望能帮助大家在构建高效、可扩展的系统时有所启发。一、什么是事件驱动架构？事件驱动架构（EDA）是一种软件架构模式，其中系统中的各个组件通
Spark 源码分析(一) SparkRpc中序列化与反序列化Serializer的抽象类解读（正在更新中~）别人能写出来的，你也能行！多学习别人的思路，形成自己的思路，高薪工作奔你而来！小白的大数据历程 Spark源码解析开发语言 spark 大数据分布式 scala
后一篇链接在这接上一章请先看解读序列化抽象类第一部分（这是一个链接）目录接上一章请先看解读序列化抽象类第一部分2.Java序列化实现类JavaSerializer(1)JavaSerializationStream类代码实际例子1：序列化(2)JavaDeserializationStream代码实际例子2：反序列化Spark源码下类图在学习过程中，抓住主要问题，请思考问题为什么Kryo序列化更加
Spark 源码分析(一) SparkRpc中序列化与反序列化Serializer的抽象类解读（java序列化部分完结，正在更新RpcEnv部分~）小白的大数据历程 Spark源码解析 spark java python
目录(3)JavaSerializerInstance定义了一个Java序列化实例(1)构造方法参数(2)方法1：serializeStream(3)方法2：deserializeStreamdefaultClassLoader(4)方法3：deserializeStreamloader(5)方法4：serialize(6)方法5：deserializeloader(7)方法6：deseriali
【自动化革命】——Java云原生应用故障注入测试的全自动化之旅墨夶 Java学习资料2 自动化 java 云原生
在当今快速变化的技术环境中，确保应用程序的高可用性和容错能力是开发者和运维团队的核心关注点。特别是在微服务架构之上构建的Java云原生应用中，面对复杂的网络环境、动态变化的服务依赖关系以及随时可能出现的各种意外情况，传统的手动测试方法已经难以满足需求。为了验证这些系统在遭遇突发状况时依然能够保持稳定运行，故障注入测试（FaultInjectionTesting,FIT）应运而生，并逐渐成为一种不可
洞察事件驱动架构的灵魂——Java中实现高度可观察性的艺术墨夶 Java学习资料1 架构 java 开发语言
在当今的软件开发领域，构建一个既能够高效响应变化又具备强大监控能力的应用系统已成为开发者们追求的目标。事件驱动架构（EDA）因其天然的支持异步处理、松耦合特性而备受青睐。然而，如何确保这样一个复杂且动态变化的系统具有良好的可见性和可控性？这就需要我们深入探讨“可观察性”这一概念，并学习如何通过精心设计让Java应用程序中的每一个事件都能被清晰地追踪和理解。本文将带您走进事件驱动架构的核心，揭示增强
Java 8新特性详解与实战小码快撩 java
引言Java8是Java发展历程中的一个里程碑版本，它引入了众多革新性的新特性和优化，大大提升了开发者的工作效率和代码质量。本文将详细解析Java8中的关键新特性，并通过实例代码进行深入讲解。一、Lambda表达式（LambdaExpression）Lambda表达式（LambdaExpression）是Java8中引入的一个重大特性，它提供了一种更简洁的匿名函数实现方式。Lambda表达式允许将
事件驱动架构下的Java应用——构建响应迅速、解耦合的高效系统墨夶 Java学习资料2 java 架构开发语言
在当今快速变化的技术环境中，软件系统的灵活性和响应速度成为了决定其成功与否的关键因素之一。传统的同步处理方式往往难以满足现代应用程序对于高性能和低延迟的要求。而事件驱动架构（Event-DrivenArchitecture,EDA）作为一种新兴的设计模式，通过引入异步机制来实现组件间的松散耦合，从而极大地提高了系统的可扩展性和维护性。本文将深入探讨如何基于Java语言构建一个高效的事件驱动架构，并
Java 数组排序赔罪 Java 系统学习 java 排序算法算法 java-ee 数组排序
目录1.Java冒泡排序（BubbleSort）1.冒泡排序2.冒泡排序的算法原理3.冒泡排序的复杂度和性能4.形成代码2.Java快速排序（QuickSort）3.Java归并排序（MergeSort）4.Java选择排序（SelectionSort）5.Java直接插入排序6.Java希尔排序（ShellSort）1.Java冒泡排序（BubbleSort）1.冒泡排序冒泡排序（BubbleS
java3d酷眩贪吃蛇下载,100行JS实现HTML5的3D贪吃蛇游戏 weixin_39983554 java3d酷眩贪吃蛇下载
js1k.com收集了小于1k的javascript小例子，里面有很多很炫很酷的游戏和特效，今年规则又增加了新花样，传统的classic类型基础上又增加了WebGL类型，以及允许增加到2K的++类型，多次想尝试提交个小游戏但总无法写出让自己满意还能控制在这么小的字节范围。自己写不出来，站在巨人肩膀总是有机会吧，折腾了一番站在Hightopo的肩膀上搞了个3D贪吃蛇游戏，算了算JS代码还只有90来行
Java数据结构__Arraylist与顺序表(1) suger__salt Java基础知识 java 数据结构算法
目录1.线性表2.顺序表3.ArrayList介绍ArrayList构造4.ArrayList使用1.常见操作2.ArratList的遍历3.ArrayList的扩容机制1.线性表线性表是一种数据结构，它由n（n≥0）个数据元素组成，数据元素类型相同，且呈现一对一的线性关系。常见的线性表有:顺序表,链表,栈,队列…2.顺序表顺序表是用一段地址连续的存储单元一次存储数据元素的线性结构,一般情况下采用
SpringBoot整合Logback日志框架洛上言后端 spring boot 后端 java
文章目录一、引入二、默认日志格式三、控制台输出四、文件输出五、日志级别六、日志组七、自定义日志格式八、自定义log配置九、logback-spring.xml自定义注意事项一、引入SpringBoot使用CommonsLogging进行所有内部日志的记录，但默认配置也提供了对常用日志的支持，如JavaUtilLogging，Log4J2，和Logback.每种logger都可以通过配置使用控制台或
Java 基础之泛型：类型安全的保障与灵活运用幽兰的天空 Java 基础启航：从零到小有所成开发语言 java
在Java编程的世界里，泛型是一个至关重要且非常实用的特性。它在Java5中被引入，从根本上改变了我们处理数据类型的方式，提供了更强的类型安全保障，同时也增加了代码的复用性和可读性。一、什么是泛型泛型（Generics）简单来说，就是允许在定义类、接口和方法时使用类型参数。这些类型参数在使用时会被具体的类型所替代。例如，我们常见的集合类ArrayList就是一个泛型类，它的定义形式是ArrayLi
Servlet中配置和使用过滤器幽兰的天空 Java 基础启航：从零到小有所成 Servlet技术 servlet hive hadoop
在Servlet中配置和使用过滤器主要包括创建过滤器类、配置过滤器以及在Web应用中使用过滤器等步骤，以下是具体内容：创建过滤器类过滤器类需要实现javax.servlet.Filter接口，并重写其中的init、doFilter和destroy方法。init方法用于过滤器的初始化，在服务器启动时被调用，通常用于加载配置文件、初始化资源等操作。doFilter方法是过滤器的核心方法，用于实现具体的
Java虚拟机（JVM）深入解析 I~Lucky jvm
Java虚拟机（JVM）是Java程序运行的核心环境，它负责将Java字节码转换为机器码并执行。本文将深入解析JVM的运行时数据区、类加载机制以及执行引擎，帮助读者更好地理解JVM的工作原理。一、运行时数据区（RuntimeDataArea）运行时数据区是JVM在执行Java程序时分配的内存区域，主要包括以下几个部分：1.方法区（MethodArea）方法区用于存储类信息、常量、静态变量以及即时编
Spring 框架中的 Bean 生命周期全解析码农小灰面试题 Spring java java spring servlet
目录一、Bean生命周期的关键步骤二、使用场景说明在当今的软件开发领域，Spring框架凭借其强大的依赖注入和控制反转特性，已成为Java开发中不可或缺的一部分。而Spring框架的核心组件之一——Bean，其生命周期的管理对于应用程序的稳定运行和资源的有效利用至关重要。本文将深入探讨Spring框架中Bean的生命周期，从实例化到销毁的每一个关键步骤，并结合使用场景进行说明，帮助开发者更好地理解
Node.js的Express框架入门秋枫ઇଓ node.js express 学习 javascript
Node.js的Express框架入门什么是Node?Node（正式名称Node.js）是一个开源的、跨平台的运行时环境，有了它，开发人员可以使用JavaScript创建各种服务器端工具和应用程序。此运行时主要用于浏览器上下文之外（即可以直接运行于计算机或服务器操作系统上）。据此，该环境省略了一些浏览器专用的JavaScriptAPI，同时添加了对更传统的OSAPI（比如HTTP库和文件系统库）的
Java语言的数据结构豪宇刘 java 数据结构 windows
Java提供了多种内置的数据结构，这些数据结构可以分为两大类：基本的数组（Array）和集合框架（CollectionsFramework）。集合框架又细分为多个接口和实现类，提供了丰富的功能来管理对象集合。以下是Java中常见数据结构的详细介绍：1.数组（Array）一维数组：最简单的数据结构，用于存储固定大小的同类型元素。多维数组：如二维数组、三维数组等，它们本质上是一维数组的嵌套。//一维数
最长回文字串的多种解法（java）心 - java
文章目录1.暴力解法2.中心扩散法3.动态规划法题目要求:给你一个字符串s，找到s中最长的回文子串1.暴力解法列举所有子串；将字符串分解为字符数组char[]arr,方便后续判断是否为回文字符串，接着使用两层for循环去跑字符串s,使用maxf初始化为1去记录最长回文字符串的长度，min记录最长字符串的起始下标。代码如下：publicStringlongestPalindrome(Strings)
Java常见面试题2 七禾页话 java面试 java 算法
Java常见面试题面向对象和面向过程的区别面向对象(POP)：将方法和数据封装为对象作为程序的基本单元，提炼出封装继承多态来作为代码指导，注重代码灵活性和复用性面向过程(OOP)：将过程作为基本程序的基本单元，过程对应到代码中就是函数，将函数和数据分离，注重步骤和流程对象实体和对象引用有什么不同Personperson=newPerson()你尝试打印person变量本身，输出可能是类似于"Per
MyBatis 注解使用指南小小小妮子~ tomcat java 开发语言 MyBatis
什么是MyBatis注解？MyBatis是一个老牌而强大的ORM框架，通过配置文件或注解来实现数据库操作。在注解模式中，你可以不用写XML配置文件，而是通过在代码中直接使用Java注解来实现。这种方式更简洁，会让你的项目代码极大约简化，同时保持构件的结构化。MyBatis注解的优势优化代码结构：较乎使用XML配置，注解使用更简洁。所有于SQL直接直观地位于接口中，汇总于一个场景中。清除多余配置文件
使用java代码消费kafka数据二进制_博客大数据 java kafka
首先创建maven项目，导入jar包org.apache.kafkakafka-clients3.0.0org.slf4jslf4j-log4j121.7.25示例一：使用java代码消费kafka所有数据packagecom.bigdata.day03;importorg.apache.kafka.clients.consumer.ConsumerConfig;importorg.apache.
JavaWeb原生框架开发JSP+Servlet+JDBC案例秦老师Q JavaWeb基础 java servlet 开发语言
目录概要功能技术名词解释技术细节1.项目列表2.网页3.Servlet小结概要JavaWeb开发案例，使用JSP、Servlet、JDBC原生框架技术，实现用户模块的功能开发，主要用于学习。功能1.注册2.登录3.用户模块3.1查询用户信息3.2删除用户信息3.3修改用户信息技术名词解释JSP：全称JavaServerPages,是由Sun公司主导创建的一种动态网页技术标准，JSP中可以编写Jav
多线程编程之存钱与取钱周凡杨 java thread 多线程存钱取钱
生活费问题是这样的：学生每月都需要生活费，家长一次预存一段时间的生活费，家长和学生使用统一的一个帐号，在学生每次取帐号中一部分钱，直到帐号中没钱时通知家长存钱，而家长看到帐户还有钱则不存钱，直到帐户没钱时才存钱。问题分析：首先问题中有三个实体，学生、家长、银行账户，所以设计程序时就要设计三个类。其中银行账户只有一个，学生和家长操作的是同一个银行账户，学生的行为是
java中数组与List相互转换的方法征客丶 JavaScript java jsonp
1.List转换成为数组。（这里的List是实体是ArrayList) 　　调用ArrayList的toArray方法。　　toArray 　　public T[] toArray(T[] a)返回一个按照正确的顺序包含此列表中所有元素的数组；返回数组的运行时类型就是指定数组的运行时类型。如果列表能放入指定的数组，则返回放入此列表元素的数组。否则，将根据指定数组的运行时类型和此列表的大小分
Shell 流程控制 daizj 流程控制 if else while case shell
Shell 流程控制和Java、PHP等语言不一样，sh的流程控制不可为空，如(以下为PHP流程控制写法)： <?php if(isset($_GET["q"])){ search(q);}else{// 不做任何事情} 在sh/bash里可不能这么写，如果else分支没有语句执行，就不要写这个else，就像这样 if else if if 语句语
Linux服务器新手操作之二周凡杨 Linux 简单操作
1.利用关键字搜寻Man Pages man -k keyword 其中-k 是选项，keyword是要搜寻的关键字如果现在想使用whoami命令，但是只记住了前3个字符who，就可以使用 man -k who来搜寻关键字who的man命令 [haself@HA5-DZ26 ~]$ man -k
socket聊天室之服务器搭建朱辉辉33 socket
因为我们做的是聊天室，所以会有多个客户端，每个客户端我们用一个线程去实现，通过搭建一个服务器来实现从每个客户端来读取信息和发送信息。我们先写客户端的线程。 public class ChatSocket extends Thread{ Socket socket; public ChatSocket(Socket socket){ this.sock
利用finereport建设保险公司决策分析系统的思路和方法老A不折腾 finereport 金融保险分析系统报表系统项目开发
决策分析系统呈现的是数据页面，也就是俗称的报表，报表与报表间、数据与数据间都按照一定的逻辑设定，是业务人员查看、分析数据的平台，更是辅助领导们运营决策的平台。底层数据决定上层分析，所以建设决策分析系统一般包括数据层处理（数据仓库建设）。项目背景介绍通常，保险公司信息化程度很高，基本上都有业务处理系统（像集团业务处理系统、老业务处理系统、个人代理人系统等）、数据服务系统（通过
始终要页面在ifream的最顶层林鹤霄
index.jsp中有ifream，但是session消失后要让login.jsp始终显示到ifream的最顶层。。。始终没搞定，后来反复琢磨之后，得到了解决办法，在这儿给大家分享下。。 index.jsp--->主要是加了颜色的那一句 <html> <iframe name="top" ></iframe> <ifram
MySQL binlog恢复数据 aigo mysql
1，先确保my.ini已经配置了binlog： # binlog log_bin = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.log log_bin_index = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.index log_error = D:/mysql-5.6.21-win
OCX打成CBA包并实现自动安装与自动升级 alxw4616 ocx cab
近来手上有个项目,需要使用ocx控件 (ocx是什么? http://baike.baidu.com/view/393671.htm) 在生产过程中我遇到了如下问题. 1. 如何让 ocx 自动安装? a) 如何签名? b) 如何打包? c) 如何安装到指定目录? 2.
Hashmap队列和PriorityQueue队列的应用百合不是茶 Hashmap队列 PriorityQueue队列
HashMap队列已经是学过了的,但是最近在用的时候不是很熟悉,刚刚重新看以一次, HashMap是K,v键 ,值 put()添加元素 //下面试HashMap去掉重复的 package com.hashMapandPriorityQueue; import java.util.H
JDK1.5 returnvalue实例 bijian1013 java thread java多线程 returnvalue
Callable接口：返回结果并且可能抛出异常的任务。实现者定义了一个不带任何参数的叫做 call 的方法。 Callable 接口类似于 Runnable，两者都是为那些其实例可能被另一个线程执行的类设计的。但是 Runnable 不会返回结果，并且无法抛出经过检查的异常。 ExecutorService接口方
angularjs指令中动态编译的方法(适用于有异步请求的情况) 内嵌指令无效 bijian1013 JavaScript AngularJS
在directive的link中有一个$http请求，当请求完成后根据返回的值动态做element.append('......');这个操作，能显示没问题，可问题是我动态组的HTML里面有ng-click，发现显示出来的内容根本不执行ng-click绑定的方法！
【Java范型二】Java范型详解之extend限定范型参数的类型 bit1129 extend
在第一篇中，定义范型类时，使用如下的方式： public class Generics<M, S, N> { //M,S,N是范型参数 } 这种方式定义的范型类有两个基本的问题： 1. 范型参数定义的实例字段，如private M m = null;由于M的类型在运行时才能确定，那么我们在类的方法中，无法使用m，这跟定义pri
【HBase十三】HBase知识点总结 bit1129 hbase
1. 数据从MemStore flush到磁盘的触发条件有哪些？ a.显式调用flush，比如flush 'mytable' b.MemStore中的数据容量超过flush的指定容量，hbase.hregion.memstore.flush.size,默认值是64M 2. Region的构成是怎么样？ 1个Region由若干个Store组成
服务器被DDOS攻击防御的SHELL脚本 ronin47
mkdir /root/bin vi /root/bin/dropip.sh #!/bin/bash/bin/netstat -na|grep ESTABLISHED|awk ‘{print $5}’|awk -F:‘{print $1}’|sort|uniq -c|sort -rn|head -10|grep -v -E ’192.168|127.0′|awk ‘{if($2!=null&a
java程序员生存手册-craps 游戏-一个简单的游戏 bylijinnan java
import java.util.Random; public class CrapsGame { /** * *一个简单的赌*博游戏，游戏规则如下： *玩家掷两个骰子，点数为1到6，如果第一次点数和为7或11，则玩家胜， *如果点数和为2、3或12，则玩家输， *如果和为其它点数，则记录第一次的点数和，然后继续掷骰，直至点数和等于第一次掷出的点
TOMCAT启动提示NB: JAVA_HOME should point to a JDK not a JRE解决开窍的石头 JAVA_HOME
当tomcat是解压的时候，用eclipse启动正常，点击startup.bat的时候启动报错; 报错如下： The JAVA_HOME environment variable is not defined correctly This environment variable is needed to run this program NB: JAVA_HOME shou
[操作系统内核]操作系统与互联网 comsci 操作系统
我首先申明：我这里所说的问题并不是针对哪个厂商的，仅仅是描述我对操作系统技术的一些看法操作系统是一种与硬件层关系非常密切的系统软件，按理说，这种系统软件应该是由设计CPU和硬件板卡的厂商开发的，和软件公司没有直接的关系，也就是说，操作系统应该由做硬件的厂商来设计和开发
富文本框ckeditor_4.4.7 文本框的简单使用支持IE11 cuityang 富文本框
<html xmlns="http://www.w3.org/1999/xhtml"> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> <title>知识库内容编辑</tit
Property null not found darrenzhu datagrid Flex Advanced propery null
When you got error message like "Property null not found ***", try to fix it by the following way: 1)if you are using AdvancedDatagrid, make sure you only update the data in the data prov
MySQl数据库字符串替换函数使用 dcj3sjt126com mysql 函数替换
需求：需要将数据表中一个字段的值里面的所有的 . 替换成 _ 原来的数据是 site.title site.keywords .... 替换后要为 site_title site_keywords 使用的SQL语句如下： updat
mac上终端起动MySQL的方法 dcj3sjt126com mysql mac
首先去官网下载: http://www.mysql.com/downloads/ 我下载了5.6.11的dmg然后安装,安装完成之后..如果要用终端去玩SQL.那么一开始要输入很长的:/usr/local/mysql/bin/mysql 这不方便啊,好想像windows下的cmd里面一样输入mysql -uroot -p1这样...上网查了下..可以实现滴. 打开终端,输入: 1
Gson使用一（Gson） eksliang json gson
转载请出自出处：http://eksliang.iteye.com/blog/2175401 一.概述从结构上看Json，所有的数据（data）最终都可以分解成三种类型：第一种类型是标量（scalar），也就是一个单独的字符串（string）或数字（numbers），比如"ickes"这个字符串。第二种类型是序列（sequence），又叫做数组（array）
android点滴4 gundumw100 android
Android 47个小知识 http://www.open-open.com/lib/view/open1422676091314.html Android实用代码七段（一） http://www.cnblogs.com/over140/archive/2012/09/26/2611999.html http://www.cnblogs.com/over140/arch
JavaWeb之JSP基本语法 ihuning javaweb
目录 JSP模版元素 JSP表达式 JSP脚本片断 EL表达式 JSP注释特殊字符序列的转义处理如何查找JSP页面中的错误 JSP模版元素 JSP页面中的静态HTML内容称之为JSP模版元素，在静态的HTML内容之中可以嵌套JSP
App Extension编程指南（iOS8/OS X v10.10）中文版啸笑天 ext
当iOS 8.0和OS X v10.10发布后，一个全新的概念出现在我们眼前，那就是应用扩展。顾名思义，应用扩展允许开发者扩展应用的自定义功能和内容，能够让用户在使用其他app时使用该项功能。你可以开发一个应用扩展来执行某些特定的任务，用户使用该扩展后就可以在多个上下文环境中执行该任务。比如说，你提供了一个能让用户把内容分
SQLServer实现无限级树结构 macroli oracle sql SQL Server
表结构如下：数据库id path titlesort 排序 1 0 首页 0 2 0,1 新闻 1 3 0,2 JAVA 2 4 0,3 JSP 3 5 0,2,3 业界动态 2 6 0,2,3 国内新闻 1 创建一个存储过程来实现，如果要在页面上使用可以设置一个返回变量将至传过去 create procedure test as begin decla
Css居中div，Css居中img，Css居中文本，Css垂直居中div qiaolevip 众观千象学习永无止境每天进步一点点 css
/**********Css居中Div**********/ div.center { width: 100px; margin: 0 auto; } /**********Css居中img**********/ img.center { display: block; margin-left: auto; margin-right: auto; }
Oracle 常用操作(实用) 吃猫的鱼 oracle
SQL>select text from all_source where owner=user and name=upper('&plsql_name'); SQL>select * from user_ind_columns where index_name=upper('&index_name'); 将表记录恢复到指定时间段以前
iOS中使用RSA对数据进行加密解密 witcheryne ios rsa iPhone objective c
RSA算法是一种非对称加密算法,常被用于加密数据传输.如果配合上数字摘要算法, 也可以用于文件签名. 本文将讨论如何在iOS中使用RSA传输加密数据. 本文环境 mac os openssl-1.0.1j, openssl需要使用1.x版本, 推荐使用[homebrew](http://brew.sh/)安装. Java 8 RSA基本原理 RS