MapReduce案例实操---对电话号码进行分区

通过MapReduce原理进行简单的分区。

 操作内容 
1. 需求 
将统计结果按照手机号前三位输出到不同文件中(分区) 
(1) 输入数据 

    
 
(2) 期望输出数据 
手机号 136、137、138、139 开头都分别放到一个独
立的 4 个文件中,其他开头放到一个文件中 
(3) 在序列化作业的基础上,增加一个分区类 

2. 需求分析 
1. 需求:将统计结果按照手机归属地不同省份输出到不同文
件中(分区) 
2. 数据输入 
 MapReduce案例实操---对电话号码进行分区_第1张图片


3. 期望数据输出 

   

4. 增加一个 ProvincePartitioner 分区 
 MapReduce案例实操---对电话号码进行分区_第2张图片
5. Driver 驱动类 

 MapReduce案例实操---对电话号码进行分区_第3张图片

这是所用到的phone_data.txt

1	13736230513	192.196.100.1	www.atguigu.com	2481	24681	200
2	13846544121	192.196.100.2			264	0	200
3 	13956435636	192.196.100.3			132	1512	200
4 	13966251146	192.168.100.1			240	0	404
5 	18271575951	192.168.100.2	www.atguigu.com	1527	2106	200
6 	84188413	192.168.100.3	www.atguigu.com	4116	1432	200
7 	13590439668	192.168.100.4			1116	954	200
8 	15910133277	192.168.100.5	www.hao123.com	3156	2936	200
9 	13729199489	192.168.100.6			240	0	200
10 	13630577991	192.168.100.7	www.shouhu.com	6960	690	200
11 	15043685818	192.168.100.8	www.baidu.com	3659	3538	200
12 	

你可能感兴趣的:(mapreduce,hadoop,大数据)