Spark项目智慧城市车流量分析项目之固定卡口下车辆的行车轨迹

数据集

  • 日期 卡口ID 摄像头编号 车牌号 拍摄时间
  • date monitor_id camera_id car action_time
    车速 道路ID 区域ID
    speed road_id area_id

数据集

模拟数据

2018-06-27 0007 00536 京R66884 2018-06-27 11:30:25 30 41 08
2018-06-27 0005 01726 闵P89564 2018-06-27 09:34:03 19 7 03
2018-06-27 0005 01272 闵P89564 2018-06-27 09:50:39 187 19 05
2018-06-27 0002 00082 闵P89564 2018-06-27 09:34:47 1 28 05
2018-06-27 0003 08417 闵P89564 2018-06-27 09:23:05 171 42 02
2018-06-27 0003 02757 闵P89564 2018-06-27 09:52:35 32 50 04
2018-06-27 0000 03759 沪W87972 2018-06-27 20:02:43 243 25 05
2018-06-27 0002 08652 沪W87972 2018-06-27 20:05:10 51 11 05

代码逻辑
Spark项目智慧城市车流量分析项目之固定卡口下车辆的行车轨迹_第1张图片

本地模拟代码

package test;

import org.apache.spark.SparkConf;
import org.apache.spark.api.java.JavaPairRDD;
import org.apache.spark.api.java.JavaRDD;
import org.apache.spark.api.java.JavaSparkContext;
import org.apache.spark.api.java.function.Function;
import org.apache.spark.api.java.function.PairFunction;
import org.apache.spark.api.java.function.VoidFunction;
import org.apache.spark.broadcast.Broadcast;
import scala.Tuple2;

import java.util.*;

public class Carlearn {
    public static void main(String[] args) {
        SparkConf conf = new SparkConf();
        conf.setMaster("local").setAppName("Carlearn");
        JavaSparkContext sc = new JavaSparkContext(conf);
        JavaRDD lineRDD = sc.textFile("monitor_flow_action");


        //mapToPair 形成一个tuple<卡扣id,车牌号>
        JavaPairRDD rdd2 = lineRDD.mapToPair(new PairFunction() {
            @Override
            public Tuple2 call(String s) throws Exception {
                String[] split = s.split("\t");
                return new Tuple2<>(split[1], split[3]);
            }
        });

        //过滤只留下一个卡扣id为001的信息
        JavaPairRDD rdd3 = rdd2.filter(new Function, Boolean>() {
            @Override
            public Boolean call(Tuple2 tuple2) throws Exception {

                return tuple2._1.equals("0001");
            }
        });

        //map 形成一个个的car
        JavaRDD rdd4 = rdd3.map(new Function, String>() {
            @Override
            public String call(Tuple2 tuple2) throws Exception {
                return tuple2._2;
            }
        });

        //去重
        JavaRDD rdd5 = rdd4.distinct();

        //转换成集合
        List result = rdd5.collect();

        //广播变量
        final Broadcast> broadcast = sc.broadcast(result);

        /**
         * mapToPair转换成Tuple<车牌号,一行的值>
         */
        JavaPairRDD rddA = lineRDD.mapToPair(new PairFunction() {
            @Override
            public Tuple2 call(String s) throws Exception {
                String[] split = s.split("\t");

                return new Tuple2<>(split[3], s);
            }
        });
        //过滤掉只留下卡扣id为001信息的车,
        JavaPairRDD> rddC = rddA.filter(new Function, Boolean>() {
            @Override
            public Boolean call(Tuple2 tuple2) throws Exception {
                List carList = broadcast.value();
                String carId = tuple2._2.split("\t")[3];
                return carList.contains(carId);
            }
        }).groupByKey();
        rddC.foreach(new VoidFunction>>() {
            @Override
            public void call(Tuple2> tuple2) throws Exception {
                Iterator iterator = tuple2._2.iterator();
                List> map = new ArrayList<>();
                //将时间和卡扣号封装成一个list
                while (iterator.hasNext()) {
                    String next = iterator.next();
                    String time = next.split("\t")[4];
                    String kakouId = next.split("\t")[1];
                    Tuple2 time_kakou = new Tuple2<>(time, kakouId);
                    map.add(time_kakou);
                }
                //通过时间排序,整理出汽车的行车轨迹
                Collections.sort(map, new Comparator>() {
                    @Override
                    public int compare(Tuple2 o1, Tuple2 o2) {
                        return o1._1.compareTo(o2._1);
                    }
                });
                //打印下行车轨迹
                String chepai = tuple2._1;
                System.out.println("汽车号:"+chepai);
                for (Tuple2 s : map) {
                    System.out.print("时间:"+s._1+"卡扣:"+s._2+"===>");
                }
                System.out.println();
            }
        });
    }
}

结果

06-27 22:39:26卡扣:0005===>时间:2018-06-27 22:40:31卡扣:0008===>时间:2018-06-27 22:41:37卡扣:0005===>时间:2018-06-27 22:42:02卡扣:0000===>时间:2018-06-27 22:43:07卡扣:0002===>时间:2018-06-27 22:44:28卡扣:0004===>时间:2018-06-27 22:45:49卡扣:0001===>时间:2018-06-27 22:51:40卡扣:0005===>时间:2018-06-27 22:53:26卡扣:0008===>时间:2018-06-27 22:54:06卡扣:0007===>时间:2018-06-27 22:57:26卡扣:0004===>时间:2018-06-27 22:57:56卡扣:0005===>时间:2018-06-27 22:58:07卡扣:0006===>时间:2018-06-27 23:00:40卡扣:0006===>时间:2018-06-27 23:01:56卡扣:0008===>时间:2018-06-27 23:04:27卡扣:0004===>时间:2018-06-27 23:04:43卡扣:0003===>时间:2018-06-27 23:05:38卡扣:0001===>时间:2018-06-27 23:09:03卡扣:0007===>时间:2018-06-27 23:09:06卡扣:0005===>时间:2018-06-27 23:09:37卡扣:0004===>时间:2018-06-27 23:11:11卡扣:0007===>时间:2018-06-27 23:12:06卡扣:0001===>时间:2018-06-27 23:12:12卡扣:0008===>时间:2018-06-27 23:14:31卡扣:0002===>时间:2018-06-27 23:16:25卡扣:0007===>时间:2018-06-27 23:23:47卡扣:0000===>时间:2018-06-27 23:24:03卡扣:0008===>时间:2018-06-27 23:26:27卡扣:0003===>时间:2018-06-27 23:29:44卡扣:0001===>时间:2018-06-27 23:30:23卡扣:0003===>时间:2018-06-27 23:33:27卡扣:0007===>时间:2018-06-27 23:34:18卡扣:0002===>时间:2018-06-27 23:34:28卡扣:0002===>时间:2018-06-27 23:34:39卡扣:0001===>时间:2018-06-27 23:39:59卡扣:0005===>时间:2018-06-27 23:45:13卡扣:0001===>时间:2018-06-27 23:48:47卡扣:0004===>
汽车号:京D44143
时间:2018-06-27 02:00:01卡扣:0007===>时间:2018-06-27 02:00:59卡扣:0001===>时间:2018-06-27 02:02:11卡扣:0008===>时间:2018-06-27 02:02:29卡扣:0001===>时间:2018-06-27 02:02:31卡扣:0001===>时间:2018-06-27 02:04:11卡扣:0005===>时间:2018-06-27 02:06:20卡扣:0000===>时间:2018-06-27 02:07:36卡扣:0007===>时间:2018-06-27 02:14:36卡扣:0004===>时间:2018-06-27 02:14:58卡扣:0005===>时间:2018-06-27 02:15:01卡扣:0007===>时间:2018-06-27 02:15:14卡扣:0003===>时间:2018-06-27 02:17:16卡扣:0005===>时间:2018-06-27 02:20:59卡扣:0001===>时间:2018-06-27 02:21:26卡扣:0008===>时间:2018-06-27 02:21:27卡扣:0000===>时间:2018-06-27 02:22:19卡扣:0004===>时间:2018-06-27 02:26:20卡扣:0007===>时间:2018-06-27 02:35:02卡扣:0002===>时间:2018-06-27 02:35:28卡扣:0006===>时间:2018-06-27 02:37:23卡扣:0001===>时间:2018-06-27 02:38:13卡扣:0005===>时间:2018-06-27 02:38:33卡扣:0002===>时间:2018-06-27 02:39:15卡扣:0000===>时间:2018-06-27 02:39:42卡扣:0008===>时间:2018-06-27 02:41:53卡扣:0001===>时间:2018-06-27 02:46:54卡扣:0007===>时间:2018-06-27 02:47:23卡扣:0008===>时间:2018-06-27 02:52:27卡扣:0001===>时间:2018-06-27 02:53:31卡扣:0006===>时间:2018-06-27 03:08:55卡扣:0007===>
汽车号:京R34631
时间:2018-06-27 14:01:24卡扣:0004===>时间:2018-06-27 14:03:36卡扣:0005===>时间:2018-06-27 14:05:04卡扣:0006===>时间:2018-06-27 14:08:40卡扣:0007===>时间:2018-06-27 14:09:29卡扣:0002===>时间:2018-06-27 14:09:51卡扣:0008===>时间:2018-06-27 14:13:40卡扣:0008===>时间:2018-06-27 14:18:55卡扣:0005===>时间:2018-06-27 14:26:54卡扣:0001===>时间:2018-06-27 14:27:20卡扣:0000===>时间:2018-06-27 14:34:02卡扣:0001===>时间:2018-06-27 14:34:39卡扣:0006===>时间:2018-06-27 14:36:10卡扣:0003===>时间:2018-06-27 14:37:08卡扣:0006===>时间:2018-06-27 14:37:30卡扣:0003===>时间:2018-06-27 14:39:25卡扣:0005===>时间:2018-06-27 14:41:00卡扣:0007===>时间:2018-06-27 14:42:03卡扣:0001===>时间:2018-06-27 14:47:36卡扣:0001===>时间:2018-06-27 14:48:16卡扣:0003===>时间:2018-06-27 14:53:22卡扣:0001===>时间:2018-06-27 14:53:34卡扣:0005===>时间:2018-06-27 14:53:54卡扣:0001===>时间:2018-06-27 14:53:56卡扣:0002===>时间:2018-06-27 14:54:14卡扣:0003===>时间:2018-06-27 14:55:44卡扣:0003===>时间:2018-06-27 14:57:27卡扣:0006===>时间:2018-06-27 14:57:53卡扣:0000===>时间:2018-06-27 14:58:12卡扣:0008===>时间:2018-06-27 14:59:11卡扣:0008===>
汽车号:沪V82625

你可能感兴趣的:(spark-鲨鱼)