RDD综合训练

题目:qm2.txt数据,每一行数据代表一次购买东西的记录,每一行的数据格式:年,月,买的东西,中间字段使用空格分隔。
实验要求:统计2015年上半年(1-6月)购买最多的东西。

qm2.txt:

2015 1 手机
2015 2 电脑
2015 3 书包
2015 4 笔
2015 5 笔
2015 6 笔
2015 7 书
2015 8 书
2015 9 零食
2015 10 书
2016 1 书
2016 2 书
2016 3 笔
2016 6 书
2016 8 书包
2016 9 手机

代码:

package com.atguigu.shiyan15

import org.apache.spark.api.java.JavaRDD.fromRDD
import org.apache.spark.{SparkConf, SparkContext}
import org.apache.spark.rdd.RDD
import org.apache.spark.sql.{DataFrame, Row, SparkSession}
import org.apache.spark.storage.StorageLevel

object No3 {
  case class Person(thing:String, month:String, year:Int)
  def main(args: Array[String]): Unit = {

    val sparConf = new SparkConf().setMaster("local").setAppName("WordCount")
    val sc = new SparkContext(sparConf)

    val sparkConf = new SparkConf().setMaster("local[*]").setAp

你可能感兴趣的:(Windows,scala,spark,intellij-idea)