spark wordcount 第一个spark 程序

阅读更多

 

 

 

wordcount

package com.baoy.worldcount

import org.apache.spark.{SparkConf, SparkContext}

/**
  * Created by cmcc-B100036 on 2016/4/1.
  */
object WordCount {
  def main(args: Array[String]) {
    if(args.length == 0) {
      println("usage: wordcount ")
      System.exit(1)
    }
    val conf = new SparkConf ().setAppName("wordcount")
    val sc = new SparkContext(conf)
    sc.textFile(args(0))
      .flatMap(_.split(" "))
      .map(x => (x, 1))
      .reduceByKey(_ + _)
      .foreach(println)
    sc.stop()
  }
}

 

 

pom

 
      org.apache.spark
      spark-core_2.10
      1.4.1
      provided
    

 

 

准备原始数据



 

在 /home/cloudera/baoyou/data/log

创建文件 wordcount.log   

 

 在 hdfs 上创建 /data 路径

hdfs dfs -mkdir /data

 

 

上传 wordcount.log 到data路径

hdfs dfs -put wordcount.log /data/

 

 

 

 

运行 本地 spark-submit

 spark-submit  --class com.baoy.worldcount.WordCount --master local  /home/cloudera/baoyou/project/SparkDemo.jar /data/wordcount.log

 

 

运行结果:
spark wordcount 第一个spark 程序_第1张图片
 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

捐助开发者

在兴趣的驱动下,写一个免费的东西,有欣喜,也还有汗水,希望你喜欢我的作品,同时也能支持一下。 当然,有钱捧个钱场(右上角的爱心标志,支持支付宝和PayPal捐助),没钱捧个人场,谢谢各位。


spark wordcount 第一个spark 程序_第2张图片spark wordcount 第一个spark 程序_第3张图片spark wordcount 第一个spark 程序_第4张图片
 
 
 谢谢您的赞助,我会做的更好!

 

 

 

 

  • spark wordcount 第一个spark 程序_第5张图片
  • 大小: 7.2 KB
  • spark wordcount 第一个spark 程序_第6张图片
  • 大小: 7.2 KB
  • spark wordcount 第一个spark 程序_第7张图片
  • 大小: 58.7 KB
  • 查看图片附件

你可能感兴趣的:(spark,wordcount,第一个,程序)