相对于转换,动作(Action)操作用于向驱动(Driver)程序返回值或者将值写入到文件当中。
val rdd1 = sc.makeRDD(1 to 10,2)
rdd1.reduce(_+_)
val rdd2 = sc.makeRDD(Array(("a",1),("a",3),("c",3),("d",5)))
rdd2.reduce((x,y)=>(x._1 + y._1,x._2 + y._2))
val rdd1 = sc.makeRDD(1 to 10,2)
rdd1.collect()
val rdd1 = sc.makeRDD(1 to 10,2)
rdd1.count()
val rdd1 = sc.makeRDD(1 to 10,2)
rdd1.first()
val rdd1 = sc.makeRDD(1 to 10,2)
rdd1.take5)
val rdd1 = sc.makeRDD(1 to 10,2)
rdd1.collect()
rdd1.takeSample(true,5,3)
val rdd = sc.makeRDD(Seq(10,4,2,5,6))
rdd.takeOrderd(3)
var rdd1 = sc.makeRDD(1 to 10,2)
rdd1.aggregate(1)(
| {(x : Int,y : Int) => x + y},
| {(a : Int,b : Int) => a + b}
| )
var rdd1 = sc.makeRDD(1 to 4,2)
rdd1.aggregate(1)(
| {(x : Int,y : Int) => x + y},
| {(a : Int,b : Int) => a + b}
| )
rdd1.fold(1)(_+_)
var rdd1 = sc.makeRDD(1 to 10,2)
rdd1.saveAsTextFile("hdfs://hadoop102:9000/rdd1")
val rdd = sc.parallelize(List((1,3),(1,2),(1,4),(2,3),(3,6),(3,8)),3)
rdd.countByKey()
var rdd = sc.makeRDD(1 to 10,2)
rdd.foreach(sum+=_)
rdd.collect().foreach(println)