SparkStream 流式计算

虚拟机中操作
cd /opt/software/rpm
nc -lk 9999
这里9999指对应的端口号

def main(args: Array[String]): Unit = {
val conf = new SparkConf().setAppName("my").setMaster("local[2]")
 //ssc  微批  框架  每隔1秒中取一次数据  核心对象
    val ssc = new StreamingContext(conf,Seconds(10))
    //监听主机和端口
    val lines = ssc.socketTextStream("hadoop112",9999)
     //单词统计
    lines.flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_).print()
     //开启  等待 接收数据
    ssc.start()
    ssc.awaitTermination()
    


你可能感兴趣的:(SparkStreaming)