Spark 之SparkStreaming 1

本文假设读者已经完成了Spark安装,可以正常运行spark-shell

启动 spark-shell ,

# spark-shell窗口
./spark-shell --master local[2] # 使用2个core

local[2],因为需要分配一个来监听。

另外打开一个shell窗口

通过socket往 本机9999端口发送数据

# nc窗口
nc -lk 9999

回到spark-shell窗口,

import org.apache.spark.streaming.{Durations, StreamingContext}
// 创建StreamingContext,每5秒批量执行次任务
val ssc = new StreamingContext(sc,Durations.seconds(5))
// 监听本地9999端口
val words = ssc.socketTextStream("localhost",9999).flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_)
words.print
ssc.start

然后在nc窗口,随便按下几个带空格的数据。如下图:

最多过5秒,可以看到spark-shell窗口有反应了。

Spark 之SparkStreaming 1_第1张图片

至此,简单的SparkStreaming已经跑通。

官方SparkStreaming入门


感谢王家林老师的知识分享

王家林老师名片:

中国Spark第一人


新浪微博:http://weibo.com/ilovepains

微信公众号:DT_Spark

博客:http://blog.sina.com.cn/ilovepains

手机:18610086859

QQ:1740415547

邮箱:[email protected]

YY课堂:每天20:00现场授课频道68917580

王家林:DT大数据梦工厂创始人、Spark亚太研究院院长和首席专家、大数据培训专家、大数据架构师。

Spark、Flink、Docker、Android技术中国区布道师。
国内最早一批从事Android、Hadoop、Spark、Docker的研究者,在Spark、Hadoop、Android、Docker等方面有丰富的源码、实务和性能优化经验。是该领域的知名咨询顾问、培训专家;
Spark最佳畅销书《大数据spark企业级实战》和《Spark大数据实例开发教程》作者;
Android移动互联网兴起以来,近10本的IT畅销书作者;
为大量企业进行技术培训和服务,包括:

三星、惠普、爱立信、摩托罗拉、索尼、华为、夏普、南方航空公司、中国国际航空公司、金立、海信、长虹、英特尔、阿尔法特、中国联通、华三、AIA、亿迅、中国电信、网龙、福赛、中国人寿、阳光保险、兴业银行等。 

找我报名有会员价哦。


你可能感兴趣的:(Spark 之SparkStreaming 1)