7.Spark Streaming:输入DStream之基础数据源以及基于HDFS的实时wordcount程序
输入DStream之基础数据源HDFS文件:基于HDFS文件的实时计算,其实就是,监控一个HDFS目录,只要其中有新文件出现,就实时处理。相当于处理实时的文件流。streamingContext.fileStream(dataDirectory)streamingContext.fileStream[KeyClass,ValueClass,InputFormatClass](dataDirecto