浅析 MapReduce/ Spark/ Spark Steaming/ Storm 与 HBase/HDFS
MapReduce是大的批量操作,不要求时限。基于文件系统,hdfs。Spark是快速的批量操作,基于内存,所以速度快。其主要亮点在于把过程给数据。Storm是流式处理,快速实时。SparkStreaming跟Storm类似,只不过SparkStreaming是小时间窗口的处理,Storm是实时的来一条处理一条。1.storm技术架构:Flume+kafka+Storm/Spark+Hbase/R