spark streaming ,预写日志(write-ahead logging)和checkpoint。
(1)什么是Spark-Streaming?sparksteaming是sparkCoreAPI的一种扩展,它可用于大规模、高吞吐量、容错的实时数据流处理。它支持从多种数据源中读取数据,如kafka,flume,twitter,zeromq,kinesis或者是tcpsocket。并且能够使用类似高阶函数的复杂算法来进行数据处理,如map(),reduce(),join(),window()等。处