sparkStremingx项目实战(python定时日志生成器+flume+kafka+ spark+ hbase+ springBoot)
数据清洗一定是对Log4j熟悉操作用户行为访问日志:1.网站页面的访问量2.网站的粘性3.推荐用户行为日志分析的意义:眼睛,神经通过定时调度工具每一分种产生的一批数据网站+Linuxcroutab项目实战:构建定时日志产生器----对接--》flume构建conf*2----》zk-kafkaflume与kafka通道测试:kafka-customer对于的topic测试flume对应流向的kaf