分布式日志收集系统 Flume 应用:实时采集 Python 爬取的豆瓣最新电影

Flume 是分布式的日志收集系统,它将各个服务器中的数据收集起来并送到指定的地方去,比如送到 HDFS。

本次 Chat 交流,主要分享如下内容:

  1. Python 爬虫程序讲解;
  2. Flume 工作原理讲解;
  3. Flume 配置文件;
  4. 常用的开源日志收集系统对比。

阅读全文: http://gitbook.cn/gitchat/activity/5bcef50f4ee6cb789ef3c80e

一场场看太麻烦?订阅GitChat体验卡,畅享300场chat文章!更有CSDN下载、CSDN学院等超划算会员权益!点击查看

你可能感兴趣的:(大数据,python)