flume 对接spark streaming

阅读更多

1.flume对接kafka的两种方式:pull 和 push 流程如下:


flume 对接spark streaming_第1张图片
 
flume 对接spark streaming_第2张图片
 

2.两者的区别


flume 对接spark streaming_第3张图片
 

3.使用pull方式可能遇到的问题:

本地测试环境:

  • spark 2.3
  • flume 1.8

   使用pull方式,flume报错如下:

  (官网上存在这个bug,尚未修复:https://issues.apache.org/jira/browse/SPARK-17152)

 

java.lang.IllegalStateException: begin() called when transaction is OPEN!
 

 

网上的解决方法:

这个报错是因为scala版本问题造成,把flume lib下的scala-library版本替换掉即可(亲测,好用)

flume 对接spark streaming_第4张图片
 

 

 

  • flume 对接spark streaming_第5张图片
  • 大小: 158.5 KB
  • flume 对接spark streaming_第6张图片
  • 大小: 154 KB
  • flume 对接spark streaming_第7张图片
  • 大小: 74.1 KB
  • flume 对接spark streaming_第8张图片
  • 大小: 21.3 KB
  • 查看图片附件

你可能感兴趣的:(flume对接spark,streaming)