flume+kafka+storm+http(分词)

一、http+storm

1、端口测试

1.1 启动storm服务

apache-storm-0.9.3/conf/bin/目录下

  • master

      python storm nimbus &
      python storm ui &
      python storm logviewer &
    
  • slave1、slave2

      python storm supervisor &
      python storm logviewer &
    

1.2 简单测试

1.2.1启动http端口

nc -l 8808

1.2.2启动测试类

python /usr/local/src/apache-storm-0.9.3/bin/storm jar \
    /usr/local/src/learn/albert/24_storm_extend/extend.jar \
    stormHttp.HttpClientTest

flume+kafka+storm+http(分词)_第1张图片

2、web测试

2.1启动storm

同1.1

2.2 启动pyweb

python 25_http_storm.py 8808

2.3 启动测试类

python /usr/local/src/apache-storm-0.9.3/bin/storm jar \
	/usr/local/src/learn/albert/24_storm_extend/extend.jar \
	stormHttp.HttpClientTest

flume+kafka+storm+http(分词)_第2张图片

二、flume + kafka + storm + 分词

1.启动服务

1.1flume kafka storm

同flume+kafka+storm

1.2pyweb(分词)

pyweb的代码——25_http_storm.py

python 25_http_storm.py 8808

2.启动任务

python /usr/local/src/apache-storm-0.9.3/bin/storm jar \
	/usr/local/src/learn/albert/24_storm_extend/extend.jar \
	stormHttp.StormKafka 

kafka同flume+kafka+storm
,未做展示

flume+kafka+storm+http(分词)_第3张图片

附:如果报错,可能存量topic格式不正确,删除、新建即可

kafka_2.11-0.10.2.1/目录下

./bin/kafka-topics.sh --delete --zookeeper localhost:2181 --topic storm_kafka

./bin/kafka-topics.sh --create --zookeeper localhost:2181 --replication-factor 3 --partition 5 --topic storm_kafka

你可能感兴趣的:(学习笔记-hadoop)