RocketMQ,JStorm与Tair使用笔记

关于RocketMQ


启动mq
nohup sh mqnamesrv -n 10.150.0.94:9876 & 
nohup sh mqbroker -n 10.150.0.94:9876 &
删除mq里的消息
1. sh mqshutdown broker
2. rm -rf ~/store
3. nohup sh mqbroker -c a.conf &




关于jstorm

关于 java.lang.IllegalArgumentException: No output fields defined for component:stream xxx:default
这个是因为xxx这个组件发出了多个流,但是它下游的bolt并没有说明每一种流的分组模式
具体来说,就是下面的EmitPaymentSpot,发出了多种流,但是下面的SplitComputeSum没有说明上面的各种流的分组
        TopologyBuilder builder = new TopologyBuilder();

        builder.setSpout("spout3", new EmitPaymentSpot(), spout_Parallelism_hint).setNumTasks(numtasks);
     
        builder.setBolt("bolt", new SplitComputeSum(), bolt_hint).setNumTasks(numtasks).
        shuffleGrouping("spout3");
 怎么改?
       
        TopologyBuilder builder = new TopologyBuilder();

        builder.setSpout("spout3", new EmitPaymentSpot(), spout_Parallelism_hint).setNumTasks(numtasks);
     
        builder.setBolt("bolt", new SplitComputeSum(), bolt_hint).setNumTasks(numtasks).
        shuffleGrouping("spout3",RaceConfig.MqTmallTradeTopic).
        shuffleGrouping("spout3",RaceConfig.MqTaobaoTradeTopic);


关于序列化
所有spout,bolt,configuration, 发送的消息(Tuple)都必须实现Serializable, 否则就会出现序列化错误.
如果是spout或bolt的成员变量没有实现Serializable时,但又必须使用时, 可以对该变量申明时,增加transient 修饰符, 然后在open或prepare时,进行实例化


几点建议
Storm中Spout用于读取并向计算拓扑中发送数据源,最近在调试一个topology时遇到了系统qps低,处理速度达不到要求的问题,经过排查后发现是由于对Spout的使用模式不当导致的多线程同步等待。这里罗列几点个人觉得编写Spout代码时需要特别注意的地方:


1. 最常用的模式是使用一个线程安全的queue,如BlockingQueue,spout主线程从queue中读取数据;另外的一个或多个线程负责从数据源(如各种消息中间件、db等)读取数据并放入queue中。
2. 如果不关心数据是否丢失(例如数据统计分析的典型场景),不要启用ack机制。
3. Spout的nextTuple和ack方法是在同一个线程中被执行的(可能最初觉得这块不会成为瓶颈,为了简单实现起见就单线程了,jstorm应该是已经改成了多线程),因此不能在nextTuple或ack方法里block住当前线程,这样将直接影响spout的处理速度,很关键。
4. Spout的nextTuple发送数据时,不能阻塞当前线程(见上一条),比如从queue中取数据时,使用poll接口而不是take,且poll方法尽量不要传参阻塞固定时间,如果queue中没有数据则直接返回;如果有多条待发送的数据,则一次调用nextTuple时遍历全部发出去。
5. Spout从0.8.1之后在调用nextTuple方法时,如果没有emit tuple,那么默认需要休眠1ms,这个具体的策略是可配置的,因此可以根据自己的具体场景,进行设置,以达到合理利用cpu资源。


关于tair

启动
进入~/tair_bin目录后,按顺序启动:
 sbin/tair_server -f etc/dataserver.conf    

 sbin/tair_cfg_svr -f etc/configserver.conf  


连接
   sbin/tairclient -c 10.150.0.94:5198 -g group_1
其中10.150.0.94:5198是config server IP:PORT,group_1是group name,在group.conf里配置的

stat -k 
   就是以kB为单位,显示各个area的使用情况

如下,quota是该区域分配的大小

RocketMQ,JStorm与Tair使用笔记_第1张图片

     datasize是用户存入该区域的数据的大小,只要datasize小于等于quota,那么用户就还能存储数据
     usesize是用户的数据加上tair的元数据,所占的大小
     quotausage就是使用的百分比 usesize/quota

删除一个namespace内的内容
   delall 2 all
   就是删除2区的所有内容

另外,删除一个namespace的内容后,使用stat -k 命令,并不能立即看到改变#delall 2 all,删除只是打标,保证用户读不到,真正的清理时间在配置文件里指定,一般都是凌晨

那么你7月3日delall 2 all,当时是看不到变化的,当你在7月4日再去看的话就是


即使你运行完delall 2 all后就关闭了tair,下次重启的时候,它就会更新各种操作就包括清理空间


退出tair

quit




参考资料

https://github.com/alibaba/jstorm/wiki/%E5%B8%B8%E8%A7%81%E9%97%AE%E9%A2%98

http://www.cnblogs.com/panfeng412/p/storm-spout-common-issues.html

你可能感兴趣的:(jstorm,rocketmq,tair)