hadoop学习-海量日志分析(提取KPI指标)

1、Web日志分析

从Web日志中,我们可以获取网站各类页面的PV值(PageView,页面访问量),访问IP;或者是用户停留时间最长的页面等等,更复杂的,可以分析用户行为特征。

在Web日志中,每条日志都代表用户的一次访问行为,以下面的一条日志为例子:

60.208.6.156 - - [18/Sep/2013:06:49:48 +0000] "GET /wp-content/uploads/2013/07/rcassandra.png HTTP/1.0" 200 185524 "http://cos.name/category/software/packages/" "Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/29.0.1547.66 Safari/537.36"
可以 拆分为8个变量:

remote_addr:60.208.6.156//用户IP地址

remote_user:- //用户名称

time_local:[18/Sep/2013:06:49:48 +0000]//记录访问时间

request:"GET /wp-content/uploads/2013/07

你可能感兴趣的:(hadoop解决方案)