作业HIVE07:Hive 日志分析案例二

作业HIVE07:Hive 日志分析案例二_第1张图片
新建日志表
作业HIVE07:Hive 日志分析案例二_第2张图片
并导入数据
这里写图片描述
创建session_info,文件格式用rcfile,并且可以进行压缩

创建tmp_session_info 得到
sessionid\userid\pv\ip\staytime等
作业HIVE07:Hive 日志分析案例二_第3张图片
创建tmp_track_url得到
sessionid\trackertime\trackeru\url\referer等

tmp_session_info与tmp_track_url进行join的结果得到session_info
采用mapjoin的方式
作业HIVE07:Hive 日志分析案例二_第4张图片
得到日访问记录表
作业HIVE07:Hive 日志分析案例二_第5张图片
结果

你可能感兴趣的:(作业HIVE07:Hive 日志分析案例二)