用户行为日志分析

用户行为日志生成渠道:

   Nginx,Ajax

记录用户访问行为日志的原因:

    网站页面的访问量

    网站的黏性

    推荐

用户行为日志内容:


1.访问的系统属性:操作系统,浏览器等等

2.访问特征:点击URL,从哪个url 跳转过来的(referer),跳转页面上停留时间

3.访问信息:session_id,访问ip(访问城市)


用户行为日志分析的意义:

离线数据处理架构:

  1.数据采集

      使用工具:flume工具

  2.数据清洗

    使用工具:Spark,Hive,MapReduce或者分布式计算框架

    清洗完之后的数据可以存放在HDFS中

   3.数据处理

     按照我们的需要进行相应业务的统计和分析

     使用工具:Spark,Hive,MapReduce或者分布式计算框架

   4.数据处理结果入库

     结果存在RDBMS,NoSql

   5.数据可视化展示

     使用工具:ECharts,HUE,Zeppelin

     通过图形化展示的方式展现出来:


你可能感兴趣的:(大数据,日志分析,大数据)