hadoop 实战——网站日志数据分析

用于分析的关键指标

  • (1)浏览量 PV

    • 定义:页面浏览量即为PV(Page View),是指所有用户浏览页面的总和,一个独立用户每打开一个页面就被记录一次。

    • 分析:网站总浏览量,可以考核用户对于网站的兴趣,就像收视率对于电视剧一样。但对于网站运营者来说,更重要的是,每个栏目下的浏览量。

  • (2)注册用户数

    • 定义:每天有多少用户注册
    • 计算公式:对访问member.php?mod=register(注册页面)的url进行计数(基本信息填写完毕,点击注册按钮,会将注册表单提交到后台)
  • (3)IP 数

    一天之内,访问网站的不同独立 IP 个数加和。

  • (4)跳出率

    • 定义:只浏览了一个页面便离开了网站的访问次数占总的访问次数的百分比,即只浏览了一个页面的访问次数/全部的访问次数汇总。

    • 分析:跳出率是非常重要的访客黏性指标,它显示了访客对网站的兴趣程度:跳出率越低说明流量质量越好,访客对网站的内容就越感兴趣,这些访客也就越可能是网站的有效用户,忠实用户。

      该指标也可以衡量网络营销的效果,指出有多少访客被网络营销吸引到宣传产品页或网站上之后,又流失掉了,可以说就是煮熟的鸭子飞了。比如,网站在某媒体上打广告推广,分析从这个推广来源进入的访客指标,其跳出率可以反映出选择这个媒体是否合适,广告语的撰写是否优秀,以及网站入口页的设计是否用户体验良好。

    • 计算公式:统计一天内只出现一条记录的IP,称为跳出数,跳出数/PV即为跳出率。

  • (5)版块热度排行榜

    • 定义:版块的访问情况排行;
    • 分析:可用于巩固热点版块成绩,加强冷清版块建设。同时对学科建设也有影响。
    • 计算公式:按访问次数统计排序;

      (版块用 forum 表示,帖子用 thread 表示)

你可能感兴趣的:(hadoop 实战——网站日志数据分析)