大数据课程L2——网站流量项目的算法分析&&数据处理

文章作者邮箱:[email protected]              地址:广东惠州

 ▲ 本章节目的

⚪ 了解网站流量项目的算法分析;

⚪ 了解网站流量项目的数据处理;

一、项目的算法分析

1. 概述

网站流量统计是改进网站服务的重要手段之一,通过获取用户在网站的行为,可以分析出哪些内容受到欢迎,哪些页面存在问题,从而使网站改进活动更具有针对性。

2. 统计分析

一般可以通过如下维度来进行统计分析:

1. 按在线情况分析

大数据课程L2——网站流量项目的算法分析&&数据处理_第1张图片

2. 按访客地区分析

大数据课程L2——网站流量项目的算法分析&&数据处理_第2张图片

3. 按时段分析(天,周,月,季度,年)

大数据课程L2——网站流量项目的算法分析&&数据处理_第3张图片

4. 按来路页面分析

大数据课程L2——网站流量项目的算法分析&&数据处理_第4张图片

二、项目的数据处理

1. 统计八个指标

1. PV-PageView(页面访问量 / 流量)

用户点击一次页面,就算作一个PV,包括刷新操作也算。

2. UV-Unique Visitor(独立访客数量)

是按不同的用户来统计的。

实现思路:

① 当一个新用户初次访问网站时,网站后台会为此用户生成一个唯一的标识 id(uvid)。

② 将 uvid 存到用

你可能感兴趣的:(大数据,spark)