优化流量和改善页面不是网站分析师的直接工作,但一个优秀的网站分析师得有能力为产品和运营部门提供分析和建议,并在公司中形成数据氛围,保证各个部门向着同一个目标前进。毕竟,网站分析是一个发现问题、分析问题和解决问题的过程。
而流量对一家互联网公司的重要性不言而喻,所以我们做流量分析、内容分析和转化分析等工作,因为我们关心流量的背后能为网站带来多少收入。
那么,网站流量数据分析流程是怎样的?常用的网站分析工具有哪些?网站流量质量如何分析?本篇文章就围绕这几个问题进行详细解答。
一、流量数据分析流程
在进行流量数据分析前,我们得知道流量数据如何获取?常见的网站流量有哪些类型?如何区分真假流量?
1.1流量数据的获取
流量数据获取主要分3类:网站日志文件、打点、JS页面标记。它们的区别如下:
现在大多数公司都是用JS页面标记来获取数据。JS页面标记是指在页面端嵌入JS标记代码,JS代码会将一些需要统计的信息以URL参数的形式附带在请求地址的后面。而JS页面标记输出的是执行过JS代码的日志请求记录。
日志输出的IP地址、访问时间戳、访问地址路径、访问来源、User Agent用于我们准确分析流量。
1.2流量数据的分类
知道流量数据如何获取后,那么常见的流量类型有哪些呢?通常,我们将网站的流量分为三大类,分别是直接流量、推介流量和搜索引擎流量,如图:
1)搜索流量:是指访问者通过点击搜索结果访问网站产生的流量;
2)推介流量:是指访问者通过点击其他网站的链接访问网站产生的流量;
3)直接流量:是指访问者直接输入域名访问网站产生的流量;
1.3直接流量的分类及分析
假如发生referer信息的丢失,推介流量便会被系统算做直接流量;当访问者首先通过搜索引擎或标记链接访问网站后,再次直接访问时,这部分也会被记录为之前的访问来源,算做直接流量。由于直接流量的复杂性,我们在分析前得弄清直接流量的分类组成和对应的分析法。
1.3.1直接流量的分类
直接流量通常包含以下三大类的流量,如图:
1)浏览器地址栏:访问者在浏览器地址栏中直接输入网址产生的流量;
2)浏览器收藏夹:访问者点击书签中收藏的网站URL产生的流量;
3)丢失来源信息:各种没有或丢失来源信息的流量,包括 Flash 广告、工具、弹窗广告等;
1.3.2直接流量的分析方法
由于浏览器地址栏、浏览器收藏夹、丢失来源信息这三个产生流量的原因和特点不同,分析方法也不同。下面针对这三类直接流量来分别探索其不同分析方法。
1、浏览器地址栏—流量分析法
针对浏览器地址栏产生的流量,一般从Landing Page、页面访问路径进行分析。
Landing Page:由于大部分是网站的首页,如果Landing Page不是网站首页的那部分流量,大部分都不是浏览器地址栏产生的流量。
页面访问路径:当发现网站的直接流量变高,或者质量变差等异常现象,一般以网站首页为起点,通过路径分析发现问题。
2、浏览器收藏夹—流量分析法
网站中的任何一个页面都可能被访问者收藏,并再次访问。分析方法如下:
1、对收藏行为和来自浏览器收藏夹的流量进行标记,然后在报告中过滤出这部分的流量;
2、进行新老访客分析。一般使用收藏夹访问网站的用户大都属于回访用户,如果大部分新增流量都是新访用户时,这部分流量一般有问题。
3、丢失来源信息—流量分析法
丢失来源信息的分析方法一般有3类:
1、为URL增加标记;
2、站内搜索关键词分析(先将直接流量分类,然后关注直接流量使用站内搜索的情况,以及关键词的变化);
3、使用跳出率指标来分析,因为纯正的直接流量是网站忠诚度最高的那类访客。
1.4如何区分真假流量
知道流量数据的分析流程及方法后,那么对于现在常见的虚假网站流量该如何区分呢?怎么辨别虚假流量去保证广告效果呢?虚假流量通常是通过程序或者人为产生的。
1.4.1真假流量的特征
虚假流量的特征:
1)目的性:虚假流量的产生一定和某个目的有关;
2)规律性:特定的目的会使虚假流量一定带有规律性。
真实流量的特征:
1)自然性:真实流量在各个维度的表现都是自然的;
2)多样性:网民的喜好不同,行为也一定是多样的。
1.4.2如何区分真假流量
知道真实和虚假流量的特征后,那么如何辨别呢?通常,辨别虚假流量是通过判断流量产生的时间/地理位置/网络属性/跳出率,访客进入页面的路径/点击分布图/重合度/忠诚度去分析的。
1、流量产生的时间
真实的流量一般分布在全天的各个时间段,即使有访问高峰,在流量曲线图中一般也为平滑曲线。而虚假流量却是人为控制的,在曲线图中的表现是流量暴增。
2、流量的地理来源
通常访客是来自各个不同的地理位置,而虚假流量很难使用多个IP来产生流量,所以如果流量集中来自一个地区就比较可疑了。
3、流量的网络属性
真实流量下,访客网络的接入方式应该是千差万别的,而虚假流量的接入一般比较单一。所以,如果访客接入方式只提供1-2种服务提供商的名称就比较可疑了。
4、流量的跳出率
真实流量下,访客可能在任何时间跳出,如果跳出率比较集中在某一个时间段,则要重点分析那个时间段的流量地理来源以及流量的网络属性了。
5、进入入径&点击分布图
通常,由于广告活动会有一个登录页面,所以流量入口只有一个。真实访客进来后会点击不同的链接,可能在任何一个页面离开,而虚假流量的访问路径与离开页面一般都相同。
6、访客忠诚度分析
通常来说,一定数量的访客访问网站后是会对网站进行回访的,即使数量很少。所以,真实流量会有访客再次回访的行为产生,而虚假流量一般是不会有回访的,对于那些没有回访的流量一般是异常的。
7、访客重合度分析
对于不同的流量渠道,可以使用访客重合度分析法判断是否为虚假流量。一般,当某个渠道在短时间内有较高访客重合度时候,就需要进一步检查流量的质量了。
二、常用的网站流量分析工具
目前,市面上常用的运营数据分析工具有友盟、talking data 、百度统计、谐云等,下面主要说下这几个主流工具的使用特点,它们的对比如下:
网站的质量分析一般是按照质和量两个维度来衡量的,如下图所示:
三、网站流量质量分析
量:X轴,指网站获得的访问量;
质:Y轴,指可以促进网站目标的事件次数,例如商品浏览、注册、购买等行为。
将流量按照它们在这两个维度上的表现展示在坐标轴上,不同的流量就会有不同的位置相对应,如果把流量的成本用圆圈的大小表示,则可把流量表示在四个象限的位置描述成四种不同的流量:
1)第一象限的流量:质高量高。这是网站的核心流量,对于这部分流量保持即可。建议降低获取流量的成本;
2)第二象限的流量:质高量低。这部分流量是网站的忠诚用户,它们有很高的质,但数量较少。建议提高这部分流量的数量;
3)第三象限的流量:量还可以但质较低,并且获取流量的成本也比较高;
4)第四象限的流量:量高质低。这部分流量要提高质。建议使用细分的方法。
想了解更多干货,欢迎留下联系方式哈。