Page View,页面访问量,指页面浏览的次数,用以衡量网站用户访问的网页数量。也就是曝光量。一般来说,PV与来访者的数量成正比,但是PV并不直接决定页面的真实来访者数量,如同一个来访者通过不断的刷新页面,也可以制造出非常高的PV。具体的说,PV值就是所有访问者在24小时(0点到24点)内看了某个网站多少个页面或某个网页多少次。PV是指页面刷新的次数,每一次页面刷新,就算做一次PV流量。
UniqueVisitor,独立访客数,指一天内访问某站点的人数,以cookie为依据。1天内同一访客的多次访问只记录为一个访客。通过IP和cookie是判断UV值的两种方式。通常情况下是依靠浏览器的cookies来确定访客是否是独立访客(之前是否访问过该页面),在同一台电脑上使用不同的浏览器访问或清除浏览器缓存后重新访问相同的页面,也相当于不同的访客在访问,会导致UV量增加。
- 用Cookie分析UV值
当客户端第一次访问某个网站服务器的时候,网站服务器会给这个客户端的电脑发出一个Cookie,通常放在这个客户端电脑的C盘当中。在这个Cookie中会分配一个独一无二的编号,这其中会记录一些访问服务器的信息,如访问时间,访问了哪些页面等等。当你下次再访问这个服务器的时候,服务器就可以直接从你的电脑中找到上一次放进去的Cookie文件,并且对其进行一些更新,但那个独一无二的编号是不会变的。
- 怎么标记用户?
cookie+uuid,判断客户端(即浏览器)是否存在cookie,不存在则分配uuid并写入cookie
IP,用IP来标记用户,则统计出来的uv数会等于IP数,个人认为有点奇怪,但确实看过相关资料有此方案. 此方案不需要依赖cookie。
注意到使用 cookie+uuid 方案还有一些细节:要写磁盘cookie还是内存cookie? cookie多久失效?答:个人认为要写磁盘且失效时间设置较长的时间。
新访客,新UV指一天内的新增用户数
实现:参考上述UV的实现方式,只要新分配uuid,则说明是新用户
独立IP数,指一天内使用不同IP地址的用户访问网站数量,同一IP无论访问了几个页面,独立的IP数均为1.但是假如说两台机器访问而使用的是同一个IP,那么只能算是一个IP的访问。
每次请求的IP,跟当天已经统计在内的IP集合进行比较,不重复则加1,重复则忽略,跨天后IP集合清空。
IP和UV之间的数据不会有太大的差异,通常UV量和比IP量高出一点,每个UV相对于每个IP更准确地对应一个实际的浏览者。
- ①UV大于IP
这种情况就是在网吧、学校、公司等,公用相同IP的场所中不同的用户,或者多种不同浏览器访问您网站,那么UV数会大于IP数。
- ②UV小于IP
在家庭中大多数电脑使用ADSL拨号上网,所以同一个用户在家里不同时间访问您网站时,IP可能会不同,因为它会根据时间变动IP,即动态的IP地址,但是实际访客数唯一,便会出现UV数小于IP数。
Unique IP,独立IP,和UV类似,正常情况下,同一个IP可能会有很多个UV,同一个UV只能有一个IP。
Visit View,访问次数(或称访问频次、打开次数、会话数),用以记录所有访客一天内访问量多少次网站。当访客完成所有的浏览并最终关掉该网站的所有页面时,便完成了一次访问,同一访客一天内可能有多次访问行为,访问次数累计。
实现:内存cookie+失效时间30分钟,查看浏览器是否存在cookie,不存在则分配会话ID(sid),并写入到cookie,在整个会话期间都携带sid,判断一天内不重复的sid数即可
Cost PerClick,每次点击费用,即点击单价。
Cost Per Mile千次展示费用,即广告展示一千次需要支付的费用。
Revenue PerMille 千次展示收入,和CPM类似,RPM是针对广告展示商(比如Adsense商户)而言的。
Click-throughRate,点击率,点击次数占展示次数的百分比。
Content View,内容播放数, 是指在一个统计周期内,视频被打开,且视频正片内容(除广告)被成功播放的次数之和
PageRank,即网页的级别技术,或网站权重或受欢迎度。网页排名,它是Google排名运算法则(排名公式)的一部分,用来标识网页的等级/重要性。级别从1到10级,10级为满分。PR值越高说明该网页越受欢迎。
是网页等级的一个标准(0-10)。PR值越高说明这个网站越受欢迎。=1,说明网站不太流行;=7~10,网站非常受欢迎。当PR值达到4时就已经很不错。
Query Per Second),每秒查询率,每秒的响应请求数,也即是最大吞吐能力。QPS是对一个特定的查询服务器在规定时间内所处理流量多少的衡量标准,在因特网上,作为域名系统服务器的机器的性能经常用每秒查询率来衡量。每秒的响应请求数,也即是最大吞吐能力。
QPS = req/sec = 请求数/秒
QPS统计方式 [一般使用 http_load 进行统计]
QPS = 总请求数 / ( 进程总数 * 请求时间 )
QPS:单个进程每秒请求服务器的成功次数
原理:每天80%的访问集中在20%的时间里,这20%时间叫做峰值时间
公式:( 总PV数 * 80% ) / ( 每天秒数 * 20% ) = 峰值时间每秒请求数(QPS)
机器:峰值时间每秒QPS / 单台机器的QPS = 需要的机器
服务器数量计算:服务器数量 =ceil( 每天总PV / 单台服务器每天总PV )
问:每天100w PV 的在单台机器上,这台机器需要多少QPS?
答:( 1000000 * 0.8 ) / (86400 * 0.2 ) = 46 (QPS)
问:如果一台机器的QPS是18,需要几台机器来支持?
答:46/ 18 = 3
Transactions Per Second 的缩写,每秒处理的事务数目。一个事务是指一个客户机向服务器发送请求然后服务器做出反应的过程。客户机在发送请求时开始计时,收到服务器响应后结束计时,以此来计算使用的时间和完成的事务个数,最终利用这些信息作出的评估分。
TPS 的过程包括:客户端请求服务端、服务端内部处理、服务端返回客户端。
例如,访问一个 Index 页面会请求服务器 3 次,包括一次 html,一次 css,一次 js,那么访问这一个页面就会产生一个“T”,产生三个“Q”。
Gross Merchandise Volume,成交金额,主要包括付款金额和未付款的。GMV是流水,只要你下了订单,生成订单号,产生的订单中往往会包括付款订单和未付款的订单,而gmv统计的指标就是其二者之和。
电商平台给出的计算指标是:GMV=销售额+取消订单金额+拒收订单金额+退货订单金额。
转换率=转换次数/总点击量 * 100%
定义:就是说 在一个统计时间内,完成转换行为的次数占总点击次数的比率。
转换率是网站最最终是否盈利的核心,提升网站转换率是网站综合运营实力的结果。
举例,一天 UV为5000,有50个用户有了后续的转换行为,转换率=50/5000 *100% =1%
用户(独立用户)来到网站之后,只浏览了一个页面就离开与总的访问数量的百分比。
跳出率的作用:是网站分析的主要指标,跳出率越高,说明网站的吸引力越低,当跳出率达到一定程度时,说明你的网站页面需要优化或者页面更新了。
降低跳出率方法:
a.服务器要快
b.没有欺骗性的跳转
c.采用面包屑导航,每个分页上都加上导航
d.网站的质量要高
用户推出网站的次数除以用户浏览网站的次数的百分比。
退出率百分比的作用:反映了网站对于访客的吸引力,如果退出率很高的话就要想办法改善网站的内容来吸引更多的客户。
举例,对于一个IP 可能会产生5个PV,有2种可能,第一是他点了5个不同的页面,第二是连续打开5次首页。第二种的跳出率是100%。
跳出率是衡量访问的质量的关键。
跳出率高,说明很多新用户来了,看了一页就离开。
跳出率低,说明新老客户来了点击很多页面才离开。
跳出率与退出率区别:
跳出率和退出率都能是以网页为基数的,而且都是反映出网站质量的重要参数,严格来区分的话,跳出率是表达访客仅访问了一个页面就离开,反映的是某个网页的质量好坏,能体现的网站问题也比较重要,而退出率能是表达访客仅访问了网站几个(≥1)页面就离开,反映的是多个网页的综合质量。同时由于退出率的计算复杂。
跳出率:针对的是网站,指一定时间内,只访问了一页的就走的会话占会话总数的比率
退出率:某个页面作为会话的结束页面,占会话总数的比率
明显"跳"的动作比较大,"跳"是针对网站的,"退"的动作幅度比较小,是针对某个页面的
上述的多数统计指标,需要有两种cookie
磁盘cookie:cookie写入到磁盘中,关闭浏览器再次打开依然存在.
内存cookie:仅仅存在于浏览器进程内存中,关闭浏览器后消失。又叫持久cookie、临时cookie
https://blog.csdn.net/w8y56f/article/details/87512732
https://blog.51cto.com/linuxnote/1653958