数据分析相关概念多且杂,容易搞混。为了便于大家区分,今天小编就来盘点一下数据分析常用的指标解释。建议大家收藏起来方便查看。
PART
01
** 互联网相关**
1、PV(Page View)页面浏览量
指某段时间内访问网站或某一页面的用户的总数量,通常用来衡量一篇文章或一次活动带来的流量效果,也是评价网站日常流量数据的重要指标。PV可重复累计,以用户访问网站作为统计依据,用户每刷新一次即重新计算一次。
2、UV(Unique Visitor)独立访客
指来到网站或页面的用户总数,这个用户是独立的,同一用户不同时段访问网站只算作一个独立访客,不会重复累计,通常以PC端的Cookie数量作为统计依据。
3、Click 点击
一般针对付费广告而言,指用户点击某个链接、页面、banner的次数,可重复累计。比如我在PC端看到一则新闻链接点进去看了一会就关了,过了一会又点进去看了一遍,这就算我为这篇新闻贡献两次点击。
4、avr.time 平均停留时长
指某个页面被用户访问,在页面停留时长的平均值,通常用来衡量一个页面内容的质量。
avr.time=访客数量/用户总停留时长
5、CTR 点击率
指某个广告、Banner、URL被点击的次数和被浏览的总次数的比值。一般用来考核广告投放的引流效果。
CTR=点击数(click)/被用户看到的次数
6、投资回报率(ROI:Return On Investment )
反映投入和产出的关系,衡量我这个投资值不值得,能给到我多少价值的东西(非单单的利润),这个是站在投资的角度或长远生意上看的。
其计算公式为:投资回报率(ROI)=年利润或年均利润/投资总额×100%,通常用于评估企业对于某项活动的价值,ROI高表示该项目价值高。
7、留存/顾客留存(Retention / Customer Retention)
指建立后能够长期维持的客户关系的百分比。一般针对**新用户**关注留存率较多。
8、新用户(New User)
指一段时间内从未访问过的用户,如每日新增用户(历史从未访问),一般针对**新用户**关注留存率较多,关注的留存率指标一般有1、3、7、30日留存等等。
9、DAU(Daily Active User)日活跃用户 单日登录或使用了某个产品的用户数(去除重复登录的用户)。通常游戏类付费网站会采用DAU的概念。 10、MAU(monthly activeusers)月活跃用户 把DAU的统计周期拉长到一个月,即是MAU的数据。
PART
02
** 统计学相关**
1、绝对数和相对数
绝对数:是反应客观现象总体在一定时间、一定地点下的总规模、总水平的综合性指标,也是数据分析中常用的指标。比如年GDP,总人口等等。
相对数:是指两个有联系的指标计算而得出的数值,它是反应客观现象之间的数量联系紧密程度的综合指标。相对数一般以倍数、百分数等表示。相对数的计算公式:
相对数=比较值(比数)/基础值(基数)
2、百分比和百分点
百分比:是相对数中的一种,他表示一个数是另一个数的百分之几,也称为百分率或百分数。百分比的分母是100,也就是用1%作为度量单位,因此便于比较。
百分点:是指不同时期以百分数的形式表示的相对指标的变动幅度,1%等于1个百分点。
3、频数和频率
频数:一个数据在整体中出现的次数。
频率:某一事件发生的次数与总的事件数之比。频率通常用比例或百分数表示。
4、比例与比率
比例:是指在总体中各数据占总体的比重,通常反映总体的构成和比例,即部分与整体之间的关系。
比率:是样本(或总体)中各不同类别数据之间的比值,由于比率不是部分与整体之间的对比关系,因而比值可能大于1。
5、倍数和番数
倍数:用一个数据除以另一个数据获得,倍数一般用来表示上升、增长幅度,一般不表示减少幅度。
番数:指原来数量的2的n次方。
6、同比和环比
同比:指的是与历史同时期的数据相比较而获得的比值,反应事物发展的相对性。
环比:指与上一个统计时期的值进行对比获得的值,主要反映事物的逐期发展的情况。
7、均值
即平均值,平均数是表示一组数据集中趋势的量数,是指在一组数据中所有数据之和再除以这组数据的个数。
8、中位数
对于有限的数集,可以通过把所有观察值高低排序后找出正中间的一个作为中位数。如果观察值有偶数个,通常取最中间的两个数值的平均数作为中位数。
9、方差
是在概率论和统计方差衡量随机变量或一组数据时离散程度的度量。概率论中方差用来度量随机变量和其数学期望(即均值)之间的偏离程度。统计中的方差(样本方差)是每个样本值与全体样本值的平均数之差的平方值的平均数。在许多实际问题中,研究方差即偏离程度有着重要意义。方差是衡量源数据和期望值相差的度量值。
10、标准差
中文环境中又常称均方差,是离均差平方的算术平均数的平方根,用σ表示。标准差是方差的算术平方根。标准差能反映一个数据集的离散程度。平均数相同的两组数据,标准差未必相同。
11、皮尔森相关系数
皮尔森相关系数是用来反映两个变量线性相关程度的统计量。相关系数用r表示,其中n为样本量,分别为两个变量的观测值和均值。r描述的是两个变量间线性相关强弱的程度。r的绝对值越大表明相关性越强。
12、相关系数
相关系数是最早由统计学家卡尔·皮尔逊设计的统计指标,是研究变量之间线性相关程度的量,一般用字母r表示。由于研究对象的不同,相关系数有多种定义方式,较为常用的是皮尔森相关系数。
欢迎关注,访问更多精彩:数据之魅。
如需转载,请联系授权,谢谢合作。