赤裸裸的统计学

一、统计学是大数据时代最炙手可热的学问

举例了基尼系数:衡量一个国家的财富分配的公平程度,范围在0-1,越小越平均
对描述性数据过度依赖会带来误导性的结果和判断,抽样来解决大问题

二、描述统计学

平均数
中位数
绝对数相对数
标准差:表示数据离散程度,反映了分散在平均值周围数据的聚合程度
正态分布:

三、统计数字会撒谎

1、统计数据的单位站的角度不同可能就是另一个角度解读数据
2、你无法管理你无法衡量的事物,需要找到有效的评价指标

四、相关性和相关系数

1、关系系数在区间【-1 1】,不受变量单位的限制
2、求和公式=∑ Xi = X1+ X2+ X3+ X4+......Xi (i=n时)
平均数=∑( Xi )/n(i=n时)


赤裸裸的统计学_第1张图片
1.jpg
五、概率和期望值

1、概率学是研究不确定时间和结果的学问

六-七:两个故事

1、蒙提.霍尔悖论
2、黑天鹅事件

八、数据与偏见

1、健康用户偏见、幸存者偏见、记忆性偏见、发表性偏见、选择性偏见
九、中心极限定理
1、中心极限定理的核心就是,一个大型样本的正确抽样与其所代表的群体存在相似关系
2、标准差是衡量群体中所有个体的离散性,标准误差是仅仅衡量样本平均值的离散性
3、通过中心极限定理,我们便可知道样本平均值和整体平均值之间的距离和概率
4、任意一个群体的样本平均值在群体平均值周围呈正态分布
十-十四
1、回归分析能够控制其他因素不变的前提下,对某个具体变量与某个特定结果之间的关系进行量化

你可能感兴趣的:(赤裸裸的统计学)