统计学(网易云可汗学院公开课笔记)

前言

啦啦啦啦,小菜鸟来喽~~很开心成为DataWhale团队成员,开开心心的和小伙伴们组队学习统计学,昨天乖巧的看完了Task1和Task2的视频(可汗学院统计学12-34集),还做了好多笔记,超有成就感哒,今天又结合《深入浅出统计学》这本书看了下,这本书的内容也太阔爱了吧!!!我早看这本书的话,现在可能已经深深掌握统计精髓,哈哈哈哈,话不多说啦,直接上链接喽!!!

资料链接

本次统计学学习以网易云可汗学院公开课为主:
视频链接:http://open.163.com/special/Khan/khstatistics.html
并以《深入浅出统计学》为辅:
书籍链接:https://pan.baidu.com/s/1dCV6rrOWZU-deKxAoectGA

说明:

看视频记了很多公式推导笔记,但由于时间紧迫,就先不写公式推导了,上传了看书时觉得总结性的笔记。

数据类型会影响求概率的方法。数据类型有两种,分别为:离散数据和连续数据。

1 离散数据

  • 概率分布方法有:几何分布、二项分布、泊松分布
  • 对于离散概率分布,我们关心的是取得一个特定数值的概率

统计学(网易云可汗学院公开课笔记)_第1张图片统计学(网易云可汗学院公开课笔记)_第2张图片
统计学(网易云可汗学院公开课笔记)_第3张图片
统计学(网易云可汗学院公开课笔记)_第4张图片

伪装下的泊松分布

泊松分布还有一个用途,当n很大(你>50)且p很小(p<0.1)时,可以用泊松分布近似代替二项分布。即用X~Po(np)近似代替X-B(n,p)。因为n很大时,使用二项分布,需要计算n的阶乘,会很麻烦。

2 连续数据

  • 概率分布方法有:正态分布(又称高斯分布)。
  • 对于连续概率分布,关心的是取得一个数值范围的概率
  • 概率密度函数可用于描述连续数据。**
  • 通过计算一个数值范围内的概率密度函数下方的面积,可得出该数值范围的概率。即为了求出P(a
  • 概率密度函数下方额总面积必须等于1。

2.1 正态分布是连续数据的“理想”

统计学(网易云可汗学院公开课笔记)_第5张图片

2.2正态概率计算三步走

  1. 确定分布于范围。如果正态分布适用于你所遇到的情况,则看是否能求出均值和标准差,只有先得知这些消息,才能求出概率,这需要弄清楚要求的是哪一部分面积。
  2. 使其标准化为N(0,1),即让变量X标准化,使均值为0,标准差为1,据此得出标准正态变量Z。即令X~N(均值,方差)——>Z-N(0,1),然后先求限值标准分,最后查表。
  3. 查找概率,一旦转化为正态曲线,就能使用方便医用的概率表查找概率。
    统计学(网易云可汗学院公开课笔记)_第6张图片
    统计学(网易云可汗学院公开课笔记)_第7张图片

你可能感兴趣的:(统计学)