正态分布-接受Normal

正态分布|高斯分布

高斯这个名字要记住,以后可以装逼用(高斯真的唬了我两年啊)
标准差也不要说标准差,我们就说σ(sigma)

正态分布特征
  • 中间高、两边低、左右对称,曲线呈钟形
  • 关于x=μ对称
  • σ决定曲线的形状
  • X~N(μ,σ2),则Z=(X- μ)/ σ ~N(0,1)
智商群落里独树一帜的莫扎特和爱因斯坦老爷子

那些年我们用过却不记得的正态分布

rnorm是产生随机数的一种方法
  • n表示生成随机数的个数
  • meansd分别是对正态分布的均值和标准差(sigma)的设定
> set.seed(1)
> rnorm(5, mean = 0, sd = 1)
[1] -0.6264538  0.1836433 -0.8356286  1.5952808  0.3295078
z.test
  • z.test并不是base函数,是BSDA包中的
> z.test(1:11,sigma.x = 1)

    One-sample z-Test

data:  1:11
z = 19.9, p-value < 2.2e-16
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
 5.409049 6.590951
sample estimates:
mean of x 
        6 

> a <- 1:11
> n <- length(a)
> mean(a)-1/sqrt(n)*qnorm(1-0.05/2)###1为sd
[1] 5.409049
> mean(a)+1/sqrt(n)*qnorm(1-0.05/2)
[1] 6.590951
pnorm
> library(BSDA)
> set.seed(0713)
> tmp<- rnorm(10)
> tmp1<- z.test(tmp,sigma.x = 1)
> tmp1

    One-sample z-Test

data:  tmp
z = -1.0947, p-value = 0.2736
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
 -0.9659728  0.2736173
sample estimates:
 mean of x 
-0.3461777 

> pnorm(-abs(z.test(tmp,sigma.x = 1)$statistic))*2
        z 
0.2736437 
scale是我们画热图常用的对数据处理的一个函数
  • center是指每列的元素减去该列的均值
  • scale是指在center功能执行后,每列元素除以其标准差
  • 所以,最后展示在热图里的数据就是,该元素与其均值究竟差了几个标准差
scale(x, center = TRUE, scale = TRUE)
> x <- matrix(1:10, ncol = 2)
> y<- scale(x)
> y
           [,1]       [,2]
[1,] -1.2649111 -1.2649111
[2,] -0.6324555 -0.6324555
[3,]  0.0000000  0.0000000
[4,]  0.6324555  0.6324555
[5,]  1.2649111  1.2649111
attr(,"scaled:center")
[1] 3 8
attr(,"scaled:scale")
[1] 1.581139 1.581139

参考资料:
https://www.zhihu.com/question/26854682


课程分享
生信技能树全球公益巡讲
(https://mp.weixin.qq.com/s/E9ykuIbc-2Ja9HOY0bn_6g)
B站公益74小时生信工程师教学视频合辑
(https://mp.weixin.qq.com/s/IyFK7l_WBAiUgqQi8O7Hxw)
招学徒:
(https://mp.weixin.qq.com/s/KgbilzXnFjbKKunuw7NVfw)

你可能感兴趣的:(正态分布-接受Normal)