R语言数学统计函数和描述性统计函数

目录

1. 数学统计函数

2. 描述性统计函数

2.1 summary()

2.2 fivenum ()

 2.3 describe()


1. 数学统计函数

R语言中有许多基于概率论的数学统计函数。这里主要讨论R中的概率分布函数,R中有将近20种不同分布的函数它们都有几种前缀,其中d开头代表其是概率密度函数,p开头是分布函数,q开头是分布函数的反函数,r开头是产生满足该分布的随机数,在d、p、q、r后面加上相应分布的名称就构成了相应的函数例如r+binomial->rbinom()表示的就是生成二项分布的随机数的函数

分布 随机数 概率密度 分布函数 分位数函数
正态分布 rnorm dnorm pnorm qnorm
二项分布 rbinom dbinom pbinom qbinom
负二项分布 rnbinom dnbinom pnbinom qnbinom
几何分布 rgeom dgeom pgeom qgeom
超几何分布 rhyper dhyper phyper qhyper
F分布 rf df pf qf
泊松分布 rpois dpois ppois qpois
t分布 rt dt pt qt
连续均匀分布 runif dunif punif qunif

2. 描述性统计函数

2.1 summary()

summar函数会告诉我们数据的最值、中位数、平均数、四分位数,非常方便

> m<-mtcars[c("mpg","hp","wt","am")]
> summary(m)
      mpg              hp              wt              am        
 Min.   :10.40   Min.   : 52.0   Min.   :1.513   Min.   :0.0000  
 1st Qu.:15.43   1st Qu.: 96.5   1st Qu.:2.581   1st Qu.:0.0000  
 Median :19.20   Median :123.0   Median :3.325   Median :0.0000  
 Mean   :20.09   Mean   :146.7   Mean   :3.217   Mean   :0.4062  
 3rd Qu.:22.80   3rd Qu.:180.0   3rd Qu.:3.610   3rd Qu.:1.0000  
 Max.   :33.90   Max.   :335.0   Max.   :5.424   Max.   :1.0000  

2.2 fivenum ()

fivenum函数功能与summary类似,不过是针对某一列,从左到右依次从最小值到最大值

> fivenum(m$mpg)
[1] 10.40 15.35 19.20 22.80 33.90

 2.3 describe()

describe函数会告诉你最值和缺失值数目等

> describe(m)
m 

 4  Variables      32  Observations
------------------------------------------------------------------------------
mpg 
       n  missing distinct     Info     Mean      Gmd      .05      .10 
      32        0       25    0.999    20.09    6.796    12.00    14.34 
     .25      .50      .75      .90      .95 
   15.43    19.20    22.80    30.09    31.30 

lowest : 10.4 13.3 14.3 14.7 15.0, highest: 26.0 27.3 30.4 32.4 33.9
------------------------------------------------------------------------------
hp 
       n  missing distinct     Info     Mean      Gmd      .05      .10 
      32        0       22    0.997    146.7    77.04    63.65    66.00 
     .25      .50      .75      .90      .95 
   96.50   123.00   180.00   243.50   253.55 

lowest :  52  62  65  66  91, highest: 215 230 245 264 335
------------------------------------------------------------------------------
wt 
       n  missing distinct     Info     Mean      Gmd      .05      .10 
      32        0       29    0.999    3.217    1.089    1.736    1.956 
     .25      .50      .75      .90      .95 
   2.581    3.325    3.610    4.048    5.293 

lowest : 1.513 1.615 1.835 1.935 2.140, highest: 3.845 4.070 5.250 5.345 5.424
------------------------------------------------------------------------------
am 
       n  missing distinct     Info      Sum     Mean      Gmd 
      32        0        2    0.724       13   0.4062    0.498 

------------------------------------------------------------------------------
> 

你可能感兴趣的:(R语言,r语言,概率论,机器学习)