基本图形-箱型图

箱型图可以非常好地展现连续型变量的特征。通过绘制出变量的最大值,最小值,中位数,上四分位数和下四分位数。

考虑mtcars数据集的mpg变量。绘制箱型图用到函数boxplot(),参数为连续数值型向量。

> boxplot(mtcars$mpg)


简单箱型图

箱型图还可以方便地进行分组比较。boxplot(y~A,data=某个数据框) ,y是连续数值型变量,A是类别型变量。这个函数的目的是将y变量按照A的类别进行分组,绘制箱型图。

> boxplot(mpg~cyl,data=mtcars)


分组箱型图

boxplot函数还有其他的参数可以控制箱型图。y~A*B 表示绘制y变量,按照A和B两种分类两两组合进行分组,varwidth=T表示,箱型图的宽度与各个分组的样本数成正比。

> boxplot(mpg~am*cyl,data=mtcars,varwidth=T)


分组箱型图

图中可以看出,am和cyl分别为0和8的汽车是最多的。油耗随着汽缸数的下降而减少。

你可能感兴趣的:(基本图形-箱型图)