数学之路(3)-数据分析(2)

本博客所有内容是原创,未经书面许可,严禁任何形式的转载。

http://blog.csdn.net/u010255642


茎叶图

R使用stem函数,格式为:

stem(变量,scale=长度,width=绘图宽度,atom=容差)

我们绘制一下产品单位成本的茎叶图:

>read.table("I:/my_docs/cp.csv",,header=TRUE,sep=",")->cp

> stem(cp$单机成本...,scale=2)

  The decimal point is 1 digit(s) to the right of the |

  29 | 68

  30 | 1356778

  31 | 1135

  32 | 7

  33 | 

  34 | 36

Scale2,表示将个数位分成2段,0-4一段,5-9一段。

从茎叶图中可看出,单位成本主要集中在300-400

箱线图

R的相应函数为:boxplot

> boxplot(jiuye$平均教育经费)

下图中间那个箱子的顶部是上四分位数,底部是下四分位数,中间的粗线是中位数位置,箱体由上下伸出的垂直部分表示数据的散布范围,另外在散布范围外还有一些小圆点,那些是异常点,可见平均教育经费有一些特大值,最大的异常值超过了12000

数学之路(3)-数据分析(2)_第1张图片



五数

R中使用fivenum函数

> fivenum(cp$单机成本...)

[1] 296.210 304.275 307.225 313.915 346.230

分别是最小值,下四分位数,中位数,上四分位数,最大值。

你可能感兴趣的:(数据分析,r)