描述:
茎叶图(Stem-and-Leaf display)又称“枝叶图”,由统计学家约翰托奇( Arthur Bowley)设计,它的思路是将数组中的数按位数进行比较,将数的大小基本不变或变化不大的位作为一个主干(茎),将变化大的位的数作为分枝(叶),列在主干的后面,这样就可以清楚地看到每个主干后面的几个数,每个数具体是多少。
茎叶图是一个与直方图相类似的特殊工具,但又与直方图不同,茎叶图保留原始资料的资讯,直方图则失去原始资料的讯息。将茎叶图茎和叶逆时针方向旋转90度,实际上就是一个直方图,可以从中统计出次数,计算出各数据段的频率或百分比。从而可以看出分布是否与正态分布或单峰偏态分布逼近。
特点:
1、用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示。
2、茎叶图只便于表示个位之前相差不大的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观、清晰。
R中使用stem函数绘制茎叶图,在控制台进行输出,如下所示:
> x<-c(89,79,57,46,1,24,71,5,6,9,10,15,16,19,22,31,40,41,52,55,60,61,65,69,70,75,85,91,92,94)
> stem(x)
The decimal point is 1 digit(s) to the right of the |
0 | 1569
1 | 0569
2 | 24
3 | 1
4 | 016
5 | 257
6 | 0159
7 | 0159
8 | 59
9 | 124
stem额外提供scale参数调整茎的粒度,scale数值越小,茎的粒度越粗,width参数设置最大的宽度,需要容纳茎叶图行宽,若width参数过小,输出将被截断,atom参数指定数据容忍度,数据差异在容忍度范围内的被当作同一个数。调整了scale参数后的示例如下:
> x<-c(89,79,57,46,1,24,71,5,6,9,10,15,16,19,22,31,40,41,52,55,60,61,65,69,70,75,85,91,92,94)
> stem(x,scale=0.5)
The decimal point is 1 digit(s) to the right of the |
0 | 15690569
2 | 241
4 | 016257
6 | 01590159
8 | 59124
width参数过小的示例,输出被截断了:
> x<-c(89,79,57,46,1,24,71,5,6,9,10,15,16,19,22,31,40,41,52,55,60,61,65,69,70,75,85,91,92,94)
> stem(x,scale=0.5,width=16)
The decimal point is 1 digit(s) to the right of the |
0 | 1569
2 | 241
4 | 0162
6 | 0159
8 | 5912
相同的数据集在Minitab中的输出,采用缺省设置:
4 0 1569
8 1 0569
10 2 24
11 3 1
14 4 016
(3) 5 257
13 6 0159
9 7 0159
5 8 59
3 9 124
中间的括弧表示数据趋中的情况,中位数出现在附近。