1、画图函数
对于数据来说,转成图之后更加详细,生动。下面介绍常见的作图函数:
直方图:hist(x$x1) : 表示将x数据框中的x1列做出一个直方图;
散点图:plot(x$x1,x$x2):x数据框的x1为横坐标,x2列为纵坐标,做一个散点图;
散点图的进一步设置:
plot(x$x1,x$x2,main="数学分析与线性代数成绩之间的关系",
xlab="数学分析",
ylab="线性代数",
xlim=c(0,100),
ylim=c(0,100),
xaxs="i", #设置x轴的显示风格。
yaxs="i",
col="red", #设置点的颜色。
pch=19) #点的图形类型:圆盘
)
散点图中的连线图:
a=c(2,3,4,5,6)
b=c(4,7,8,9,12)
plot(a,b,type='l') #l是小写的,如果大写成L,则报错。
列联函数:table(): 统计没每个分数值一共出现了多少次。
柱状图:barplot():barplot(table(x$x1)):画柱状图,其实就是把列联函数的结果输入,然后出来图形。
饼图:pie(table(x$x1));把列联函数的结果输入,然后出来图形。
箱线图:boxplot(x$x1,x$x2,x$x3):
箱子的上下横线为样本的25%和75%分位数
箱子中间的横线为样本的中位数
上下延伸的直线称为尾线,尾线的尽头为最高值和最低值
异常值
boxplot(x[2:4],col=c("red","green","blue"),notch=T) ——这个命令用来画箱线图,而且用了三种颜色,分别对应x数据框的234列。而且加了一个缺口即:notch为ture。
boxplot(x$x1,x$x2,x$x3,horizontal=T) ——此命令表示把箱线图横着放。。。
星相图:stars(x[c("x1")])
每个观测单位的数值表示为一个图形
每个图的每个角表示一个变量,字符串类型会标注在图的下方
角线的长度表达值的大小
雷达图:stars(x[c("x1","x2","x3")],full=T,draw.segment=T) ——跟星相图基本类似,其半径长度代表了数值的大小。full 表示是画整个圆形还是半个圆形。这里T(rue)表示整个圆,draw.segment表示是不是画成这种雷达图。。。
茎叶图:stem(x$x1):高中学过了。所有的数据都列出来了。。哈哈
qq图:qqnorm(x1): 可用于判断是否正态分布
直线的斜率是标准差,截距是均值
点的散布越接近直线,则越接近正态分布
热力图:必须把数据框转成矩阵。
2、
求矩阵的平均值:mean(x) 如果x是一个矩阵,那么所求的就是矩阵各个值的平均值。求各行的平均值:apply(x,1,mean) ;求各列的平均值:
apply(x,2,mean)