基础知识总结
小羊
- 前段时间,我一直在学习R语言,通过编程艺术和PPV课程,还有R实战,内容还没有学习完。
- 现在,做个总结吧。
# 1
v=read.table("abc.txt") # 注意了,是abc. 而不是abc,(是.而不是,)
v=read.table("d:/Rwork/abc.txt") # 有路径时用一个/或者用\\
vc<-read.table('clipboard',header=F) #不读列头是指:把第一行当作“数据”读进去!!
v3<-read.csv('abc3.csv',header=T) ##另一种读Excel的方法(剪切板方法 也可以用来读Excel文件)
# 2
write.table(t,file='d:\\Rwork\\mark.txt',col.names=F,row.names=F,sep=' ') #sep=' '里面加空格,输出的数据才有间隙
write.table(t,file='d:\\Rwork\\mark1.txt',col.names=F,row.names=F,sep='') #sep=''不加空格是不对的。
# 3.编译检查
dim()
summary()
# 4
rownames(rt)=rt[,1] #设置行名!为“原来的第一列”
# 5
x <- cbind(x1 = 3, x2 = c(4:1, 2:5))
dimnames(x)[[1]] <- letters[1:8] #设置行名【【1】】,如果是列名换成[[2 ]]即可
rownames(x)<- letters[1:8] #设置行名,==等价于上面
rowSums(x); colSums(x); rowMeans(x); colMeans(x) #求和、平均值
# 6. 把data.frame变为matrix,出现""在数据上,去除引号的过程
rt=read.table("mRNAsymboll.txt",sep="\t",header=T,check.names=F) #!!改成自己的文件名
rt=as.matrix(rt)
rownames(rt)=rt[,1]
exp=rt[,2:ncol(rt)]
dimnames=list(rownames(exp),colnames(exp))
data=matrix(as.numeric(as.matrix(exp)),nrow=nrow(exp),dimnames=dimnames) #读取矩阵数据
# 7.增维
x1<-c(1,2,3,4,5,6)
dim(x1)<-c(2,3)
# 8.查看某列某项有多少个值,或统计计数
summary(z$high==170)
table(z[,2]==170)
# 9.for语句(需要用哪个变量时,先赋值为0.如 w<-0)
w<-0
for(i in 1:59){w[i]=i*2+3}
w
# 10.while语句
d<-0
d[1]=5
i=1
while(d[i]<121){i=i+1;d[i]=d[i-1]+2}
d
# 11.
t3[which(t3>100)]=100
# 12.使用apply函数
apply(t,2,mean) ##中间为2,求每列的均数
apply(t,1,mean) ##中间为1,求每行的均数
apply(t,2,max) ##求每列中的 最大值(每科成绩的最高分)
apply(t,2,min) ##求每列中的 最小值(每科成绩的最低分)
apply(t[c('t1','t2','t3')],1,sum) #求每个人的总分
which.max(apply(t[c('t1','t2','t3')],1,sum)) #哪一个人的总分最高
t$num[which.max(apply(t[c('t1','t2','t3')],1,sum))] #求3门课总分最高的那个人学号
# 13. 散点图
plot(t$t1,t$t2,
main='数学分析与线性代数成绩的关系',
xlab='数学分析',
ylab='线性代数',
xlim=c(0,100),#根据图形的分布可以适当调节数轴的范围
ylim=c(0,100),
xaxs='i',#set x axis style as internal数轴的风格
yaxs='i',#set y axis style as internal
col='red',#set the color of plotting symbol to red
pch=19)#set the plotting symbol to filled dots
# 14.清除内容
ls()
rm(list = ls())
#(end)