R语言学习5

R语言学习5
访问变量和处理数据子集

  1. 访问数据框

seywd(“C:/RBOOK/”)
Squid<-read.table(file=”Squid.txt”,header=TRUE)#读取Squid.txt
names(Squid)#读取Squid中的变量
[1] ”Sample””Year””Month””Location””Sex””GSI”
str(Squid)#Squid中的变量属性
‘data.frame’:2644 obs.of 6 variables:
$ Sample : int 1 2 3 4
$ Year :int 1 1 1 1
$ Month : int 1 1 1 2
$ Location : int 1 2 1 3
$ Sex : int 2 2 2 2
$ GSI :num 10.44 12.33 14.03 9.30
setwd(“C:/RBOOK/”)
Squid2<-read.table(file=”Squid.txt”,dec=”,”,header=TRUE)#分隔符是逗号

  1. 函数中的数据参数

M1<-lm(GSI~factor(Location)+factor(Year),data=Squid)#线性回归函数模型,不是所
函数支持data选项。
mean(GSI,data=Squid)#不支持data选项。
boxplot(GSI~factor(Location),data=Squid)#函数中没有data参数。
Squid$GSI#访问GSI变量。
Squid[,6]#访问第六列数据。
mean(Squid$GSI)#计算GSI的平均值。

  1. 访问数据子集

Squid$Sex
unique(Squid$Sex)#这个变量里有多少个唯一值。
Sel<-Squid$Sex==1
SquidM<-Squid[Sel,]
SquidM#输出性别为雄性的数据
SquidM<-Squid[Squid$Sex==1,]
SquidM#简写
Squid<-Squid[Squid$Location==1|Squid$Location==2|Squid$Location==4,]#Location为1,2,4的数据。
SquidM.1<-Squid[Squid$Sex==1&Squid$Location==1,]#性别为雄性,地址为1的数据。
<0 rows>(or 0-length row.names)#对应的测量值为0。
Ordl<-order(Squid$Month)
Squid[Ordl,]#根据月份由低到高的值排列GSI数据。
Squid$GSI[Ord1]#只显示GSI的排列。

4.组合数据集
>Setwd(“C:/RBOOK/”)
>Sq1 >Sq2 >SquidMerged<-merge(Sq1,Sq2,by=”Sample”)
>SquidMerged#依据Sample将两个表格组合。
>SquidMerged<-merge(Sq1,Sq2,by=”Sample”,all=TRUE)
>SquidMerged#Sq1里没有的,Sq2里出现的数据,用NA填充。

5.输出数据
>SquidM<-Squid[Squid$Sex==1,]
>write.table(SquidM,file=”MaleSquid.txt”,sep=””,quote=FALSE,append=False,na=”NA”)
Ascii文件,quote=FALSE消除字符串(标题)的引号标志,na=”NA”允许缺失值由什么来替代,append=FALSE打开一个新的文件。

6.重新编码分类变量
>Str(Squid)
>Squid$fSex<-factor(Squid$Sex)
>Squid$fSex<-factor(Squid$Sex,levels=c(1,2),labels=c(“M”,”F”))
>Squid$fSex#性别1,2换为M,F。
>boxplot(GSI~fSex,data=Squid)
>M1<-lm(GSI~fSex+fLocation,data=Squid)#画箱图和线性规划。SSS

你可能感兴趣的:(R语言学习5)