R第九天

一、基本数据操作 dataframe

na.omit(数据集)——删除缺失值

names()——查看数据集列的名字

names(数据集)[第几列]<- '新列名'  ——修改列名

若不知道在第几列的话  通过names(数据集)%in%(修改列名的向量)——判断前面的是不是在后面的向量中 

names(数据集)[names(数据集)%in%(修改列名的向量)] <- (新名字的向量)

数据集$列名  或   数据集['列名'] ——创建新的一列  美元符号返回向量,[]返回的还是数据框

根据条件来创建变量air_narm$YMO <-  ifelse(air_narm$AGE<30,'YOUNG',ifelse(air_narm$AGE>60,'OLD','MIDDLE')

sum(air_narm$YMO) != air_narm$YMO_2)——看两列不同的有几个

先常见一个保留的列名向量,数据集[向量]——保留愿数据集的列  或 数据集[,保留列名的向量]

剔除列的话,在向量前加个负号  或者 names(数据集)%in%(修改列名的向量) 生成逻辑向量

subset(数据集,逻辑向量(选TRUE的行),列的信息不写就是全选)

你可能感兴趣的:(R第九天)