常见数据处理方法

以存在缺失值和重复值的dataset数据集为例

1.删除缺失值

dataset1<-na.omit(dataset)

2.删除重复值

如dataset数据集中Ensembl.Gene.ID这一列存在重复值

(1)建立是否重复索引

index<-duplicated(data.set$Ensembl.Gene.ID)

index

在后面我们用!来取反:

data.set1<-data.set[!index,]

data.set1

3.数据合并merge()函数

4.数据转置t()函数

你可能感兴趣的:(常见数据处理方法)