去除空白行和na,duplicate 'row.names'的处理

去除空白行


image.png
df=df[-which(df$start_pc==""),]

去除na行

df<- df[-which(is.na(df$start_pc)), ]

同时去除两者

df[!(is.na(df$start_pc) | df$start_pc==""), ]

想要给数据重新命名,但是有的行具有重复值即:多个探针ID对应一个同一个基因。目的:为了去掉这些重复的基因,将数据处理成每一行为不重复的基因。

rownames(SRP273720_counts)<-SRP273720_counts[,14]

Error in .rowNamesDF<-(x, value = value) :
duplicate 'row.names' are not allowed
In addition: Warning message:
non-unique values when setting 'row.names': 'CCDC39', 'DUXAP8', 'GOLGA8M', 'ITFG2-AS1', 'LINC01238', 'LINC02203', 'PINX1', 'POLR2J3', 'POLR2J4', 'RMRP', 'SCARNA4', 'SIGLEC5', 'SNORA16A', 'SNORA17B', 'SNORA50A', 'SNORD38B', 'SNORD3D', 'TBCE'

取平均值

SRP273720_ordered <- aggregate(SRP273720_counts[,2:13],
                             by = list(SRP273720_counts$hgnc_symbol),FUN = mean)

如果空白的、NA或者INF不能去除,需要先查看一下是否是数值型(字符型肯定是去处不了的!!!)

Seurat包的findmarkers函数只能根据划分好的亚群进行差异分析吗 - 云+社区 - 腾讯云 (tencent.com)

你可能感兴趣的:(去除空白行和na,duplicate 'row.names'的处理)