从GFF注释文件获得Gene ID与Gene Name的对应关系列表

zless Homo_sapiens.GRCh38.95.gtf.gz | sed -n '6,10005p' >test.gtf
R
gtf <- read.table("test.gtf",header=F,sep="\t",stringsAsFactors=F)
gtf_gene <- gtf[gtf[,3]=="gene",]
id <- NULL
name <- NULL
for (i in 1:nrow(gtf_gene)){
 temp <- unlist(strsplit(gtf_gene[i,9],";"))
 id[i] <- substr(temp[1],9,nchar(temp[1]))
 name[i] <- substr(temp[3],11,nchar(temp[3]))
 print(i)
 }
id2name <- cbind(id,name)
截屏2020-12-11 14.48.08.png

你可能感兴趣的:(从GFF注释文件获得Gene ID与Gene Name的对应关系列表)