数据整理|miRNA-mRNA互作网络的输入数据

需求

下表是从miRNA预测工具Funrich软件中导出的​数据。



需要整理成:
两列,一列是gene,一列miRNA,每对mRNA-miRNA组合占一行,形如:


思路

1.第二列miRNA进行分割,分隔符为;
2.每个基因对应多少个miRNA,就重复多少次放在第一列。
3.miRNA依次排列即可。

代码实现

输入数据可以自己编一个。也可以在生信星球公众号回复“mi636”获得。

library(rio)
x = import_list("miRNA.xlsx")
x2=x$Detail
x2
colnames(x2)=x2[2,]
x2 = x2[-c(1,2),]
library(stringr)
x3 = str_split(x2$miRNA,"; ")
x3 = lapply(x3, function(x){str_remove(x,";")})
df = data.frame(gene = rep(x2$`Gene symbol`,times = sapply(x3,length)),
                miRNA = unlist(x3))
export(df,"miRNA_cyto.txt")

(^-^)V搞定!
下次有一个互作网络图复现的视频讲解,剧透一个:


你可能感兴趣的:(数据整理|miRNA-mRNA互作网络的输入数据)