Wego input文件准备

今天通过几行代码来准备Wego input的文件:

  1. Wego官网要求的输入文件格式(https://wego.genomics.cn/)

    1639148090(1).jpg

  2. 现有GO分析结果


    1639148267(1).jpg
  3. 要把gene编号和对应的GO编号提取出来,用sed和awk命令实现。

第一步:先把##和%都替换成 \t

sed -e 's/%/\t/g' -e 's/##/\t/g' data.txt

第二步:用awk把带有GO的列输出

awk '{print $1}{ for(i=1;i<=NF;i++)if($i~/GO/) print $(i)}' go.txt >1.txt   

第三步:再把\nGO替换成GO

在vim编辑器里%s/\nGO/GO/g(因为sed里不识别\n)

你可能感兴趣的:(Wego input文件准备)