Linux--SRA runinfo 和accession list 的20题

1,如何下载SRA 的runinfo table 和accession list,PRJNA398328
提示:pubmed ,SRA 数据库

2,查看SRR_Acc_List.txt ,标记行号,单行显示;
提示:less,-NS
3,在SraRunTable.txt中 查找 RNA 并且统计行数
提示:grep ,wc
4,显示SRR_Acc_List.txt 前10行,并且结果存贮为 id
提示:head,>
5,将SraRunTable.txt 命名为info,将SRR_Acc_List.txt 命名为allid
提示:mv
6,查看allid 前10行,并且在info 中查询,id 的第一行、第二行、第三行信息;
提示:grep
7,查找 info中所用包含id 的信息;
提示:grep -f
8, 以上结果计算行数
提示:wc
9,对id进行编辑,插入#开头的说明,第一行#accession id,第二行date:2018.05.20,插入SRR59338,退出,并保存;
提示:vi,i,esc,:,wq
10,在id 中搜索,SRR59338,并计数。在id中搜索SRR59338,并进行精确匹配
提示:grep,-c;-w
11,查找 grep 这个命令在哪里
提示:which grep
12,筛选出,不以#开头的行;
提示:grep -v,^
13, 找出info 中SRA_study 是哪一列,并提取那一列,显示前10行
提示:head(info),tr ‘\t’ ‘\n’, cat -n
14,找出 ,第一列,genotype 那一列,mouse_number 那一列,primary_tumor_index,SRA_Study
提示: cut,
15,mouse_number 那一列,提取出第一个分号前边的内容;
提示: cut -d‘;’
16, 抽提出 info 的第一列,并且排序,进一步去重,并统计每个去重的个数;
提示:cut ,sort,uniq,alias(后期用)
17,将上一步统计好的 按照重复次数的多少排序,多的在前,少的在后;另存为 tmp
提示:sort -k1,1 -r
18,找出 tmp 的第一列;
提示:awk ’{print}‘
20,上边的第一列相加
提示: paste -s -d + ,bc
21 取出第一列是WXS 的那些行;
提示:awk ,==

部分命令展示

新技能get:
cut |grep | sort | uniq -c

你可能感兴趣的:(Linux--SRA runinfo 和accession list 的20题)