linux习题11-20题

十一、安装 samtools 软件

miniconda安装 wget -c https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/Miniconda2-4.5.11-Linux-x86_64.sh bash Miniconda2-4.5.11-Linux-x86_64.sh # uname -a

遇到yes/no,输入yes,否则enter;然后source ~/.bashrc

配置镜像(安装一次,只配置一次,注意语句复制正确) conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/bioconda conda config --set show_channel_urls yes # 创建名为rna的软件安装环境 conda create -n rna python=2 # 查看当前conda环境 conda info --envs # 激活/进入conda的rna环境,避免每次用-n rna source activate rna # 安装 sam-tools软件 conda search sra-tools conda install -y sam-tools # done正确安装,且能调出软件help

image.png
samtools view -h SRR1039512.sort.bam|less -S
image.png

十三根据上面的命令,找到我使用的参考基因组 /home/jianmingzeng/reference/index/bowtie/hg38 具体有多少条染色体

这道题暂时不会做。

十四上面的后缀为BAM 的文件的第二列,只有 0 和 16 两个数字,用 cut/sort/uniq等命令统计它们的个数。

samtools view SRR1039510.sort.bam |cut -f2|grep 0|wc -l
samtools view SRR1039510.sort.bam |cut -f2|grep 16|wc -l
image.png

十五重新打开 rmDuplicate/samtools/paired 文件夹下面的后缀为BAM 的文件,再次查看第二列,并且统计

samtools view SRR1039510.sort.bam |cut -f2|sort |uniq -c
image.png

十六下载 http://www.biotrainee.com/jmzeng/sickle/sickle-results.zip 文件,并且解压,查看里面的文件夹结构, 这个文件有2.3M,注意留心下载时间及下载速度。

wget http://www.biotrainee.com/jmzeng/sickle/sickle-results.zip
unzip sickle-results
tree
image.png

十七解压 sickle-results/single_tmp_fastqc.zip 文件,并且进入解压后的文件夹,找到 fastqc_data.txt 文件,并且搜索该文本文件以 >>开头的有多少行?

cd sickle-results
unzip single_tmp_fastqc.zip
cd single_tmp_fastqc
less -S fastqc_data.txt|grep ^">>"|wc -l 
image.png

十八下载 http://www.biotrainee.com/jmzeng/tmp/hg38.tss 文件,去NCBI找到TP53/BRCA1等自己感兴趣的基因对应的 refseq数据库 ID,然后找到它们的hg38.tss 文件的哪一行。

wget http://www.biotrainee.com/jmzeng/tmp/hg38.tss
grep 'NM_000546' hg38.tss 
grep 'NM_001126113' hg38.tss 
image.png

十九,解析hg38.tss文件,统计每条染色体的基因个数。

less hg38.tss |cut -f2|sort|uniq -c
image.png

二十.解析hg38.tss 文件,统计NM和NR开头的序列,了解NM和NR开头的含义

grep '^NM' hg38.tss |wc -l
grep '^NR' hg38.tss |wc -l
image.png

你可能感兴趣的:(linux习题11-20题)