IGV 自己加载或者导入参考基因组

1.加载基因组及注释文件

加载的基因组文件必须是fasta格式或者IGV.genome格式。

fasta文件必须是纯文本文件,不能是压缩文件,且应当有一个通过Samtools软件生成的.fai格式的索引文件。

如果载入的fasta文件没有索引,IGV会自动尝试对其进行index。

2.导入参考基因组及注释文件(http://software.broadinstitute.org/software/igv/LoadGenome)

注释文件就是基因组的说明书,告诉我们哪些序列是编码蛋白的基因,哪些是非编码基因,外显子、内含子、UTR等的位置等等。注释文件在以上三个提供参考基因组的网站中都有提供,比如Ensemble。但是现在最权威的人类和小鼠基因组的注释还属Gencode数据库。


实验目的:下载panTro6的参考基因组和注释文件,并导入到IGV中

https://www.ncbi.nlm.nih.gov/assembly/GCF_002880755.1/

https://www.ncbi.nlm.nih.gov/genome/?term=Pan+troglodytes


实验步骤:

Step1: 下载PanTro genome  FASTA format from NCBI

1. download genome and annotation files from https://www.ncbi.nlm.nih.gov/genome/?term=Pan+troglodytes

Step2: 解压上述下载的genome文件,创建.genome为后缀的file。Genomes--Create.genomes File

Step3: 对fasta文件建立索引,生成的索引文件以.fai后缀结尾。File--Load from files

确保该.fai文件与对应的fasta文件在一个文件夹内。


Step4: files----load fom file----选择上述下载并解压的annotation.gtf/gff文件。根据提示生成sorted.annotation.gtf/gff文件

Step5: load genome from file。加载.genome文件

Step6: load files。加载sorted.annotation.gtf/gff文件

Step7: load bam.file and own gtf file and observe targeted gene reads enrichment.

你可能感兴趣的:(IGV 自己加载或者导入参考基因组)