IGV-基因组浏览器

电脑系统:Ubuntu18.04
Itegrative Genomics Viewer (IGV)是由Broad研究院的研究人员开发的一款功能强大的综合性基因组学可视化工具,此工具可以让从事生物信息的科研工作者轻松的分析查看多种基因组数据。除了直观的查看序列信息遗传密码中的序列变化突变外,还可以查看拷贝数变化、染色质沉淀数据和表观遗传学修饰等。使用者可以选择多种显示模式,以热图、柱状图、散点图或其他形式查看他们的数据。

一、软件安装:下载解压即可使用

http://software.broadinstitute.org/software/igv/download (有Windows,MAC,Linux系统对应的版本)如图1

图1.IGV下载界面

要求Java版本是8.0的

sh igv.sh 

二、软件使用:

1.数据准备:

参考基因组必须为FASTA格式
IGV只是负责将比对结果可视化,并没有比对过程,所以不能直接载入reads
需要将待比对的reads与前面指定的参考基因组用bwa进行比对
比对后的sam文件也不能直接载入(麻烦),要转bam;bam排序;bam建索引(可以一步完成)

2.使用过程:
sh igv.sh 

(1). 参考基因组文件导入


图2.IGV的运行界面

(2). 测序数据的导入
以bam或bw文件类型为例,导入路径:File→Load form File, 选择bam或bw文件;注意的是bam一定要sort,而且在bam文件所在的目录下一定要有bam文件对应.bai索引文件。

samtools sort -@ 8 -o WT-1.map.sam  WT-1.map.sam   #bam文件排序
samtools index -@ 8 WT-1.map.bam WT-1.map.bai     #bam文件构建索引

导入后可以在方框2的位置选择感兴趣的染色体,也可以在方框3的位置输入感兴趣的基因组位置(格式:染色体:起始位置-终止位置),单击回车即可显示出所选区域的read的覆盖情况(方框4,5所示区域)。如果所选基因组过大,在read覆盖区会出现Zoom in to see coverage,此时可以通过点击方框6中的“+”或“-”号调整所展示的区域。如果想选择基因进行可视化,可以在方框3键入基因的位置,或者通过Regions→Gene Lists来选择感兴趣的基因集,当然也可导入自己感兴趣的基因list。

图3.结果件展示1

方框4为Coverage track,表示的是该样品在基因组上的覆盖度,横坐标是基因组位置,纵坐标则是该位置上的测序深度。方框5对应的是该样品比对到参考基因组上read的track,每一条代表一个read,可以通过讲鼠标的光标移动到read位置,就可以显示比对详情,也可以直观的看到每个碱基是什么。当导入bw文件时只有方框4的内容为read的覆盖深度,所以想看read的比对信息还要用bam文件。

图4.结果展示2

图片介绍:
(1) 处可手动输入想要察看的染色体/contigs/scaffolds编号,然后回车察看;
(2) 处是参考序列对应的核酸序列,其中四种核酸分别用不同的颜色表示:(A, C, G, T),下面为对应的翻译的氨基酸序列,甲硫氨酸(M)用绿色表示,终止密码子(*)红色星号表示;当右上角的标尺足够大时此区域才会显示;
(3) 处不同颜色条表示排序方式,鼠标停留在此处右键选择 可选取不同的颜色形式;同时每一个长条对应的序列和比对信息可以鼠标右键选择来拷贝;每一个长条都是由一系列的核酸序列组成,可通行 来显示;比对的reads长条也可通过成对的形式显示;
(4) 处鼠标停留时会显示此处碱基统计信息,例如在此处显示为红蓝色,红色是T,蓝色是C,红色方块大于蓝色,表示所有比对到这一位置的序列中这一位点碱基是T的序列大于C的,即C可能是突变;当导入数据为比对的bam数据时,此处所在区域为 Coverage Track

查看结果

序列比对结果

图5.序列比对结果1

1.可通过 View >>Preferences >>Alignments 面板设置相关参数;
2.在 Track 区不进行 Color alignments by 的情况下,alignments 只有亮灰和白色两种长条,其中白色的比对质量为零 (mapping quality equal to zero);
3.插入:用紫色的 I 或红色的 I (当插入的碱基数多余预设的阀值时)表示;鼠标停留察看详细的插入碱基情况;
4.缺失:黑条表示;


图6.序列比对结果2

5.Sort alignments by 可对Track区域进行排序,如想返回最初结果则选择 Re-pack alignments 即可;
6.默认情况下 Track Alignments 区以左图紧凑的单个 reads 的形式展示,通过 View as pairs 可成对显示,且中间以细线连接 (图6);


图7.序列比对结果3

7.Paired-end alignment tracks 时 (View as pairs),右键选择 View mate region in split screen 可分隔显示;可实现多个分隔;在下图7①处右键选择 Switch to standard view 或鼠标左键双击可返回单个分区;

可变剪切情况
1.Loaded junctions data in the standard .bed format (例如TopHat’s “junctions.bed”等输出文件);

图8.可变剪切

察看变异

  1. Mutation Files:MAF (mutation annotation format) and MUT (mutation)文件;
  2. VCF Files


    图9.变异

    图顶部的每个横条显示了单个基因座的等位基因分数
    每个样本中每个位点的基因型。深蓝色=杂合子,青色=纯合子变异,灰色=参考。过滤后的条目是透明的

参考资料

https://www.jianshu.com/p/5477dd408146
https://www.sohu.com/a/275591269_100128066
https://www.jianshu.com/p/57631e99261a
https://cloud.tencent.com/developer/article/1050826
推荐阅读原文

你可能感兴趣的:(IGV-基因组浏览器)