基因组浏览器、BAM文件可视化工具(2)--- IGV

整合基因组浏览器(IGV)是一种高性能的可视化工具,用来交互式地探索大型综合基因组数据。它支持各种数据类型,包括array-based的和下一代测序的数据和基因注释。IGV这个工具很牛,发了NB:

James T. Robinson, Helga Thorvaldsdóttir, Wendy Winckler, Mitchell Guttman, Eric S. Lander, Gad Getz, Jill P. Mesirov. Integrative Genomics Viewer. Nature Biotechnology 29, 24–26 (2011)

使用IGV的基本思路

1)安装和配置

要用linux上的IGV(首先需要去官网下载一个Linux下的IGV),然后需要一个远程控制工具:

这里使用 VNC,网上下载破解版,安装(输入注册码即可破解,文章底部有注册码)。

2)运行IGV

开启 linux 的 VNCserver,开启了之后,linux上会显示节点和端口,用于Windows端的连接。

vncserver -geometry 1366x768  #调节分辨率 

开启服务后,Linux会提示可以登录的节点,登录VNC需要你的ip、端口及VNC密码。

 运行 VNC 客户端(VNC viewer)里的 IGV.sh 开启可视化程序(打开Windows的VNC会自动跳转到Linux下的IGV安装目录,双击IGV.sh即可打开)。

1.载入参考基因组数据

可以点击选择一个,也可以通过菜单栏Genomes载入文件。

2.载入排序后的bam文件

通过菜单栏的File,load from file。。。

3)IGV可视化数据准备

不是什么数据都可以拿IGV看的,参考基因组必须为FASTA格式;

IGV只是负责将比对结果可视化,并没有比对过程,所以不能直接载入reads;

需要将待比对的reads与前面指定的参考基因组用bwa进行比对; 

比对后的sam文件也不能直接载入(麻烦),要转bam;bam排序;bam建索引(可以一步完成);

命令流程如下:

BWA出来的sam文件无法直接被 IGV 利用的,必须经过 samtools 处理后才能被 IGV 显示出来。

##-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

samtools view -@ 10 -bS -F 4 ./contigs_sequence_align_to_public_genome.sam > ./contigs_sequence_align_to_public_genome.bam

samtools sort -@ 10 ./contigs_sequence_align_to_public_genome.bam contigs_sequence_align_to_public_genome.sorted

samtools index contigs_sequence_align_to_public_genome.sorted.bam contigs_sequence_align_to_public_genome.sorted.bai

samtools depth contigs_sequence_align_to_public_genome.sorted.bam >depth_reads.txt

wc -l depth_reads.txt > Coverage-aln_reads.txt

##-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

更多的使用细节参照samtools 使用方法。

IGV 需要设置内存,在看大型基因组时很吃内存.

示例:

下面显示的是组装异常区,这是手动连接的地方,Pacbio全部不能顺利跨过去,说明组装有问题。


 以下是单细胞转录组比对可视化:


4)IGV用户指南

目录:http://software.broadinstitute.org/software/igv/UserGuide

5)用户界面

                                             Main Window(主窗口)

1.tool bar(工具栏),menu bar(菜单栏),pop-up menus(弹出式菜单)。

2.染色体上的红色盒子表示显示这部分染色体,显示完整染色体是红框会消失。

3.尺度显示了染色体的可见部分,刻度线显示了染色体的位置,跨度列表显示了当前显示的碱基的数量。

4.IGV在水平行显示的数据称为tracks。通常,每个tracks代表一个样本或实验。这个例子展示了甲基化、基因表达、拷贝数,LOH和突变数据。

5.IGV也显示某些特性,比如在tracks中的基因。默认情况下,IGV在一个面板显示数据,在另一个面板显示数据特性。拖放一个track名称,将一个track从一个面板移动到另一个地方。

6.Track名称列在最左边面板。名字的易读性取决于 tracks的高度,例如,track越小,它的名字的可读性越小。

7.属性名称被列在顶部的属性面板。彩色块代表属性值,每个独特的值被都有一个独特的颜色。鼠标放在一个颜色块的附近来查看其属性值。


------------------------------------------------------------------------------------I am a line !----------------------------------------------------------------------------------------------------------

转载链接地址:https://www.cnblogs.com/leezx/p/5603481.html

你可能感兴趣的:(基因组浏览器、BAM文件可视化工具(2)--- IGV)