保姆级 IGV 基因组浏览器使用指南(图文详解)

一、软件下载

http://software.broadinstitute.org/software/igv/download

这里以下载 Windows 版本为例,下载带有 Java 的版本,方便安装。

img

由于大部分数据是通过服务器跑出的结果,所以也有小伙伴有在 Linux 服务器端使用的需求。这里推荐几种方式:

  • 配合远程控制软件来使用,国产推荐 Todesk,向日葵
  • 话说目前有部分单位禁止远程软件,推荐结合 Jupyter 来使用
  • 建立 FTP 来通过 url 访问

建议最好安装在固态硬盘所在分区,提高加载速度。

img

如果没有在桌面找到 IGV 软件,按住 Win 键,搜索 igv 可以找到并运行

img

IGV 有下载文件的需求,所以通过网络访问权限

img

二、软件介绍

1、数据载入

为了方便介绍功能,我们需要先下载几个测试数据:

测试数据下载:

下面的数据来自人肝脏的 DNaseq 数据,分别为bigbed 文件与 bigwig 文件:

bigbed 文件:https://www.ncbi.nlm.nih.gov/geo/download/?acc=GSE172690&format=file&file=GSE172690%5FENCFF812QNX%5Fpeaks%5Fmm10%2EbigBed

bigwig 文件:https://www.ncbi.nlm.nih.gov/geo/download/?acc=GSE172690&format=file&file=GSE172690%5FENCFF705ESF%5Fread%2Ddepth%5Fnormalized%5Fsignal%5Fmm10%2EbigWig

想了解更多基因组相关文件格式:https://blog.csdn.net/u011262253/article/details/109367884

载入数据:

img

成功载入数据

img

切换其中一个染色体:

img

2、软件面板

img

这里分五大部分来介绍:

  • 工具栏

  • 轨迹信息栏

  • 基因组窗口

  • 轨迹窗口

  • 基因窗口

1、工具栏

从左到右依次为划分为三个小工具:

参考基因组工具

img

a. 选择参考基因组物种及版本,如果没有本地版本,需要联网下载

b. 选择染色体编号

c. 搜索染色体区间,格式如图所示,最常用的功能还是输入感兴趣的基因,直接跳转到对应的位置

img

视图操作工具

img

依次为主页面,前一步,后一步,刷新,定义区域,Trace适屏,弹出信息显示

缩放工具

用于控制整个视图的缩放比例,快捷键

img

2、轨迹信息栏

右键可以打开菜单,进一步修改,后面详细来研究。

3、基因组窗口

上部分为整条染色体,点击即可跳转该位置

img

下半部分为目前染色体可见部分对于的染色体位置,用刻度线标识,单位为碱基数。

img

4、轨迹窗口

每一行代表一个样本的 Trace

5、基因窗口

显示基因的特征区域,可以与 Trace 面板配合,来查看研究区域的生物学信号。

三、常用操作

1、下载参考基因组及注释

  • 左上角点击 More:
img
  • 搜索物种名及其参考基因组版本:

    更多参考基因组知识:https://blog.csdn.net/u011262253/article/details/117486244

img
  • 进入下载进度,这一步比较慢,建议科学上网或晚上挂着下载
img

2、数据加载

目前支持的格式包括:

  • 序列比对:bam,cram

  • 基因组注释:bed, gtf, gff3, psl, bigbed

  • 信号数据:wig, bedgraph, bigwig, tdf

  • 拷贝数:seg

拖动文件到轨迹窗口

img

本地文件载入

右上角点击 File-> Load from File,选择本地文件即可

img

通过 URL 加载

如谷歌的数据gs://genomics-public-data/platinum-genomes/bam/NA12877_S1.bam,自己有服务器最好建立 ftp 站点,方便查看

img

通过官方服务器加载

这里有一些公共项目的数据集,有兴趣的小伙伴可以多浏览

img

3、搜索

在工具栏的搜索框输入,图中 C 的位置:

img

有几种搜索方式:

  • 按基因组坐标搜索:chr6:64,664,854-64,666,044

  • 按基因名搜索:如 pou5f1,但是不支持别名等其他名称搜索

  • 按突变搜索,支持两种格式:

    • KRAS:G12C,搜索 KRAS 第 12 个氨基酸上,从G 到 C 的突变。* 表示终止密码子

    • 123A>T,搜索 KRAS 第 123 个氨基酸,从 A 到 T 的突变

4、放大缩小

  • 放大:

    • 双击轨迹窗口

    • 按住 Shift 健,单击轨迹窗口

    • 点击缩放工具 +

    • 在基因组标尺窗口按住左键滑动,选中区域便会放大

  • 缩小:按住 Alt 健,单击轨迹窗口

5、滚动平移

  • 水平移动

    • 按住左键在轨迹窗口左右拖动

    • 点击基因组标尺或染色体图

    • HomeEnd

  • 垂直滚动

    • 按住左键在轨迹窗口上下拖动

    • Page UpPage Down

6、右键菜单

在轨迹信息栏和基因窗口都可以右键呼出如下菜单栏,我们在出图时会依次用到

img

四、绘图

1、折线图

右键选择折线图选项

img

修改颜色

img

设置颜色

img

设置数据值域

img
img

这里试试设置不同的数据范围,也就是值域,这里注意 Y 轴变化

  • 设置Min,Mid,Max 依次为 0,0,0.2,效果如下

    img
  • 设置Min,Mid,Max 依次为 -0.2,0,0.2,效果如下

    img
  • 设置Min,Mid,Max 依次为 -1,0,1,效果如下

    img

最终效果如下:

img

2、散点图

切换到散点图选项

img

设置同折线图,效果如下

img

3、条形图

切换到条形图

img

设置同折线图,最终效果

img

4、热图

选择热图选项

img

配置参数

img

设置

img

效果

img

总结一下,一共可以绘制四种图,包括:

热图

img

折线图

img

条形图

img

散点图

img

5、基因

右键可以打开设置菜单,一共有三种形式选择:

img

堆叠形式

多个转录本堆叠在一起显示

img

展开形式

分别显示多条转录本

img

压缩形式

img

样本参数设置

基因特征显示

img

6、保存图片

支持格式两种 png,svg。这两种格式导出后,用 PS 和 AI 修改后就是论文中常见的图啦。

你可能感兴趣的:(保姆级 IGV 基因组浏览器使用指南(图文详解))