ESP数据库简介

欢迎关注"生信修炼手册"!

ESP 全称是NHLBI Exome Sequencing Project, 是由多个大学和研究结构合作开展的一个大型的外显子测序项目,主要目的是通过NGS技术对不同人群进行SNP分型,来辅助心脏,肺,血液相关疾病的研究。

官网如下:

http://evs.gs.washington.edu/EVS/

通过首页的Data Browser按钮,可以检索数据库。可以通过以下4种方式进行检索:

  1. HUGO命名的gene symbol

  2. Entrez Gene ID

  3. 染色体区域

  4. dbSNP rs ID


ESP数据库简介_第1张图片

检索结果中提供了两种人群的结果

  1. EuropeanAmerican

  2. AfricanAmerican

ESP数据库简介_第2张图片

在结果展示的页面,给出了每个变异位点相关的详细信息。

1. 基因相关信息

这部分内容会给出基因的symbol, ID,染色体区域等基本信息,还会给出pathway, COSMIC, STRING, OMIM等数据库的链接


ESP数据库简介_第3张图片

2. 变异位点表头信息

通过单选框,对变异位点的表头进行筛选

ESP数据库简介_第4张图片

3.  变异位点的详情页面

根据前面筛选的表头,展示每个变异位点对应的信息

ESP数据库简介_第5张图片

不同类型的变异位点填充色是不同的,颜色和变异类型的对应关系如下

ESP数据库简介_第6张图片

检索的结果是可以下载的,点击右上角的download按钮即可下载,支持textvcf两种格式。

ESP数据库简介_第7张图片

除了检索之外,还可以一次下载整个数据库中的内容,点击首页的Download按钮即可跳转到下载页面。

该页面提供的数据是对6503例样本的分析结果,变异位点的位置是基于hg19版本的,为了适配hg38版本,新增了字段来存储hg38版本上的位置信息。提供了5个文件供下载,可以分成3类

1.SNP分型结果

ESP6500SI-V2-SSA137.GRCh38-liftover.snps_indels.txt.tar.gz
ESP6500SI-V2-SSA137.GRCh38-liftover.snps_indels.vcf.tar.gz

2.测序覆盖度结果

ESP6500SI-V2.GRCh38-liftover.coverage.all_sites.txt.tar.gz
ESP6500SI-V2.coverage.seq_blocks.txt.tar.gz

3.外显子目的区域文件

agilent_nimblegen_exome_targets_esp_project.tar.gz

通常情况下,下载VCF文件就可以了。

扫描关注微信号,更多精彩内容等着你!

ESP数据库简介_第8张图片


你可能感兴趣的:(ESP数据库简介)