生物信息学常用数据库

写在前面

说来惭愧,感觉读到研究生,说来说去张口闭口也就是TCGA、GEO、ARRAYEXPRESS、GTEX数据库,感觉还不如一些临床医生自学生物信息学的,平常都没去探索一些新的数据库,这边做个记录.黑色部分代表我查到的简介,而红色部分则表示我的个人看法,其实这个关于数据也有别人写过教程了https://mp.weixin.qq.com/s/rNOIuXTqh-xJg2oj3AlRDA

GEO数据库

GEO数据库全称GENE EXPRESSION OMNIBUS,是由美国国立生物技术信息中心NCBI创建并维护的基因表达数据库。它收录了世界各国研究机构提交的高通量基因表达数据,目前已经发表的论文中涉及到的基因表达检测的数据可以通过这个数据库中找到,并且免费提供下载
数据类型包括各种物种的各种组学的数据,可以说非常全面的一个平台了,但是有时需要注意作者可能会上传一些错误的数据上去,所以拿到数据之后还需要进行质控
网址:https://www.ncbi.nlm.nih.gov/geo/

TCGA数据库

TCGA是基因中碱基的缩写,所以看名字大家也就能知道这个数据库是基因测序的信息库,其全称是TheCancer Genome Atlas(TCGA)计划,由美国美国国家癌症和肿瘤研究所(NCI)和国家人类基因组研究所(NHGRI)于2006年联合启动,第一阶段三年耗资1亿美元,收集多形性成胶质细胞瘤和卵巢癌的数据,将肿瘤组织与癌旁组织进行测序。2009年再投2.75亿美元对20多种肿瘤进行大规模研究,目前有20多种组织类型的30多种癌症11000多个病人的临床与基因信息。
TCGA数据库可以说是我最常用的数据库之一了,主要是泛癌分析部分

ICGC数据库

https://mp.weixin.qq.com/s/2ny_QLvK-Rl8G3UNcwoodg-这篇推文包括了如何下载数据的教程,但是是一个个数据下载的样式。
ICGC(International Cancer Genome Consortium,国际肿瘤基因组协作组),收集了50种不同癌种的数据,其中包括基因异常表达,体细胞突变,表观遗传修饰,临床数据等,是除TCGA外研究肿瘤的又一利器!

MSK-IMPACT

MSK-IMPACT检测1万余例晚期癌症的结果。
这个下载界面在
生物信息学常用数据库_第1张图片
但是也只能一个个下载

文章里的网站

一.信息类数据库

1.综合型数据库
NCBI:https://www.ncbi.nlm.nih.gov/

UCSC:http://genome.ucsc.edu/ (基因组浏览器)

Ensembl : http://asia.ensembl.org/index.html

Genecards : https://www.genecards.org/

BioGPS : http://biogps.org/#goto=welcome 大型综合数据库

MGD : http://www.informatics.jax.org/ 小鼠基因组

2.蛋白数据库
UniProt :https://www.uniprot.org/ 蛋白信息

SMART : http://smart.embl-heidelberg.de/ 信息/结构域/修饰/互作

CR2Cancer : http://cis.hku.hk/CR2Cancer/ 信息/表达/甲基化/CNV/预后/…

COBALT : https://www.ncbi.nlm.nih.gov/tools/cobalt/re_cobalt.cgi 保守性

Clustalo : https://www.ebi.ac.uk/Tools/msa/clustalo/ 保守性

ClustalW : https://www.ebi.ac.uk/Tools/msa/clustalo/ 保守性

multalin : http://multalin.toulouse.inra.fr/multalin/ 保守性

InterPro : http://www.ebi.ac.uk/interpro/ motif分析

PROSITE : https://prosite.expasy.org/ motif分析

ELM : http://elm.eu.org/ motif分析

NLSdb : https://rostlab.org/services/nlsdb/ 核定位

iACP : http://lin-group.cn/server/iACP 预测抗癌肽

3.-miRNA数据库
miRBase : http://www.mirbase.org/ 信息

Tools4miRs : https://tools4mirs.org 整合型

mirPath :http://snf-515788.vm.okeanos.grnet.gr/ 通路

miRPathDB : https://mpd.bioinf.uni-sb.de/ 通路

HMDD : http://www.cuilab.cn/hmdd pub/疾病

MISIM : http://www.lirmed.com/misim/Home 预测/疾病

Oncomir : http://www.oncomir.org/ 肿瘤/表达预后

miRNACancerMap : http://cis.hku.hk/miRNACancerMAP/ 肿瘤/表达预后

DIANA Tools : http://diana.imis.athena-innovation.gr/DianaTools/index.php?r=site/page&view=software 功能/机制

ENCORI : http://starbase.sysu.edu.cn/ ceRNA

4.lncRNA数据库
noncode : http://www.noncode.org/ 信息

lncrnadb : http://www.lncrnadb.org/ 信息

lncipedia : http://www.lncrnadb.org/ 信息

LncBook : http://bigd.big.ac.cn/lncbook/index 信息

AnnoLnc :http://annolnc.cbi.pku.edu.cn 信息/表达/机制

Rsite2 : http://www.cuilab.cn/rsite2 结构

RNA-MoIP : http://rnamoip.cs.mcgill.ca/ 结构

TANRIC : https://bioinformatics.mdanderson.org/public-software/tanric/ 肿瘤/表达

lnCAR :https://lncar.renlab.org 表达/结构

Lnc2Cancer : http://www.bio-bigdata.net/lnc2cancer/ pub/表达/表型

lncRNADisease : http://www.rnanut.net/lncrnadisease/ pub/疾病

HDncRNA : http://hdncrna.cardiacdev.com/ pub/心血管

iLoc-LncRNA : http://lin-group.cn/server/iLoc-LncRNA/ 定位/预测/Fasta

lncLocator : http://www.csbio.sjtu.edu.cn/bioinf/lncLocator/# 定位/预测/Fasta

RNAlocate :http://www.rna-society.org/rnalocate/index.html 定位/检索

lncATLAS : http://lncatlas.crg.eu/定位/基于测序

Co-LncRNA : https://www.lncrnablog.com/tag/co-lncrna/ 功能/相关性

LncBase : http://carolina.imis.athena-innovation.gr/diana_tools/web/index.php?r=lncbasev2/index-predicted ceRNA

LncTar : http://www.cuilab.cn/lnctar lncRNA-RNA

LncTar: a tool for predicting the RNA targets of long noncoding RNAs

Lnc2Meth : http://bio-bigdata.hrbmu.edu.cn/Lnc2Meth/ 甲基化

LncRNASNP2 : http://bioinfo.life.hust.edu.cn/lncRNASNP#!/ SNP/CNV/突变

LncRNA2Target : http://www.lncrna2target.org lncRNA-蛋白/miRNA

LNCediting : http://bioinfo.life.hust.edu.cn/LNCediting/ A-to-I

5.circRNA数据库
circBase : http://www.circbase.org/ 信息

circbank : http://www.circbank.cn/help.html 信息/ceRNA

CIRCpedia : https://www.picb.ac.cn/rnomics/circpedia/ 信息/保守性

circAtlas : http://circatlas.biols.ac.cn/ 信息/ceRNA/RBP

CircInteractome : https://circinteractome.nia.nih.gov 信息/ceRNA/RBP/siRNA

circRNADb : http://reprod.njmu.edu.cn/circrnadb 信息/编码蛋白

CircFunBase : http://bis.zju.edu.cn/CircFunBase/ 信息/功能/蛋白/miRNA

TSCD : http://gb.whu.edu.cn/TSCD/ 组织特异性分析

CSCD : http://gb.whu.edu.cn/CSCD/ 肿瘤特异性分析

circRNADisease : http://cgga.org.cn:9091/circRNADisease/ pub/疾病

TRCirc : http://www.licpathway.net/TRCirc/view/index 转录因子-circ

ENCORI : http://starbase.sysu.edu.cn/ ceRNA/RBP

6.外泌体数据库
EVmiRNA : http://bioinfo.life.hust.edu.cn/EVmiRNA#!/ miRNA

exoRBase : http://www.exorbase.org/ 血液/mRNA/lnc/circ

miRandola : http://mirandola.iit.cnr.it/ RNA/疾病-高通量

7.假基因数据库
dreamBase : http://rna.sysu.edu.cn/dreamBase/ 整合型/表达/组蛋白修饰/RNA修饰/蛋白结合/miRNA

8.融合基因数据库
ChimerDB : http://ercsb.ewha.ac.kr/fusiongene/整合型/pub+预测

COSMIC Fusion : https://cancer.sanger.ac.uk/cosmic/fusion pub

9.DNA修饰数据库
AWESOME :http://www.awesome-hust.com/ snp

Pancan-meQTL : http://gong_lab.hzau.edu.cn/Pancan-meQTL/ SNP/甲基化-生存/调控

iDNA6mA-PseKNC : http://lin-group.cn/server/iDNA6mA-PseKNC N6甲基化/Fasta

MethBank : https://bigd.big.ac.cn/methbank/ 甲基化/多物种/注释库

10 RNA修饰数据库
RMBase :http://rna.sysu.edu.cn/rmbase/ RNA修饰/SNP

m6AVar : http://m6avar.renlab.org/ m6A

WHISTLE : http://180.208.58.19/whistle/index.html m6A/预测

iRNA-3typeA :http://lin-group.cn/server/iRNA-3typeA.php m1A/m6A/A-to-I/预测

LNCediting : http://bioinfo.life.hust.edu.cn/LNCediting/ A-to-I

11.蛋白修饰数据库
PTMD : http://ptmd.biocuckoo.org/ 修饰-疾病

Phosphonet : http://www.phosphonet.ca/ 磷酸化

PhosphositePlus : https://www.phosphosite.org/homeAction.action 磷酸化

qPhos : http://qphos.cancerbio.info/ 磷酸化

GPS : http://gps.biocuckoo.cn/index.php 磷酸化

GPS-MSP : http://msp.biocuckoo.org/index.php 蛋白甲基化

12.药物数据库
DGIdb : http://www.dgidb.org/ 药物-基因

Pubchem : https://pubchem.ncbi.nlm.nih.gov/ 化合物/信息/结构

CTD : http://ctdbase.org/ 信息/化合物/互作

NRDTD :http://chengroup.cumt.edu.cn/NRDTD/ 药物-ncRNA

ETCM : http://www.tcmip.cn/ETCM/ 中药/靶分子/功能/疾病

BATMAN-TCM : http://bionet.ncpsb.org/batman-tcm/ 中药/靶分子/功能/疾病

TCMSP : https://lsp.nwu.edu.cn/ 中药成分/靶分子/疾病

TCMID : http://119.3.41.228:8000/tcmid/ 中药信息

SymMap : https://www.symmap.org/ 整合型

VigiBase :https://www.who-umc.org/vigibase/vigilyze/ 药物不良数据库

13.疾病数据库
HMDD : http://www.cuilab.cn/hmdd (疾病/miRNA/靶分子)

lncRNADisease : http://www.rnanut.net/lncrnadisease/ (疾病/lncRNA)

circRNADisease : http://cgga.org.cn:9091/circRNADisease/ (疾病/circRNA)

HDncRNA :http://hdncrna.cardiacdev.com (心血管疾病/ncRNA)

OsteoporosAtlas : http://biokb.ncpsb.org/osteoporosis/ (骨质疏松/基因/miRNA)

AlzBase : http://alz.big.ac.cn/alzBase(阿尔茨海默症/GEO)

14.其他数据库
Autophagy:http://www.autophagy.lu/index.html 自噬数据库

eFORGE:https://eforge.altiusinstitute.org/ 表观遗传数据库

CellMarker:http://biocc.hrbmu.edu.cn/CellMarker/ 细胞标志物数据库

COSMIC:https://cancer.sanger.ac.uk/cosmic/ 癌症体细胞突变数据库

二.样本数据库
1.样本存储数据库
GEO : https://www.ncbi.nlm.nih.gov/geo/ (2020)大型/众多疾病

TCGA : https://portal.gdc.cancer.gov/ (2020)肿瘤

ICGC : https://dcc.icgc.org (2020)肿瘤

CGGA : http://www.cgga.org.cn/download.jsp 胶质瘤

CPTAC : https://cptac-data-portal.georgetown.edu 肿瘤蛋白质组数据库

Treehouse : https://treehousegenomics.soe.ucsc.edu/public-data/#v9publicpolya 儿童肿瘤

CCEL : https://portals.broadinstitute.org/ccle 肿瘤细胞株

cbioportal : http://www.cbioportal.org/ 肿瘤

Protein Atlas : http://www.proteinatlas.org/ 免疫组化数据库/肿瘤

GTEx : https://www.gtexportal.org/home/index.html 正常样本

Cistrome : http://cistrome.org/db/#/ (2020)表观组数据

ReMap : http://tagc.univ-mrs.fr/remap/index.php ChIPseq数据

HMP : https://portal.hmpdacc.org/ 人类菌群数据

PanglaoDB : https://panglaodb.se/index.html 单细胞转录组/表达/亚群marker

2.分析平台
NetworkAnalyst : https://www.networkanalyst.ca /芯片/RNAseq

GREIN : www.ilincs.org/apps/grein/ GEO-array/RNAseq-预分析

BioJupies :https://amp.pharm.mssm.edu/biojupies/ RNAseq

IRIS-EDA : http://bmbl.sdstate.edu/IRIS/ RNAseq/scRNA-seq

iDEP.85 : http://bioinformatics.sdstate.edu/idep/ 芯片/RNAseq

Granatum : http://granatum.dcmb.med.umich.edu:8102/?state_id=c11e507cd31c35d0&tab=info 单细胞测序

MicrobiomeAnalyst : https://www.microbiomeanalyst.ca 微生物组学

Microbializer : https://microbializer.tau.ac.il 微生物组学

3.基于GEO/TCGA开发的数据库
GEO2R : https://www.ncbi.nlm.nih.gov/geo/geo2r/ 差异分析/芯片编号

BART : http://igc1.salk.edu:3838/bart/ 差异分析/芯片编号/原始文件

ImaGEO : http://bioinfo.genyo.es/imageo/ meta/芯片编号

R2 : https://hgserver1.amc.nl/cgi-bin/r2/main.cgi 多种分析

CRN : http://syslab4.nchu.edu.tw/ 肿瘤相关

Lung cancer Explorer:http://lce.biohpc.swmed.edu/lungcancer/index.php#page-top 肺癌

GEPIA : http://gepia.cancer-pku.cn/ 表达/预后/相关性

Oncomine : https://www.oncomine.org/resource/login.html 表达/预后/相关性

UALCAN : http://ualcan.path.uab.edu/index.html 表达/预后/相关/甲基化

LinkedOmics : http://www.linkedomics.org/login.php 表达/相关/甲基化

TRGAted : https://nborcherding.shinyapps.io/TRGAted/ 预后/OS/DFS/DFI

KM plotter : http://kmplot.com/analysis/ 预后/mRNA/miRNA

MethSurv : https://biit.cs.ut.ee/methsurv/ 甲基化预后

MethHC : http://methhc.mbc.nctu.edu.tw/php/index.php 甲基化-表达

MEXPRESS : https://mexpress.be/ 甲基化

Lung cancer Explorer:http://lce.biohpc.swmed.edu/lungcancer/index.php#page-top 肺癌

HCMDB:http://hcmdb.i-sanger.com/index 人肿瘤转移数据

三.交互数据库
1.RNA-DNA数据库
LongTarget : http://lncrna.smu.edu.cn/ R-loop

R-loopDB : http://rloop.bii.a-star.edu.sg/ (R-loop)

2.(RNA-RNA) miRNA-RNA数据库

ENCORI : http://starbase.sysu.edu.cn/ (ceRNA)

TargetScan : http://www.targetscan.org/vert_72/ ceRNA

miRWalk : http://mirwalk.umm.uni-heidelberg.de/ (整合型)

TarBase : http://carolina.imis.athena-innovation.gr/diana_tools/web/index.php?r=tarbasev8%2Findex pub

miRTarBase : http://mirtarbase.mbc.nctu.edu.tw/php/index.php (预测)

LncBase : http://carolina.imis.athena-innovation.gr/diana_tools/web/index.php?r=lncbasev2%2Findex 预测/lncRNA

LncACTdb 2.0 : http://www.bio-bigdata.net/LncACTdb/index.html pub/预测/ceRNA

miRTissue : http://150.145.111.118:3838/mirTissue/ 交互的影响

3.蛋白-DNA) 转录因子数据库
JASPAR :http://jaspar.genereg.net/ (2020)

AnimalTFDB : http://bioinfo.life.hust.edu.cn/AnimalTFDB/#!/ 找TF

Unibind : https://unibind.uio.no 转录因子信息

iTIS-PseTNC : http://lin-group.cn/server/iTIS-PseTNC 预测TSS

dbtoolkit : http://dbtoolkit.cistrome.org/ TF预测

ChIPBase : http://rna.sysu.edu.cn/chipbase/index.php (TF-ncRNA/蛋白/共表达)

ChIP-Atlas : http://chip-atlas.org/ TF找靶分子

TRRUST : www.grnpedia.org/trrust/ pub/预测?

miRGen : http://carolina.imis.athena-innovation.gr/diana_tools/web/index.php?r=mirgenv3%2Findex TF-miRNA

TransmiR : http://www.cuilab.cn/transmir TF-miRNA

mirTrans : https://mcube.nju.edu.cn/jwang/lab/soft/mirtrans/ TF-miRNA

4.(蛋白-DNA) 增强子数据库
EnhancerDB : http://lcbb.swjtu.edu.cn/EnhancerDB/ 增强子-TF-基因/miRNA

HACER : http://bioinfo.vanderbilt.edu/AE/HACER/ 增强子-TF-靶基因

EnhancerAtlas :http://www.enhanceratlas.org/CONTACT 增强子-基因

TiED : https://lcbb.swjtu.edu.cn/TiED 组织特异性/TF/靶分子/SNP

HEDD :http://zdzlab.einstein.yu.edu/1/hedd.php (增强子-疾病)

5.蛋白-蛋白数据库
STRING : https://string-db.org/cgi/input.pl (蛋白-蛋白互作网络)

BioGRID : https://thebiogrid.org/ pub

APID :http://apid.dep.usal.es (pub/实验)

OLS:https://www.ebi.ac.uk/ols/ontologies/mi

HDOCK :http://hdock.phys.hust.edu.cn/ (预测/蛋白-蛋白)

InterEvDock2 : https://bioserv.rpbs.univ-paris-diderot.fr/services/InterEvDock2/ 预测

6.药物-蛋白数据库
DGIdb :http://www.dgidb.org/ (药物-基因)

NRDTD : (药物-ncRNA)

ETCM : http://bionet.ncpsb.org/batman-tcm/ 中药/靶分子/功能/疾病

BATMAN-TCM : http://bionet.ncpsb.org/batman-tcm/ 中药/靶分子/功能/疾病

TCMSP : https://lsp.nwu.edu.cn/ 中药成分/靶分子/疾病

SEA:http://sea.bkslab.org/ 预测药物靶点

SuperPred:http://prediction.charite.de/ 预测药物靶点

KINOME: https://kinome.dddc.ac.cn/en/ 预测药物调控激酶

VARIDT:http://varidt.idrblab.net/ttd/ 药物转运体数据库

7.肿瘤微环境数据库
CIBERSORT : https://cibersort.stanford.edu/ 免疫浸润

TIMER : http://timer.cistrome.org/ 免疫浸润

TISIDB : http://cis.hku.hk/TISIDB/ 基因-免疫细胞

CancerSEA : http://biocc.hrbmu.edu.cn/CancerSEA/ 肿瘤单细胞

四.富集数据库
1.功能数据库
Metascape : https://metascape.org/gp/index.html 富集分析

DAVID : https://david.ncifcrf.gov/ 富集分析

WebGestalt : http://www.webgestalt.org/ ORA/GSEA/NTA

TAM : http://www.lirmed.com/tam2/ miRNA富集分析

GSEA : https://www.gsea-msigdb.org/gsea/index.jsp GSEA

Enrichr : http://amp.pharm.mssm.edu/Enrichr/ 富集

KOBAS : http://kobas.cbi.pku.edu.cn/index.php 聚类

g: Profiler : https://biit.cs.ut.ee/gprofiler/ 聚类/ID转换

OmicsNet : www.omicsnet.ca 网络构建

FunRich:http://funrich.org/download

2.通路数据库
KEGG : https://www.kegg.jp 通路

Reactome : https://reactome.org/ 通路

Pathview : https://reactome.org/ 通路/可视化

五.实验数据库
1.试剂数据库
CiteAb : https://www.citeab.com/ 抗体

BenchSci : https://www.benchsci.com 抗体

Labome : https://www.labome.com/index.html 抗体/siRNA

Selleckchem : https://www.selleck.cn/ 抑制剂

CRISPRlnc : http://www.crisprlnc.org/ crispr/lncRNA

MRPrimerW2 : http://mrprimerw2.com/ qPCR引物

ChIPprimersDB : https://www.chipprimers.com ChIP-PCR引物

PrimerBank:https://pga.mgh.harvard.edu/primerbank/ qPCR引物

Addgene:http://www.addgene.org/ 载体信息共享网站

2.实验protocol数据库
Jove : https://www.jove.com 视频/权限

bio-protocol : https://bio-protocol.org/cn/default.aspx protocol

Current Protocols : https://currentprotocols.onlinelibrary.wiley.com/ protocol

Nature protocol : https://www.nature.com/nprot/ protocol

Springer Protocols : https://experiments.springernature.com/springer-protocols-closure protocol

Cold Spring Harbor Protocols : http://cshprotocols.cshlp.org/ protocol

cirRNA

https://mp.weixin.qq.com/s/bzDfU_5w5un5UH_V2k4GRw

你可能感兴趣的:(生物信息学)