说来惭愧,感觉读到研究生,说来说去张口闭口也就是TCGA、GEO、ARRAYEXPRESS、GTEX数据库,感觉还不如一些临床医生自学生物信息学的,平常都没去探索一些新的数据库,这边做个记录.黑色部分代表我查到的简介,而红色部分则表示我的个人看法,其实这个关于数据也有别人写过教程了https://mp.weixin.qq.com/s/rNOIuXTqh-xJg2oj3AlRDA
GEO数据库全称GENE EXPRESSION OMNIBUS,是由美国国立生物技术信息中心NCBI创建并维护的基因表达数据库。它收录了世界各国研究机构提交的高通量基因表达数据,目前已经发表的论文中涉及到的基因表达检测的数据可以通过这个数据库中找到,并且免费提供下载
数据类型包括各种物种的各种组学的数据,可以说非常全面的一个平台了,但是有时需要注意作者可能会上传一些错误的数据上去,所以拿到数据之后还需要进行质控
网址:https://www.ncbi.nlm.nih.gov/geo/
TCGA是基因中碱基的缩写,所以看名字大家也就能知道这个数据库是基因测序的信息库,其全称是TheCancer Genome Atlas(TCGA)计划,由美国美国国家癌症和肿瘤研究所(NCI)和国家人类基因组研究所(NHGRI)于2006年联合启动,第一阶段三年耗资1亿美元,收集多形性成胶质细胞瘤和卵巢癌的数据,将肿瘤组织与癌旁组织进行测序。2009年再投2.75亿美元对20多种肿瘤进行大规模研究,目前有20多种组织类型的30多种癌症11000多个病人的临床与基因信息。
TCGA数据库可以说是我最常用的数据库之一了,主要是泛癌分析部分
https://mp.weixin.qq.com/s/2ny_QLvK-Rl8G3UNcwoodg-这篇推文包括了如何下载数据的教程,但是是一个个数据下载的样式。
ICGC(International Cancer Genome Consortium,国际肿瘤基因组协作组),收集了50种不同癌种的数据,其中包括基因异常表达,体细胞突变,表观遗传修饰,临床数据等,是除TCGA外研究肿瘤的又一利器!
MSK-IMPACT检测1万余例晚期癌症
的结果。
这个下载界面在
但是也只能一个个下载
一.信息类数据库
1.综合型数据库
NCBI:https://www.ncbi.nlm.nih.gov/
UCSC:http://genome.ucsc.edu/ (基因组浏览器)
Ensembl : http://asia.ensembl.org/index.html
Genecards : https://www.genecards.org/
BioGPS : http://biogps.org/#goto=welcome 大型综合数据库
MGD : http://www.informatics.jax.org/ 小鼠基因组
2.蛋白数据库
UniProt :https://www.uniprot.org/ 蛋白信息
SMART : http://smart.embl-heidelberg.de/ 信息/结构域/修饰/互作
CR2Cancer : http://cis.hku.hk/CR2Cancer/ 信息/表达/甲基化/CNV/预后/…
COBALT : https://www.ncbi.nlm.nih.gov/tools/cobalt/re_cobalt.cgi 保守性
Clustalo : https://www.ebi.ac.uk/Tools/msa/clustalo/ 保守性
ClustalW : https://www.ebi.ac.uk/Tools/msa/clustalo/ 保守性
multalin : http://multalin.toulouse.inra.fr/multalin/ 保守性
InterPro : http://www.ebi.ac.uk/interpro/ motif分析
PROSITE : https://prosite.expasy.org/ motif分析
ELM : http://elm.eu.org/ motif分析
NLSdb : https://rostlab.org/services/nlsdb/ 核定位
iACP : http://lin-group.cn/server/iACP 预测抗癌肽
3.-miRNA数据库
miRBase : http://www.mirbase.org/ 信息
Tools4miRs : https://tools4mirs.org 整合型
mirPath :http://snf-515788.vm.okeanos.grnet.gr/ 通路
miRPathDB : https://mpd.bioinf.uni-sb.de/ 通路
HMDD : http://www.cuilab.cn/hmdd pub/疾病
MISIM : http://www.lirmed.com/misim/Home 预测/疾病
Oncomir : http://www.oncomir.org/ 肿瘤/表达预后
miRNACancerMap : http://cis.hku.hk/miRNACancerMAP/ 肿瘤/表达预后
DIANA Tools : http://diana.imis.athena-innovation.gr/DianaTools/index.php?r=site/page&view=software 功能/机制
ENCORI : http://starbase.sysu.edu.cn/ ceRNA
4.lncRNA数据库
noncode : http://www.noncode.org/ 信息
lncrnadb : http://www.lncrnadb.org/ 信息
lncipedia : http://www.lncrnadb.org/ 信息
LncBook : http://bigd.big.ac.cn/lncbook/index 信息
AnnoLnc :http://annolnc.cbi.pku.edu.cn 信息/表达/机制
Rsite2 : http://www.cuilab.cn/rsite2 结构
RNA-MoIP : http://rnamoip.cs.mcgill.ca/ 结构
TANRIC : https://bioinformatics.mdanderson.org/public-software/tanric/ 肿瘤/表达
lnCAR :https://lncar.renlab.org 表达/结构
Lnc2Cancer : http://www.bio-bigdata.net/lnc2cancer/ pub/表达/表型
lncRNADisease : http://www.rnanut.net/lncrnadisease/ pub/疾病
HDncRNA : http://hdncrna.cardiacdev.com/ pub/心血管
iLoc-LncRNA : http://lin-group.cn/server/iLoc-LncRNA/ 定位/预测/Fasta
lncLocator : http://www.csbio.sjtu.edu.cn/bioinf/lncLocator/# 定位/预测/Fasta
RNAlocate :http://www.rna-society.org/rnalocate/index.html 定位/检索
lncATLAS : http://lncatlas.crg.eu/定位/基于测序
Co-LncRNA : https://www.lncrnablog.com/tag/co-lncrna/ 功能/相关性
LncBase : http://carolina.imis.athena-innovation.gr/diana_tools/web/index.php?r=lncbasev2/index-predicted ceRNA
LncTar : http://www.cuilab.cn/lnctar lncRNA-RNA
LncTar: a tool for predicting the RNA targets of long noncoding RNAs
Lnc2Meth : http://bio-bigdata.hrbmu.edu.cn/Lnc2Meth/ 甲基化
LncRNASNP2 : http://bioinfo.life.hust.edu.cn/lncRNASNP#!/ SNP/CNV/突变
LncRNA2Target : http://www.lncrna2target.org lncRNA-蛋白/miRNA
LNCediting : http://bioinfo.life.hust.edu.cn/LNCediting/ A-to-I
5.circRNA数据库
circBase : http://www.circbase.org/ 信息
circbank : http://www.circbank.cn/help.html 信息/ceRNA
CIRCpedia : https://www.picb.ac.cn/rnomics/circpedia/ 信息/保守性
circAtlas : http://circatlas.biols.ac.cn/ 信息/ceRNA/RBP
CircInteractome : https://circinteractome.nia.nih.gov 信息/ceRNA/RBP/siRNA
circRNADb : http://reprod.njmu.edu.cn/circrnadb 信息/编码蛋白
CircFunBase : http://bis.zju.edu.cn/CircFunBase/ 信息/功能/蛋白/miRNA
TSCD : http://gb.whu.edu.cn/TSCD/ 组织特异性分析
CSCD : http://gb.whu.edu.cn/CSCD/ 肿瘤特异性分析
circRNADisease : http://cgga.org.cn:9091/circRNADisease/ pub/疾病
TRCirc : http://www.licpathway.net/TRCirc/view/index 转录因子-circ
ENCORI : http://starbase.sysu.edu.cn/ ceRNA/RBP
6.外泌体数据库
EVmiRNA : http://bioinfo.life.hust.edu.cn/EVmiRNA#!/ miRNA
exoRBase : http://www.exorbase.org/ 血液/mRNA/lnc/circ
miRandola : http://mirandola.iit.cnr.it/ RNA/疾病-高通量
7.假基因数据库
dreamBase : http://rna.sysu.edu.cn/dreamBase/ 整合型/表达/组蛋白修饰/RNA修饰/蛋白结合/miRNA
8.融合基因数据库
ChimerDB : http://ercsb.ewha.ac.kr/fusiongene/整合型/pub+预测
COSMIC Fusion : https://cancer.sanger.ac.uk/cosmic/fusion pub
9.DNA修饰数据库
AWESOME :http://www.awesome-hust.com/ snp
Pancan-meQTL : http://gong_lab.hzau.edu.cn/Pancan-meQTL/ SNP/甲基化-生存/调控
iDNA6mA-PseKNC : http://lin-group.cn/server/iDNA6mA-PseKNC N6甲基化/Fasta
MethBank : https://bigd.big.ac.cn/methbank/ 甲基化/多物种/注释库
10 RNA修饰数据库
RMBase :http://rna.sysu.edu.cn/rmbase/ RNA修饰/SNP
m6AVar : http://m6avar.renlab.org/ m6A
WHISTLE : http://180.208.58.19/whistle/index.html m6A/预测
iRNA-3typeA :http://lin-group.cn/server/iRNA-3typeA.php m1A/m6A/A-to-I/预测
LNCediting : http://bioinfo.life.hust.edu.cn/LNCediting/ A-to-I
11.蛋白修饰数据库
PTMD : http://ptmd.biocuckoo.org/ 修饰-疾病
Phosphonet : http://www.phosphonet.ca/ 磷酸化
PhosphositePlus : https://www.phosphosite.org/homeAction.action 磷酸化
qPhos : http://qphos.cancerbio.info/ 磷酸化
GPS : http://gps.biocuckoo.cn/index.php 磷酸化
GPS-MSP : http://msp.biocuckoo.org/index.php 蛋白甲基化
12.药物数据库
DGIdb : http://www.dgidb.org/ 药物-基因
Pubchem : https://pubchem.ncbi.nlm.nih.gov/ 化合物/信息/结构
CTD : http://ctdbase.org/ 信息/化合物/互作
NRDTD :http://chengroup.cumt.edu.cn/NRDTD/ 药物-ncRNA
ETCM : http://www.tcmip.cn/ETCM/ 中药/靶分子/功能/疾病
BATMAN-TCM : http://bionet.ncpsb.org/batman-tcm/ 中药/靶分子/功能/疾病
TCMSP : https://lsp.nwu.edu.cn/ 中药成分/靶分子/疾病
TCMID : http://119.3.41.228:8000/tcmid/ 中药信息
SymMap : https://www.symmap.org/ 整合型
VigiBase :https://www.who-umc.org/vigibase/vigilyze/ 药物不良数据库
13.疾病数据库
HMDD : http://www.cuilab.cn/hmdd (疾病/miRNA/靶分子)
lncRNADisease : http://www.rnanut.net/lncrnadisease/ (疾病/lncRNA)
circRNADisease : http://cgga.org.cn:9091/circRNADisease/ (疾病/circRNA)
HDncRNA :http://hdncrna.cardiacdev.com (心血管疾病/ncRNA)
OsteoporosAtlas : http://biokb.ncpsb.org/osteoporosis/ (骨质疏松/基因/miRNA)
AlzBase : http://alz.big.ac.cn/alzBase(阿尔茨海默症/GEO)
14.其他数据库
Autophagy:http://www.autophagy.lu/index.html 自噬数据库
eFORGE:https://eforge.altiusinstitute.org/ 表观遗传数据库
CellMarker:http://biocc.hrbmu.edu.cn/CellMarker/ 细胞标志物数据库
COSMIC:https://cancer.sanger.ac.uk/cosmic/ 癌症体细胞突变数据库
二.样本数据库
1.样本存储数据库
GEO : https://www.ncbi.nlm.nih.gov/geo/ (2020)大型/众多疾病
TCGA : https://portal.gdc.cancer.gov/ (2020)肿瘤
ICGC : https://dcc.icgc.org (2020)肿瘤
CGGA : http://www.cgga.org.cn/download.jsp 胶质瘤
CPTAC : https://cptac-data-portal.georgetown.edu 肿瘤蛋白质组数据库
Treehouse : https://treehousegenomics.soe.ucsc.edu/public-data/#v9publicpolya 儿童肿瘤
CCEL : https://portals.broadinstitute.org/ccle 肿瘤细胞株
cbioportal : http://www.cbioportal.org/ 肿瘤
Protein Atlas : http://www.proteinatlas.org/ 免疫组化数据库/肿瘤
GTEx : https://www.gtexportal.org/home/index.html 正常样本
Cistrome : http://cistrome.org/db/#/ (2020)表观组数据
ReMap : http://tagc.univ-mrs.fr/remap/index.php ChIPseq数据
HMP : https://portal.hmpdacc.org/ 人类菌群数据
PanglaoDB : https://panglaodb.se/index.html 单细胞转录组/表达/亚群marker
2.分析平台
NetworkAnalyst : https://www.networkanalyst.ca /芯片/RNAseq
GREIN : www.ilincs.org/apps/grein/ GEO-array/RNAseq-预分析
BioJupies :https://amp.pharm.mssm.edu/biojupies/ RNAseq
IRIS-EDA : http://bmbl.sdstate.edu/IRIS/ RNAseq/scRNA-seq
iDEP.85 : http://bioinformatics.sdstate.edu/idep/ 芯片/RNAseq
Granatum : http://granatum.dcmb.med.umich.edu:8102/?state_id=c11e507cd31c35d0&tab=info 单细胞测序
MicrobiomeAnalyst : https://www.microbiomeanalyst.ca 微生物组学
Microbializer : https://microbializer.tau.ac.il 微生物组学
3.基于GEO/TCGA开发的数据库
GEO2R : https://www.ncbi.nlm.nih.gov/geo/geo2r/ 差异分析/芯片编号
BART : http://igc1.salk.edu:3838/bart/ 差异分析/芯片编号/原始文件
ImaGEO : http://bioinfo.genyo.es/imageo/ meta/芯片编号
R2 : https://hgserver1.amc.nl/cgi-bin/r2/main.cgi 多种分析
CRN : http://syslab4.nchu.edu.tw/ 肿瘤相关
Lung cancer Explorer:http://lce.biohpc.swmed.edu/lungcancer/index.php#page-top 肺癌
GEPIA : http://gepia.cancer-pku.cn/ 表达/预后/相关性
Oncomine : https://www.oncomine.org/resource/login.html 表达/预后/相关性
UALCAN : http://ualcan.path.uab.edu/index.html 表达/预后/相关/甲基化
LinkedOmics : http://www.linkedomics.org/login.php 表达/相关/甲基化
TRGAted : https://nborcherding.shinyapps.io/TRGAted/ 预后/OS/DFS/DFI
KM plotter : http://kmplot.com/analysis/ 预后/mRNA/miRNA
MethSurv : https://biit.cs.ut.ee/methsurv/ 甲基化预后
MethHC : http://methhc.mbc.nctu.edu.tw/php/index.php 甲基化-表达
MEXPRESS : https://mexpress.be/ 甲基化
Lung cancer Explorer:http://lce.biohpc.swmed.edu/lungcancer/index.php#page-top 肺癌
HCMDB:http://hcmdb.i-sanger.com/index 人肿瘤转移数据
三.交互数据库
1.RNA-DNA数据库
LongTarget : http://lncrna.smu.edu.cn/ R-loop
R-loopDB : http://rloop.bii.a-star.edu.sg/ (R-loop)
2.(RNA-RNA) miRNA-RNA数据库
ENCORI : http://starbase.sysu.edu.cn/ (ceRNA)
TargetScan : http://www.targetscan.org/vert_72/ ceRNA
miRWalk : http://mirwalk.umm.uni-heidelberg.de/ (整合型)
TarBase : http://carolina.imis.athena-innovation.gr/diana_tools/web/index.php?r=tarbasev8%2Findex pub
miRTarBase : http://mirtarbase.mbc.nctu.edu.tw/php/index.php (预测)
LncBase : http://carolina.imis.athena-innovation.gr/diana_tools/web/index.php?r=lncbasev2%2Findex 预测/lncRNA
LncACTdb 2.0 : http://www.bio-bigdata.net/LncACTdb/index.html pub/预测/ceRNA
miRTissue : http://150.145.111.118:3838/mirTissue/ 交互的影响
3.蛋白-DNA) 转录因子数据库
JASPAR :http://jaspar.genereg.net/ (2020)
AnimalTFDB : http://bioinfo.life.hust.edu.cn/AnimalTFDB/#!/ 找TF
Unibind : https://unibind.uio.no 转录因子信息
iTIS-PseTNC : http://lin-group.cn/server/iTIS-PseTNC 预测TSS
dbtoolkit : http://dbtoolkit.cistrome.org/ TF预测
ChIPBase : http://rna.sysu.edu.cn/chipbase/index.php (TF-ncRNA/蛋白/共表达)
ChIP-Atlas : http://chip-atlas.org/ TF找靶分子
TRRUST : www.grnpedia.org/trrust/ pub/预测?
miRGen : http://carolina.imis.athena-innovation.gr/diana_tools/web/index.php?r=mirgenv3%2Findex TF-miRNA
TransmiR : http://www.cuilab.cn/transmir TF-miRNA
mirTrans : https://mcube.nju.edu.cn/jwang/lab/soft/mirtrans/ TF-miRNA
4.(蛋白-DNA) 增强子数据库
EnhancerDB : http://lcbb.swjtu.edu.cn/EnhancerDB/ 增强子-TF-基因/miRNA
HACER : http://bioinfo.vanderbilt.edu/AE/HACER/ 增强子-TF-靶基因
EnhancerAtlas :http://www.enhanceratlas.org/CONTACT 增强子-基因
TiED : https://lcbb.swjtu.edu.cn/TiED 组织特异性/TF/靶分子/SNP
HEDD :http://zdzlab.einstein.yu.edu/1/hedd.php (增强子-疾病)
5.蛋白-蛋白数据库
STRING : https://string-db.org/cgi/input.pl (蛋白-蛋白互作网络)
BioGRID : https://thebiogrid.org/ pub
APID :http://apid.dep.usal.es (pub/实验)
OLS:https://www.ebi.ac.uk/ols/ontologies/mi
HDOCK :http://hdock.phys.hust.edu.cn/ (预测/蛋白-蛋白)
InterEvDock2 : https://bioserv.rpbs.univ-paris-diderot.fr/services/InterEvDock2/ 预测
6.药物-蛋白数据库
DGIdb :http://www.dgidb.org/ (药物-基因)
NRDTD : (药物-ncRNA)
ETCM : http://bionet.ncpsb.org/batman-tcm/ 中药/靶分子/功能/疾病
BATMAN-TCM : http://bionet.ncpsb.org/batman-tcm/ 中药/靶分子/功能/疾病
TCMSP : https://lsp.nwu.edu.cn/ 中药成分/靶分子/疾病
SEA:http://sea.bkslab.org/ 预测药物靶点
SuperPred:http://prediction.charite.de/ 预测药物靶点
KINOME: https://kinome.dddc.ac.cn/en/ 预测药物调控激酶
VARIDT:http://varidt.idrblab.net/ttd/ 药物转运体数据库
7.肿瘤微环境数据库
CIBERSORT : https://cibersort.stanford.edu/ 免疫浸润
TIMER : http://timer.cistrome.org/ 免疫浸润
TISIDB : http://cis.hku.hk/TISIDB/ 基因-免疫细胞
CancerSEA : http://biocc.hrbmu.edu.cn/CancerSEA/ 肿瘤单细胞
四.富集数据库
1.功能数据库
Metascape : https://metascape.org/gp/index.html 富集分析
DAVID : https://david.ncifcrf.gov/ 富集分析
WebGestalt : http://www.webgestalt.org/ ORA/GSEA/NTA
TAM : http://www.lirmed.com/tam2/ miRNA富集分析
GSEA : https://www.gsea-msigdb.org/gsea/index.jsp GSEA
Enrichr : http://amp.pharm.mssm.edu/Enrichr/ 富集
KOBAS : http://kobas.cbi.pku.edu.cn/index.php 聚类
g: Profiler : https://biit.cs.ut.ee/gprofiler/ 聚类/ID转换
OmicsNet : www.omicsnet.ca 网络构建
FunRich:http://funrich.org/download
2.通路数据库
KEGG : https://www.kegg.jp 通路
Reactome : https://reactome.org/ 通路
Pathview : https://reactome.org/ 通路/可视化
五.实验数据库
1.试剂数据库
CiteAb : https://www.citeab.com/ 抗体
BenchSci : https://www.benchsci.com 抗体
Labome : https://www.labome.com/index.html 抗体/siRNA
Selleckchem : https://www.selleck.cn/ 抑制剂
CRISPRlnc : http://www.crisprlnc.org/ crispr/lncRNA
MRPrimerW2 : http://mrprimerw2.com/ qPCR引物
ChIPprimersDB : https://www.chipprimers.com ChIP-PCR引物
PrimerBank:https://pga.mgh.harvard.edu/primerbank/ qPCR引物
Addgene:http://www.addgene.org/ 载体信息共享网站
2.实验protocol数据库
Jove : https://www.jove.com 视频/权限
bio-protocol : https://bio-protocol.org/cn/default.aspx protocol
Current Protocols : https://currentprotocols.onlinelibrary.wiley.com/ protocol
Nature protocol : https://www.nature.com/nprot/ protocol
Springer Protocols : https://experiments.springernature.com/springer-protocols-closure protocol
Cold Spring Harbor Protocols : http://cshprotocols.cshlp.org/ protocol
https://mp.weixin.qq.com/s/bzDfU_5w5un5UH_V2k4GRw