自学生物信息学(思维+超全常用网站)

如果你有以下情况,你可以做什么?

  • 一个基因或一种蛋白质
    • 1、在DNA水平上
    • 2、在转录层面
    • 3、在蛋白质水平上
  • 一组基因/蛋白质
  • 芯片
  • 高通量测序数
  • 一系列测序数据
  • 生物学问题

一个基因或一种蛋白质

1、在DNA水平上

这个基因的基因组位置是什么?
它是否有串联复制的副本?
基因的外显子/内含子结构是什么?
基因内是否有可转座子元素?
表观遗传学条例?
转录因子结合?

  • geneXplain TRANSFAC功能数据库(转录因子、它们在基因组上的结合位点和与DNA结合的profiles的数据库)
  • Softberry在线比对寻找生物启动子和启动子模型

2、在转录层面

该基因是否有替代剪接?
该基因是否有替代启动子?
替代多腺苷酸化部位?
RNA编辑?
转录效率和GC含量?
由miRNAs调节?反义RNAs?piRNAs?

  • miRBase数据库(提供了285个物种中已知的所有miRNA信息)

该基因的表达模式是什么?

  • GEO,国际公共数据库(收录并整理了全球范围内研究工作者上传的微阵列芯片、二代测序及其他形式的高通量基因组数据)
  • ENCODE,DNA元素百科全书(为了解基因组当中的调控反应,利用高通量的测序技术来进行分析的

自学生物信息学(思维+超全常用网站)_第1张图片

  • GTExPortal,基因的多器官组织表达量分布图

RNA修饰是否影响基因的功能?

  • THE RNA INSTITUTE,RNA Modification Database,收录RNA

3、在蛋白质水平上

该蛋白是否有保守的结构域?
该蛋白的亚细胞定位是什么?
二级结构?
三维结构?
蛋白质变性?
与其他蛋白质的相互作用?

  • RCSB PDB,蛋白质结构数据库
  • UniPort,蛋白质数据库(包含蛋白质序列,功能信息,研究论文索引,EBI)
  • THE HUMAN PROTEIN ATLAS,人类蛋白图谱(查询蛋白在各种组织、细胞中的表达)
  • SMART(用于蛋白质结构域鉴定、注释的在线分析工具,数据与UniProt、Ensembl和STRING数据库同步)
  • ExPASy(大型综合性在线工具,用于生物信息学的在线工具合集,从基因组学、蛋白质组学和结构生物学,到进化和系统发育、系统生物学和医学化学,自动与每个资源的最新版本保持一致)

一组基因/蛋白质

序列相似性搜索,多重序列比对

  • Clustal多重序列比对

系统发育树的构建——MEGA等
常见motif搜索

  • TRANSFAC功能数据库
  • MEME suite,motif挖掘和分析工具(从批量数据中鉴定出某些保守的motif)
  • WEBLoGo(基于多序列比对,以图形的形式将保守区域展示出来,总高度表示此位置上的序列保守性,单个碱基代表出现的频率。seqlogo图可以直观清晰的反应序列偏好特征,每个位置出现的碱基或氨基酸类型反映了该位置序列的偏好性,每个字母的大小与该碱基在该位置上的出现频率成正相关。这种表现方式对研究转录因子结合、RNA修饰等有重要指导意义,时常被应用到论文中)

调节通路/机理分析——DAVID、Gene spring、Pathway Studio

  • DAVID(在线免费分析软件,可以为大规模的基因或蛋白列表提供系统综合的生物功能注释信息,主要用于差异基因的功能和通路富集分析)
  • Gene ontology consortium(适用于各种物种的、对基因和蛋白功能进行限定和描述的,并能随着研究不断深入而更新的语义词汇标准。分别从分子功能、参与的生物途径及细胞中的定位对基因产物进行了标准化描述,一个基因对应有一个或多个GO term(GO功能),一个term对应多个gene。)
  • GOEAST(生成具有详细信息的表格和图形输出、支持对最多3个实验的GO术语富集状态进行比较、支持对最多3个实验的GO术语富集状态进行比较)

芯片

检查杂交数据的质量
鉴定差异表达基因(Bioconductor, GeneSpring)
异表达基因之间的相关性(Pathway调控–DAVID;Gene function correlations功能–Gene Ontology)

高通量测序数

  • ISRNA
  • Expression Atlas(查询基因、lncRNA、microRNA等分子在各种条件、各种疾病中的本底和差异表达)
  • GENEVESTIGATOR,基因研究的网站(查看大量关于基因研究的数据和文章,例如基因表达、数组表达式等,还有关于生物扰动作用和相关研究报告等信息)

一系列测序数据

  • galaxy线生信分析平台
  • genepattern(强大的基因组学分析平台,该平台整合了大量的基因表达分析、蛋白质组学分析、SNP分析、流式细胞分析、RNA-seq数据分析等)
  • Plob(专注于生物信息相关领域“图书馆”,它主要专注于收集、整理和记录生物信息学、基因组学、转录组学、蛋白质组学等相关领域的资料)
  • BioGRID(公开的数据库,主要记录、整理包括蛋白、遗传和化学互作的数据,涵盖人类和所有主要的模式生物。)

生物学问题

找出与你的问题相关的基因/蛋白质
使用所有可用的工具和资源(BioTools技术服务)

  • Tufts
  • Github

你可能感兴趣的:(数据库)