定量蛋白组生信分析

主要来源于诺禾公司文件学习笔记,略有修改,侵权删!

1)蛋白功能注释

目前提供注释的通用功能数据库主要有 GO、KEGG、COG 等。通过利用这些数据库对鉴定到的蛋白质进行功能注释,以了解不同蛋白质的功能特性,数据库注释结果统计见下图。功能注释基本步骤如下:
GO:GO 注释是将鉴定到的蛋白质利用 interproscan 软件进行分析,该软件涉及6 大知名数据库(Pfam,PRINTS, ProDom,SMART, ProSite, PANTHER)的搜索,因此会使得注释的结果更加全面。
KEGG、COG:
1) KEGG、COG 注释是将鉴定到的蛋白质进行 BLAST 比对(blastp,evalue ≤ 1e-4);
2) BLAST 结果过滤:对于每一条序列的 BLAST 结果,选取 score 最高的比对结果进行注释(图 1,2)。结构域注释(IPR)也用 interproscan 软件进行,包括 PfamProDom,SMART等结构域的数据库,利用模式结构或特征进行功能未知蛋白的结构域注释(图3)。


定量蛋白组生信分析_第1张图片
image.png

定量蛋白组生信分析_第2张图片
image.png

定量蛋白组生信分析_第3张图片
image.png

2)蛋白差异分析

Proteome Discoverer2.2 首先计算每个 PSM 的各 marker 对间的比值,然后对每个蛋白质包含的所有 unique 肽段的比值进行加权求平均值,作为该蛋白的对应 marker 对的比值。最后将待比较的不同样品的所有生物重复两两比较所得比值取中位数,作为最终样品间的差异倍数(Fold Change,FC)。将每个蛋白在两个比较对样品中的相对定量值进行了 T-test 检验,并计算相应的 p-value,以此作为显著性指标。当 FC≥1.5,同时 p-value≤0.05 时,蛋白表现为表达量显著差异(图 4)。


定量蛋白组生信分析_第4张图片
image.png

对每个样品中蛋白相对含量进行聚类分析(图 5),利用聚类热图观察不同蛋白在不同样品间比较时的上调、下调情况。每行进行了 Z 值校正,(观测值-行均值)/行标准差。


定量蛋白组生信分析_第5张图片
image.png

3)差异蛋白富集分析

将差异蛋白筛选出来后,差异蛋白数目相对较多,分析目标不明确,通过差异蛋白富集分析,可以将差异蛋白富集到参与的生物学功能或细胞通路中,从而给出差异蛋白质与哪些生物学功能显著相关或确定差异蛋白参与的最主要生化代谢途径和信号转导途径。结构域富集分析,该功能或者定位有可能与造成差异的原因有关。
GO 功能显著性富集分析给出与所有鉴定到的蛋白质背景相比,差异蛋白质中显著富集的 GO 功能条目,从而给出差异蛋白质与哪些生物学功能显著相关。

该分析首先把所有差异蛋白质向 Gene Ontology 数据库
(http://www.geneontology.org/)的各个 term 映射,计算每个 term 的蛋白质数目,然后应用超几何检验,找出与所有蛋白质背景相比,在差异蛋白质中显著富集的 GO 条目(图 6)。

定量蛋白组生信分析_第6张图片
image.png

图 6 GO 富集柱状图
KEGG Pathway 显著性富集分析方法同 GO 功能富集分析,是以 KEGG Pathway 为单位,应用超几何检验,找出与所有鉴定到蛋白背景相比,在差异蛋白中显著性富集的 Pathway。通过 Pathway 显著性富集能确定差异蛋白参与的最主要生化代谢途径和信号转导途径(图 7)。
定量蛋白组生信分析_第7张图片
image.png

图 7KEGG 富集气泡图
4)差异蛋白互作分析
利用 StringDB 蛋白质互作数据库( http://string-db.org/)进行鉴定蛋白的互作分析,若在数据库中有相应的物种,则直接提取相应物种的序列,若无,则提取近源物种的序列,然后将差异蛋白的序列与提取出的序列进行 blast 比对,得出相应的互作信息,构建网络图,网络图的例图见图 8。
定量蛋白组生信分析_第8张图片
image.png

图 8 差异蛋白互作网络图

你可能感兴趣的:(定量蛋白组生信分析)