蛋白组分析---用Persues进行后续分析

1. 上文中,我们用Maxquant软件分析了.raw数据,最终得到了个txt命名的文件,长这样:
proteinGroups.txt是用来后续分析的软件
2. 接下来,我们下载并打开Persues软件:
部分汉化的一个不伦不类的软件,让具有强迫症的我心里刺挠
3. 我们导入刚刚的文件:
很简单的

PS:
因为Persues是Maxquant的配套软件,其可用于但不限于Maxquant软件的后续分析,因此,Persues可以自动识别Maxquant的结果文件,并将关键的信息进行分类:Numerical(数据型变量)、Categorical(分类型变量)、Text(信息型变量)和Main(主要分析变量,主要是蛋白组的关键信息)等几个关键的分类指标。

4. 我们将衡量蛋白丰度的关键性变量导入到Main这个表格中,然后选择OK:

LFQ intensity___

得到标准的处理界面:
3个窗口的界面

左侧:处理的数据矩阵;中间:流程图流程;右侧:矩阵的关键信息

5. 接下来就是数据过滤
5.1. 过滤受到污染的蛋白(这是基于Categorical指标的)
选对分类指标,mode

得到的过滤后的结果:


行数由2633行缩减到2539行
5.2. 过滤多肽列大于1的多肽(目的是找出独立的多肽列)
image.png

得到的过滤后的结果:


行数由2539行缩减到2233行
5.3. 过滤反库的序列
image.png

得到的过滤后的结果:


行数由2233行缩减到2225行
6. 7数据转换
对Main中的主要数据进行log2(x)的转换

得到的结果:


可以发现是取对数之后的结果
7. 缺失值(6个样本中最多不能缺失超过2个)
过滤有效值,6个样本中有效值至少大于等于4

得到的过滤后的结果:


行数由2225行缩减到1801行
8. 缺失值的填充
基于每一列分布的缺失值的填充

可以看到起先显示NaN的被填充上了数据
9. 最后是T检验和FDR检验
9.1. 对样本列进行注释,区分实验组和对照组
这里我们区分了两个组其中一个是FGP,另一个是VGP

可以看到显示出了分组类型
9.2. 接着进行两样本Student t检验
选定对照组和实验组

image.png
10. 将分析好的数据进行导出
选择导出的文件夹,导出文本格式的矩阵
参考文章:
  1. https://cloud.tencent.com/developer/article/1489812

你可能感兴趣的:(蛋白组分析---用Persues进行后续分析)