GEO数据下载及整理

GEO中的Series Matrix File(s)通常是经过了标准化和对数转换的数据。如果表达丰度的数值在50以内,通常是经过log2转化的。如果数字在几百几千,则是未经转化的。对于是否需要标准化的问题,可以通过boxplot函数观察一下样本表达丰度值的分布是否整齐进行判断。

查看GSE数据下载界⾯中的SOFT⽂件、Series Matrix File(s)⽂件中均有描述该系列的数据是如何进⾏标准化处理的,常见的标准化处理⽅法有3种:

RMA算法、

GC-RMA算法、

MAS5算法

其中前两中算法的返回值已经经过log2转换,可直接进⾏差异表达分析,第三种算法返回值未经过log2转换,需要⾃⾏进⾏log2转换。

你可能感兴趣的:(生信,随机森林)