利用随机森林模型对大批量质控样本进行回归校正

We provide a free web-based toolbox to implement SERRFbased normalizations (http://serrf.fiehnlab.ucdavis.edu).

从代码分析来看,模型如文章所述,对每一个QC中的化合物拟合了批次、进样顺序、以及其他化合物响应值这3个变量,其中特殊之处在于考虑了化合物之间的相关性,将QC样本作为train,真实样本作为target,对train和target分别计算了两两变量之间的spearman相关性,接着,用相关性对变量进行降序排列,找到相关性最强、且在train和target中重合的10个变量作为随机森林的自变量(所谓的“其他”)。至于为什么选10个变量,文章并没有提及。

你可能感兴趣的:(利用随机森林模型对大批量质控样本进行回归校正)