Seurat24式太极拳之10云手---为什么在使用sctransform时我们可以选择更多的PC?

十、云手
后坐扣脚 转体松勾 并步云手 开步云手 并步云手
开步云手 开步云手 扣脚云手

在标准的Seurat工作流程中,我们重点关注此数据集的10个PC,尽管我们强调指出,此参数的设置较高时,结果相似。有趣的是,我们发现使用sctransform时,通常可以通过将此参数设得更高来受益。我们认为这是因为sctransform工作流程执行了更有效的规范化,从而从数据中强烈消除了技术影响。

即使经过标准的对数归一化后,测序深度的变化仍然是一个混杂因素(请参见图1),并且这种影响会微妙地影响更高的PC。在sctransform中,此效果已大大减轻(请参见图3)。这意味着更高的PC更可能代表微妙的但与生物学相关的异质性来源-因此包括它们可能会改善下游分析。

此外,默认情况下,sctransform返回3,000个可变基因,而不是2,000。基本原理相似,其他可变特征不太可能受细胞间技术差异的驱动,而可能代表更微妙的生物学波动。通常,我们发现用sctransform生成的结果对这些参数的依赖性较小(实际上,在转录组中使用所有基因时,我们获得了几乎相同的结果,尽管这确实降低了计算效率)。这可以帮助用户生成更可靠的结果,此外,还可以使用具有相同参数设置的标准分析管道进行应用,这些参数设置可以快速应用于新的数据集:

例如,以下代码在一个命令中复制了完整的端到端工作流程:

pbmc <- CreateSeuratObject(pbmc_data) %>% PercentageFeatureSet(pattern = "^MT-", col.name = "percent.mt") %>% 
    SCTransform(vars.to.regress = "percent.mt") %>% RunPCA() %>% FindNeighbors(dims = 1:30) %>% 
    RunUMAP(dims = 1:30) %>% FindClusters()

你可能感兴趣的:(Seurat24式太极拳之10云手---为什么在使用sctransform时我们可以选择更多的PC?)