hello,大家好,又是周五,一周又将过去了,时间总是匆匆,片刻不停留,我们唯一能做的,就是在时间流逝的过程中,留下点印记,虽然我们穷,找不下对象,但是过的开心也是成功~~~~
今天我们来学习一个很好的分析点,空间基因表达模式与共定位(共定位可以是细胞类型的共定位,也可以是配受体的共定位),参考的文章是Scalable and model-free detection of spatial patterns and colocalization,方法非常棒,推荐给大家。
空间组学分析的一个重要步骤是表征空间表达模式和共定位。已经开发了几种方法来识别空间可变基因。Trendsceek 使用permutation test来检测点的空间分布与其基于标记点过程的表达水平之间的显著依赖性。Sepal 通过扩散时间对空间可变基因进行排序,理由是具有空间模式的基因比具有随机空间分布的基因需要更多时间才能达到同质状态。SpatialDE 和 SPARK 都利用高斯过程回归作为空间协方差结构的基础数据生成模型。SpatialDE 将表达变异性分解为空间方差和噪声,并通过比较有和没有空间分量的可能性来估计统计显著性。SPARK 通过广义线性空间误差模型扩展 SpatialDE,能够直接模拟原始计数并调整协变量。SPARK-X 检查表达式协方差矩阵和距离协方差矩阵的相似性,并测试它们是否比偶然预期的更相似。这些方法的统计能力高度依赖于空间协方差模型,即它们与真实的潜在表达模式的匹配程度。尽管考虑了多个内核,包括具有不同平滑度参数的高斯、线性和周期性内核,以确保识别各种空间模式,但统计能力将大大降低,以识别由那些预定义的内核函数建模不佳的空间模式。此外,空间协方差模型是建立在细胞距离上的,这会将真实的表达差异与由细胞密度差异驱动的表达差异混淆。考虑到细胞密度不均匀,MERINGUE 基于空间邻域图计算空间自相关和互相关,以识别空间可变基因和基因相互作用。
章节1:空间基因表达模式
library(devtools)
install_github("liuqivandy/SpaGene")
Load the library and the data
library(SpaGene)
load("BreastCancer/bc_raw.rds")###Seurat分析出来的rds
Find spatially variable genes and patterns
brain10x_sv<-SpaGene(count,location)
# the most significant spt
head(brain10x_sv$spagene_res[order(brain10x_sv$spagene_res$adjp),])
## score zval pval adjp
## COL12A1 8.48 -16.17570 3.741996e-59 5.534038e-55
## FN1 8.52 -16.06389 2.284824e-58 1.689513e-54
## COL3A1 8.72 -15.50484 1.608692e-54 7.930316e-51
## COL1A2 8.88 -15.05759 1.538985e-51 5.690014e-48
## B2M 9.16 -14.27491 1.568364e-46 3.865755e-43
## COL1A1 9.16 -14.27491 1.568364e-46 3.865755e-43
空间表达模式绘图
pattern<-FindPattern(bc_spagene)
PlotPattern(pattern,location)
Top five genes falling into each pattern
Top five genes falling into each pattern
top5<-apply(pattern$genepattern,2,function(x){names(x)[order(x,decreasing=T)][1:5]})
library(pheatmap)
pheatmap(pattern$genepattern[rownames(pattern$genepattern)%in%top5,])
章节2 :Identification of spatially colocalized ligand-receptor pairs
SpaGene 以识别由共定位配体和受体对介导的细胞间通讯。SpaGene 通过空间转录组学从示例数据中发现了 35 种配体-受体相互作用。两个最重要的配体-受体对是 Igfbp5-Cav1 (adjp=3e-31) 和 Apoe-Lrp6 (adjp=1e-18),两者都发生在 ONL 和 GL 之间。Apoe 已知富含 ONL 和 GL,并且被 SpaGene 鉴定为非常重要(adjp=1e-50)。大多数具有高 Apoe 表达的斑点都被具有高 Lrp6 表达的斑点包围,表明它们之间存在潜在的相互作用。Apoe-Lrp6 介导 Wnt 信号传导,这对于调节突触完整性和认知很重要。在 ONL 和 GL 层之间鉴定 Apoe-Lrp6 可能暗示 Wnt 信号传导在建立外围-CNS 嗅觉连接中的潜在调节。
Identify colocalized ligand-receptor pairs
load("LRpair_human.rds")
bc_lr<-SpaGene_LR(count,location,LRpair=LRpair)
# the most signficant colocalized LR pairs
head(bc_lr[order(bc_lr$adj),])
## score comm zval pval adjp
## COL1A2_ITGA11 28.36 18 -10.176989 1.256075e-24 2.348861e-21
## FN1_SDC2 28.68 19 -9.034053 8.271455e-20 7.733810e-17
## COL1A1_ITGA11 28.88 16 -8.319718 4.408658e-17 2.748063e-14
## FN1_CD44 28.92 18 -8.176851 1.456795e-16 6.810516e-14
## COL1A2_ITGB1 29.12 20 -7.462516 4.244301e-14 1.587369e-11
## COL1A1_ITGB1 29.16 15 -7.319648 1.243107e-13 3.320871e-11
Plot the ligand-receptor pair FN1-CD44
plotLR(count,location,LRpair=c("FN1","CD44"),alpha.min=0.5)
最后,我们以小鼠脑的数据为例分析一下空间模式与共定位
library(SpaGene)
load("brain10X/brain10x.rds")
brain10x_sv<-SpaGene(count,location)
# the most significant spt
head(brain10x_sv$spagene_res[order(brain10x_sv$spagene_res$adjp),])
## score zval pval adjp
## 3110035E14Rik 7.838590 -58.63093 0 0
## Igfbp2 9.747681 -41.03227 0 0
## Scg2 8.992579 -47.99306 0 0
## Ptma 9.705009 -41.42563 0 0
## Ngef 8.725417 -50.45585 0 0
## Dbi 7.745826 -59.48606 0 0
pattern<-FindPattern(brain10x_sv,nPattern = 15)
PlotPattern(pattern,location,pt.size = 0.5)
top5<-apply(pattern$genepattern,2,function(x){names(x)[order(x,decreasing=T)][1:5]})
library(pheatmap)
pheatmap(pattern$genepattern[rownames(pattern$genepattern)%in%top5,],fontsize_row = 6)
Identify colocalized ligand-receptor pairs
load("LRpair.rds")
brain10x_lr<-SpaGene_LR(count,location,LRpair=LRpair)
# the most signficant colocalized LR pairs
head(brain10x_lr[order(brain10x_lr$adj),]
## score comm zval pval adjp
## Cck_Cckbr 28.63822 214 -32.06833 6.095309e-226 1.075212e-222
## Apoe_Sdc4 28.74954 242 -30.67785 5.620267e-207 4.957076e-204
## Pdyn_Oprk1 28.85343 201 -29.38006 4.936498e-190 2.902661e-187
## Apoe_Abca1 28.95733 210 -28.08228 8.062429e-174 3.555531e-171
## Tac1_Tacr1 29.13173 204 -25.90386 3.012735e-148 1.062893e-145
## Nptx1_Nptxr 29.15028 204 -25.67211 1.197629e-145 3.521030e-143
plotLR(count,location,LRpair=c("Cck","Cckbr"),alpha.min=0.2,pt.size = 1)
生活很好,有你更好