youngleeyoung

gitto-page enrichment

Giotto|| 空间表达数据分析工具箱
20

Seurat 新版教程：分析空间转录组数据（上）
Seurat 新版教程：分析空间转录组数据（下）
scanpy教程：空间转录组数据分析
10X Visium:空间转录组样本制备到数据分析
空间信息在空间转录组中的运用

Giotto, a toolbox for integrative analysis and visualization of spatial expression data

像Seurat一样，Giotto也是一位画家。乔托·迪·邦多纳（Giotto di Bondone 1266年－1337年），意大利画家、雕刻家与建筑师，被认为是意大利文艺复兴时期的开创者，被誉为“欧洲绘画之父”。在乔托的作品当中，可以看出他对于画作中真实空间的表达相当努力，有些壁画甚至还搭配了真实教堂内部的透视感来构图。这也许是Dries实验室选择这个名字作为其开发的空间表达数据分析工具箱的名字吧。

我们知道Seurat和scanpy中均有分析空间转录组的函数，美中不足的是空间信息多是用来作为可视化的画板，没有得到很好的利用。今天我们就跟着Giotto的教程看看，空间表达数据可以做什么以及是如何做到的。

首先，Giotto为常见的单细胞表达数据处理提供了一个灵活的框架，如:

质量控制
归一化
降维
聚类和细胞类型注释
当然，针对非单细胞分辨率的空间技术，如10X Visium ，Giotto实现了3种算法，通过整合已知基signatures 或单细胞RNAseq注释数据来估计不同细胞类型在空间中的富集（也可以理解为一种映射）。

最重要的是，Giotto进一步利用空间信息形成空间网格和或空间接近网络，用于:

识别空间特异基因
提取连续的空间表达模式
使用HMRF识别离散的空间域
探索细胞类型/细胞类型空间相互作用富集或耗尽
利用空间和配受体表达计算细胞空间相互作用
发现相互作用改变基因(interaction changed genes，ICG)：由于与相邻细胞相互作用而改变一种细胞类型表达的基因
最后，Giotto提供了界面版工具来探索空间表达数据：Giotto Viewer(http://spatial.rc.fas.harvard.edu/giotto-viewer/)

具体每一步算法，还是建议把原论文打印出来慢慢研究。这里可以看做是一份demo报告，而且Giotto本身还在发展当中，如果真的用Giotto来分析自己的空间表达数据，开始看其官网：https://rubd.github.io/Giotto_site/index.html

截至2020-12-13，官网已经准备好了15个案例教程，支持分析9种最先进的空间技术，包括原位杂交(seqFISH+， merFISH, osmFISH)，测序(Slide-seq, Visium, STARmap)和基于成像的多路复用/蛋白质组学(CyCIF, MIBI, CODEX)。并分别提供了不同的数据集，以便用户学习使用。

Install a Giotto environment (optional) # 学会R包安装
Create a Giotto object # 理清楚Giotto数据结构
Process and filter a Giotto object # 类比单细胞数据分析流程学习
Dimension reduction
Cluster cells or spots
Identify differentially expressed genes
Annotate clusters
Cell-type enrichment or deconvolution per spot # 低分辨率单细胞技术分析
Create a Spatial grid or Network # 空间数据分析
Find genes with a spatially coherent gene expression pattern
Identify genes that are spatially co-expressed
Explore spatial domains with HMRF
Calculate spatial cell-cell interaction enrichment
Find cell-cell interaction changed genes (ICG)
Identify enriched or depleted ligand-receptor interactions in hetero and homo-typic cell interactions
Export Giotto results to use in Giotto viewer # 在线工具

创建Giotto 对象
安装与加载：

library(devtools) # if not installed: install.packages(‘devtools’)
library(remotes) # if not installed: install.packages(‘remotes’)
remotes::install_github(“RubD/Giotto”)

library(Seurat) # 假设大家都会分析单细胞数据了，这个假设坏不坏，坏
library(SeuratData)
library(ggplot2)
library(cowplot)
library(dplyr)
library(Giotto)
library(patchwork)
library(tidyverse)

我们将使用Giotto自带的数据集mini_visium做为演示数据，这样数据较小，运行时间较快。在创建Giotto对象之前首先需要做一步初始化，这一点和metaCELL还是很像。

?createGiottoInstructions
temp_dir = ‘./mini_visium/’
myinstructions = createGiottoInstructions(save_dir = temp_dir,
save_plot = FALSE,
show_plot = F,
python_path = ‘D:\Program Files (x86)\anconda\python.exe’)

可以看到Giotto过程是依赖python的，这一点早期的Seurat差不多，这当然会有些不便之处，至少知道同一个环境下python在哪，需要哪些库需要安装。这是后话，在我们的展示中这都不是问题（有问题的地方我们可以跳过_）。下面我们来创建这个对象：

expr_path = system.file(“extdata”, “visium_DG_expr.txt.gz”, package = ‘Giotto’)
loc_path = system.file(“extdata”, “visium_DG_locs.txt”, package = ‘Giotto’)
mini_visium <- createGiottoObject(raw_exprs = expr_path,
spatial_locs = loc_path,
instructions = myinstructions)

这个会有一个提示：

Consider to install these (optional) packages to run all possible Giotto commands for spatial analyses: scran trendsceek SPARK multinet RTriangle FactoMiner
Giotto does not automatically install all these packages as they are not absolutely required and this reduces the number of dependenciesWarning message:
In createGiottoObject(raw_exprs = expr_path, spatial_locs = loc_path, :
module: community was not found with python path: D:\Program Files (x86)\anconda\python.exe

经验告诉我，community 是用来分群的，我们不用louvain算法来计算距离，用leiden可以的。创建完对象我们当然要看看对象长什么样了。

mini_visium
An object of class giotto
634 genes across 624 samples.

Steps and parameters used:

list()

str(mini_visium,max.level = 2)
Formal class ‘giotto’ [package “Giotto”] with 19 slots
…@ raw_exprs :Formal class ‘dgCMatrix’ [package “Matrix”] with 6 slots
…@ norm_expr : NULL
…@ norm_scaled_expr : NULL
…@ custom_expr : NULL
…@ spatial_locs :Classes ‘data.table’ and ‘data.frame’: 624 obs. of 3 variables:
… …- attr(, “.internal.selfref”)=
…@ cell_metadata :Classes ‘data.table’ and ‘data.frame’: 624 obs. of 1 variable:
… …- attr(, “.internal.selfref”)=
…@ gene_metadata :Classes ‘data.table’ and ‘data.frame’: 634 obs. of 1 variable:
… …- attr(*, “.internal.selfref”)=
…@ cell_ID : chr [1:624] “AAAGGGATGTAGCAAG-1” “AAATGGCATGTCTTGT-1” “AAATGGTCAATGTGCC-1” “AAATTAACGGGTAGCT-1” …
…@ gene_ID : chr [1:634] “Gna12” “Ccnd2” “Btbd17” “Sox9” …
…@ spatial_network : NULL
…@ spatial_grid : NULL
…@ spatial_enrichment : NULL
…@ dimension_reduction: NULL
…@ nn_network : NULL
…@ images : NULL
…@ parameters : list()
…@ instructions :List of 11
…@ offset_file : NULL
…@ OS_platform : chr “windows”

可以看到也是一个S4对象包含了表达谱和空间信息，需要知道每部分存放的数据是什么。

head(mini_visium@spatial_locs)
sdimx sdimy cell_ID
1: 5477 -4125 AAAGGGATGTAGCAAG-1
2: 5959 -2808 AAATGGCATGTCTTGT-1
3: 4720 -5202 AAATGGTCAATGTGCC-1
4: 5202 -5322 AAATTAACGGGTAGCT-1
5: 4101 -4604 AACAACTGGTAGTTGC-1
6: 5821 -3047 AACAGGAAATCGAATA-1

head(mini_visium@cell_metadata)
cell_ID
1: AAAGGGATGTAGCAAG-1
2: AAATGGCATGTCTTGT-1
3: AAATGGTCAATGTGCC-1
4: AAATTAACGGGTAGCT-1
5: AACAACTGGTAGTTGC-1
6: AACAGGAAATCGAATA-1

head(mini_visium@gene_metadata)
gene_ID
1: Gna12
2: Ccnd2
3: Btbd17
4: Sox9
5: Sez6
6: Serpinf1

有了表达谱和空间信息，我们还需要图像数据，也加载进来。

1. read image

png_path = system.file(“extdata”, “deg_image.png”, package = ‘Giotto’)
mg_img = magick::image_read(png_path)
mg_img

2. test and modify image alignment

mypl = spatPlot(mini_visium, return_plot = T, point_alpha = 0.8)
orig_png = createGiottoImage(gobject = mini_visium, mg_object = mg_img, name = ‘image’,
xmax_adj = 450, xmin_adj = 550,
ymax_adj = 200, ymin_adj = 200)
mypl_image = addGiottoImageToSpatPlot(mypl, orig_png)
mypl_image

3. add images to Giotto object

image_list = list(orig_png)
mini_visium = addGiottoImage(gobject = mini_visium,
images = image_list)
showGiottoImageNames(mini_visium)
The following images are available: image
[1] “image”

图像数据在：

mini_visium@images

至此，一个空间表达数据对象就构建完成了，我们可以类比Seurat或scanpy的数据结构来看看Giotto的数据结构，以便在下游分析的时候随心所欲地提取数据。

表达数据标准分析
空间表达数据首先是表达数据，所以之前我们学到的单细胞表达数据的分析方法框架是完全可以用的。所谓，降维聚类必知必会嘛。先查看数据分析执行基本的数据质控。

explore gene and cell distribution

p1 <- filterDistributions(mini_visium, detection = ‘genes’) + ggtitle(" Gene Distributions")
p2 <- filterDistributions(mini_visium, detection = ‘cells’)+ ggtitle(" Cell Distributions")
p1 + p2

显示有多少基因和细胞在组合阈值时丢失。

filterCombinations(mini_visium,
expression_thresholds = c(1),
gene_det_in_min_cells = c(20, 20, 50, 50),
min_det_genes_per_cell = c(100, 200, 100, 200))

$results
threshold gene_detected_in_min_cells min_detected_genes_per_cell combination removed_genes removed_cells
1: 1 20 100 20-100 1 2
2: 1 20 200 20-200 1 75
3: 1 50 100 50-100 43 2
4: 1 50 200 50-200 43 77

$ggplot

之后，我们进行数据过滤以及均一化等操作。

filter and normalize

mini_visium <- filterGiotto(gobject = mini_visium,
expression_threshold = 1,
gene_det_in_min_cells = 50,
min_det_genes_per_cell = 100,
expression_values = c(‘raw’),
verbose = T)
mini_visium <- normalizeGiotto(gobject = mini_visium, scalefactor = 6000, verbose = T)
mini_visium <- addStatistics(gobject = mini_visium)

mini_visium <- calculateHVG(gobject = mini_visium)

看看基因和细胞的信息：

head(mini_visium@cell_metadata)
cell_ID nr_genes perc_genes total_expr
1: AAAGGGATGTAGCAAG-1 226 38.24027 992.0223
2: AAATGGCATGTCTTGT-1 283 47.88494 1123.8751
3: AAATGGTCAATGTGCC-1 247 41.79357 1024.8760
4: AAATTAACGGGTAGCT-1 221 37.39425 971.3199
5: AACAACTGGTAGTTGC-1 306 51.77665 1157.2925
6: AACAGGAAATCGAATA-1 337 57.02200 1227.8457

head(mini_visium@gene_metadata)
gene_ID nr_cells perc_cells total_expr mean_expr mean_expr_det hvg
1: Gna12 501 80.54662 1984.1670 3.1899791 3.960413 no
2: Ccnd2 356 57.23473 1250.6225 2.0106471 3.512984 no
3: Btbd17 252 40.51447 783.0241 1.2588812 3.107238 no
4: Sox9 308 49.51768 1015.9613 1.6333783 3.298576 no
5: Sez6 504 81.02894 2179.5787 3.5041458 4.324561 no
6: Serpinf1 105 16.88103 312.4149 0.5022748 2.975380 no

可以直接用函数获得上述信息：

pDataDT(mini_visium)
fDataDT(mini_visium)

此时的Giotto对象结构:

591 genes across 622 samples.

Steps and parameters used:

$0_subset
cells removed genes removed
2 43

$1_filter
used expression values gene expression threshold minimum # of genes detected per cell
“raw” “1” “100”
minimum times a gene is detected over all cells
“50”

$2_normalize
normalization method normalized to library size scalefactor log-normalized logbase
“standard” “yes” “6000” “yes” “2”
log offset genes scaled cell scaled if both, order of scaling
“1” “yes” “yes” “first_genes”

$3_gene_stats
expression values used detection_threshold
“normalized” “0”

$4_cell_stats
expression values used detection_threshold
“normalized” “0”

$5_hvg
method used expression values1 expression values2 expression values3 reversed log scale
“cov_groups” “normalized” “scaled” “custom” “FALSE”
logbase expression threshold number of expression groups threshold for z-score difference in variance
“2” “0” “20” “1.5” “0.1”
name for HVGs
“hvg”

执行降维。

?runPCA
mini_visium <- runPCA(gobject = mini_visium)
screePlot(mini_visium, ncp = 30)

每个PC的解释度

提取PCA坐标，对于UMAP和tsne也可以类比，方便自己画图谱。

head(mini_visium@dimension_reduction $c e l l s$ pca $p c a$ coordinates[1:4,1:4])
Dim.1 Dim.2 Dim.3 Dim.4
AAAGGGATGTAGCAAG-1 0.9011678 -0.3335627 -0.14288217 -0.90345159
AAATGGCATGTCTTGT-1 3.8096179 3.4784611 0.61075503 0.06560415
AAATGGTCAATGTGCC-1 -8.0655096 0.4639553 -0.35425095 -1.02290334
AAATTAACGGGTAGCT-1 -7.3829491 1.3098899 0.04309618 -1.28969309

关于特征选择的PCA信息Giotto提供的并不像Seurat那么多。

可视化降维：

ppca <- plotPCA(gobject = mini_visium)
mini_visium <- runUMAP(mini_visium, dimensions_to_use = 1:10)
pumap<- plotUMAP(gobject = mini_visium)
mini_visium <- runtSNE(mini_visium, dimensions_to_use = 1:10)
ptsne <- plotTSNE(gobject = mini_visium)

下面是标准分析的核心了：聚类发现细胞亚群

mini_visium <- createNearestNetwork(gobject = mini_visium, dimensions_to_use = 1:10, k = 15)
mini_visium <- doLeidenCluster(gobject = mini_visium, resolution = 0.4, n_iterations = 1000)

查看聚类结果

head(mini_visium@cell_metadata)
cell_ID nr_genes perc_genes total_expr leiden_clus
1: AAAGGGATGTAGCAAG-1 226 38.24027 992.0223 3
2: AAATGGCATGTCTTGT-1 283 47.88494 1123.8751 4
3: AAATGGTCAATGTGCC-1 247 41.79357 1024.8760 2
4: AAATTAACGGGTAGCT-1 221 37.39425 971.3199 2
5: AACAACTGGTAGTTGC-1 306 51.77665 1157.2925 2
6: AACAGGAAATCGAATA-1 337 57.02200 1227.8457 4

查看聚类结果

visualize UMAP cluster results

plotUMAP(gobject = mini_visium, cell_color = ‘leiden_clus’, show_NN_network = T, point_size = 2.5)

visualize UMAP and spatial results

spatDimPlot(gobject = mini_visium, cell_color = ‘leiden_clus’, spat_point_shape = ‘voronoi’)

spatial voronoi plot with selected clusters

p1 <- spatPlot(mini_visium, point_shape = ‘voronoi’, cell_color =‘leiden_clus’, select_cell_groups = c(1,2,3))

spatial voronoi plot without showing not selected clusters

p2 <- spatPlot(mini_visium, point_shape = ‘voronoi’, cell_color =‘leiden_clus’, select_cell_groups = c(1,2,3), show_other_cells = F)

spatial voronoi plot without showing not selected cells, but showing the voronoi borders

p3 <- spatPlot(mini_visium, point_shape = ‘voronoi’, cell_color =‘leiden_clus’, select_cell_groups = c(1,2,3,4), show_other_cells = F,
vor_border_color = ‘black’)

p1+p2+ p3

亚群间差异基因，提供三种差异分析分析方法： “scran”, “gini”, “mast”，我们只使用其中的一种作为示例。

?findMarkers_one_vs_all
mast_markers = findMarkers_one_vs_all(gobject = mini_visium,
method = ‘mast’,
expression_values = ‘normalized’,
cluster_column = ‘leiden_clus’)

head(mast_markers)
genes Pr(>Chisq) coef ci.hi ci.lo fdr cluster ranking
1: Chgb 1.647262e-34 -2.103924 -1.749995 -2.457852 7.864001e-32 1_vs_others 1
2: Ogfrl1 2.661252e-34 -2.073549 -1.724172 -2.422927 7.864001e-32 1_vs_others 2
3: Prkcg 1.066031e-33 -2.215784 -1.843982 -2.587586 2.100080e-31 1_vs_others 3
4: Fxyd7 1.788067e-31 -1.915721 -1.564124 -2.267317 2.641869e-29 1_vs_others 4
5: Camkv 6.043544e-31 -1.934645 -1.586670 -2.282620 6.140771e-29 1_vs_others 5
6: Dpp6 6.234285e-31 -2.225360 -1.883683 -2.567037 6.140771e-29 1_vs_others 6

差异基因可视化

topgenes_mast = mast_markers[, head(.SD, 2), by = ‘cluster’]$genes # 这里的.SD 用的很溜啊
topgenes_mast
[1] “Chgb” “Ogfrl1” “Tcf7l2” “Prkcd” “Ddn” “Ttr” “Ngef” “Arpp19” “Prdm8” “Cpne6” “Spink8” “Wfs1” “Ccn2” “Cplx3”
[15] “Ccdc153” “Rarres2”
violinPlot(mini_visium, genes = topgenes_mast, cluster_column = ‘leiden_clus’,
strip_text = 10, strip_position = ‘right’)

topgenes_mast = mast_markers[, head(.SD, 6), by = ‘cluster’]$genes
topgenes_mast

plotMetaDataHeatmap(mini_visium, selected_genes = topgenes_mast,
metadata_cols = c(‘leiden_clus’))

根据差异基因注释细胞类型，这当然是一个需要谨慎考虑的，这里为了方便演示，只是取一个基因名作为其细胞类型。

clusters_cell_types = paste0(mast_markers[, head(.SD, 1), by = ‘cluster’] $genes,"_cells") clusters_cell_types names(clusters_cell_types) = 1:length(unique(mini_visium@cell_metadata$ leiden_clus))
mini_visium@cell_metadata
mini_visium = annotateGiotto(gobject = mini_visium, annotation_vector = clusters_cell_types,
cluster_column = ‘leiden_clus’, name = ‘cell_types’)

check new cell metadata

pDataDT(mini_visium)

           cell_ID nr_genes perc_genes total_expr leiden_clus   cell_types

1: AAAGGGATGTAGCAAG-1 226 38.24027 992.0223 3 Ddn_cells
2: AAATGGCATGTCTTGT-1 283 47.88494 1123.8751 4 Ngef_cells
3: AAATGGTCAATGTGCC-1 247 41.79357 1024.8760 2 Tcf7l2_cells
4: AAATTAACGGGTAGCT-1 221 37.39425 971.3199 2 Tcf7l2_cells
5: AACAACTGGTAGTTGC-1 306 51.77665 1157.2925 2 Tcf7l2_cells

618: TTGTAATCCGTACTCG-1 313 52.96108 1179.7196 2 Tcf7l2_cells
619: TTGTATCACACAGAAT-1 240 40.60914 999.6419 4 Ngef_cells
620: TTGTCGTTCAGTTACC-1 219 37.05584 991.4468 3 Ddn_cells
621: TTGTGGCCCTGACAGT-1 202 34.17936 924.0617 1 Chgb_cells
622: TTGTTCAGTGTGCTAC-1 232 39.25550 1019.5997 6 Spink8_cells

空间数据分析
这里我们开始切入纳入空间位置之后的分析，其中之一就是，对低分辨率的技术，利用signatures 矩阵看空间中细胞类型的富集情况。可以说是与单细胞数据的联合分析，也可以说是把spot看作是局部bulk数据，对spot的反卷积（deconvolution），用以推断每个spot的细胞类型组成。

如果有signatures 可以用之计算每个空间位置基因标记富集分数。Giotto采用三种富集方法进行富集分析:

PAGE (Parametric Analysis of Gene Set Enrichment)
在这种方法中，一组已知的细胞型特异性标记基因作为输入。目的是评估这些基因是否在每个点(spot)比其他点表达得更高。具体地说，对于每个点，我们定义一个与一组标记基因相对应的富集分数，如下所示。首先，对于整个基因组中的每个基因，我们利用该位点的表达值相对于所有位点的平均表达值来计算该基因的表达折叠变化。

Enrichment analysis based on rank of gene expression
在这种方法中，不需要已知的标记基因列表。相反，将使用外部单细胞RNAseq数据集以及每个细胞的单元类型注释作为输入。

利用超几何分布的富集分析
这种方法也需要一组已知的细胞类型特异性标记基因作为输入，但它通过简单地使用超几何检验来评估富集程度。基于标记基因注释和基因表达值二值化，将所有基因划分为4个不重叠的类别，来构建列联表。后者是由每个位点前5%的表达基因决定的。根据列联表计算出一个p值。这里的富集分数被定义为-log10(p-value)。

cell type signatures

combination of all marker genes identified

sign_matrix_path = system.file(“extdata”, “sig_matrix.txt”, package = ‘Giotto’)
brain_sc_markers = data.table::fread(sign_matrix_path) # file don’t exist in data folder
sig_matrix = as.matrix(brain_sc_markers[,-1]); rownames(sig_matrix) = brain_sc_markers$Event
sig_matrix[1:4,1:4]
Astro_ependymal Cerebellum Cholinergic_monoaminergic Cortex_hippocampus_thalamus
Cartpt 0 0 1 0
Gm15469 0 0 1 0
Pmch 0 0 1 0
Ly6a 0 0 0 0

由于我们草率地找了个signatures 所以富集可能会不准，但是作为演示是可以的。

mini_visium = runSpatialEnrich(mini_visium,
sign_matrix = sig_matrix,
enrich_method = ‘PAGE’) #default = ‘PAGE’

heatmap of enrichment versus annotation (e.g. clustering result)

cell_types = colnames(sig_matrix)
plotMetaDataCellsHeatmap(gobject = mini_visium,
metadata_cols = ‘leiden_clus’,
value_cols = cell_types,
spat_enr_names = ‘PAGE’,
x_text_size = 8, y_text_size = 8)

查看富集分数

enrichment_results = mini_visium@spatial_enrichment$PAGE
head(enrichment_results)
cell_ID Astro_ependymal Cerebellum Cortex_hippocampus_thalamus Cortex_hippocampus di_mesencephalon_1 di_mesencephalon_2 Hindbrain
1: AAAGGGATGTAGCAAG-1 -1.2800440 -0.5864989 0.917972068 -0.05840974 -2.0124908 2.44315201 0.6100475
2: AAATGGCATGTCTTGT-1 -1.1898333 -0.8364881 1.146730319 2.94314936 -0.3084605 -0.07627204 0.2909754
3: AAATGGTCAATGTGCC-1 -0.3672426 -0.7726506 -0.961627156 -3.13654976 2.3252251 0.04925334 1.0702687
4: AAATTAACGGGTAGCT-1 0.2906555 0.6332150 0.004221154 -4.66096648 2.3323610 1.60580233 1.5530766
5: AACAACTGGTAGTTGC-1 2.1619438 -1.4829558 -2.718809976 -5.05188952 0.2268543 -1.41909263 -0.4450371
6: AACAGGAAATCGAATA-1 -0.4275308 -0.2356467 1.354997024 4.45432092 -1.2874840 -0.79001109 1.4877626
Olfactory_bulb Oligo_dendrocyte Peptidergic Vascular
1: -2.0100819 -0.4722108 1.0807732 -0.7906277
2: 0.1148558 -1.8963290 -1.3098433 1.0049731
3: -0.1948654 0.4321902 1.2949379 2.3258985
4: -1.4450167 0.8517501 0.4966094 0.0358209
5: -0.5760702 2.3737223 1.1574013 0.4736639
6: -0.6069400 -1.3063133 -0.5210430 -0.8693017

可视化结果

enrich_cell_types = colnames(enrichment_results)
enrich_cell_types = enrich_cell_types[enrich_cell_types != ‘cell_ID’]

enrich_cell_types

spatplot

?spatCellPlot
spatCellPlot(gobject = mini_visium, spat_enr_names = ‘PAGE’,
cell_annotation_values = enrich_cell_types,show_image=T,show_legend=F,
cow_n_col = 3,coord_fix_ratio = NULL, point_size = 1)

创建空间网格，看局部空间的异质性。

mini_visium <- createSpatialGrid(gobject = mini_visium,
sdimx_stepsize = 300,
sdimy_stepsize = 300,
minimum_padding = 50)
showGrids(mini_visium)
?spatPlot
spatPlot(gobject = mini_visium, show_grid = T, point_size = 1.5,
show_image=T,group_by=“cell_types”)

提取网格和相关数据点

annotated_grid = annotateSpatialGrid(mini_visium)
annotated_grid
sdimx sdimy cell_ID gr_x_loc gr_y_loc gr_loc
1: 5477 -4125 AAAGGGATGTAGCAAG-1 gr_x_9 gr_y_5 gr_57
2: 5959 -2808 AAATGGCATGTCTTGT-1 gr_x_11 gr_y_9 gr_107
3: 4720 -5202 AAATGGTCAATGTGCC-1 gr_x_6 gr_y_2 gr_18
4: 5202 -5322 AAATTAACGGGTAGCT-1 gr_x_8 gr_y_1 gr_8
5: 4101 -4604 AACAACTGGTAGTTGC-1 gr_x_4 gr_y_4 gr_40

618: 4996 -5442 TTGTAATCCGTACTCG-1 gr_x_7 gr_y_1 gr_7
619: 6303 -2688 TTGTATCACACAGAAT-1 gr_x_12 gr_y_10 gr_120
620: 5202 -3885 TTGTCGTTCAGTTACC-1 gr_x_8 gr_y_6 gr_68
621: 5340 -3406 TTGTGGCCCTGACAGT-1 gr_x_8 gr_y_7 gr_80
622: 5615 -4125 TTGTTCAGTGTGCTAC-1 gr_x_9 gr_y_5 gr_57

annotated_grid_metadata = annotateSpatialGrid(mini_visium,
cluster_columns = c(‘leiden_clus’, ‘cell_types’, ‘nr_genes’))

annotated_grid_metadata

           cell_ID sdimx sdimy gr_x_loc gr_y_loc gr_loc leiden_clus   cell_types nr_genes

1: AAAGGGATGTAGCAAG-1 5477 -4125 gr_x_9 gr_y_5 gr_57 3 Ddn_cells 226
2: AAATGGCATGTCTTGT-1 5959 -2808 gr_x_11 gr_y_9 gr_107 4 Ngef_cells 283
3: AAATGGTCAATGTGCC-1 4720 -5202 gr_x_6 gr_y_2 gr_18 2 Tcf7l2_cells 247
4: AAATTAACGGGTAGCT-1 5202 -5322 gr_x_8 gr_y_1 gr_8 2 Tcf7l2_cells 221
5: AACAACTGGTAGTTGC-1 4101 -4604 gr_x_4 gr_y_4 gr_40 2 Tcf7l2_cells 306

618: TTGTAATCCGTACTCG-1 4996 -5442 gr_x_7 gr_y_1 gr_7 2 Tcf7l2_cells 313
619: TTGTATCACACAGAAT-1 6303 -2688 gr_x_12 gr_y_10 gr_120 4 Ngef_cells 240
620: TTGTCGTTCAGTTACC-1 5202 -3885 gr_x_8 gr_y_6 gr_68 3 Ddn_cells 219
621: TTGTGGCCCTGACAGT-1 5340 -3406 gr_x_8 gr_y_7 gr_80 1 Chgb_cells 202
622: TTGTTCAGTGTGCTAC-1 5615 -4125 gr_x_9 gr_y_5 gr_57 6 Spink8_cells 232

创建空间网络，我们可以用Delaunay", “kNN” 两种方法。

mini_visium = createSpatialNetwork(gobject = mini_visium, minimum_k = 2, maximum_distance_delaunay = 400)
mini_visium = createSpatialNetwork(gobject = mini_visium, minimum_k = 2, method = ‘kNN’, k = 10)
showNetworks(mini_visium)
The following images are available: Delaunay_network kNN_network
[1] “Delaunay_network” “kNN_network”

查看其中一个网络的信息，看到一个有from to 文件，这就可以用igraph来构建网络了啊。

mini_visium@spatial_network $Delaunay_network$ networkDT
from to sdimx_begin sdimy_begin sdimx_end sdimy_end distance weight
1: AAAGGGATGTAGCAAG-1 TCAAACAACCGCGTCG-1 5477 -4125 5340 -4125 137.0000 0.007299270
2: AAAGGGATGTAGCAAG-1 ACGATCATACATAGAG-1 5477 -4125 5546 -4244 137.5573 0.007269700
3: AAAGGGATGTAGCAAG-1 TTGTTCAGTGTGCTAC-1 5477 -4125 5615 -4125 138.0000 0.007246377
4: AAAGGGATGTAGCAAG-1 ATCGACTCTTTCCGTT-1 5477 -4125 5408 -4005 138.4233 0.007224219
5: AAAGGGATGTAGCAAG-1 GTAAGCGGGCAGTCAG-1 5477 -4125 5546 -4005 138.4233 0.007224219

1787: TTCAAGCCGAGCTGAG-1 TTGTATCACACAGAAT-1 6372 -2808 6303 -2688 138.4233 0.007224219
1788: TTCGACGGGAAGGGCG-1 TTCGCACTCGCGTGCT-1 4239 -4125 4308 -4245 138.4233 0.007224219
1789: TTCTTAGTGGCTCAGA-1 TTGTGGCCCTGACAGT-1 5408 -3287 5340 -3406 137.0584 0.007296161
1790: TTCTTGTAACCTAATG-1 TTGGCTCGCATGAGAC-1 3620 -4005 3757 -4005 137.0000 0.007299270
1791: TTGCACGGAGCAGCAC-1 TTGTCGTTCAGTTACC-1 5271 -3766 5202 -3885 137.5573 0.007269700

我们还是直接用Giotto来绘制吧，懒，哼。

p1 <- spatPlot(gobject = mini_visium, show_network = T,
network_color = ‘blue’, spatial_network_name = ‘Delaunay_network’,
point_size = 2.5, cell_color = ‘leiden_clus’) + ggtitle(“Delaunay_network”)

p2 <- spatPlot(gobject = mini_visium, show_network = T,
network_color = ‘blue’, spatial_network_name = ‘kNN_network’,
point_size = 2.5, cell_color = ‘leiden_clus’) + ggtitle(“kNN_network”)

p1+ p2

Giotto目前有五种不同的方法来识别空间连续表达模式（spatially coherent expression pattern）。三个先前发表的方法SpatialDE 、Trendsceek 和SPARK 可以与SpatialDE、Trendsceek和SPARK函数一起运行。Giotto介绍有两种新方法（“kmeans”, “rank”）是基于对空间网络中相邻细胞二值化表达数据的统计。

首先，对于每个基因，表达值采用kmeans聚类(k = 2)或简单的rank阈值设定(默认为30%)进行二值化，这是两种方法唯一的区别。接下来，根据相邻细胞间的二值化表达式值计算列联表，并将其用作Fisher精确检验的输入，以获得概率比估计值和p值。在这种情况下，如果一个基因通常在近端或邻近的细胞中被发现高表达，则被认为是空间基因。除了每个基因的胜率和p值外，还计算并提供了基因的平均表达量、高表达细胞数和hub细胞数。一个hub细胞被认为是一个高表达感兴趣的基因的细胞，它有多个高表达该基因的邻近细胞。用户可以利用这些特征进一步对具有不同特征的空间基因进行排序和探索。由函数 BinSpect (Binary Spatial extract)实现。

?binSpect
km_spatialgenes = binSpect(mini_visium)
km_spatialgenes

   genes       p.value   estimate   adj.p.value        score  av_expr high_expr

1: Ddn 1.249839e-282 19.1956483 7.386550e-280 1.246001e+04 6.031918 426
2: Shox2 6.120417e-223 24.2751032 7.234333e-221 1.242072e+04 3.984479 118
3: Hpca 8.836558e-253 13.1227650 2.611203e-250 7.616126e+03 6.964470 378
4: Zic1 5.861216e-226 12.2212691 8.659947e-224 6.338144e+03 4.284136 211
5: Mobp 6.841076e-234 10.7129452 1.347692e-231 5.751587e+03 7.660916 318

587: Plod1 8.569300e-01 1.0134093 8.627694e-01 1.564695e-01 3.052250 229
588: Tmem119 8.710065e-01 0.9854772 8.754504e-01 1.361002e-01 3.126011 180
589: Fn1 8.757291e-01 0.9871367 8.787028e-01 1.309915e-01 3.300124 193
590: Ndufa4l2 9.561515e-01 0.9885798 9.577720e-01 4.432688e-02 3.200996 115
591: Vsir 1.000000e+00 0.9989055 1.000000e+00 0.000000e+00 3.037544 177

可视化基因

spatGenePlot(mini_visium, expression_values = ‘scaled’,
genes = km_spatialgenes[1:4]$genes,
point_shape = ‘border’, point_border_stroke = 0.1,
show_network = F, network_color = ‘lightgrey’, point_size = 2.5,
cow_n_col = 2)

rank_spatialgenes = binSpect(mini_visium, bin_method = ‘rank’)
spatGenePlot(mini_visium, expression_values = ‘scaled’,
genes = rank_spatialgenes[1:4]$genes,
point_shape = ‘border’, point_border_stroke = 0.1,
show_network = F, network_color = ‘lightgrey’, point_size = 2.5,
cow_n_col = 2)

计算空间相关分数（calculate spatial correlation scores）。地理学第一定律：Everything is related to everything else, but near things are more related to each other. （任何事物都是与其他事物相关的，只不过相近的事物关联更紧密）。这一定律告诉我们，空间位置对对象间的相关性是有决定作用的。了识别空间共表达基因(Spatial co-expression patterns)的稳健模式，detectSpatialCorGenes和clusterSpatialCorGenes 可以用于识别的单个空间基因。第一个函数通过网格平均法或k近邻法在空间上平滑基因表达，然后计算基因到基因的相关性(默认=皮尔逊)分数。

ext_spatial_genes = km_spatialgenes[1:100]$genes
ext_spatial_genes

   genes       p.value   estimate   adj.p.value        score  av_expr high_expr

1: Ddn 1.249839e-282 19.1956483 7.386550e-280 1.246001e+04 6.031918 426
2: Shox2 6.120417e-223 24.2751032 7.234333e-221 1.242072e+04 3.984479 118
3: Hpca 8.836558e-253 13.1227650 2.611203e-250 7.616126e+03 6.964470 378
4: Zic1 5.861216e-226 12.2212691 8.659947e-224 6.338144e+03 4.284136 211
5: Mobp 6.841076e-234 10.7129452 1.347692e-231 5.751587e+03 7.660916 318

检测空间相关的基因

spat_cor_netw_DT = detectSpatialCorGenes(mini_visium,
method = ‘network’, spatial_network_name = ‘Delaunay_network’,
subset_genes = ext_spatial_genes)

spat_cor_netw_DT$cor_DT
gene_ID variable spat_cor expr_cor cordiff spatrank exprrank rankdiff
1: 2010300C02Rik 2010300C02Rik 1.0000000 1.0000000 0.0000000 1 1 0
2: 2010300C02Rik Icam5 0.8697253 0.5558625 0.3138629 2 5 -3
3: 2010300C02Rik Itpka 0.8631855 0.6118914 0.2512941 3 2 1
4: 2010300C02Rik Ppp1r1a 0.8290775 0.5070328 0.3220448 4 8 -4
5: 2010300C02Rik Ddn 0.8159786 0.5619251 0.2540535 5 4 1

9996: Zic1 Itpka -0.6782534 -0.4374862 -0.2407671 96 94 2
9997: Zic1 Vxn -0.7007696 -0.4780233 -0.2227463 97 96 1
9998: Zic1 Sst -0.7252043 -0.3920385 -0.3331659 98 84 14
9999: Zic1 Rprml -0.7293975 -0.5113883 -0.2180092 99 100 -1
10000: Zic1 Dkk3 -0.7297394 -0.4979835 -0.2317558 100 99 1

2. cluster correlation scores

spat_cor_netw_DT = clusterSpatialCorGenes(spat_cor_netw_DT, name = ‘spat_netw_clus’, k = 8)
heatmSpatialCorGenes(mini_visium, spatCorObject = spat_cor_netw_DT, use_clus_name = ‘spat_netw_clus’)

可视化和过滤空间相关的基因

top_netw_spat_cluster = showSpatialCorGenes(spat_cor_netw_DT, use_clus_name = ‘spat_netw_clus’,
selected_clusters = 6, show_top_genes = 1)
top_netw_spat_cluster
gene_ID variable spat_cor expr_cor cordiff spatrank exprrank rankdiff clus
1: Amotl1 Amotl1 1 1 0 1 1 0 6
2: Grm4 Grm4 1 1 0 1 1 0 6
3: Lef1 Lef1 1 1 0 1 1 0 6
4: Nexn Nexn 1 1 0 1 1 0 6
5: Ntng1 Ntng1 1 1 0 1 1 0 6
6: Patj Patj 1 1 0 1 1 0 6
7: Plekhg1 Plekhg1 1 1 0 1 1 0 6
8: Prkcd Prkcd 1 1 0 1 1 0 6
9: Prkch Prkch 1 1 0 1 1 0 6
10: Rab37 Rab37 1 1 0 1 1 0 6
11: Rgs16 Rgs16 1 1 0 1 1 0 6
12: Shox2 Shox2 1 1 0 1 1 0 6
13: Slc17a6 Slc17a6 1 1 0 1 1 0 6
14: Synpo2 Synpo2 1 1 0 1 1 0 6
15: Tcf7l2 Tcf7l2 1 1 0 1 1 0 6
16: Tnnt1 Tnnt1 1 1 0 1 1 0 6
17: Vav3 Vav3 1 1 0 1 1 0 6
18: Vipr2 Vipr2 1 1 0 1 1 0 6
19: Zfhx3 Zfhx3 1 1 0 1 1 0 6
20: Zic1 Zic1 1 1 0 1 1 0 6

cluster_genes_DT = showSpatialCorGenes(spat_cor_netw_DT, use_clus_name = ‘spat_netw_clus’, show_top_genes = 1)
cluster_genes = cluster_genes_DT $clus; names(cluster_genes) = cluster_genes_DT$ gene_ID
cluster_genes
mini_visium = createMetagenes(mini_visium, gene_clusters = cluster_genes, name = ‘cluster_metagene’)
spatCellPlot(mini_visium,
spat_enr_names = ‘cluster_metagene’,
cell_annotation_values = netw_ranks$clusters,
point_size = 1.5, cow_n_col = 3,show_image=T,show_legend=F)

如前所述，空间域（Spatial domain detection）用隐马尔可夫随机场(HMRF)模型识别。简而言之，HMRF是一个基于图形的模型，它将每个细胞的状态推断为细胞的内在状态(从细胞自身的基因表达载体推断)和细胞的外在状态(基于细胞周边的状态分布)的联合概率。在我们的例子中状态的概念是空间域。邻域图定义了邻居细胞的影响程度，以及定义细胞间相互作用强度的参数beta。HMRF将每个cell分配给k个空间域中的一个(k由用户定义)。

hmrf_folder = paste0(temp_dir,’/’,‘11_HMRF/’)
if(!file.exists(hmrf_folder)) dir.create(hmrf_folder, recursive = T)

?doHMRF

perform hmrf

my_spatial_genes = km_spatialgenes[1:100]$genes
HMRF_spatial_genes = doHMRF(gobject = mini_visium,
expression_values = ‘scaled’,
spatial_genes = my_spatial_genes,
spatial_network_name = ‘Delaunay_network’,
k = 8,
betas = c(28,2,2),
output_folder = paste0(hmrf_folder, ‘/’, ‘Spatial_genes_brain/SG_top100_k8_scaled’))

提示：

expression_matrix.txt already exists at this location, will be overwritten

spatial_genes.txt already exists at this location, will be overwritten

spatial_network.txt already exists at this location, will be overwritten

spatial_cell_locations.txt already exists at this location, will be overwritten
[1] “D:\Program Files (x86)\anconda\python.exe E:/software/R/R-4.0.2/library/Giotto/python/reader2.py -l “./mini_visium//11_HMRF//Spatial_genes_brain/SG_top100_k8_scaled/spatial_cell_locations.txt” -g “./mini_visium//11_HMRF//Spatial_genes_brain/SG_top100_k8_scaled/spatial_genes.txt” -n “./mini_visium//11_HMRF//Spatial_genes_brain/SG_top100_k8_scaled/spatial_network.txt” -e “./mini_visium//11_HMRF//Spatial_genes_brain/SG_top100_k8_scaled/expression_matrix.txt” -o “./mini_visium//11_HMRF//Spatial_genes_brain/SG_top100_k8_scaled/result.spatial.zscore” -a test -k 8 -b 28 2 2 -t 1e-10 -z none -s 100 -i 100”

可见内置的是python实现的，我们用system函数在R中运行它。

system(“D:\Program Files (x86)\anconda\python.exe E:/software/R/R-4.0.2/library/Giotto/python/reader2.py -l "
./mini_visium//11_HMRF//Spatial_genes_brain/SG_top100_k8_scaled/spatial_cell_locations.txt” -g "
./mini_visium//11_HMRF//Spatial_genes_brain/SG_top100_k8_scaled/spatial_genes.txt" -n "
./mini_visium//11_HMRF//Spatial_genes_brain/SG_top100_k8_scaled/spatial_network.txt" -e "
./mini_visium//11_HMRF//Spatial_genes_brain/SG_top100_k8_scaled/expression_matrix.txt" -o "
./mini_visium//11_HMRF//Spatial_genes_brain/SG_top100_k8_scaled/result.spatial.zscore"
-a test -k 8 -b 30 2 2 -t 1e-10 -z none -s 100 -i 100")

127

check and select hmrf

myviewHMRFresults2D <- edit(viewHMRFresults2D)
environment(myviewHMRFresults2D) <- environment(viewHMRFresults2D)
debug(myviewHMRFresults2D)
?viewHMRFresults2D
viewHMRFresults2D(gobject = mini_visium,
HMRFoutput = HMRF_spatial_genes,
k = 8, betas_to_view = 2,
point_size = 2)

for(i in seq(28, 30, by = 2)) {
myviewHMRFresults2D(gobject = mini_visium,
HMRFoutput = HMRF_spatial_genes,
k = 8, betas_to_view = i,
point_size = 2)
}

myaddHMRF <- edit(addHMRF)
environment(myaddHMRF) <- environment(addHMRF)
mini_visium = myaddHMRF(gobject = mini_visium,
HMRFoutput = HMRF_spatial_genes,
k = 8, betas_to_add = c(28),
hmrf_name = ‘HMRF’)

mini_visium@cell_metadata
giotto_colors = getDistinctColors(8)
giotto_colors
names(giotto_colors) = 1:8
head(mini_visium@cell_metadata)
spatPlot(gobject = mini_visium, cell_color = ‘HMRF_k8_b.28’,
point_size = 3, coord_fix_ratio = 1, cell_color_code = giotto_colors)

识别细胞与细胞的相互作用改变了基因( cell-to-cell Interaction Changed Genes,ICG)，即由于接近其他细胞类型而差异表达的基因。为了无偏性地识别与特定细胞型相互作用相关的所有潜在基因表达变化，Giotto实施了4项差异基因分析来识别这种相互作用改变的基因(ICG)，包括t检验、limma检验、Wilcoxon秩和检验和空间排列检验。对于每一种细胞类型，我们将注释的细胞分成两个互补的亚组，其中一个亚组包含邻近另一种特定细胞类型的细胞的子集。这些组间差异表达的基因是通过上述每一种统计检验来鉴别的。若要调整多个假设检验，则通过重新随机化细胞类型中的细胞来创建背景空分布。这种分析可以用函数findInteractionChangedGenes或findICG实现。

gene_metadata = fDataDT(mini_visium)
high_expressed_genes = gene_metadata[mean_expr_det > 4]$gene_ID

high_expressed_genes

identify genes that are associated with proximity to other cell types

?findICG
ICGscoresHighGenes = findICG(gobject = mini_visium,
selected_genes = high_expressed_genes,
spatial_network_name = ‘Delaunay_network’,
cluster_column = ‘cell_types’,
diff_test = ‘permutation’,
adjust_method = ‘fdr’,
nr_permutations = 500,
do_parallel = T, cores = 2)

colnames(ICGscoresHighGenes$CPGscores)
[1] “genes” “sel” “other” “log2fc” “diff” “p.value” “p.adj” “perm_sel” “perm_other”
[10] “perm_log2fc” “perm_diff” “cell_type” “int_cell_type” “nr_select” “int_nr_select” “nr_other” “int_nr_other” “unif_int”
[19] “spec_int” “type_int”

可视化细胞接近基因得分

map(c( “cell_barplot”, “cell-cell”,
“dotplot”),function(x){
plotCellProximityGenes(mini_visium, cpgObject = ICGscoresHighGenes, method = x)
}) %>% cowplot::plot_grid(plotlist = .,ncol=3)

过滤 Interaction Changed Gene scores

ICGscoresFilt = filterICG(ICGscoresHighGenes,
min_cells = 2, min_int_cells = 2, min_fdr = 0.1,
min_spat_diff = 0.1, min_log2_fc = 0.1, min_zscore = 1)

过滤并可视化ICG基因

filter genes

?filterICG
ICGscoresFilt = filterICG(ICGscoresHighGenes,
min_cells = 2, min_int_cells = 2, min_fdr = 0.1,
min_spat_diff = 0.1, min_log2_fc = 0.1, min_zscore = 1)

ICGscoresFilt $C P G s c o r e s$ other

visualize subset of interaction changed genes (ICGs)

random subset

ICG_genes = topgenes_mast = mast_markers[, head(.SD, 1), by = ‘cluster’]$genes # c(‘Cpne2’, ‘Scg3’, ‘Cmtm3’, ‘Cplx1’, ‘Lingo1’)
ICG_genes_types = clusters_cell_types
names(ICG_genes) = ICG_genes_types

?plotICG
plotICG(gobject = mini_visium,
cpgObject = ICGscoresHighGenes,
source_type = ‘Tcf7l2_cells’,
source_markers = c(“Scg3”,“Nptx1”,“Stx1a”),
ICG_genes = ICG_genes)

基因表达在细胞附近发生的变化可以用几种方法来考量，配体受体对（Spatially informed ligand-receptor pairing）是其中的一个。为了研究细胞在微环境中是如何交流的，Giotto可以从现有的数据库中整合已知的配体-受体信息。通过计算这类基因对在两种细胞类型的相邻细胞中空间共表达情况，它可以估计出在两种细胞类型的相互作用，哪些配体-受体对可能更多(或更少)用于通信。这是在spatCellCellcom函数中实现的，更具体地说，对于每对配体-受体，计算出每对细胞类型的细胞-细胞通信评分S。

我们读入Giotto自带的配体受体对数据，在您自己的研究中可以根据需要准备或收集目的配受体。

LR_data = data.table::fread(system.file(“extdata”, “mouse_ligand_receptors.txt”, package = ‘Giotto’))
LR_data

 mouseLigand mouseReceptor

1: A2m Lrp1
2: Aanat Mtnr1a
3: Aanat Mtnr1b
4: Adam12 Itga9
5: Adam12 Itgb1

1063: Wnt7b Lrp5
1064: Xcl1 Xcr1
1065: Xcl2 Xcr1
1066: Yars Cxcr1
1067: Zp3 Mertk

先通过基因表达数据对细胞-细胞间的交流进行评分，这里没有用到空间数据，该方法用于模拟基于scRNAseq的CCI分析。

基因匹配

LR_data[, ligand_det := ifelse(mouseLigand %in% mini_visium@gene_ID, T, F)]
LR_data[, receptor_det := ifelse(mouseReceptor %in% mini_visium@gene_ID, T, F)]
LR_data_det = LR_data[ligand_det == T & receptor_det == T]
select_ligands = LR_data_det $mouseLigand select_receptors = LR_data_det$ mouseReceptor

get statistical significance of gene pair expression changes based on expression

expr_only_scores = exprCellCellcom(gobject = mini_visium,
cluster_column = ‘cell_types’,
random_iter = 500,
gene_set_1 = select_ligands,
gene_set_2 = select_receptors)

用空间数据对细胞通讯评分。

spatial_all_scores = spatCellCellcom(mini_visium,
spatial_network_name = ‘Delaunay_network’,
cluster_column = ‘cell_types’,
random_iter = 500,
gene_set_1 = select_ligands,
gene_set_2 = select_receptors,
adjust_method = ‘fdr’,
do_parallel = T,
cores = 4,
verbose = ‘none’)

spatial_all_scores[1:2,]
LR_comb lig_cell_type lig_expr ligand rec_cell_type rec_expr receptor LR_expr lig_nr rec_nr rand_expr av_diff log2fc pvalue
1: Npy-Npy2r Prdm8_cells 4.163227 Npy Spink8_cells 2.721694 Npy2r 6.884920 8 5 5.202572 1.6823484 0.3975514 0.052
2: Npy-Npy2r Ngef_cells 3.345273 Npy Prdm8_cells 2.803618 Npy2r 6.148892 5 3 6.866103 -0.7172109 -0.1567514 0.520
LR_cell_comb p.adj PI
1: Prdm8_cells–Spink8_cells 0.104 0.39077973
2: Ngef_cells–Prdm8_cells 0.688 -0.02545824

select top LR

selected_spat = spatial_all_scores[p.adj <= 0.5 & abs(log2fc) > 0.1 & lig_nr >= 2 & rec_nr >= 2]
selected_spat
data.table::setorder(selected_spat, -PI)

top_LR_ints = unique(selected_spat[order(-abs(PI))] $LR_comb)[1:33] top_LR_cell_ints = unique(selected_spat[order(-abs(PI))]$ LR_cell_comb)[1:33]
?plotCCcomHeatmap
plotCCcomHeatmap(gobject = mini_visium,
comScores = spatial_all_scores,
selected_LR = top_LR_ints,
selected_cell_LR = top_LR_cell_ints,
show = ‘LR_expr’)

plotCCcomDotplot(gobject = mini_visium,
comScores = spatial_all_scores,
selected_LR = top_LR_ints,
selected_cell_LR = top_LR_cell_ints,
cluster_on = ‘PI’)

结合空间数据的细胞通讯。

?combCCcom
comb_comm = combCCcom(spatialCC = spatial_all_scores,
exprCC = expr_only_scores)

for top 1 expression ranks, you recover 0 % of the highest spatial rank
for top 10 expression ranks, you recover 29.55 % of the highest spatial rank
for top 20 expression ranks, you recover 57.95 % of the highest spatial rank

comb_comm[1:2]
LR_comb LR_cell_comb lig_cell_type rec_cell_type ligand receptor lig_expr_spat rec_expr_spat LR_expr_spat lig_nr_spat rec_nr_spat
1: Npy-Npy2r Ccdc153_cells–Ccdc153_cells Ccdc153_cells Ccdc153_cells Npy Npy2r 3.764760 0.9497822 4.714542 11 11
2: Npy-Npy2r Ccdc153_cells–Chgb_cells Ccdc153_cells Chgb_cells Npy Npy2r 3.472081 0.4239559 3.896037 17 11
rand_expr_spat av_diff_spat log2fc_spat pvalue_spat p.adj_spat PI_spat lig_expr rec_expr LR_expr lig_nr rec_nr rand_expr av_diff log2fc
1: 4.429262 0.28527998 0.08812256 0.102 0.204 0.06083716 3.552652 0.8706337 4.423286 106 106 3.334204 1.0890821 0.3973956
2: 3.861855 0.03418194 0.01239384 0.844 0.844 0.00091290 3.552652 0.2954424 3.848095 106 119 3.343469 0.5046257 0.1972939
pvalue p.adj PI LR_expr_rnk LR_spat_rnk exprPI_rnk spatPI_rnk
1: 0.168 0.336 0.18823066 12 9 19 8
2: 0.404 0.808 0.01826718 19 22 25 21

从张大表中我们可以提取很多可以可视化的信息。

top differential activity levels for ligand receptor pairs

plotRankSpatvsExpr(gobject = mini_visium,
comb_comm,
expr_rnk_column = ‘exprPI_rnk’,
spat_rnk_column = ‘spatPI_rnk’,
midpoint = 10)

predict maximum differential activity

plotRecovery(gobject = mini_visium,
comb_comm,
expr_rnk_column = ‘exprPI_rnk’,
spat_rnk_column = ‘spatPI_rnk’,
ground_truth = ‘spatial’)
percentage explained = 0.6022727

我们自己画画二者之间的关系。

p1 <- ggplot(comb_comm,aes(LR_spat_rnk ,LR_expr_rnk))+ geom_point() + theme_bw()

p2 <- ggplot(comb_comm,aes(exprPI_rnk ,spatPI_rnk))+ geom_point()+ theme_bw()
p1+p2

并用我们的igraph绘制网络图。

comb_commdf $SOURCE <- str_split(comb_commdf$ LR_cell_comb,"–",simplify = T)[,1]
comb_commdf $TARGET <- str_split(comb_commdf$ LR_cell_comb,"–",simplify = T)[,2]

comb_commdf
library(igraph)
?graph_from_data_frame
colnames(graph_from_data_frame)
?recode
comb_commdf <- comb_commdf %>% relocate(c(“SOURCE”, “TARGET”,“LR_expr_rnk”, “LR_spat_rnk”, “exprPI_rnk”, “spatPI_rnk”),.before =“LR_comb”)

net<- graph_from_data_frame(comb_commdf)

plot(net)
allcolour=c("#DC143C","#0000FF","#20B2AA","#FFA500","#9370DB",
“#98FB98”,"#F08080","#1E90FF","#7CFC00","#FFFF00",
“#808000”,"#FF00FF","#FA8072","#7B68EE","#9400D3",
“#800080”,"#A0522D","#D2B48C","#D2691E","#87CEEB",
“#40E0D0”,"#5F9EA0","#FF1493",
“#FFE4B5”,"#8A2BE2","#228B22","#E9967A","#4682B4",
“#32CD32”,"#F0E68C","#FFFFE0","#EE82EE","#FF6347",
“#6A5ACD”,"#9932CC","#8B008B","#8B4513","#DEB887")

karate_groups <- cluster_optimal(net)
coords <- layout_in_circle(net, order =
order(membership(karate_groups))) # 设置网络布局
E(net) $w i d t h < - E (n e t)$ LR_expr_rnk /E(net)$LR_spat_rnk # 边点权重（粗细）

net2 <- net # 复制一份备用

for (i in 1: length(unique(comb_commdf $KaTeX parse error: Expected '}', got 'EOF' at end of input: \dotsque(comb_commdf$ SOURCE),function(x) {
get.edge.ids(net,vp = c(unique(comb_commdf $KaTeX parse error: Expected 'EOF', got '}' at position 18: \dotsURCE)[i],x)) }̲)%>% unlist()]$ color <- allcolour[i]
} # 这波操作谁有更好的解决方案？

plot(net, edge.arrow.size=.1,
edge.curved=0.2,
vertex.color=allcolour,
vertex.frame.color="#555555",
vertex.label.color=“black”,
layout = coords,
vertex.label.cex=.7)

可见，模型建好之后，可视化的工作就是提取相关的信息就可以了。作为本次演示的结尾，我们看看如果有目标cell、spot如何画出它的边界，毕竟还是想以空间结尾。

nb_annot = findNetworkNeighbors(mini_visium,
spatial_network_name = ‘Delaunay_network’,
source_cell_ids = unique(mini_visium@spatial_network $kNN_network$ networkDT$to)[sample(500,30)],
)

mini_visium = addCellMetadata(mini_visium, new_metadata = nb_annot, by_column = T, column_cell_ID = ‘cell_ID’)
?spatPlot
spatPlot(mini_visium, point_shape = ‘voronoi’, cell_color =‘nb_cells’,show_image=T,
cell_color_code = c(source = ‘blue’, target = ‘red’, both = ‘yellow’, others = ‘lightgrey’ , neighbor=‘green’))

@Article{,
author = {Ruben Dries and Qian Zhu and Rui Dong and Chee-Huat Linus Eng and Huipeng Li and Kan Liu and Yuntian Fu and Tianxiao Zhao and Arpan Sarkar and Rani E George and Nico Pierson and Long Cai and Guo-Cheng Yuan},
title = {Giotto, a toolbox for integrative analysis and visualization of spatial expression data},
journal = {bioRxiv},
year = {2020},
doi = {10.1101/701680},
url = {https://doi.org/10.1101/701680},
}

Updating immune cell deconvolution for the spatial genomics era
https://www.drieslab.com/
https://rubd.github.io/Giotto/

你可能感兴趣的:(数据挖掘,r语言)

nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Python实现关联规则推荐这孩子谁懂哈 Python Machine Learning python 关联规则机器学习
1.什么关联规则关联规则（AssociationRules）是反映一个事物与其他事物之间的相互依存性和关联性，如果两个或多个事物之间存在一定的关联关系，那么，其中一个事物就能通过其他事物预测到。关联规则是数据挖掘的一个重要技术，用于从大量数据中挖掘出有价值的数据项之间的相关关系。关联规则挖掘的最经典的例子就是沃尔玛的啤酒与尿布的故事，通过对超市购物篮数据进行分析，即顾客放入购物篮中不同商品之间的关
CV、NLP、数据控掘推荐、量化海的那边- AI算法自然语言处理人工智能
下面是对CV（计算机视觉）、NLP（自然语言处理）、数据挖掘推荐和量化的简要概述及其应用领域的介绍：1.CV（计算机视觉，ComputerVision）定义：计算机视觉是一门让计算机能够从图像或视频中提取有用信息，并做出决策的学科。它通过模拟人类的视觉系统来识别、处理和理解视觉信息。主要任务：图像分类：识别图像中的物体并分类，比如猫、狗、车等。目标检测：在图像或视频中定位并识别多个对象，如人脸检测
【机器学习与R语言】1-机器学习简介苹果酱0567 面试题汇总与解析 java 中间件开发语言 spring boot 后端
1.基本概念机器学习：发明算法将数据转化为智能行为数据挖掘VS机器学习：前者侧重寻找有价值的信息，后者侧重执行已知的任务。后者是前者的先期准备过程：数据——>抽象化——>一般化。或者：收集数据——推理数据——归纳数据——发现规律抽象化：训练：用一个特定模型来拟合数据集的过程用方程来拟合观测的数据：观测现象——数据呈现——模型建立。通过不同的格式来把信息概念化一般化：一般化：将抽象化的知识转换成可用
系统架构师软考历年论文题目（2009-2024年）及分析 pccai-vip 系统架构师系统架构
时间题目20091.论基于DSSA的软件架构设计与应用；2.论信息系统建模方法；3.论基于REST服务的Web应用系统设计；4.论软件可靠性设计与应用20101.论软件的静态演化和动态演化及其应用；2.论数据挖掘技术的应用；3.论大规模分布式系统缓存设计策略；4.论软件可靠性评价20111.论模型驱动架构在系统开发中的应用；2.论企业集成平台的架构设计；3.论企业架构管理与应用；4.论软件需求获取
大数据新视界 --大数据大厂之数据挖掘入门：用 R 语言开启数据宝藏的探索之旅青云交大数据新视界数据库大数据数据挖掘 R 语言算法案例未来趋势应用场景学习建议大数据新视界
亲爱的朋友们，热烈欢迎你们来到青云交的博客！能与你们在此邂逅，我满心欢喜，深感无比荣幸。在这个瞬息万变的时代，我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客，正是这样一个温暖美好的所在。在这里，你们不仅能够收获既富有趣味又极为实用的内容知识，还可以毫无拘束地畅所欲言，尽情分享自己独特的见解。我真诚地期待着你们的到来，愿我们能在这片小小的天地里共同成长，共同进步。本博客的精华专栏：Ja
R语言标准普尔500指数Garch(1,1)模型 ronghuilin
一、例3.3标准普尔500指数的月超额收益率，从1926年开始，共792个观察值，如图所示。记rt为超额收益率，rt的样本ACF和rt2的样本PACF。在间隔为1，3时有少许序列相关性，但主要特征是平方序列显示的强烈线性相关性。例题建立garch(1,1)模型的过程：（1）应用arma(p,q)模型消除数据的线性依赖（2）在arma(p,q)模型基础上，建立garch(1,1)模型（3）改进g
大数据之flink与hive 星辰_mya 大数据 flink hive
其实吧我不太想写flink，因为线上经验确实不多，这也是我需要补的地方，没有条件创造条件，先来一篇吧flink：高性能低延迟流批一体的分布式计算框架基于事件时间对实时数据精准处理快速响应支持批处理，高效离线分析和数据挖掘数据仓库的引擎丰富数据源/接收器，集成多种数据存储格式和源，比较常见就是咱们今天的主题hive了checkpoint恢复机制，故障恢复快速恢复计算任务分布式弹性扩展，据业务灵活增加
R 地图绘制-比例尺与指北针 jamesjin63
ggplot绘制mapR语言可以进行数据分析，也可以进行地图绘制，而且非常简洁，快速。虽然Arcgis基于桌面可视化操作，能够进行空间分析，但是唯一不足的就是操作步骤繁琐而且一不小心，就要从头再来，可重复性较低。这篇文章主要讲述如何利用R语言中的ggplot与sf绘制带有指北针、图列与标尺的地图屏幕快照2020-06-28下午9.27.59.png数据我们下载非洲地区54个国家的图层Afirca.
纯生信很难发表？只是你没有及时抓住研究热点 SCI狂人团队
当你还做meta分析的时候，你会发现meta分析很难发或者单位已经不承认了，而聪明的人已经开始做常规的生信GEO、TCGA数据挖掘这些（这个时候生信比较好发）。当你开始做常规的生信GEO、TCGA数据挖掘的时候，你会发现这些一样也是比较难发了，而聪明的人已经开始抓免疫评分这个热点进行生信数据挖掘（这个时候免疫评分比较好发）。当你开始对免疫评分这个热点进行生信数据挖掘的时候，你会发现自己的研究方向差
学习小组Day4笔记--王英芳一万万万万
R语言基础准备工作电脑用户名需要是英文R基础，Rstudio人性化界面资源Rfordatasciencechapter1下载RandRstudio给自己一个全新的R语言环境R是什么一种变成语言，统计计算和绘图的环境，汇集了许多函数，强大分析功能。图形界面Rstudio开源集成开发环境IDE4个板块，脚本编辑器，控制台（脚本运行，结果显示），environment（对象/变量列表）history，文
R语言基础笔记 waterHBO r语言笔记开发语言
起因:今天不知道要写什么。把之前的笔记复制一下。代码开头，导入:#清除系统变量rm(list=ls())#隐藏警告信息:options(warn=-1)#把当前目录，设置为工作目录。library(rstudioapi)current_folder_path0.0&ideology<10.0)分组聚合，类似groupby()df2<-aggregate(df1KaTeXparseerror:Exp
R语言包AMORE安装报错问题以及RStudio与Rtools环境配置卡卡_R-Python R语言数据分析与可视化 r语言开发语言
在使用R语言进行AMORE安装时会遇到报错，这时候需要采用解决办法：'''AMORE包安装，需要离线官网下载安装包：Indexof/src/contrib/Archive/AMORE(r-project.org)https://cran.r-project.org/src/contrib/Archive/AMORE/一、出现的问题最近开始学习R语言，安装了最新版的R4.4.1和RStudio，但安
K-means 算法的介绍与应用小魏冬琅 matlab 算法 kmeans 机器学习
目录引言K-means算法的基本原理表格总结：K-means算法的主要步骤K-means算法的MATLAB实现优化方法与改进K-means算法的应用领域表格总结：K-means算法的主要应用领域结论引言K-means算法是一种经典的基于距离的聚类算法，在数据挖掘、模式识别、图像处理等多个领域中得到了广泛应用。其核心思想是将相似的数据对象聚类到同一个簇中，而使得簇内对象的相似度最大、簇间的相似度最小
Matlab,Python,Java,C++的比较 Codefengfeng python java c++
Matlabmatlab是一个大型计算机，擅长矩阵计算与科学计算，适合构建模型；然而，编译软件的运行效率低，不适合大型软件开发。Pythonpython的优势是简单，入门快。适合做数据挖掘、数据分析、机器学习、人工智能、自然语言处理、爬虫、批量文件处理等，此外，Python开源免费，有很多的库，开发环境开发社区都比较友好；不过，Python是动态型的语言，需要更多的测试，并且错误仅仅是在运行的时候
生态位宽度计算&可视化展示（R语言）光疏介质 r语言
生态位宽度是指物种（或其它生物单位）在群落中所利用的各种不同资源的总和。物种的生态位越宽，该物种的特化程度就越小，倾向于泛化种（generalistspecies）；物种的生态位越窄，倾向于是一个特化种（specialistsspecies）。本篇所使用为生态位宽度指数即**Levins的生态位宽度指数。**（除此之外也有用shannon指数）#安装并加载必要的包if(!requireNamesp
如何搞定数据挖掘？这篇文章告诉你！ isNotNullX 数据挖掘人工智能
在数字化的时代，数据是我们日常生活中不可或缺的一部分。数据所蕴含的信息具有重要价值，而数据挖掘和数据分析就是解读这些信息的重要工具。本文从明晰数据概念入手，再探讨数据挖掘。一·什么是数据？数据定义：数据（Data）是指对客观事物的属性、数量、位置、关系等进行记录和描述的原始材料或信息。数据可以是数字、文字、图像、声音等多种形式，它们是信息的载体，用于表示、传递和存储信息。简单来说，数据就是观测值。
一些机器学习不错的书籍 jimmyleeee 机器学习人工智能
最近，在学习一些机器学习的相关知识，在Github上居然找到了一个可以下载一些不错的介绍机器学习和大数据挖掘和分析的书籍。具体的书籍的信息可以参考一下链接：Books/DataSciencefromScratch.pdfatmaster·varunkashyapks/Books·GitHub
R语言多项逻辑回归-因变量是无序多分类医学和生信笔记医学统计学 r语言医学统计学
因变量是无序多分类资料（＞2）时，可使用多分类逻辑回归（multinomiallogisticregression）。使用课本例16-5的数据，课本电子版及数据已上传到QQ群，自行下载即可。某研究人员欲了解不同社区和性别之间居民获取健康知识的途径是否相同，对2个社区的314名成人进行了调查，其中X1是社区，社区1用0表示，社区2用1表示；X2是性别，0是男，1是女，Y是获取健康知识途径，1是传统大
Protocol Buffer编译器安装雪域迷影
本文翻译自ProtocolBufferCompilerInstallationProtocolBufferCompilerInstallation如何安装protocolbuffer编译器尽管不是强制性的，但gRPC应用程序通常利用ProtocolBuufer来进行服务定义和数据序列化。该站点上的大多数示例代码都使用protocolbuffer语言（proto3）的版本3。protocolbuff
R语言自学笔记-2内置数据集实验室长工
#b站视频——R语言入门与数据分析#内置数据集#固定格式的数据（矩阵、数据框或一个时间序列等）#统计建模、回归分析等试验需要找合适的数据集#R内置数据集，存储在，通过help(package="datasets")#通过data函数访问这些数据集data()#得到新窗口前面：数据集名字后面：内容#包含R所有用到的数据类型，包括：向量、矩阵、列表、因子、数据框以及时间序列等#直接输入数据集的名字就可
使用SparkSql进行表的分析与统计 xingyuan8 大数据 java
背景我们的数据挖掘平台对数据统计有比较迫切的需求，而Spark本身对数据统计已经做了一些工作，希望梳理一下Spark已经支持的数据统计功能，后期再进行扩展。准备数据在参考文献6中下载鸢尾花数据，此处格式为iris.data格式，先将data后缀改为csv后缀（不影响使用，只是为了保证后续操作不需要修改）。数据格式如下：SepalLengthSepalWidthPetalLengthPetalWid
从零开始学python数据分析-从零开始学Python数据分析与挖掘 PDF 扫描版 weixin_37988176
给大家带来的一篇关于数据挖掘相关的电子书资源，介绍了关于Python、数据分析、数据挖掘方面的内容，本书是由清华大学出版社出版，格式为PDF，资源大小67.8MB，刘顺祥编写，目前豆瓣、亚马逊、当当、京东等电子书综合评分为：7.5。内容介绍从零开始学Python数据分析与挖掘本书以Python3版本作为数据分析与挖掘实战的应用工具，从Pyhton的基础语法开始，陆续介绍有关数值计算的Numpy、数
在TCGA上下载数据并且进行处理 Red Red 生信小技巧 r语言数据库
浏览器搜索TCGAGDC进入网站在TCGA数据库主页选择“Repository”模式根据所需要的选项在侧边栏选择数据清空购物车！！第一次登陆可忽略将刚刚选择好的数据加入购物车，并且在购物车里下载Metadata和Cart数据，下载到同一个文件夹下。使用R语言脚本对数据进行处理，将其提取为genesymbol和样本的数据，推荐看一下该博主处理数据！！真的非常详细！他R语言脚本在这个链接里
废字承晔儿
u额堵不堵不断进步数据挖掘额v也得分发的大跳脱衣舞一个月肚饿肚饿金额见到你的就不会预计不不会吧菊花怪下班v触宝电话代表大会素冠荷鼎厚度还是v四川饭馆有电梯的但丁地狱冬天的多点多发发动态鼎泰丰饭地方放多放房东鹅二房方圆大厦？而他得让让热厄尔热水器…
大数据分析与安全分析 Zh&&Li 网络安全运维数据分析安全数据挖掘运维数据库
大数据分析一、大数据安全威胁与需求分析1.1大数据相关概念发展大数据：是指非传统的数据处理工具的数据集大数据特征：海量的数据规模、快速的数据流转、多样的数据类型和价值密度低等大数据的种类和来源非常多，包括结构化、半结构化和非结构化数据有关大数据的新兴网络信息技术应用不断出现，主要包括大规模数据分析处理、数据挖掘、分布式文件系统、分布式数据库、云计算平台、互联网和存储系统1.2大数据安全威胁分析“数
R语言-非结构化数据-文本数据读入 pdc31czy R r语言数据分析
#2.2.2非结构化数据-文本数据读入rm(list=ls())#清空工作空间##1.读入简单文本数据###假如数据包含大量经过结构化的文本数据#只需按照读入csv等标准式数据的方法读入#例：novel=read.csv("novel.csv",fileEncoding="UTF-8")head(novel)##2.用readtable读入文本###文本数据普通读法test=read.table(
千万级规模高性能、高并发的网络架构经验分享搬砖养女人网络架构经验分享
主题：INTO100沙龙时间：2015年11月21日下午地点：梦想加联合办公空间分享人：卫向军（毕业于北京邮电大学，现任微博平台架构师，先后在微软、金山云、新浪微博从事技术研发工作，专注于系统架构设计、音视频通讯系统、分布式文件系统和数据挖掘等领域。）架构以及我理解中架构的本质在开始谈我对架构本质的理解之前，先谈谈对今天技术沙龙主题的个人见解，千万级规模的网站感觉数量级是非常大的，对这个数量级我们
Coding and Paper Letter（十四） G小调的Qing歌
资源整理。1Coding:1.R语言包ungeviz，ggplot2的拓展包，专门用来作不确定性的可视化。ungeviz2.计算机图形学相关开源项目。计算机图形学光线追踪开源项目C++源码。computergraphicsraytracing计算机图形学格网开源项目C++源码。computergraphicsmeshes计算机图形学介绍开源项目。computergraphics3.R语言包GLMM
r语言做绘制精美pcoa图_R语言高级绘图 — ggplot2 weixin_39560002 r语言做绘制精美pcoa图
2)PCA的作图PCA主成分分析，可以将高维数据进行降维处理。我们的OTU表格就是典型的高维数据，可以对其进行降维处理得到主成分PC1和PC2，然后将所有样品都分解到这两个成分方向，进行散点绘图，可以直观的看出样品间的差异。首先需要一系列的统计处理，然后用ggplot2进行绘图，过程如下：#加载需要的三个包(需要先下载，再加载)>library(ade4)>library(ggplot2)>lib
微信开发者验证接口开发 362217990 微信开发者 token 验证
微信开发者接口验证。 Token，自己随便定义，与微信填写一致就可以了。根据微信接入指南描述 http://mp.weixin.qq.com/wiki/17/2d4265491f12608cd170a95559800f2d.html 第一步：填写服务器配置第二步：验证服务器地址的有效性第三步：依据接口文档实现业务逻辑这里主要讲第二步验证服务器有效性。建一个
一个小编程题-类似约瑟夫环问题 BrokenDreams 编程
今天群友出了一题：一个数列,把第一个元素删除,然后把第二个元素放到数列的最后,依次操作下去,直到把数列中所有的数都删除,要求依次打印出这个过程中删除的数。 &
linux复习笔记之bash shell (5) 关于减号-的作用 eksliang linux关于减号“-”的含义 linux关于减号“-”的用途 linux关于“-”的含义 linux关于减号的含义
转载请出自出处： http://eksliang.iteye.com/blog/2105677 管道命令在bash的连续处理程序中是相当重要的，尤其在使用到前一个命令的studout（标准输出）作为这次的stdin（标准输入）时，就显得太重要了，某些命令需要用到文件名，例如上篇文档的的切割命令（split）、还有
Unix(3) 18289753290 unix ksh
1)若该变量需要在其他子进程执行，则可用"$变量名称"或${变量}累加内容什么是子进程？在我目前这个shell情况下，去打开一个新的shell，新的那个shell就是子进程。一般状态下，父进程的自定义变量是无法在子进程内使用的，但通过export将变量变成环境变量后就能够在子进程里面应用了。 2)条件判断： &&代表and ||代表or&nbs
关于ListView中性能优化中图片加载问题酷的飞上天空 ListView
ListView的性能优化网上很多信息，但是涉及到异步加载图片问题就会出现问题。具体参看上篇文章http://314858770.iteye.com/admin/blogs/1217594 如果每次都重新inflate一个新的View出来肯定会造成性能损失严重，可能会出现listview滚动是很卡的情况，还会出现内存溢出。现在想出一个方法就是每次都添加一个标识，然后设置图
德国总理默多克：给国人的一堂“震撼教育”课永夜-极光教育
http://bbs.voc.com.cn/topic-2443617-1-1.html德国总理默多克：给国人的一堂“震撼教育”课　安吉拉—默克尔，一位经历过社会主义的东德人，她利用自己的博客，发表一番来华前的谈话，该说的话，都在上面说了，全世界想看想传播——去看看默克尔总理的博客吧！　　德国总理默克尔以她的低调、朴素、谦和、平易近人等品格给国人留下了深刻印象。她以实际行动为中国人上了一堂
关于Java继承的一个小问题。。。随便小屋 java
今天看Java 编程思想的时候遇见一个问题，运行的结果和自己想想的完全不一样。先把代码贴出来！ //CanFight接口 interface Canfight { void fight(); } //ActionCharacter类 class ActionCharacter { public void fight() { System.out.pr
23种基本的设计模式 aijuans 设计模式
Abstract Factory：提供一个创建一系列相关或相互依赖对象的接口，而无需指定它们具体的类。　　Adapter：将一个类的接口转换成客户希望的另外一个接口。A d a p t e r模式使得原本由于接口不兼容而不能一起工作的那些类可以一起工作。　　Bridge：将抽象部分与它的实现部分分离，使它们都可以独立地变化。　　Builder：将一个复杂对象的构建与它的表示分离，使得同
《周鸿祎自述：我的互联网方法论》读书笔记 aoyouzi 读书笔记
从用户的角度来看,能解决问题的产品才是好产品,能方便/快速地解决问题的产品,就是一流产品. 商业模式不是赚钱模式一款产品免费获得海量用户后,它的边际成本趋于0,然后再通过广告或者增值服务的方式赚钱,实际上就是创造了新的价值链. 商业模式的基础是用户,木有用户,任何商业模式都是浮云.商业模式的核心是产品,本质是通过产品为用户创造价值. 商业模式还包括寻找需求
JavaScript动态改变样式访问技术百合不是茶 JavaScript style属性 ClassName属性
一:style属性格式: HTML元素.style.样式属性="值"; 创建菜单:在html标签中创建或者在head标签中用数组创建 <html> <head> <title>style改变样式</title> </head> &l
jQuery的deferred对象详解 bijian1013 jquery deferred对象
jQuery的开发速度很快，几乎每半年一个大版本，每两个月一个小版本。每个版本都会引入一些新功能，从jQuery 1.5.0版本开始引入的一个新功能----deferred对象。 &nb
淘宝开放平台TOP Bill_chen C++c 物流 C#
淘宝网开放平台首页：http://open.taobao.com/ 淘宝开放平台是淘宝TOP团队的产品，TOP即TaoBao Open Platform，是淘宝合作伙伴开发、发布、交易其服务的平台。支撑TOP的三条主线为： 1.开放数据和业务流程 * 以API数据形式开放商品、交易、物流等业务； &
【大型网站架构一】大型网站架构概述 bit1129 网站架构
大型互联网特点面对海量用户、海量数据大型互联网架构的关键指标高并发高性能高可用高可扩展性线性伸缩性安全性大型互联网技术要点前端优化 CDN缓存反向代理 KV缓存消息系统分布式存储 NoSQL数据库搜索监控安全想到的问题： 1.对于订单系统这种事务型系统，如
eclipse插件hibernate tools安装白糖_ Hibernate
eclipse helios(3.6)版 1.启动eclipse 2.选择 Help > Install New Software...> 3.添加如下地址： http://download.jboss.org/jbosstools/updates/stable/helios/ 4.选择性安装：hibernate tools在All Jboss tool
Jquery easyui Form表单提交注意事项 bozch jquery easyui
jquery easyui对表单的提交进行了封装，提交的方式采用的是ajax的方式，在开发的时候应该注意的事项如下： 1、在定义form标签的时候，要将method属性设置成post或者get，特别是进行大字段的文本信息提交的时候，要将method设置成post方式提交，否则页面会抛出跨域访问等异常。所以这个要
Trie tree(字典树)的Java实现及其应用-统计以某字符串为前缀的单词的数量 bylijinnan java实现
import java.util.LinkedList; public class CaseInsensitiveTrie { /** 字典树的Java实现。实现了插入、查询以及深度优先遍历。 Trie tree's java implementation.(Insert,Search,DFS) Problem Description Igna
html css 鼠标形状样式汇总 chenbowen00 html css
css鼠标手型cursor中hand与pointer Example：CSS鼠标手型效果 <a href="#" style="cursor:hand">CSS鼠标手型效果</a><br/> Example：CSS鼠标手型效果 <a href="#" style=&qu
[IT与投资]IT投资的几个原则 comsci it
无论是想在电商,软件,硬件还是互联网领域投资,都需要大量资金,虽然各个国家政府在媒体上都给予大家承诺,既要让市场的流动性宽松,又要保持经济的高速增长....但是,事实上,整个市场和社会对于真正的资金投入是非常渴望的,也就是说,表面上看起来,市场很活跃,但是投入的资金并不是很充足的......
oracle with语句详解 daizj oracle with with as
oracle with语句详解转在oracle中，select 查询语句，可以使用with,就是一个子查询，oracle 会把子查询的结果放到临时表中，可以反复使用例子:注意，这是sql语句，不是pl/sql语句，可以直接放到jdbc执行的 ----------------------------------------------------------------
hbase的简单操作 deng520159 数据库 hbase
近期公司用hbase来存储日志,然后再来分析 ,把hbase开发经常要用的命令找了出来. 用ssh登陆安装hbase那台linux后用hbase shell进行hbase命令控制台! 表的管理 1）查看有哪些表 hbase(main)> list 2）创建表 # 语法：create <table>, {NAME => <family&g
C语言scanf继续学习、算术运算符学习和逻辑运算符 dcj3sjt126com c
/* 2013年3月11日20:37:32 地点：北京潘家园功能：完成用户格式化输入多个值目的：学习scanf函数的使用 */ # include <stdio.h> int main(void) { int i, j, k; printf("please input three number:\n"); //提示用
2015越来越好 dcj3sjt126com 歌曲
越来越好房子大了电话小了感觉越来越好假期多了收入高了工作越来越好商品精了价格活了心情越来越好天更蓝了水更清了环境越来越好活得有奔头人会步步高想做到你要努力去做到幸福的笑容天天挂眉梢越来越好婆媳和了家庭暖了生活越来越好孩子高了懂事多了学习越来越好朋友多了心相通了大家越来越好道路宽了心气顺了日子越来越好活的有精神人就不显
java.sql.SQLException: Value '0000-00-00' can not be represented as java.sql.Tim feiteyizu mysql
数据表中有记录的time字段（属性为timestamp）其值为：“0000-00-00 00:00:00” 程序使用select 语句从中取数据时出现以下异常： java.sql.SQLException:Value '0000-00-00' can not be represented as java.sql.Date java.sql.SQLException: Valu
Ehcache（07）——Ehcache对并发的支持 234390216 并发 ehcache 锁 ReadLock WriteLock
Ehcache对并发的支持在高并发的情况下，使用Ehcache缓存时，由于并发的读与写，我们读的数据有可能是错误的，我们写的数据也有可能意外的被覆盖。所幸的是Ehcache为我们提供了针对于缓存元素Key的Read（读）、Write（写）锁。当一个线程获取了某一Key的Read锁之后，其它线程获取针对于同
mysql中blob,text字段的合成索引 jackyrong mysql
在mysql中，原来有一个叫合成索引的，可以提高blob,text字段的效率性能，但只能用在精确查询，核心是增加一个列，然后可以用md5进行散列，用散列值查找则速度快比如： create table abc(id varchar(10),context blog,hash_value varchar(40)); insert into abc(1,rep
逻辑运算与移位运算 latty 位运算逻辑运算
源码：正数的补码与原码相同例+7 源码：00000111 补码：00000111 （用8位二进制表示一个数）负数的补码：符号位为1，其余位为该数绝对值的原码按位取反；然后整个数加1。 -7 源码： 10000111 ，其绝对值为00000111 取反加一：11111001 为-7补码已知一个数的补码，求原码的操作分两种情况：
利用XSD 验证XML文件 newerdragon java xml xsd
XSD文件（XML Schema 语言也称作 XML Schema 定义（XML Schema Definition，XSD）。具体使用方法和定义请参看： http://www.w3school.com.cn/schema/index.asp java自jdk1.5以上新增了SchemaFactory类可以实现对XSD验证的支持，使用起来也很方便。以下代码可用在J
搭建 CentOS 6 服务器(12) - Samba rensanning centos
（1）安装 # yum -y install samba Installed: samba.i686 0:3.6.9-169.el6_5 # pdbedit -a rensn new password:123456 retype new password:123456 …… （2）Home文件夹 # mkdir /etc
Learn Nodejs 01 toknowme nodejs
（1）下载nodejs https://nodejs.org/download/ 选择相应的版本进行下载（2）安装nodejs 安装的方式比较多，请baidu下我这边下载的是“node-v0.12.7-linux-x64.tar.gz”这个版本（1）上传服务器（2）解压 tar -zxvf node-v0.12.
jquery控制自动刷新的代码举例 xp9802 jquery
1、html内容部分复制代码代码示例: <div id='log_reload'> <select name="id_s" size="1"> <option value='2'>-2s-</option> <option value='3'>-3s-</option

gitto-page enrichment

1. read image

2. test and modify image alignment

3. add images to Giotto object

explore gene and cell distribution

显示有多少基因和细胞在组合阈值时丢失。

filter and normalize

可以直接用函数获得上述信息：

查看聚类结果

visualize UMAP cluster results

visualize UMAP and spatial results

spatial voronoi plot with selected clusters

spatial voronoi plot without showing not selected clusters

spatial voronoi plot without showing not selected cells, but showing the voronoi borders

check new cell metadata

1: AAAGGGATGTAGCAAG-1 226 38.24027 992.0223 3 Ddn_cells 2: AAATGGCATGTCTTGT-1 283 47.88494 1123.8751 4 Ngef_cells 3: AAATGGTCAATGTGCC-1 247 41.79357 1024.8760 2 Tcf7l2_cells 4: AAATTAACGGGTAGCT-1 221 37.39425 971.3199 2 Tcf7l2_cells 5: AACAACTGGTAGTTGC-1 306 51.77665 1157.2925 2 Tcf7l2_cells

cell type signatures

combination of all marker genes identified

heatmap of enrichment versus annotation (e.g. clustering result)

spatplot

检测空间相关的基因

2. cluster correlation scores

perform hmrf

check and select hmrf

high_expressed_genes

identify genes that are associated with proximity to other cell types

filter genes

visualize subset of interaction changed genes (ICGs)

random subset

1: A2m Lrp1 2: Aanat Mtnr1a 3: Aanat Mtnr1b 4: Adam12 Itga9 5: Adam12 Itgb1

基因匹配

get statistical significance of gene pair expression changes based on expression

select top LR

top differential activity levels for ligand receptor pairs

predict maximum differential activity

你可能感兴趣的:(数据挖掘,r语言)

1: AAAGGGATGTAGCAAG-1 226 38.24027 992.0223 3 Ddn_cells
2: AAATGGCATGTCTTGT-1 283 47.88494 1123.8751 4 Ngef_cells
3: AAATGGTCAATGTGCC-1 247 41.79357 1024.8760 2 Tcf7l2_cells
4: AAATTAACGGGTAGCT-1 221 37.39425 971.3199 2 Tcf7l2_cells
5: AACAACTGGTAGTTGC-1 306 51.77665 1157.2925 2 Tcf7l2_cells

1: A2m Lrp1
2: Aanat Mtnr1a
3: Aanat Mtnr1b
4: Adam12 Itga9
5: Adam12 Itgb1