生信修炼手册

WGCNA实战练习

欢迎关注微信公众号《生信修炼手册》!

本文采用WGCNA官网的Tutirial 1的数据，对加权基因共表达网络分析和后续的数据挖掘的具体操作进行梳理

整个分析流程可以分为以下几个步骤

1. 数据预处理

这部分内容包括以下4个部分

读取基因表达量数据
对样本和基因进行过滤
读取样本表型数据
可视化样本聚类树和表型数据

官方的示例数据是一个小鼠的芯片表达谱数据，包含了135个雌性小鼠的数据，在提供的表达谱数据中，除了探针ID和样本表达量之外，还有额外的探针注释信息，在读取原始数据时，需要把多余注释信息去除，代码如下

# 读取文件
options(stringsAsFactors = FALSE)
femData = read.csv("LiverFemale3600.csv")

# 去除多余的注释信息列
datExpr0 = as.data.frame(t(femData[, -c(1:8)]))
names(datExpr0) = femData$substanceBXH
rownames(datExpr0) = names(femData)[-c(1:8)]

对于基因的表达量数据，需要进行过滤，对于基因而言，可以过滤缺失值或者低表达的基因，对于样本而言，如果该样本中基因缺失值很多，也需要过滤，WGCNA内置了一个检验基因和样本的函数，通过该函数可以进行一个基本过滤，代码如下

gsg = goodSamplesGenes(datExpr0)
if (!gsg$allOK) {
datExpr0 = datExpr0[gsg$goodSamples, gsg$goodGenes]
}

goodSamples和goodGenes就是需要保留的基因和样本。基础过滤之后，还可以看下是否存在离群值的样本，通过样本的聚类树进行判断，代码如下

pdf(file = "sampleClustering.pdf", width = 15, height = 10);
par(cex = 0.6);
plot(sampleTree, 
  main = "Sample clustering to detect outliers", 
  sub="", xlab="", cex.lab = 1.5,
  cex.axis = 1.5, cex.main = 2)
dev.off()

生成的图片如下

从图上可以看出，F2_221 这个样本和其他样本差距很大，可以将该样本过滤掉。代码如下

clust = cutreeStatic(
  sampleTree,
  cutHeight = 15,
  minSize = 10)

keepSamples = (clust==1)
datExpr = datExpr0[keepSamples, ]
nGenes = ncol(datExpr)
nSamples = nrow(datExpr)

表型数据中也包含了不需要的列，而且其样本比表达谱的样本多，需要根据表达谱的样本提取对应的表型数据，代码如下

# 读取文件
traitData = read.csv("ClinicalTraits.csv")

# 删除多余的列
allTraits = traitData[, -c(31, 16)]
allTraits = allTraits[, c(2, 11:36) ]

# 报纸和表达谱的样本一致
femaleSamples = rownames(datExpr)
traitRows = match(femaleSamples, allTraits$Mice)
datTraits = allTraits[traitRows, -1]
rownames(datTraits) = allTraits[traitRows, 1]

表达谱数据和表型数据准备好之后，可以绘制样本聚类树和表型的热图，代码如下

# 由于去除了样本，重新对剩余样本聚类
sampleTree2 = hclust(dist(datExpr), method = "average")

traitColors = numbers2colors(datTraits, signed = FALSE)

plotDendroAndColors(
  sampleTree2,
  traitColors,
  groupLabels = names(datTraits),
  main = "Sample dendrogram and trait heatmap")

生成的图片如下

上版部分为样本的聚类树，下班部分为样本对应的表型的热图，顺序和聚类树中的顺序一致，表达量从低到高，颜色从白色过渡到红色，灰色代表缺失值。

2. 构建共表达网络，识别modules

在构建共表达网络时，将基因间的相关系数进行乘方运算来表征其相关性，首先需要确定乘方的值，代码如下

# 设定一些列power梯度

powers = c(c(1:10), seq(from = 12, to=20, by=2))
sft = pickSoftThreshold(datExpr, powerVector = powers, verbose = 5)

在sft这个对象中保存了每个power值计算出来的网络的特征，结构如下

> str(sft)
List of 2
$ powerEstimate: num 6
$ fitIndices   :'data.frame':    15 obs. of  7 variables:
  ..$ Power         : num [1:15] 1 2 3 4 5 6 7 8 9 10 ...
  ..$ SFT.R.sq      : num [1:15] 0.0278 0.1264 0.3404 0.5062 0.6807 ...
  ..$ slope         : num [1:15] 0.345 -0.597 -1.03 -1.422 -1.716 ...
  ..$ truncated.R.sq: num [1:15] 0.456 0.843 0.972 0.973 0.94 ...
  ..$ mean.k.       : num [1:15] 747 254.5 111 56.5 32.2 ...
  ..$ median.k.     : num [1:15] 761.7 250.8 101.7 47.2 25.1 ...
  ..$ max.k.        : num [1:15] 1206 574 324 202 134 ...

其中powerEstimate就是最佳的power值，fitIndices保存了每个power对应的网络的特征。

代码如下

plot(
  sft$fitIndices[,1],
  -sign(sft$fitIndices[,3])*sft$fitIndices[,2],
  xlab="Soft Threshold (power)",
  ylab="Scale Free Topology Model Fit,signed R^2",type="n",
  main = paste("Scale independence")
)

text(
  sft$fitIndices[,1],
  -sign(sft$fitIndices[,3])*sft$fitIndices[,2],
  labels=powers,
  cex=0.9,
  col="red"
)


abline(h=0.90, col="red")

生成的图片如下

sft$fitIndices 保存了每个power构建的相关性网络中的连接度的统计值，k就是连接度值，可以看到，对于每个power值，提供了max, median, max3种连接度的统计量，这里对连接度的均值进行可视化，代码如下

plot(
sft$fitIndices[,1],
sft$fitIndices[,5],
xlab="Soft Threshold (power)",
ylab="Mean Connectivity",
type="n",
main = paste("Mean connectivity")
)

text(
sft$fitIndices[,1],
sft$fitIndices[,5],
labels=powers,
cex=cex1,
col="red"
)

生成的图片如下

确定好power值之后，可以直接构建相关性网络

net = blockwiseModules(
datExpr,
power = sft$powerEstimate,
TOMType = "unsigned",
minModuleSize = 30,
reassignThreshold = 0,
mergeCutHeight = 0.25,
numericLabels = TRUE,
pamRespectsDendro = FALSE,
saveTOMs = TRUE,
saveTOMFileBase = "femaleMouseTOM",
verbose = 3)

net对象中保存了所有相关性网络和module的结果，可以将基因的聚类树和对应的module进行可视化，代码如下

mergedColors = labels2colors(net$colors)

plotDendroAndColors(
  net$dendrograms[[1]],
  mergedColors[net$blockGenes[[1]]],
  "Module colors",
  dendroLabels = FALSE,
  hang = 0.03,
  addGuide = TRUE,
  guideHang = 0.05
)

生成的图片如下

上方为基因的聚类树，聚类时的距离为1-TOM值，下方为基因对应的modules。

类似的，还可以结合基因间的距离，即1-TOM值，用热图展示，代码如下

geneTree = net$dendrograms[[1]]
moduleColors = labels2colors(net$colors)
dissTOM = 1 - TOMsimilarityFromExpr(
  datExpr,
  power = sft$powerEstimate)
plotTOM = dissTOM ^ 7
diag(plotTOM) = NA
TOMplot(
  plotTOM,
  geneTree,
  moduleColors,
  main = "Network heatmap plot, all genes"
)

生成的图片如下

在前面我们提到过，在识别module的过程中共，首先用dynamicTreeCut识别modules, 然后根据Module eigengene间的相关性合并modules,net`这个对象中保存了合并前和合并后的modules, 可以将二者画在同一张图上，可视化代码如下

unmergedColors = labels2colors(net$unmergedColors)
mergedColors   = labels2colors(net$colors)

plotDendroAndColors(
  net$dendrograms[[1]],
  cbind(unmergedColors[net$blockGenes[[1]]], mergedColors[net$blockGenes[[1]]]),
  c("Dynamic Tree Cut" , "Merged colors"),
  dendroLabels = FALSE,
  hang = 0.03,
  addGuide = TRUE,
  guideHang = 0.05
)

生成的图片如下

对于合并前的modules, 其相关性分析的结果可视化如下

unmergedColors = labels2colors(net$unmergedColors)

MEList = moduleEigengenes(datExpr, colors = unmergedColors)
MEs = MEList$eigengenes

MEDiss = 1-cor(MEs)

METree = hclust(as.dist(MEDiss), method = "average")

plot(METree,
     main = "Clustering of module eigengenes",
     xlab = "",
     sub = "")

生成的图片如下

对于每个module而言，我们希望知道该module下对应的基因，提取方式如下

> moduleColors = labels2colors(net$colors)
> unique(moduleColors)
[1] "grey"         "turquoise"    "grey60"       "yellow"       "tan"         
[6] "green"        "red"          "black"        "blue"         "midnightblue"
[11] "cyan"         "magenta"      "salmon"       "lightgreen"   "brown"       
[16] "purple"       "pink"         "greenyellow"  "lightcyan"
> head(names(datExpr)[moduleColors=="red"])
[1] "MMT00000159" "MMT00000793" "MMT00000840" "MMT00001154" "MMT00001245"
[6] "MMT00001260"

同样我们也可以提取module对应的基因表达量数据，绘制热图, 代码如下

which.module="red"
plotMat(
t(scale(datExpr[,moduleColors==which.module ]) ),
nrgcols=30,
rlabels=F,
rcols=which.module,
main=which.module,
cex.main=2
)

生成的图片如下

3. 筛选与表型相关的modules

本质上是计算module的ME值与表型的相关系数，代码如下

nGenes = ncol(datExpr)
nSamples = nrow(datExpr)

MEs0 = moduleEigengenes(datExpr, moduleColors)$eigengenes
MEs = orderMEs(MEs0)
moduleTraitCor = cor(
MEs,
datTraits,
use = "p"
)

moduleTraitPvalue = corPvalueStudent(
moduleTraitCor,
nSamples
)

可以对module和表型间的系数的结果进行可视化，代码如下

textMatrix =  paste(
signif(moduleTraitCor, 2),
"\n(",
signif(moduleTraitPvalue, 1),
")",
sep = ""
)

dim(textMatrix) = dim(moduleTraitCor)

labeledHeatmap(
Matrix = moduleTraitCor,
xLabels = names(datTraits),
yLabels = names(MEs),
ySymbols = names(MEs),
colorLabels = FALSE,
colors = blueWhiteRed(50),
textMatrix = textMatrix,
setStdMargins = FALSE,
cex.text = 0.5,
zlim = c(-1,1),
main = paste("Module-trait relationships")
)

生成的图片如下

指定一个我们感兴趣的表型，可以得到与其相关性最高的module, 代码如下

> which.trait <- "weight_g"
> moduleTraitCor[, which.trait]
> moduleTraitCor[, which.trait]
     MEmagenta        MEblack    MEturquoise        MEgreen    MElightcyan
  -0.017418109   -0.312679561   -0.272907078    0.001339804   -0.128053858
        MEblue        MEbrown          MEred       MEsalmon       MEyellow
   0.314323101    0.591340840    0.509942529    0.432058666    0.219900538
  MElightgreen  MEgreenyellow       MEgrey60         MEpink       MEpurple
  -0.057215182   -0.022394396   -0.016705204   -0.051495573   -0.021167541
         MEtan         MEcyan MEmidnightblue         MEgrey
   0.269827166    0.181595161    0.193569095    0.089702947

以上结果中，和weight_g最相关的为module为MEred，当然也可以自己指定一个阈值，筛选出多个候选的modules。在WGCNA中，对于基因定义了GS值，表征基因和表型之间的相关性，对于module而言，也可以用所有基因GS绝对值的平均数来表征该module与表型之间的惯性，代码如下

moduleColors = labels2colors(net$colors)
which.trait <- "weight_g"
y <- datTraits[, which.trait]
GS <- as.numeric(cor(y ,datExpr, use="p"))
GeneSignificance <-  abs(GS)
ModuleSignificance <- tapply(
GeneSignificance,
moduleColors, mean, na.rm=T)
plotModuleSignificance(GeneSignificance, moduleColors)

生成的图片如下

可以看到brown, red这两个模块和体重相关。对于ME和某一表型而言，还可以将数据合并，聚类展示，代码如下

weight <- datTraits[, which.trait]
MEs0 = moduleEigengenes(datExpr, moduleColors)$eigengenes
MEs = orderMEs(MEs0)
MET = orderMEs(cbind(MEs, weight))


par(mar = c(4, 2, 1, 2), cex = 0.9)
plotEigengeneNetworks(
MET, "",
marDendro = c(0,4,1,2),
marHeatmap = c(3,4,1,2),
cex.lab = 0.8,
xLabelsAngle = 90
)

生成的图片如下

4. 筛选关键基因

筛选出与表型高相关的modules之后，还可以对modules下的基因进行进一步筛选，主要根据GS值和MM值，代码如下

datKME = signedKME(
datExpr,
MEs,
outputColumnName="MM.")

FilterGenes= abs(GS1)> .2 & abs(datKME$MM.brown)>.8

筛选出候选基因后，可以进行下游的功能富集分析，使用clusterProfiler等R包，进一步挖掘功能。

5. 导出module数据, 绘制网络图

可以导出指定modules对应的基因共表达网络，方便可视化，代码如下

TOM = TOMsimilarityFromExpr(datExpr, power = 6)
modules = c("brown", "red")
probes = names(datExpr)
inModule = is.finite(match(moduleColors, modules));
modProbes = probes[inModule];
modTOM = TOM[inModule, inModule];
dimnames(modTOM) = list(modProbes, modProbes)

cyt = exportNetworkToCytoscape(
modTOM,
edgeFile = paste("CytoscapeInput-edges-", paste(modules, collapse="-"), ".txt", sep=""),
nodeFile = paste("CytoscapeInput-nodes-", paste(modules, collapse="-"), ".txt", sep=""),
weighted = TRUE,
threshold = 0.02,
nodeNames = modProbes,
nodeAttr = moduleColors[inModule]
)

最终会生成以下两个文件，可以导入cytoscape进行绘图

CytoscapeInput-edges-brown-red.txt
CytoscapeInput-nodes-brown-red.txt

当然也支持导出VisANT软件支持的格式，详细用法请参阅官网的帮助文档。

扫描关注微信号，更多精彩内容等着你！

用了这么多年的PCA可视化竟然是错的！！！生信宝典
本文启发于上周开的单细胞转录组课程，本次课程由资深单细胞算法研究者戴老师主讲，深入浅出，各部分分析原理从理论到应用层面解释透彻，最新流程，最新代码，绝对值得学习。课程尚未结束，我就迫不及待向一位未能安排出时间参加此课程的老友及时安利了视频课。言归正传，介绍培训课程的一张幻灯片：很多PCA可视化结果都是不合适的。PCA或PCoA是常用的降维工具，之前有几篇文章介绍PCA的原理和可视化。一文看懂PCA
2022-04-17 图灵基因
NatBiotech|组织中单细胞转录组的空间图谱原创图灵基因图灵基因2022-04-1707:03收录于话题#前沿生物大数据分析单细胞RNA测序（scRNA-seq）已经彻底改变了单细胞水平上的基因表达研究。最近，空间技术通过添加空间信息将转录组学提升到了一个新的水平。但是，它缺乏单细胞分辨率。现在，来自德克萨斯大学MD安德森癌症中心的一个小组开发了一种名为CellTrek的计算方法，将这两个数
生信人应该这样来装软件(未完待续) dandanwu90
P1优先选择二进制可执行软件来安装不同组学任务模块比对重要全基因组测序/外显子测序找差异和变异转录组相关计数软件安装规律：二进制，下载解压，全路径调用#C语言查看在还是不在whichmakewhichcmakewhichjavawhichperlwhichpython#查看版本python--versionperl--version查看版本，版本问题导致错误如何判断所有软件是否是二进制，进入软件官
时空组专辑数据库文献详解 | 拟南芥叶片单细胞空间转录组图谱尐尐呅
深圳华大生命科学研究院等在自主研发的时空组学技术Stereo-seq基础上，针对植物样本具有细胞壁这一特性，建立了一套适用于植物的、单细胞化的空间转录组技术scStereo-seq（single-cellSpaTialEnhancedREsolutionOmics-sequencing）。研究团队将其示范应用于模式植物拟南芥（Arabidopsis）的叶片研究中，对上、下表皮细胞、栅栏细胞、海绵细
大模型日报2024-06-07 赛博 AI 大模型日报人工智能 AIGC GPT4o OpenAI Gemini
大模型日报2024-06-07大模型资讯大规模单细胞转录组学基础模型研究摘要:大型预训练模型已成为基础模型，在自然语言处理及相关领域取得突破。本文介绍了在单细胞转录组学领域应用大规模基础模型的研究进展。MMLU-Pro：评估语言理解模型的新基准摘要:MMLU-Pro是一个增强型基准，旨在评估语言理解模型在更广泛和更具挑战性的任务中的表现。最近，大型语言模型在自然语言处理领域取得了显著进展，推动了这
推荐一份生物信息学入门很好的参考材料小明的数据分析笔记本
链接是https://bioinformatics.uconn.edu/resources-and-events/tutorials-2/这个是康涅狄格大学（UniversityofConnecticut）提供的一份教程，主要的内容包括1、生物信息学中经常用到的文件格式image.png2、linux操作系统和R语言的基础知识image.png3、转录组数据的处理流程image.png这里包括有参
seurat提取表达矩阵_10X scRNA免疫治疗学习笔记-3-走Seurat标准流程幸福的小酒瓶 seurat提取表达矩阵
刘小泽写于19.10.15笔记目的：根据生信技能树的单细胞转录组课程探索10XGenomics技术相关的分析课程链接在：http://jm.grazy.cn/index/mulitcourse/detail.html?cid=55第二单元第7讲：走Seurat标准流程【文章结构总-分-总，结尾有完整的代码，熟悉者前面可以跳过，去看后面8min完成的代码】前言前面介绍了自己利用cellrangerc
慌张品2020
最近在拼转录组的文章了，兴趣还是没有的，只有迫使自己必须去做。而文学书对于我，就是水对鱼的必须，几日不读闲书，我就抽抽成鱼干，整个人就没有活力，没有兴致。两周多“断舍离”的日子，整个人都不在状态，莫名无助，莫名空落，办事效率也低。突然明白，我原来是特别渴望被关心被肯定。至少有书为伴，常有共鸣。而强迫抽身出来对付枯燥的文章，无好书无关心无肯定，犹如一个人面对绝境，浸满孤独无助和慌张。
单细胞转录组和表观组学图谱揭示效应、记忆和耗竭CD8 T细胞在不同细胞命运分化中的共享生物学特征（下篇） Davey1220
文章信息文章题目：Longitudinalsinglecelltranscriptionalandepigeneticmappingofeffector,memory,andexhaustedCD8Tcellsrevealssharedbiologicalcircuitsacrossdistinctcellfates期刊：bioRxiv链接：https://www.biorxiv.org/cont
2022《Nature Plants》通过基因组组装揭示模式蕨类植物的动态基因组进化 iBioinformatics
Introduction大多数蕨类植物的大基因组和复杂度，阻碍了其通过基因组组装来阐明蕨类生物学和陆地植物的进化。本研究对水蕨（Ceratopterisrichardii）进行了染色体水平的基因组组装，以及相关的甲基组、转录组和代谢组分析。该组装揭示了一段非常动态的基因组进化历史，包括大约6000万年前最近一次全基因组复制后基因组内容和结构的快速变化。包括大量基因丢失、串联复制和来自细菌的多个水平
使用clusterProfiler进行GO、KEGG富集分析（有参情况）纪伟讲测序
寻找差异表达的基因并识别它们的功能，是我们进行RNA测序的最主要目的。很明显，这些差异的基因必然与功能改变密切相关，例如，比较患病个体与正常个体的组织表达谱，不难想到这些显著失调的基因参与了生物学过程、信号通路等，导致了疾病的发生。前面已经讲了如何使用DESeq2、edgeR基于转录组测序获得的基因表达值鉴定差异表达基因。那么，后续如何继续通过生信分析的方法，探索差异表达的基因发挥了怎样的功能，参
1区9+非肿瘤纯生信，逻辑清晰易懂，机器学习筛选关键基因的纯生信也可以发高水平期刊，抓紧上车！生信小课堂
影响因子：9.186关于非肿瘤生信，我们也解读过很多，主要有以下类型1单个疾病WGCNA+PPI分析筛选hub基因。2单个疾病结合免疫浸润，热点基因集，机器学习算法等。3两种相关疾病联合分析，包括非肿瘤结合非肿瘤，非肿瘤结合肿瘤或者非肿瘤结合泛癌分析4基于分型的非肿瘤生信分析5单细胞结合普通转录组生信分析目前非肿瘤生信发文的门槛较低，有需要的朋友欢迎交流研究概述：本研究首先使用R语言在三个基因表达
7+非肿瘤纯生信，内容不多但思路值得借鉴！生信小课堂
关于非肿瘤生信，我们也解读过很多，主要有以下类型1单个疾病WGCNA+PPI分析筛选hub基因。2单个疾病结合免疫浸润，铁死亡，自噬等基因集，机器学习算法等。3两种相关疾病联合分析，包括非肿瘤结合非肿瘤，非肿瘤结合肿瘤或者非肿瘤结合泛癌分析4基于分型的非肿瘤生信分析5单细胞结合普通转录组生信分析目前非肿瘤生信发文的门槛较低，有需要的朋友患者添加小编咨询生信分析咨询请关注生信小课堂研究背景：扩张型心
跟着Cell学单细胞转录组分析(十二):转录因子分析 KS科研分享与服务
转录因子分析可以了解细胞异质性背后的基因调控网络的异质性。转录因子分析也是单细胞转录组常见的分析内容，R语言分析一般采用的是SCENIC包，具体原理可参考两篇文章。1、《SCENIC:single-cellregulatorynetworkinferenceandclustering》。2、《AscalableSCENICworkflowforsingle-cellgeneregulatoryne
医学组学1+1＞2：代谢组+转录组/微生物组关联分析策略及案例解读 Magigene 经验分享
代谢组学，这门专注于生物体内小分子代谢物及其动态变化的学问，反映了生物体在健康与疾病状态下的生物化学过程变化。其在表型层面上为我们理解生命活动的微妙平衡提供了最直接的视角。转录组学则是一门描绘细胞内全基因转录产物（RNA）图谱的科学，其核心在于揭示基因表达的动态变化及其调控机制，从分子层面解码生命的语言。而微生物组学，则致力于解析宿主体内外微生物群落的结构、功能及其与宿主的相互作用，体现了微生物与
科研盘点丨空间转录组技术在肝脏研究中的应用晶典教你玩转科研
哺乳动物的肝脏是维持代谢稳态及解毒的重要器官，单细胞RNA测序技术可以鉴定到大多数肝细胞类型，但如何获取细胞类型在组织上的定位及其基因表达情况，并研究细胞间相互作用及通讯对于增强我们对肝脏发育及疾病发生、发展机制的了解至关重要。10x空间转录组技术结合显微成像、靶向探针捕获、芯片、测序技术，从一片完整的冰冻组织切片或石蜡组织切片中获取切片不同位置细胞中转录组数据，并将组织学和基因表达分析相结合。接
7.3分非肿瘤生信，热点基因集+免疫浸润+WGCNA+调控网络+单细胞+实验验证，值得收藏！生信小课堂
影响因子：7.31关于非肿瘤生信，我们也解读过很多，主要有以下类型1单个疾病WGCNA+PPI分析筛选hub基因。2单个疾病结合免疫浸润，铁死亡，自噬等基因集，机器学习算法等。3两种相关疾病联合分析，包括非肿瘤结合非肿瘤，非肿瘤结合肿瘤或者非肿瘤结合泛癌分析4基于分型的非肿瘤生信分析目前非肿瘤生信发文的门槛较低，有需要的朋友欢迎交流研究概述：动脉粥样硬化(AS)是一种慢性炎症性疾病。免疫代谢和氧化
2021-11-10 图灵基因
NatureMethods|空间转录组学整合分析可能带来新革命原创风不止步图灵基因今天收录于话题#前沿生物大数据分析撰文：风不止步IF=28.544推荐度：⭐⭐⭐⭐⭐亮点：内质网(ER)中错误折叠蛋白的积累导致ER应激，从而激活旨在恢复蛋白质稳态的未折叠蛋白反应(UPR)。作者批判性地审查了现有的内质网应激和UPR导向的类药物分子，强调它们的价值和局限性。2021年10月28日，CSHL癌症中心的
8+非肿瘤生信+实验验证，筛选坏死性凋亡相关hub基因并建模，思路可模仿可升级！生信小课堂
生信小课堂研究背景：特发性肺纤维化(IPF)是一种尚未明确发表机制的肺病。近年来，IPF的发病率随时间增加。坏死性凋亡是一种促炎型的程序性细胞死亡，可促进细胞内容物的释放以激活免疫反应。近年来，免疫浸润一直是癌症研究领域的热点。多种免疫细胞在肺纤维化过程中起重要作用。关于非肿瘤生信，我们也解读过很多，主要有以下类型1单个疾病WGCNA+PPI分析筛选hub基因。2单个疾病结合免疫浸润，热点基因集，
生信学习Day1-小白小白又白
第一天作业第一次使用markdown怎么用markdown列表字体链接等library(WGCNA)options(stringsAsFactors=FALSE)allowWGCNAThreads()把`符号搞错了，打了'，引用框框就没显示啦。。。Q：引用的图片怎么调整大小呢？
基因组+转录组助力油菜种子油含量自然变异的遗传研究 felix108
派森诺与华中农业大学合作，在MolecularPlant上发表了题为《Genome-andtranscriptome-wideassociationstudiesprovideinsightsintothegeneticbasisofnaturalvariationofseedoilcontentinBrassicanapus》的研究结果。该研究为提高甘蓝型油菜和其他油料作物的有机碳提供了丰富的遗
10X单细胞转录组个性化分析-拟时序分析 Seurat_Satija
在发育过程中，细胞会对刺激做出反应，在整个生命过程中，从一种功能性“状态”转变为另一种功能性“状态”。处于不同状态的细胞表达的基因不同，产生蛋白质和代谢物的动态重复序列，从而完成它们的工作。当细胞在不同状态间转变时，会经历转录重组的过程，其中一些基因被沉默，而另一些基因被激活。这些瞬时状态通常难以表征，因为在更稳定状态之间纯化细胞是困难或不可能的。单细胞RNA-Seq可以使您在不需要纯化细胞的情况
转录组结果和qRT-PCR结果又不一致？！ Seurat_
什么？！按照转录组筛选的5个最明显的差异基因只有2个与qRT-PCR结果一致？转录组测序（RNA-seq）将细胞内某一类型（或全部）的RNA逆转录成DNA，通过高通量测序的方法测定其序列并统计其表达水平的一项技术。是检测基因表达变化的通用方法。qRT-PCR是指通过对PCR扩增反应中每一个循环产物荧光信号的实时检测从而实现对起始模板定量及定性的分析。RNA-seq无需知道实验样本的基因组序列含比传
【文献分享】拟南芥叶片空间转录组 jjjscuedu
空间转录组（SpatialTranscriptomics）是测量完整组织切片的总mRNA，将总mRNA的空间信息与形态学内容相结合，并绘制所有基因表达发生的位置，获得生物过程复杂而完整的基因表达图谱。在确定不同细胞群的同时保留空间位置，为细胞功能、表型和组织微环境中位置的关系提供了重要信息。可揭示精细生理区域中激活的信号通路，完成分子特征驱动生物特征的机制解析。NatureMethods将空间转录
两则脐带血相关文献 MC学公卫
[精读]一篇单细胞转录组测序分析的文章：Single-cellTranscriptomicLandscapeofNucleatedCellsinUmbilicalCordBlood[泛读]一篇生统分析脐带血的血常规数据的文章：Acomprehensivestudyofumbilicalcordbloodcelldevelopmentalchangesandreferencerangesbygest
【文献速递】-肌萎缩性侧索硬化症分子病理的时空动力学六博说
肌萎缩性脊髓侧索硬化症(ALS)的瘫痪是由于运动神经元变性导致骨骼肌失去神经支配而引起的。运动神经元和胶质细胞之间的相互作用导致了运动神经元的丢失，但是在完整的脊髓组织中驱动这些过程的分子事件的时空顺序仍然不清楚。在这里，我们使用空间转录组技术获得了疾病过程中小鼠脊髓的基因表达测量，以及ALS患者的死后组织，以表征ALS的潜在分子机制。我们识别通路动力学，区分小胶质细胞和星形胶质细胞群体在早期时间
单细胞转录组基础分析六：伪时间分析 Seurat_Satija
本文是参考学习单细胞转录组基础分析六：伪时间分析的学习笔记。可能根据学习情况有所改动。Monocle进行伪时间分析的核心技术是一种机器学习算法——反向图形嵌入(ReversedGraphEmbedding)。它分析的前提需要一张展现细胞转录特征相似性关系的图，Monocle2使用DDTree降维图，Monocle3使用UMAP降维图。Monocle的机器学习算法可以依据上述降维图形，学习描述细胞如
scIMC：scRNA-seq插补方法基准 tzc_fly 单细胞多组学分析人工智能
在scRNA-seq中一个主要的挑战即为“dropout”事件，它扭曲了基因表达，显著影响了单细胞转录组的下游分析。为了解决这个问题，已经做了很多努力，并开发了几种基于模型和基于深度学习的scRNA-seq插补方法。但是，目前还缺乏对现有方法进行全面、系统的比较。在这项工作中，作者使用6个模拟和2个真实的scRNA-seq数据集，从以下四个方面全面评估和比较了总共12种可用的插补方法：1.基因表达
宝藏R包：TCGA的转录组数据挖掘一站搞定小洁忘了怎么分身
最近在看ceRNA的时候看到了一个宝藏R包，写包简化了芯片数据下游分析之后，我正想着写转录组下游分析的简化版，就看到了它。用起来~0.R包和数据准备if(!require(GDCRNATools))BiocManager::install("GDCRNATools")library(GDCRNATools)这里使用的是作者给的示例数据，RNA-seq是1000行，miRNAseq是2588个。#m
利用三代转录本升级基因组注释（gff3）郝永超M1racle
因为课题需要，我们在前期组装了一个基因组并进行了注释，但是存在两个问题，一个是没有考虑可变剪切，另一个是注释的基因并不准确，三代转录组的广泛普及对于基因研究提供了很大的便利，通过三代转录本比对到基因组，再利用TOFU软件去冗余可以得到一个基于三代的基因组注释，在IGV上查看比较可以发现，三代的注释无论是结构还是完整度上都比二代的注释更准确，而且考虑到了可变剪切。那么完全可以将三代的基因组注释跟二代
HQL之投影查询归来朝歌 HQL Hibernate 查询语句投影查询
在HQL查询中，常常面临这样一个场景，对于多表查询，是要将一个表的对象查出来还是要只需要每个表中的几个字段，最后放在一起显示？针对上面的场景，如果需要将一个对象查出来： HQL语句写“from 对象”即可 Session session = HibernateUtil.openSession();
Spring整合redis bylijinnan redis
pom.xml <dependencies>  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redi
org.hibernate.NonUniqueResultException: query did not return a unique result: 2 0624chenhong Hibernate
参考：http://blog.csdn.net/qingfeilee/article/details/7052736 org.hibernate.NonUniqueResultException: query did not return a unique result: 2 在项目中出现了org.hiber
android动画效果不懂事的小屁孩 android动画
前几天弄alertdialog和popupwindow的时候，用到了android的动画效果，今天专门研究了一下关于android的动画效果，列出来，方便以后使用。 Android 平台提供了两类动画。一类是Tween动画，就是对场景里的对象不断的进行图像变化来产生动画效果（旋转、平移、放缩和渐变）。第二类就是 Frame动画，即顺序的播放事先做好的图像，与gif图片原理类似。
js delete 删除机理以及它的内存泄露问题的解决方案换个号韩国红果果 JavaScript
delete删除属性时只是解除了属性与对象的绑定，故当属性值为一个对象时，删除时会造成内存泄露（其实还未删除）举例： var person={name:{firstname:'bob'}} var p=person.name delete person.name p.firstname -->'bob' // 依然可以访问p.firstname，存在内存泄露
Oracle将零干预分析加入网络即服务计划蓝儿唯美 oracle
由Oracle通信技术部门主导的演示项目并没有在本月较早前法国南斯举行的行业集团TM论坛大会中获得嘉奖。但是，Oracle通信官员解雇致力于打造一个支持零干预分配和编制功能的网络即服务（NaaS）平台，帮助企业以更灵活和更适合云的方式实现通信服务提供商（CSP）的连接产品。这个Oracle主导的项目属于TM Forum Live!活动上展示的Catalyst计划的19个项目之一。Catalyst计
spring学习——springmvc（二） a-john springMVC
Spring MVC提供了非常方便的文件上传功能。 1，配置Spring支持文件上传： DispatcherServlet本身并不知道如何处理multipart的表单数据，需要一个multipart解析器把POST请求的multipart数据中抽取出来，这样DispatcherServlet就能将其传递给我们的控制器了。为了在Spring中注册multipart解析器，需要声明一个实现了Mul
POJ-2828-Buy Tickets aijuans ACM_POJ
POJ-2828-Buy Tickets http://poj.org/problem?id=2828 线段树，逆序插入 #include<iostream>#include<cstdio>#include<cstring>#include<cstdlib>using namespace std;#define N 200010struct
Java Ant build.xml详解 asia007 build.xml
1,什么是antant是构建工具2,什么是构建概念到处可查到，形象来说，你要把代码从某个地方拿来，编译，再拷贝到某个地方去等等操作，当然不仅与此，但是主要用来干这个3,ant的好处跨平台 --因为ant是使用java实现的，所以它跨平台使用简单--与ant的兄弟make比起来语法清晰--同样是和make相比功能强大--ant能做的事情很多，可能你用了很久，你仍然不知道它能有
android按钮监听器的四种技术百合不是茶 android xml配置监听器实现接口
android开发中经常会用到各种各样的监听器,android监听器的写法与java又有不同的地方; 1,activity中使用内部类实现接口 ,创建内部类实例使用add方法与java类似创建监听器的实例 myLis lis = new myLis(); 使用add方法给按钮添加监听器
软件架构师不等同于资深程序员 bijian1013 程序员架构师架构设计
本文的作者Armel Nene是ETAPIX Global公司的首席架构师，他居住在伦敦，他参与过的开源项目包括 Apache Lucene,，Apache Nutch， Liferay 和 Pentaho等。如今很多的公司
TeamForge Wiki Syntax & CollabNet User Information Center sunjing TeamForge How do Attachement Anchor Wiki Syntax
the CollabNet user information center http://help.collab.net/ How do I create a new Wiki page? A CollabNet TeamForge project can have any number of Wiki pages. All Wiki pages are linked, and
【Redis四】Redis数据类型 bit1129 redis
概述 Redis是一个高性能的数据结构服务器，称之为数据结构服务器的原因是，它提供了丰富的数据类型以满足不同的应用场景，本文对Redis的数据类型以及对这些类型可能的操作进行总结。 Redis常用的数据类型包括string、set、list、hash以及sorted set.Redis本身是K/V系统，这里的数据类型指的是value的类型，而不是key的类型，key的类型只有一种即string
SSH2整合-附源码白糖_ eclipse spring tomcat Hibernate Google
今天用eclipse终于整合出了struts2+hibernate+spring框架。我创建的是tomcat项目，需要有tomcat插件。导入项目以后，鼠标右键选择属性，然后再找到“tomcat”项，勾选一下“Is a tomcat project”即可。具体方法见源码里的jsp图片，sql也在源码里。补充1：项目中部分jar包不是最新版的，可能导
[转]开源项目代码的学习方法 braveCS 学习方法
转自： http://blog.sina.com.cn/s/blog_693458530100lk5m.html http://www.cnblogs.com/west-link/archive/2011/06/07/2074466.html 1）阅读features。以此来搞清楚该项目有哪些特性2）思考。想想如果自己来做有这些features的项目该如何构架3）下载并安装d
编程之美-子数组的最大和（二维） bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; import java.util.Random; public class MaxSubArraySum2 { /** * 编程之美子数组之和的最大值（二维） */ private static final int ROW = 5; private stat
读书笔记-3 chengxuyuancsdn jquery笔记 resultMap配置 ibatis一对多配置
1、resultMap配置 2、ibatis一对多配置 3、jquery笔记 1、resultMap配置当<select resultMap="topic_data"> <resultMap id="topic_data">必须一一对应。 (1)<resultMap class="tblTopic&q
[物理与天文]物理学新进展 comsci
如果我们必须获得某种地球上没有的矿石,才能够进行某些能量输出装置的设计和建造,而要获得这种矿石,又必须首先进行深空探测,而要进行深空探测,又必须获得这种能量输出装置,这个矛盾的循环,会导致地球联盟在与宇宙文明建立关系的时候,陷入困境怎么办呢?
Oracle 11g新特性:Automatic Diagnostic Repository daizj oracle ADR
Oracle Database 11g的FDI（Fault Diagnosability Infrastructure）是自动化诊断方面的又一增强。 FDI的一个关键组件是自动诊断库（Automatic Diagnostic Repository-ADR）。在oracle 11g中，alert文件的信息是以xml的文件格式存在的，另外提供了普通文本格式的alert文件。这两份log文
简单排序:选择排序 dieslrae 选择排序
public void selectSort(int[] array){ int select; for(int i=0;i<array.length;i++){ select = i; for(int k=i+1;k<array.leng
C语言学习六指针的经典程序，互换两个数字 dcj3sjt126com c
示例程序，swap_1和swap_2都是错误的，推理从1开始推到2，2没完成，推到3就完成了 # include <stdio.h> void swap_1(int, int); void swap_2(int *, int *); void swap_3(int *, int *); int main(void) { int a = 3; int b =
php 5.4中php-fpm 的重启、终止操作命令 dcj3sjt126com PHP
php 5.4中php-fpm 的重启、终止操作命令: 查看php运行目录命令：which php/usr/bin/php 查看php-fpm进程数：ps aux | grep -c php-fpm 查看运行内存/usr/bin/php -i|grep mem 重启php-fpm/etc/init.d/php-fpm restart 在phpinfo()输出内容可以看到php
线程同步工具类 shuizhaosi888 同步工具类
同步工具类包括信号量（Semaphore）、栅栏（barrier）、闭锁（CountDownLatch）闭锁（CountDownLatch） public class RunMain { public long timeTasks(int nThreads, final Runnable task) throws InterruptedException { fin
bleeding edge是什么意思 haojinghua DI
不止一次，看到很多讲技术的文章里面出现过这个词语。今天终于弄懂了——通过朋友给的浏览软件，上了wiki。我再一次感到，没有辞典能像WiKi一样，给出这样体贴人心、一清二楚的解释了。为了表达我对WiKi的喜爱，只好在此一一中英对照，给大家上次课。 In computer science, bleeding edge is a term that
c中实现utf8和gbk的互转 jimmee c iconv utf8&gbk编码
#include <iconv.h> #include <stdlib.h> #include <stdio.h> #include <unistd.h> #include <fcntl.h> #include <string.h> #include <sys/stat.h> int code_c
大型分布式网站架构设计与实践 lilin530 应用服务器搜索引擎
1.大型网站软件系统的特点？ a.高并发，大流量。 b.高可用。 c.海量数据。 d.用户分布广泛，网络情况复杂。 e.安全环境恶劣。 f.需求快速变更，发布频繁。 g.渐进式发展。 2.大型网站架构演化发展历程？ a.初始阶段的网站架构。应用程序，数据库，文件等所有的资源都在一台服务器上。 b.应用服务器和数据服务器分离。 c.使用缓存改善网站性能。 d.使用应用
在代码中获取Android theme中的attr属性值 OliveExcel android theme
Android的Theme是由各种attr组合而成, 每个attr对应了这个属性的一个引用, 这个引用又可以是各种东西. 在某些情况下, 我们需要获取非自定义的主题下某个属性的内容 (比如拿到系统默认的配色colorAccent), 操作方式举例一则: int defaultColor = 0xFF000000; int[] attrsArray = { andorid.r.
基于Zookeeper的分布式共享锁 roadrunners zookeeper 分布式共享锁
首先，说说我们的场景，订单服务是做成集群的，当两个以上结点同时收到一个相同订单的创建指令，这时并发就产生了，系统就会重复创建订单。等等......场景。这时，分布式共享锁就闪亮登场了。共享锁在同一个进程中是很容易实现的，但在跨进程或者在不同Server之间就不好实现了。Zookeeper就很容易实现。具体的实现原理官网和其它网站也有翻译，这里就不在赘述了。官
两个容易被忽略的MySQL知识 tomcat_oracle mysql
1、varchar(5)可以存储多少个汉字，多少个字母数字？　　相信有好多人应该跟我一样，对这个已经很熟悉了，根据经验我们能很快的做出决定，比如说用varchar(200)去存储url等等，但是，即使你用了很多次也很熟悉了，也有可能对上面的问题做出错误的回答。　　这个问题我查了好多资料，有的人说是可以存储5个字符，2.5个汉字（每个汉字占用两个字节的话），有的人说这个要区分版本，5.0
zoj 3827 Information Entropy(水题) 阿尔萨斯 format
题目链接：zoj 3827 Information Entropy 题目大意：三种底，计算和。解题思路：调用库函数就可以直接算了，不过要注意Pi = 0的时候，不过它题目里居然也讲了。。。limp→0+plogb(p)=0，因为p是logp的高阶。 #include <cstdio> #include <cstring> #include <cmath&

WGCNA实战练习

1. 数据预处理

2. 构建共表达网络，识别modules

3. 筛选与表型相关的modules

4. 筛选关键基因

5. 导出module数据, 绘制网络图

你可能感兴趣的:(转录组,WGCNA)