wangchuang2017

WGCNA（加权基因共表达网络分析）

WGCNA（加权基因共表达网络分析）

序章

这个工具现在很火，高分文章用到很多。

加权基因共表达网络分析(WGCNA，Weighted gene co-expression network analysis)
WGCNA能够从复杂数据中（N多分组）快速地提取出与样本特征相关的基因共表达模块，以供后续分析。简单地说，它通过计算基因之间的表达相关性，将具有表达相关性的基因聚类到一个模块中，然后再分析模块与样本特征（包括临床特征、手术方式、治疗方法等等）之间的相关性，WGCNA搭建了一座样本特征与基因表达变化之间的桥梁。

1. 材料准备

文件下载

链接：http://pan.baidu.com/s/1bpvu9Dt

密码：w7g4

软件安装

source("http://bioconductor.org/biocLite.R");

biocLite("WGCNA")

2. 实战

# 导入数据

library(WGCNA)

options(stringsAsFactors = FALSE)

# 指允许R语言程序最大线程运行

allowWGCNAThreads()

image.png

# 设置工作目录路径，R脚本语言和文件夹在同一个目录下

setwd("/Users/chengkai/Desktop/Test")

samples=read.csv('Sam_info.txt',sep = '\t',row.names = 1)

expro=read.csv('ExpData.txt',sep = '\t',row.names = 1)

dim(expro)

image.png

##筛选方差前25%的基因##

m.vars=apply(expro,1,var)

expro.upper=expro[which(m.vars>quantile(m.vars, probs = seq(0, 1, 0.25))[4]),]

dim(expro.upper)

datExpr=as.data.frame(t(expro.upper));

nGenes = ncol(datExpr)

nSamples = nrow(datExpr)

上一步是为了减少运算量，因为一个测序数据可能会有好几万个探针，而可能其中很多基因在各个样本中的表达情况并没有什么太大变化，为了减少运算量，这里我们筛选方差前25%的基因。

##样本聚类检查离群值##

gsg = goodSamplesGenes(datExpr, verbose = 3);

gsg$allOK

sampleTree = hclust(dist(datExpr), method = "average")

plot(sampleTree, main = "Sample clustering to detect outliers"

, sub="", xlab="")

save(datExpr, file = "FPKM-01-dataInput.RData")

从结果上来，我们分析的样本没啥离群值，所以代码里说不作处理。

image.png

一个离群值的案例

image.png

如果需要去除离群样本，则执行下列代码，其中cutHeight=多少就看你自己了。

clust = cutreeStatic(sampleTree, cutHeight = 20000, minSize = 10)

table(clust)

keepSamples = (clust==1)

datExpr = datExpr[keepSamples, ]

nGenes = ncol(datExpr)

nSamples = nrow(datExpr)

save(datExpr, file = "FPKM-01-dataInput.RData")

执行上述代码的话，就会去掉8个样本

image.png

##软阈值筛选##

powers = c(seq(1,10,by = 1), seq(12, 20, by = 2))

sft = pickSoftThreshold(datExpr, powerVector = powers, verbose = 5)

par(mfrow = c(1,2));

cex1 = 0.9;

plot(sft$fitIndices[,1], -sign(sft$fitIndices[,3])*sft$fitIndices[,2],

xlab="Soft Threshold (power)",ylab="Scale Free Topology Model Fit,signed R^2",type="n",

main = paste("Scale independence"));

text(sft$fitIndices[,1], -sign(sft$fitIndices[,3])*sft$fitIndices[,2],

labels=powers,cex=cex1,col="red");

abline(h=0.90,col="red")

plot(sft$fitIndices[,1], sft$fitIndices[,5],

xlab="Soft Threshold (power)",ylab="Mean Connectivity", type="n",

main = paste("Mean connectivity"))

text(sft$fitIndices[,1], sft$fitIndices[,5], labels=powers, cex=cex1,col="red")

软阈值是WGCNA的算法中非常重要的一个环节，简单的说硬阈值是一种一刀切的算法，比如高考分数>500分能上一本，低于500就不行，软阈值的话切起来比较柔和一些，会考虑你学校怎么样，平时成绩怎么样之类。

image.png

# 运行下列代码，让程序推荐你一个power, 数据质量太差啦，程序给了我"NA",自己设定power=14

> sft$powerEstimate

[1] NA

##一步法网络构建：One-step network construction and module detection##

net = blockwiseModules(datExpr, power = 14, maxBlockSize = 6000,

TOMType = "unsigned", minModuleSize = 30,

reassignThreshold = 0, mergeCutHeight = 0.25,

numericLabels = TRUE, pamRespectsDendro = FALSE,

saveTOMs = TRUE,

saveTOMFileBase = "AS-green-FPKM-TOM",

verbose = 3)

table(net$colors)

sft$powerEstimate

结果跑出来如下图

image.png

结果是每个模块中包含的基因数量。一般来说，结果包含十几个到二十几个模块是比较正常的，此外一个模块中的基因数量不宜过多，像我们这个结果里模块1的基因数量达到了2307，这个就有点太多了，主要是因为我们powers=14，软阈值太低了导致的。所以说上述软阈值的筛选可以对我们的模块分析起到微调的作用。

##绘画结果展示### open a graphics window

#sizeGrWindow(12, 9)

# Convert labels to colors for plotting

mergedColors = labels2colors(net$colors)

# Plot the dendrogram and the module colors underneath

plotDendroAndColors(net$dendrograms[[1]], mergedColors[net$blockGenes[[1]]],"Module colors",

dendroLabels = FALSE, hang = 0.03,

addGuide = TRUE, guideHang = 0.05)

由于我们的软阈值比较低，所以这一结果中几乎没有grey模块，grey模块中的基因是共表达分析时没有被接受的基因，可以理解为一群散兵游勇。当然如果分析结果中grey模块中的基因数量比较多也是不太好的，表示样本中的基因共表达趋势不明显，不同特征的样本之间差异性不大，或者组内基因表达一致性比较差。

image.png

##结果保存###

moduleLabels = net$colors

moduleColors = labels2colors(net$colors)

table(moduleColors)

MEs = net$MEs;

geneTree = net$dendrograms[[1]];

save(MEs, moduleLabels, moduleColors, geneTree,

file = "AS-green-FPKM-02-networkConstruction-auto.RData")

这一步就是保存上面跑出来的结果了，同时哪个模块有多少基因一目了然。

image.png

##表型与模块相关性##

moduleLabelsAutomatic = net$colors

moduleColorsAutomatic = labels2colors(moduleLabelsAutomatic)

moduleColorsWW = moduleColorsAutomatic

MEs0 = moduleEigengenes(datExpr, moduleColorsWW)$eigengenes

MEsWW = orderMEs(MEs0)

modTraitCor = cor(MEsWW, samples, use = "p")

colnames(MEsWW)

modlues=MEsWW

modTraitP = corPvalueStudent(modTraitCor, nSamples)

textMatrix = paste(signif(modTraitCor, 2), "\n(", signif(modTraitP, 1), ")", sep = "")

dim(textMatrix) = dim(modTraitCor)

labeledHeatmap(Matrix = modTraitCor, xLabels = colnames(samples), yLabels = names(MEsWW), cex.lab = 0.9, yColorWidth=0.01,

xColorWidth = 0.03,

ySymbols = colnames(modlues), colorLabels = FALSE, colors = blueWhiteRed(50),

textMatrix = textMatrix, setStdMargins = FALSE, cex.text = 0.5, zlim = c(-1,1)

, main = paste("Module-trait relationships"))

cex.lab可以更改X轴Y轴label字体的大小，cex.text可以更改热图中字体的大小，colors可以改变颜色。
样本特征和共表达模块的相关性热图中，grey模块中的相关性应该很小，如果你与样本特征相关性最显著的模块是grey模块，那肯定是有问题的，毕竟grey模块中的基因是一群散兵游勇，它们的表达在各个样本中杂乱无章，根本说明不了问题。

image.png

###导出网络到Cytoscape#### Recalculate topological overlap if needed

TOM = TOMsimilarityFromExpr(datExpr, power = 14);

# Read in the annotation file# annot = read.csv(file = "GeneAnnotation.csv");

# Select modules需要修改，选择需要导出的模块颜色

modules = c("lightgreen");

# Select module probes选择模块探测

probes = names(datExpr)

inModule = is.finite(match(moduleColors, modules));

modProbes = probes[inModule];

#modGenes = annot$gene_symbol[match(modProbes, annot$substanceBXH)];

# Select the corresponding Topological Overlap

modTOM = TOM[inModule, inModule];

dimnames(modTOM) = list(modProbes, modProbes)

# Export the network into edge and node list files Cytoscape can read

cyt = exportNetworkToCytoscape(modTOM,

edgeFile = paste("AS-green-FPKM-One-step-CytoscapeInput-edges-", paste(modules, collapse="-"), ".txt", sep=""),

nodeFile = paste("AS-green-FPKM-One-step-CytoscapeInput-nodes-", paste(modules, collapse="-"), ".txt", sep=""),

weighted = TRUE,

threshold = 0.02,

nodeNames = modProbes,

#altNodeNames = modGenes,

nodeAttr = moduleColors[inModule]);

这一步就是把选定的模块中的基因导出来，结果包含edges和nodes的信息。导出不同模块的基因只需要改变modules = c("模块颜色名")即可，输出多个模块的信息时，从该行代码运行即可，前面一行的运算量很大。
edges文件很大，试想一个模块中有500个基因，几乎两两基因之间都有关系，那就有上万条信息，构建出来的网络肯定密密麻麻的用不了。
这里处理办法有两种：
1、取Weight值前多少的作用关系；
2、选定seed基因，比如某个lncRNA或者已知与表型具有密切关联的基因，构建与该基因有关的共表达网络

image.png

## 可视化基因网络##

# Calculate topological overlap anew: this could be done more efficiently by saving the TOM

# calculated during module detection, but let us do it again here.

dissTOM = 1-TOMsimilarityFromExpr(datExpr, power = 14);

# Transform dissTOM with a power to make moderately strong connections more visible in the heatmap

plotTOM = dissTOM^7;

# Set diagonal to NA for a nicer plot

diag(plotTOM) = NA;

# Call the plot function#sizeGrWindow(9,9)

TOMplot(plotTOM, geneTree, moduleColors, main = "Network heatmap plot, all genes")

#随便选取1000个基因来可视化

nSelect = 1000

# For reproducibility, we set the random seed

set.seed(10);

select = sample(nGenes, size = nSelect);

selectTOM = dissTOM[select, select];

# There's no simple way of restricting a clustering tree to a subset of genes, so we must re-cluster.

selectTree = hclust(as.dist(selectTOM), method = "average")

selectColors = moduleColors[select];

# Open a graphical window#sizeGrWindow(9,9)

# Taking the dissimilarity to a power, say 10, makes the plot more informative by effectively changing# the color palette; setting the diagonal to NA also improves the clarity of the plot

plotDiss = selectTOM^7;

diag(plotDiss) = NA;

TOMplot(plotDiss, selectTree, selectColors, main = "Network heatmap plot, selected genes")

这里是随机选取1000个基因来可视化模块内基因的相关性，你也可以多取一点，不过取太多容易报错，也没有必要。像结果中天青色和蓝色两个模块的共表达聚类结果还是不错的。

image.png

#此处画的是根据基因间表达量进行聚类所得到的各模块间的相关性图

MEs = moduleEigengenes(datExpr, moduleColors)$eigengenes

MET = orderMEs(MEs)

sizeGrWindow(7, 6)

plotEigengeneNetworks(MET, "Eigengene adjacency heatmap", marHeatmap = c(3,4,2,2), plotDendrograms = FALSE, xLabelsAngle = 90)

这个是分析共表达模块之间的相关性分析。

image.png

到这里，WGCNA的分析基本就结束了。不过，WGCNA分析过程中还有许多其它分析来检验WGCNA分析结果的可信度等等。有兴趣的童鞋可以参看这篇文章：http://www.stat.wisc.edu/~yandell/statgen/ucla/WGCNA/wgcna.html

image.png

参考文献

https://mp.weixin.qq.com/s?__biz=MzAwMzY4MTYxNw%3D%3D&mid=2655761164&idx=1&sn=68db947fe07a4d6fc77023abfa5da35b&scene=45#wechat_redirect （小张聊科研）

GenVisR 基因组数据可视化实战(三) 11的雾
3.genCov画每个突变位点附件的coverage，跟igv有点相似。这个操作起来很复杂，但是图还是挺有用的。可以考虑。由于我的referencegenomebuild是hg38BiocManager::install(c("TxDb.Hsapiens.UCSC.hg38.knownGene","BSgenome.Hsapiens.UCSC.hg38"))library(TxDb.Hsapien
python抓取网页内容401应该用哪个库_python3使用requests模块爬取页面内容入门坂田月半
python的爬虫相关模块有很多，除了requests模块，再如urllib和pycurl以及tornado等。相比而言，requests模块是相对简单易上手的。通过文本，大家可以迅速学会使用python的requests模块爬取页码内容。1.Requests唯一的一个非转基因的PythonHTTP库，人类可以安全享用。官网：http://cn.python-requests.org/zh_CN/
洛谷P1719 最大加权矩形 0hang 算法 c++开发语言
洛谷P1719最大加权矩形题目描述为了更好的备战NOIP2013，电脑组的几个女孩子LYQ,ZSC,ZHQ认为，我们不光需要机房，我们还需要运动，于是就决定找校长申请一块电脑组的课余运动场地，听说她们都是电脑组的高手，校长没有马上答应他们，而是先给她们出了一道数学题，并且告诉她们：你们能获得的运动场地的面积就是你们能找到的这个最大的数字。校长先给他们一个n\timesnn×n矩阵。要求矩阵中最大加
潜意识通过负面情绪向你传达哪些信号云手a
洛伊德认为：人的情绪如同一座冰山，分为三个部分。第一个部分是意识，浮在海面上，大概只占百分之五；第二部分是潜意识，隐藏在水下的庞然大物，约占95%；第三部分是前意识，是连结意识和潜意识的层面。而人的行为举止，只有少部分是由意识所控制，而大部分是由潜意识所主宰，而且是在人本身没有觉察到的情况下对人的行为举止发生作用的。潜意识隐藏在海面之下，它聚集了人类数百万年来的遗传基因层次的信息，囊括了人类生存最
小肠是身体的加油站，大肠是资源回收利用专家乐乐飞扬
肠营养肠健康。近期，专家介绍目前有不少青少年肠道有问题，18岁得直肠癌的有家族遗传基因，也有经常烧烤吃腌制食品的，都是得直肠癌的因素。预防结直肠癌多吃新鲜食物、蔬菜和果。小肠是身体的加油站,大肠是资源回收利用专家，它的环境清洁能力十分重要。消化是一场神奇之旅，从口腔开始,到肛门结束，全长8---10米长，有一间教室那儿长。从你看到食物的那一刻起,消化就开始了。先遗军---口腔分泌唾液,胃分泌胃酸排
2023-10-25 帕金森大健康
睡眠会影响孩子的身高吗孩子长高依赖的因素有哪些？研究显示，孩子的身高，70%取决于父母的遗传基因，30%取决于后天因素。后天影响因素包括饮食、运动、睡眠、心理健康等。其中，睡眠对身高的影响很大。睡眠为什么会影响孩子身高呢生长激素是生长发育过程中非常重要的激素之—，生长激素分泌异常可导致孩子身材矮小。生长激素分泌特点与其他激素不同，它在体内的浓度并不是稳定在某一水平，而是呈现脉冲式分泌，白天的分泌量
9.单细胞 RNA-seq：聚类分析 denghb001
学习目标：利用多种方法来评估聚类选择的PC基于重要的PC执行单细胞聚类单细胞RNA-seq聚类分析现在我们已经整合了高质量的细胞，我们想知道我们的细胞群中存在的不同细胞类型。image目标：为了生成特定细胞类型的簇，并使用已知的细胞类型的标志基因来确定的簇的身份。为了确定分群是否代表真实的细胞类型或由于生物或技术差异而形成的群集，如在细胞周期的S期的细胞群，特定批次的簇，或具有高线粒体含量的细胞。
内网穿透之EW使用、判断服务器是否出网板栗妖怪学习内网渗透
环境搭建使用的是下面文章的环境记一次学习--内网穿透-CSDN博客ew代理然后同样通过thinkphp漏洞写入文件，然后通过蚁剑连接然后上传ew的Linux版本，然后加权执行一层代理正向代理设置正向代理（在ubuntu上），然后kali在proxychain配置文件中连接ubuntu的192.168.244.154的代理端口反向代理在ubuntu上设置反向代理，将连接反弹到kali上的某个端口。然
达尔文医学——《我们为什么生病》笔记完结篇蹉跎笑我
一、对疾病原因的回顾为什么我们被大自然精心设计的身体，仍然为疾病所困？其原因在于：1、遗传因素很多疾病具有遗传性，人类的基因并不是完美无缺。一些致病基因是其只在生命晚期表现出危害，石器时期的人根本活不到这个年龄，自然选择也就没有机会清除掉。但更主要的原因是：有害的基因之所以保留下来，是因为存在潜在的益处。2、环境的巨变人类文明萌芽以来只有一万年，我们身体的进化速度跟不上环境的改变。3、一些疾病的原
hulk能量来源？ fourtwo
作为漫威死粉，其旗下的几乎所有电影都看了，看了之后，受好奇心的驱使，脑子里一直有一些疑问，比如绿巨人的能量来源问题。绿巨人那么大的身体，力大无穷，必然伴随着大量能量消耗，但是据我目前所知，电影里好像没有解释过这一点。既然官方没有解释，那就自己寻找解释吧。绿巨人形成原因是由于班纳受到了大量的伽马射线的照射，使其体内细胞基因发生变异，导致班纳的细胞能在过度活跃的情况下变成绿巨人的细胞。那么问题来了，绿
高通量测序的数据处理与分析指北(二)--宏基因组篇 lantary
博客原文宏基因组篇前言之前的一篇文章已经从生物实验的角度讲述了高通量测序的原理，这篇文章旨在介绍宏基因组二代测序数据的处理方式及其原理。在正文开始之前，我们先来认识一下什么是宏基因组。以我的理解，宏基因组就是某环境中所有生物的基因组的合集，这个环境可以是下水道，河流等自然环境，也可以是人体内肠道，口腔等体环境。而宏基因组中的生物往往指的是微生物，如真菌，细菌，病毒，古细菌。我们这里主要以肠道微生物
山东大学小树林支教调研团青青仓木队山东大学青青仓木队
传承红色基因赓续红色血脉---希望小屋·山大担当暑期社会实践7月25日，山东大学“青青仓木”暑期线上支教队给枣庄欧峪小学四年级的小朋友们开展了“一起红色寻访”主题班会。第一个模块叫做“红领巾心向党”。大学生为小朋友们详细介绍了中国少年先锋队，从性质、标志、纪念日以及精神等方面加深了小朋友们对少先队的理解。在讨论环节中，小朋友们展开热烈讨论，对自己身上的“红领巾”有了更深入的认识，意识到了自己肩负的
骨神经纤维瘤应该怎么治疗乐一_d7c7
骨神经纤维瘤是生长在神经干处的以纤维细胞为主的良性肿瘤，是皮肤、深部软组织、神经和骨的一种复杂性肿瘤。瘤体并非都与大神经干相连，亦可起于很小的无髓纤维。外有疏松透亮薄包膜，其外有或无轻反应区。骨神经纤维瘤这种病引起有可能与胚胎发育早期变异有关，不易预防。目前已知本病在染色体上的基因定位。多发性神经纤维瘤病为胚胎形成早期阶段神经嵴分化和迁徙异常导致的多系统损害的、常见的常染色体显性遗传病。神经纤维瘤
平滑法时间序列模型原理及Python实践 AI智博信息数据分析与挖掘 python 人工智能
平滑法时间序列模型原理主要涉及通过一定的算法对时间序列数据进行平滑处理，以消除或减弱数据中的随机波动和噪声，从而揭示出数据中的长期趋势和季节性变化，进而对未来数据进行预测。以下是平滑法时间序列模型的详细原理：一、基本原理平滑法时间序列模型基于对历史数据的平滑处理，通过对数据的平均或加权平均，去除数据中的随机波动，使得时间序列数据更加平滑，便于分析和预测。这种方法能够帮助我们更好地理解数据的长期趋势
用DESeq2包来对RNA-seq数据进行差异分析 Seurat_Satija
差异分析的套路都是差不多的，大部分设计思想都是继承limma这个包，DESeq2也不例外。DESeq2是DESeq包的更新版本，看样子应该不会有DESeq3了，哈哈，它的设计思想就是针对count类型的数据。可以是任意features的count数据，比如对各个基因的count，或者外显子，或者CHIP-seq的一些feature，都可以用来做差异分析。使用这个包也是需要三个数据：表达矩阵分组矩阵
群体遗传分析（一）#学习笔记 kangroomoon
哈温的遗传平衡定律是基础，费、莱、霍的群体遗传学是数学基础和理论框架，木村资生的中性进化论深化了自然选择的概念。中性学说认为：分子水平上的遗传变异在很大程度上是中性的，变异程度主要由突变速率和有效群体大小决定。（通过观察值和理论值之间的差异性测验中性进化假说）群体遗传多态性与结构分析Locus：遗传座位，在群体中通常包含多个allele：等位基因，即遗传多态性。大多数的新突变是由于geneticd
王清霞平顶山网络焦点中级八期坚持分享第183天20180716 懒洋洋_a7fc
影响儿童身体发展的因素包括先天素质和后天环境。先天素质是由遗传基因和胎儿发育过程的环境因素之间复杂的相互作用决定的，后天环境主要是指儿童生长过程中的营养、睡眠和运动等。
颠颠撞撞在人间，胜在有这一张嘴（好好说话）曹润青
图片选自网络1小华刚上初中，看中了一款新上市的手机，怎么样让爸妈买给自己呢？权衡了一下爸妈两人的特点，他决定拿他那管家、管账、管老爸的老妈下手。“妈妈，今天上班累了吧？”老妈刚一进门小华就迎了上去，接过外套，堆着笑脸。“在学校犯错了？”老妈一阵狐疑，猜想着这个滑头的小子，是不想被骂还是有所求。“你儿子充分遗传了你的优秀基因，在学校混得风生水起，错误跟我无缘。”小华自夸起来。“上次打架呢？”老妈坐在
2022-05-07 cholv正践录
网上买菜越来越没有性价比了。它现有的运行逻辑必须要比菜场便宜得多才行。骨子里还是平台运营的不规范造成的。缺乏标准的同时，在售的又不能做到客观展示。比方说，买个油，我就想知道是不是转基因的，大多商品都没有明确展示。这几天，情况消停了不少。咱也多光顾光顾菜场商超了。对网购也慢慢淡了下来。
2021-08-13 白月梦闲谈
曹魏开国皇帝曹丕，7年就驾崩，真的是因为纵欲无度吗？集英雄和奸贼于一身的曹操，拼杀一辈子打下半壁江山，却没料到最钟爱的两个接班人曹昂和曹冲都先后早死，最后曹丕和曹植这对同胞兄弟上演了一出夺嫡大戏，笑到最后的是继承了曹操奸诈基因的曹丕。可让所有人想不到的是，仅仅做了7年皇帝的曹丕，年仅40岁就一命呜呼了！曹丕为什么会如此短命呢？他曾经从老爹手里抢女人，又和弟弟曹植有争风吃醋的传闻，在曹操死后又接收了
CVA财务建模课程心得分享End 爱尔兰诗人
8月6号CVA协会重点讲述现金流折现估值法，首先要明确该方法的核心思想，即一家公司的价值是基于其未来可产生的现金流来计算，等于现金流按照能够反映其风险的折现率进行折现的结果。DCF的基本要素包括：加权平均资本成本，自由现金流，终值，企业价值和股权价值。其中需要搞清楚加权平均资本成本WACC，WACC是基于实体的股权资本成本以及债务资本成本计算的综合成本。另外，DCF分析主要依赖预测数据，所以需要注
「达摩院MindOpt」用于多目标规划（目标规划法） MindOpt_003 算法云计算阿里云
前篇我们讲述了使用加权和法对多目标规划问题的优化，本篇将讲述使用目标规划法。1.原理目标规划法，首先是为每个目标函数设定一个期望值（目标值）gig_igi。方案1：然后构建一个新的目标函数F(x)F(x)F(x)，其形式如下：minimizeF(x)=∑[wi∗∣fi(x)−gi∣]\text{minimize}\quadF(x)=\sum[w_i*|f_i(x)-g_i|]minimizeF(x
图计算：基于SparkGrpahX计算聚类系数妙龄少女郭德纲 Spark 图算法 Scala 聚类数据挖掘机器学习
图计算：基于SparkGrpahX计算聚类系数文章目录图计算：基于SparkGrpahX计算聚类系数一、什么是聚类系数二、基于SparkGraphX的聚类系数代码实现总结一、什么是聚类系数聚类系数（ClusteringCoefficient）是图计算和网络分析中的一个重要概念，用于衡量网络中节点的局部聚集程度。它有助于理解网络中节点之间的紧密程度和网络的结构特性。这是一种用来衡量图中节点聚类程度的
2022-04-17 图灵基因
NatBiotech|组织中单细胞转录组的空间图谱原创图灵基因图灵基因2022-04-1707:03收录于话题#前沿生物大数据分析单细胞RNA测序（scRNA-seq）已经彻底改变了单细胞水平上的基因表达研究。最近，空间技术通过添加空间信息将转录组学提升到了一个新的水平。但是，它缺乏单细胞分辨率。现在，来自德克萨斯大学MD安德森癌症中心的一个小组开发了一种名为CellTrek的计算方法，将这两个数
生信人应该这样来装软件(未完待续) dandanwu90
P1优先选择二进制可执行软件来安装不同组学任务模块比对重要全基因组测序/外显子测序找差异和变异转录组相关计数软件安装规律：二进制，下载解压，全路径调用#C语言查看在还是不在whichmakewhichcmakewhichjavawhichperlwhichpython#查看版本python--versionperl--version查看版本，版本问题导致错误如何判断所有软件是否是二进制，进入软件官
谁让我眼小？我是眉尾旋
我天生一双小眼睛，就因为这双眼，二姑不知说过我多少次了，“这孩子真丑”！没办法，谁让我的遗传基因不好呢？爷爷是大眼睛、双眼皮；奶奶是单眼皮、小眼睛；爸爸是遗传了奶奶的基因。我长的特像爸爸，只要一出去，不认识的人见了我就叫小杨健。都愿爸爸不争气，爷爷那么大的眼睛他不汲取，偏偏长了一双小眼，害得我老被二姑取笑，气死我了！她说得次数一多，妈妈听了也不高兴，就开始反击：“你怎么不追根溯源，要说就说她奶，谁
守护童年，找寻人生最初的执著；追逐梦想，童年无憾，一生无怨安之腾
1.童年的力量童年到底有多重要，当你意识到这重要性的时候，往往已经走过了童年。虽然童年中的很多记忆都是模糊不清的，但它就是有一种力量指引着我们，去坚持那个深层的本我，在未来的数年里，依然去探索那个最初的执着。从呱呱坠地的那一刻起，很多东西都像命定一样，深刻在一个人的骨子里，籍由着遗传基因，在未来的岁月中，逐渐显山露水。环境对一个人的影响也特别重要，这也是为什么这几年，原生家庭这个概念如此火的原因。
读书有感——运动改造大脑雷耀华
之前有看过一本书《运动改造大脑》，觉得有一定的道理，书中用大量的数据阐述运动与我们的生活息息相关，昨天听了樊登老师的讲述感觉更加明白了许多。我们人类的基因对我们有一个比较长远的影响。书中说道在很久以前人类的祖先需要奔跑8~16千米才可以得到事物，这就让大脑形成了这样的反馈，需要有这样的运动。后来又提到美国一个学校让学生整体参加晨跑，学校的整体成绩都大幅提高，达到美国的前列，这就证明了运动的效率。现
数字图像处理（一系列对图像进行处理、分析和改进的技术）编程日记✧ 智能医疗计算机视觉图像处理人工智能
数字图像处理是指对图像进行一系列的数学和算法处理，以增强、分析或理解图像的内容。这些处理包括从基础的像素操作到复杂的高维变换和机器学习模型。1.图像降噪在图像获取和传输过程中，往往会引入噪声。降噪技术用于减少这些噪声，同时尽量保持图像的细节。常见方法有：均值滤波：将像素邻域内的像素值取平均值，从而平滑图像。这种方法简单但可能会模糊边缘。高斯滤波：使用高斯函数为权重对像素进行加权平均，可以更好地平滑
微生物数据的sparcc网络分析桂渊泉树数据分析 r语言
sparcc网络分析运行sparcc首先先安装fastspar，地址https://github.com/scwatts/fastspar整理abundance_counts数据，abundance_counts.txt格式为第一列为featureID，且列名为#OTUID，其他列是样本的OTU丰度然后执行下列脚本fastspar--iterations50--exclude_iterations
java短路运算符和逻辑运算符的区别 3213213333332132 java基础
/* * 逻辑运算符——不论是什么条件都要执行左右两边代码 * 短路运算符——我认为在底层就是利用物理电路的“并联”和“串联”实现的 * 原理很简单，并联电路代表短路或（||），串联电路代表短路与（&&）。 * * 并联电路两个开关只要有一个开关闭合，电路就会通。 * 类似于短路或（||），只要有其中一个为true（开关闭合）是
Java异常那些不得不说的事白糖_ java exception
一、在finally块中做数据回收操作比如数据库连接都是很宝贵的，所以最好在finally中关闭连接。 JDBCAgent jdbc = new JDBCAgent(); try{ jdbc.excute("select * from ctp_log"); }catch(SQLException e){ ... }finally{ jdbc.close();
utf-8与utf-8(无BOM)的区别 dcj3sjt126com PHP
BOM——Byte Order Mark，就是字节序标记在UCS 编码中有一个叫做"ZERO WIDTH NO-BREAK SPACE"的字符，它的编码是FEFF。而FFFE在UCS中是不存在的字符，所以不应该出现在实际传输中。UCS规范建议我们在传输字节流前，先传输字符"ZERO WIDTH NO-BREAK SPACE"。这样如
JAVA Annotation之定义篇周凡杨 java 注解 annotation 入门注释
Annotation: 译为注释或注解 An annotation, in the Java computer programming language, is a form of syntactic metadata that can be added to Java source code. Classes, methods, variables, pa
tomcat的多域名、虚拟主机配置 g21121 tomcat
众所周知apache可以配置多域名和虚拟主机，而且配置起来比较简单，但是项目用到的是tomcat，配来配去总是不成功。查了些资料才总算可以，下面就跟大家分享下经验。很多朋友搜索的内容基本是告诉我们这么配置：在Engine标签下增面积Host标签，如下： <Host name="www.site1.com" appBase="webapps"
Linux SSH 错误解析（Capistrano 的cap 访问错误 Permission ） 510888780 linux capistrano
1.ssh -v [email protected] 出现 Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password). 错误运行状况如下： OpenSSH_5.3p1, OpenSSL 1.0.1e-fips 11 Feb 2013 debug1: Reading configuratio
log4j的用法 Harry642 java log4j
一、前言： log4j 是一个开放源码项目，是广泛使用的以Java编写的日志记录包。由于log4j出色的表现，当时在log4j完成时，log4j开发组织曾建议sun在jdk1.4中用log4j取代jdk1.4 的日志工具类，但当时jdk1.4已接近完成，所以sun拒绝使用log4j，当在java开发中
mysql、sqlserver、oracle分页，java分页统一接口实现 aijuans oracle jave
定义：pageStart 起始页，pageEnd 终止页,pageSize页面容量 oracle分页：　　　　select * from ( select mytable.*,rownum num from (实际传的SQL) where rownum<=pageEnd) where num>=pageStart sqlServer分页：
Hessian 简单例子 antlove java Web service hessian
hello.hessian.MyCar.java package hessian.pojo; import java.io.Serializable; public class MyCar implements Serializable { private static final long serialVersionUID = 473690540190845543
数据库对象的同义词和序列百合不是茶 sql 序列同义词 ORACLE权限
回顾简单的数据库权限等命令; 解锁用户和锁定用户 alter user scott account lock/unlock; //system下查看系统中的用户 select * dba_users; //创建用户名和密码 create user wj identified by wj; identified by //授予连接权和建表权 grant connect to
使用Powermock和mockito测试静态方法 bijian1013 持续集成单元测试 mockito Powermock
实例： package com.bijian.study; import static org.junit.Assert.assertEquals; import java.io.IOException; import org.junit.Before; import org.junit.Test; import or
精通Oracle10编程SQL(6)访问ORACLE bijian1013 oracle 数据库 plsql
/* *访问ORACLE */ --检索单行数据 --使用标量变量接收数据 DECLARE v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; BEGIN select ename,sal into v_ename,v_sal from emp where empno=&no; dbms_output.pu
【Nginx四】Nginx作为HTTP负载均衡服务器 bit1129 nginx
Nginx的另一个常用的功能是作为负载均衡服务器。一个典型的web应用系统，通过负载均衡服务器，可以使得应用有多台后端服务器来响应客户端的请求。一个应用配置多台后端服务器，可以带来很多好处：负载均衡的好处增加可用资源增加吞吐量加快响应速度，降低延时出错的重试验机制 Nginx主要支持三种均衡算法： round-robin l
jquery-validation备忘白糖_ jquery css F#Firebug
留点学习jquery validation总结的代码： function checkForm(){ validator = $("#commentForm").validate({// #formId为需要进行验证的表单ID errorElement :"span",// 使用"div"标签标记错误，默认:&
solr限制admin界面访问（端口限制和http授权限制） ronin47 限定Ip访问
solr的管理界面可以帮助我们做很多事情，但是把solr程序放到公网之后就要限制对admin的访问了。可以通过tomcat的http基本授权来做限制，也可以通过iptables防火墙来限制。我们先看如何通过tomcat配置http授权限制。第一步：在tomcat的conf/tomcat-users.xml文件中添加管理用户，比如： <userusername="ad
多线程-用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 bylijinnan java 多线程
public class IncDecThread { private int j=10; /* * 题目:用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 * 两个问题： * 1、线程同步--synchronized * 2、线程之间如何共享同一个j变量--内部类 */ public static
买房历程 cfyme
2015-06-21: 万科未来城，看房子 2015-06-26: 办理贷款手续，贷款73万，贷款利率5.65=5.3675 2015-06-27: 房子首付,签完合同 2015-06-28，央行宣布降息 0.25，就2天的时间差啊，没赶上。首付，老婆找他的小姐妹接了5万，另外几个朋友借了1-
[军事与科技]制造大型太空战舰的前奏 comsci 制造
天气热了........空调和电扇要准备好.......... 最近,世界形势日趋复杂化,战争的阴影开始覆盖全世界.......... 所以,我们不得不关
dateformat dai_lm DateFormat
"Symbol Meaning Presentation Ex." "------ ------- ------------ ----" "G era designator (Text) AD" "y year
Hadoop如何实现关联计算 datamachine mapreduce hadoop 关联计算
选择Hadoop，低成本和高扩展性是主要原因，但但它的开发效率实在无法让人满意。以关联计算为例。假设：HDFS上有2个文件，分别是客户信息和订单信息，customerID是它们之间的关联字段。如何进行关联计算，以便将客户名称添加到订单列表中？ &nbs
用户模型中修改用户信息时，密码是如何处理的 dcj3sjt126com yii
当我添加或修改用户记录的时候对于处理确认密码我遇到了一些麻烦，所有我想分享一下我是怎么处理的。场景是使用的基本的那些(系统自带)，你需要有一个数据表(user)并且表中有一个密码字段(password),它使用 sha1、md5或其他加密方式加密用户密码。面是它的工作流程: 当创建用户的时候密码需要加密并且保存，但当修改用户记录时如果使用同样的场景我们最终就会把用户加密过的密码再次加密，这
中文 iOS/Mac 开发博客列表 dcj3sjt126com Blog
本博客列表会不断更新维护，如果有推荐的博客，请到此处提交博客信息。本博客列表涉及的文章内容支持定制化Google搜索，特别感谢 JeOam 提供并帮助更新。本博客列表也提供同步更新的OPML文件（下载OPML文件），可供导入到例如feedly等第三方定阅工具中，特别感谢 lcepy 提供自动转换脚本。这里有导入教程。
js去除空格，去除左右两端的空格蕃薯耀去除左右两端的空格 js去掉所有空格 js去除空格
js去除空格，去除左右两端的空格 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>&g
SpringMVC4零配置--web.xml hanqunfeng springmvc4
servlet3.0+规范后，允许servlet，filter，listener不必声明在web.xml中，而是以硬编码的方式存在，实现容器的零配置。 ServletContainerInitializer：启动容器时负责加载相关配置 package javax.servlet; import java.util.Set; public interface ServletContainer
《开源框架那些事儿21》：巧借力与借巧力 j2eetop 框架 UI
同样做前端UI，为什么有人花了一点力气，就可以做好？而有的人费尽全力，仍然错误百出？我们可以先看看几个故事。故事1：巧借力，乌鸦也可以吃核桃有一个盛产核桃的村子，每年秋末冬初，成群的乌鸦总会来到这里，到果园里捡拾那些被果农们遗落的核桃。核桃仁虽然美味，但是外壳那么坚硬，乌鸦怎么才能吃到呢？原来乌鸦先把核桃叼起，然后飞到高高的树枝上，再将核桃摔下去，核桃落到坚硬的地面上，被撞破了，于是，
JQuery EasyUI 验证扩展可怜的猫 jquery easyui 验证
最近项目中用到了前端框架-- EasyUI，在做校验的时候会涉及到很多需要自定义的内容，现把常用的验证方式总结出来，留待后用。以下内容只需要在公用js中添加即可。使用类似于如下： <input class="easyui-textbox" name="mobile" id="mobile&
架构师之httpurlconnection----------读取和发送(流读取效率通用类) nannan408
1.前言. 如题. 2.代码. /* * Copyright (c) 2015, S.F. Express Inc. All rights reserved. */ package com.test.test.test.send; import java.io.IOException; import java.io.InputStream
Jquery性能优化 r361251 JavaScript jquery
一、注意定义jQuery变量的时候添加var关键字这个不仅仅是jQuery，所有javascript开发过程中，都需要注意，请一定不要定义成如下： $loading = $('#loading'); //这个是全局定义，不知道哪里位置倒霉引用了相同的变量名，就会郁闷至死的二、请使用一个var来定义变量如果你使用多个变量的话，请如下方式定义： . 代码如下: var page
在eclipse项目中使用maven管理依赖 tjj006 eclipse maven
概览: 如何导入maven项目至eclipse中建立自有Maven Java类库服务器建立符合maven代码库标准的自定义类库 Maven在管理Java类库方面有巨大的优势，像白衣所说就是非常“环保”。我们平时用IDE开发都是把所需要的类库一股脑的全丢到项目目录下，然后全部添加到ide的构建路径中，如果用了SVN/CVS，这样会很容易就把
中国天气网省市级联页面 x125858805 级联
1、页面及级联js <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> &l

WGCNA（加权基因共表达网络分析）

你可能感兴趣的:(WGCNA（加权基因共表达网络分析）)