生信宝典

一文掌握GSEA，超详细教程！

生信宝典之前总结了一篇关于GSEA富集分析的推文——GSEA富集分析：从概念理解到界面实操，介绍了GSEA的定义、GSEA原理、GSEA分析、Leading-edge分析等，是全网最流行的原理+操作兼备教程，不太了解的朋友可以点击阅读先理解下概念（为了完整性，下面也会摘录一部分）。

GSEA案例解析

介绍GSEA分析之前，我们先看一篇Cell文章(https://sci-hub.tw/10.1016/j.cell.2016.11.033)的一个插图 (SCI-HUB客户端（文献神器V4.0）——下载文献如此简单)。

以下是文章原文对图的注解：GSEA analyses of genesets for cardiac (top) and endothelial/endocardial (bottom) development. NES, normalized enrichment score. FDR, false discovery rate. Positive and negative NES indicate higher and lower expression in iwt, respectively.

关于文章中使用的GSEA分析方法和参数，我们截取对应原文：Gene Set Enrichment Analysis was performed using the GSEA software (https://www.broadinstitute.org/gsea/) with permutation = geneset, metric = Diff_of_classes, metric = weighted, #permutation = 2500.

根据以上信息可知，上图是研究者使用GSEA软件所做的分析结果。文章通过GSEA分析，发现

与心脏发育有关的基因集 (影响心脏的收缩力、钙离子调控和新陈代谢活力等)在iwt组 (GATA基因野生型)中普遍表达更高，而在G296S组 (GATA基因的一种突变体)中表达更低；

而对于参与内皮或内膜发育的基因集，在iwt组中表达更低，在G296S组中表达更高。

作者根据这个图和其它证据推测iwt组的心脏发育更加完善，而G296S组更倾向于心脏内皮或内膜的发育，即GATA基因的这种突变可能导致心脏内皮或内膜的过度发育而导致心脏相关疾病的产生。

那么GSEA分析是什么？

参考GSEA官网主页的描述：Gene Set Enrichment Analysis (GSEA) is a computational method that determines whether an a priori defined set of genes shows statistically significant, concordant differences between two biological states (e.g. phenotypes).

在上述Cell文章中，作者更加关心参与心脏发育的基因集 (即a priori defined set of genes)与两个状态（突变体和野生型，状态的度量方式是基因表达）的关系，因此利用GSEA对其进行分析后发现，参与心脏发育 (收缩力、钙调控和新陈代谢)的基因集的表达模式更接近于iwt组的表型，而不是G296S组; 而参与心脏内皮或内膜发育的这些基因的表达模式更接近于G296S组的表型而不是iwt组的表型。

这就是GSEA分析所适用的主要场景之一。它能帮助生物学家在两种不同的生物学状态 (biological states)中，判断某一组有特定意义的基因集合的表达模式更接近于其中哪一种。因此GSEA是一种非常常见且实用的分析方法，可以将数个基因组成的基因集与整个转录组、修饰组等做出简单而清晰的关联分析。

除了对特定gene set的分析，反过来GSEA也可以用于发现两组样本从表达或其它度量水平分别与哪些特定生物学意义的基因集有显著关联，或者发现哪些基因集的表达模式或其他模式更接近于表型A、哪些更接近于表型B。这些特定的基因集合可以从GO、KEGG、Reactome、hallmark或MSigDB等基因集中获取，其中MSigDB数据库整合了上述所有基因集。研究者也可自定义gene set (即新发现的基因集或其它感兴趣的基因的集合)。

GSEA分析似乎与GO分析类似但又有所不同。GO分析更加依赖差异基因，实则是对一部分基因的分析 (忽略差异不显著的基因)，而GSEA是从全体基因的表达矩阵中找出具有协同差异 (concordant differences)的基因集，故能兼顾差异较小的基因。因此二者的应用场景略有区别。另外GO富集是定性的分析，GSEA考虑到了表达或其它度量水平的值的影响。另外，对于时间序列数据或样品有定量属性时，GSEA的优势会更明显，不需要每个分组分别进行富集，直接对整体进行处理。可以类比于之前的WGCNA分析。

GSEA定义

Gene Set Enrichment Analysis (基因集富集分析)用来评估一个预先定义的基因集的基因在与表型相关度排序的基因表中的分布趋势，从而判断其对表型的贡献。其输入数据包含两部分，一是已知功能的基因集 (可以是GO注释、MsigDB的注释或其它符合格式的基因集定义)，一是表达矩阵 (也可以是排序好的列表)，软件会对基因根据其与表型的关联度(可以理解为表达值的变化)从大到小排序，然后判断基因集内每条注释下的基因是否富集于表型相关度排序后基因表的上部或下部，从而判断此基因集内基因的协同变化对表型变化的影响。

(The gene sets are defined based on prior biological knowledge, e.g., published information about biochemical pathways or coexpression in previous experiments. The goal of GSEA is to determine whether members of a gene set S tend to occur toward the top (or bottom) of the list L, in which case the gene set is correlated with the phenotypic class distinction.)

这与之前讲述的GO富集分析不同。GO富集分析是先筛选差异基因，再判断差异基因在哪些注释的通路存在富集；这涉及到阈值的设定，存在一定主观性并且只能用于表达变化较大的基因，即我们定义的显著差异基因。而GSEA则不局限于差异基因，从基因集的富集角度出发，理论上更容易囊括细微但协调性的变化对生物通路的影响，尤其是差异倍数不太大的基因集。

GSEA原理

给定一个排序的基因表L和一个预先定义的基因集S (比如编码某个代谢通路的产物的基因, 基因组上物理位置相近的基因，或同一GO注释下的基因)，GSEA的目的是判断S里面的成员s在L里面是随机分布还是主要聚集在L的顶部或底部。这些基因排序的依据是其在不同表型状态下的表达差异，若研究的基因集S的成员显著聚集在L的顶部或底部，则说明此基因集成员对表型的差异有贡献，也是我们关注的基因集。

GSEA计算中几个关键概念：

计算富集得分 (ES, enrichment score). ES反应基因集成员s在排序列表L的两端富集的程度。计算方式是，从基因集L的第一个基因开始，计算一个累计统计值。当遇到一个落在s里面的基因，则增加统计值。遇到一个不在s里面的基因，则降低统计值。
每一步统计值增加或减少的幅度与基因的表达变化程度（更严格的是与基因和表型的关联度，可能是fold-change，也可能是pearson corelation值，后面有介绍几种不同的计算方式）是相关的，可以是线性相关，也可以是指数相关（具体见后面参数选择）。富集得分ES最后定义为最大的峰值。正值ES表示基因集在列表的顶部富集，负值ES表示基因集在列表的底部富集。
评估富集得分(ES)的显著性。通过基于表型而不改变基因之间关系的排列检验 (permutation test)计算观察到的富集得分(ES)出现的可能性。若样品量少，也可基于基因集做排列检验 (permutation test)，计算p-value。
多重假设检验校正。首先对每个基因子集s计算得到的ES根据基因集的大小进行标准化得到Normalized Enrichment Score (NES)。随后针对NES计算假阳性率。（计算NES也有另外一种方法，是计算出的ES除以排列检验得到的所有ES的平均值）
Leading-edge subset，对富集得分贡献最大的基因成员。

本文通过总结多人学习使用过程中遇到的问题进一步记录软件操作过程和结果解读，力求讲清每个需要注意的细节点。

从前文中我们了解到GSEA分析的目的是要判断S集基因（基于先验知识的基因注释信息，某个关注的基因集合）中的基因是随机分布还是聚集在排序好的L基因集的顶部或底部（这便是富集分析）。

与GO富集分析的差异在于GSEA分析不需要指定阈值（p值或FDR）来筛选差异基因，我们可以在没有经验存在的情况下分析我们感兴趣的基因集，而这个基因集不一定是显著差异表达的基因。GSEA分析可以将那些GO/KEGG富集分信息中容易遗漏掉的差异表达不显著却有着重要生物学意义的基因包含在内。

下面来看看软件具体操作和结果解读。

一、软件安装

软件下载地址：http://software.broadinstitute.org/gsea/downloads.jsp

使用官方推荐的第一个软件javaGSEA Desktop Application，根据分析数据的大小和电脑内存多少可以选择下载不同内存版本的软件。该软件是基于java环境运行的，而且需要联网。若会出现打不开的现象（小编就是就碰到了），要么是没有安装java，要么是java版本太低了，安装或更新下java就能打开。也可能是网速太慢，或Java安全性问题，这时选择官网提供的第二个软件javaGSEA Java Jar file，同样依赖java运行，但不需联网，启动快。

软件启动界面如下：

二、数据准备

所有矩阵的列以tab键分割，不同类型的数据格式和后缀要求见下表。

Data File	Content	Format	Source
Expression dataset	Contains features (genes or probes), samples, and an expression value for each feature in each sample. Expression data can come from any source (Affymetrix, Stanford cDNA, and so on).	res, gct, pcl, or txt	You create the file. 一般的基因表达矩阵整理下格式就可以。如果是其它类型数据或自己计算rank也可以，后面有更多示例。(如果后缀为`txt`格式，传统的基因表达矩阵就可以，第一列为基因名字，名字与待分析的功能注释数据集一致，同为GeneSymbol或EntrezID或其它自定义名字，第一行为标题行，含样品信息。`gct`文件需要符合下面的格式要求。)
Phenotype labels	Contains phenotype labels and associates each sample with a phenotype.	cls	You create the file or have GSEA create it for you. 一般是样品分组信息或样品属性度量值或时间序列信息。
Gene sets	Contains one or more gene sets. For each gene set, gives the gene set name and list of features (genes or probes) in that gene set.	gmx or gmt	You use the files on the Broad ftp site, export gene sets from the Molecular Signature Database (MSigDb) or create your own gene sets file. 欲检测是否富集的基因集列表。注意基因ID与表达矩阵基因ID一致。自己准备的基因集注意格式与官网提供的`gmt`格式一致。
Chip annotations	Lists each probe on a DNA chip and its matching HUGO gene symbol. Optional for the gene set enrichment analysis.	Chip	You use the files on the Broad ftp site, download the files from the GSEA web site, or create your own chip file. 主要是为芯片探针设计的转换文件。如果表达矩阵的基因名与注释集基因名一致，不需要这个文件。

1. 表达数据集文件

GESA提供有Example Datasets，下载地址：http://software.broadinstitute.org/gsea/datasets.jsp。

在这里可以下载表达矩阵Expression dataset(gct文件，常见txt格式也可以)和样品分组信息Phenotype labels（cls文件）

数据示例中两个gct文件都是表达矩阵，其中*hgu133a.gct文件第一列是探针名字，*collapsed.gct文件的第一列是gene symbol。

第一行：#1.2，表示版本号，自己准备文件时照抄就行；
第二行：两个数分别表示gene NAME的数量和样本数量（矩阵列数-2）；
矩阵：第一列是NAME；第二列Description，没有的话可以全用na或任意字符串填充；后面的就是基因在不同样本中标准化后的表达数据了（部分统计量metrics for ranking genes计算需要log转换后的数据，后面会有提及。其它情况是否为log转换的数据都可用，GSEA关注的是差异，只要可比即可）。

2. 样品分组信息

第一行：三个数分别表示：34个样品，2个分组，最后一个数字1是固定的；
第二行：以#开始，tab键分割，分组信息（有几个分组便写几个，多个分组在比较分析时，后面需要选择待比较的任意2组）；
（样品分组中NGT表示正常耐糖者，DMT表示糖尿病患者，自己使用时替换为自己的分组名字）
第三行：样本对应的组名。样本分组信息的第三行，同一组内的不同重复一定要命名为相同的名字，可以是分组的名字。例如相同处理的不同重复在自己试验记录里一般是Treat6h_1、Treat6h_2、Treat6h_3，但是在这里一定都要写成一样的值Treat6h。与表达矩阵的样品列按位置一一对应，名字相同的代表样品属于同一组。如果是样本分组信息，上图中的0和1也可以对应的写成NGT和DMT，更直观。但是，如果想把分组信息作为连续表型值对待，这里就只能提供数字。

3. 功能基因集文件（gene sets）

GSEA官网提供了8种基因分类数据库，都是关于人类的数据，包括Marker基因，位置临近基因，矫正过的基因集，调控motif基因集，GO注释，癌基因，免疫基因，最新一次更新是在2018年7月，下载地址：http://software.broadinstitute.org/gsea/downloads.jsp#msigdb。

官网提供的gmt文件有两种类型，*.symbols.gmt中基因以symbols号命名，*.entrez.gmt中基因以entrez id命名。注意根据表达矩阵的基因名字命名方式选择合适的基因集。表达数据和通路数据能关联在一起依赖的是基因名字相同，所以一定保证基因命名方式的统一。

gmt格式是多列注释文件，第一列是基因所属基因集的名字，可以是通路名字，也可以是自己定义的任何名字。第二列，官方提供的格式是URL，可以是任意字符串。后面是基因集内基因的名字，有几个写几列。列与列之间都是TAB分割。

Pathway_description    Anystring    Gene1    Gene2    Gene3
Pathway_description2    Anystring    Gene4    Gene2    Gene3    Gene5

GSEA官网只提供了人类的数据，但是掌握了官网中基因表达矩阵和注释文件的数据格式，就可以根据自己研究的物种，在公共数据库下载对应物种的注释数据，自己制作格式一致的功能基因集文件，这样便就可以做各种物种的GSEA富集分析了。

4. 芯片注释文件

如果分析的表达数据是芯片探针数据就需要用到芯片注释文件（chip），用来做ID转换，把探针名字转换为基因名字。如果我们的表达数据文件中已经是基因名了就不再需要这个文件了。

三、分析参数设置和软件运行

演示使用的数据来自GSEA官网：

表达矩阵：Diabetes_collapsed_symbols.gct
样品分组信息：Diabetes.cls
基因功能分类数据选择GO数据库：c5.all.v6.2.symbols.gmt
因为表达矩阵与注释中基因名字可以直接对应，第四个文件不需要

1. 数据导入

按照上图步骤依次点击Load data——Browse for file——在弹出文件框中找到待导入的文件，选中点击打开即可；

若文件格式没问题会弹出一个提示There were no error的框，证明文件上传成功，并且会显示在5所示的位置；若出错，请仔细核对文件格式。

注意：1）本地文件存放路径不要有中文、空格（用_代替空格）和其他特殊字符；2）所有用到的文件都需要通过上述方式先上传至软件；3）数据上传错误后可以通过点击工具栏file——clear recent file history进行清除。

2. 指定参数

点击软件左侧Run GSEA，将跳出参数选择栏。参数设置分为三个部分Require fields（必须设置的参数项）、Basic fields（基本参数设置栏）和Advanced fields（高级参数设置栏），后面两栏的参数一般不做修改，使用默认的就行。后面两部分参数设置，如果涉及到需要根据实验数据做调整的地方，会在后面的分析中会提到。

1）Require fields

Expression dataset： 导入表达数据集文件，点击后自动显示上一步中从本地导入软件内的文件，所以一定要确认上一步导入数据是否成功；
Gene sets database： 基因功能集数据库，可以从本地导入（上一步）；
在联网的情况下软件也可以为自动下载GSEA官网中的gene sets文件；
Number of permutations： 置换检验的次数，数字越大结果越准确，但是太大会占用太多内存，软件默认检验1000次。
软件分析时会得到一个基因富集的评分（ES），但是富集评分是否具有统计学意义，软件就会采用随机模拟的方法，根据指定参数随机打乱1000次，得到1000个富集评分，然后判断得到的ES是否在这1000个随机产生的得分中有统计学意义。测试使用时建议填一个很小的数如10，先让程序跑通。真正分析时再换为1000。
Phenotype labels： 选择比较方式，如果文件只有2个组别的话就比较方便了，任意选一个就行，哪个在前在后全在自己怎么解释方便；如果数据有多组的话，GSEA会提供两两间比较的组合选项或者某一组与剩下所有组的比较。选择好后，GSEA会在分析过程中根据组别信息自动到表达数据集文件中提取对应的数据作比较。
Collapse dataset to gene symbols： 如果表达数据集文件中NAME已经与gene sets database中名字一致，选择FALSE，反之选择TRUE。
Permutation type： 选择置换类型，phenotype或者gene sets。
每组样本数目大于7个时 ，建议选择phenotype，否则选择gene sets。
Chip platform： 表达数据集为芯片数据时才需要，目的是对ID进行注释转换，如果已经转换好了就不需要了。应该也适用于其它需要转换ID的情况，不过事先转换最方便。

2）Basic fields

通常选择默认参数即可，在此简单介绍一下

Analysis name： 取名需要注意不能有空格，需要用_代替空格。如果做的分析多，最好选择一个有意义的名字，比如shengxinbaodian （生信宝典全拼），方便查找。
Enrichment statistic： 基因集富集分析(PNAS)的最后一部分给出了GSEA中所用方法的数学描述，感兴趣的可以查看一下论文。在此给出每种富集分析不同算法的参数情况：▪ classic: p=0 若基因存在，则ES值加1；若基因不存在，则ES值减1 ▪ weighted (default): p=1 若基因存在，则ES加rank值；若基因不存在，则ES减rank值 ▪ weighted_p2: p=2 基因存在，ES加rank值的平方，不存在则减rank值的平方 ▪ weighted_p1.5: p=1.5 基因存在，ES加rank值得1.5次方，不存在则减rank值得1.5次方

备注：如果想用其它加权，就自己计算rank值，使用preranked mode。

Metric for ranking genes： 基因排序的度量

下面提到的均值也可以是中位数。
如果表型是分组信息，GSEA在计算分组间的差异值时支持5种统计方式，分别是signal2noise、t-Test、ratio_of_class、 diff_of_class(log2转换后的值计算倍数)和log2_ratio_of_class。
下面公式很清楚。
如果表型是连续数值信息（定量表型）: GSEA通过表型文件（cls）和表达数据集文件（gct），使用pearson相关性、Cosine、Manhattan 或Euclidean指标之一计算两个配置文件之间的相关性。
（注意：若是分组表型文件想转换为定量表型，cls文件中分类标签应该指定为数字）

Gene list sorting mode： 对表达数据集中的基因进行排序，按照排序度量的真实值（默认）或者绝对值排序；
Gene list ordering mode： 使用此参数确定表达数据集中基因是按照降序（默认）或者升序排列；
Max size & Min size： 从功能基因集中筛选出不属于表达数据集中的基因后，剩下基因总数在此范围内则保留下来做后续的分析，否则将此基因集排除；一般太多或太少都没有分析意义。
Save results in this folder： 在此可以选择分析文件在本地电脑的存储地址。

3）Advanced fields

Collapsing mode for probe sets => 1 gene：多个探针对应一个基因时的处理方式。
Normalized mode: 富集得分的标准化方式。
Randomization mode：只用于phenotype permutation。
Median for class metrics: 计算metrics ranking时用中值而不是平均值。
Number of markers：红蝶图中展示的Gene Marker数目。
Plot graphs for the top sets of each phenotype：绘制多少GSEA plot，默认top 20，其它不绘制。一般会把这个值调高。
Seed for permutation：随机数种子，如果想让每次结果一致，这里需要设置同样的一个整数。

以上参数都设置好后点击参数设置栏下方的一个绿色按钮Run，若软件左下方GSEA reports处的状态显示Running的话则表示运行成功，此过程大概需要十分钟左右，视数据大小而定。

Command：显示运行这个分析的命令行，以后就可以批量运行类似分析了。

四、结果解读

数据分析完后的结果会保存到我们设置的路径下，点开文件夹中的index.html就可以查看网页版结果，更加方便。

结果报告分为多个子项目，其中最重要的是前面两部分，基因富集结果就在这里。从第三部分开始其实是软件在分析数据的过程产生的中间文件， 也很重要，读懂后可以加深对GSEA分析的认识，理解我们是如何从最初的基因表达矩阵得到最终的结果（即报告的前两个项目）。建议先从Dataset details看起，然后再返回看第一部分的结果报告。

1. Enrichment in phenotype

以正常人组NGT的17个样本数据为例解析最终结果。

报告首页文字总结信息表示：

经过条件筛选后还剩下3953个GO条目，其中1697个GO条目在NGT组中富集；
有36个GO基因条目在FDR<25%的条件下显著富集，这部分基因最有可能用于推进后续实验；
在统计检验p<0.01, p<0.05的条件下分别有19和114个GO条目显著富集；
结果有多种显示方式：图片快照（snapshot）、网页（html）和表格（Excel）形式；
点击Guide to可以查看官方帮助解读结果的文档。

1）点击enrichment results in html，在网页查看富集结果，如下：

GS：基因集的名字，GO条目的名字
SIZE：GO条目中包含表达数据集文中的基因数目（经过条件筛选后的值）；
ES：富集评分；
NES：校正后的归一化的ES值。
由于不同用户输入的基因数据库文件中的基因集数目可能不同，富集评分的标准化考虑了基因集个数和大小。
其绝对值大于1为一条富集标准。
计算公式如下：
NOM p-val：即p-value，是对富集得分ES的统计学分析，用来表征富集结果的可信度；
FDR q-val：即q-value，是多重假设检验校正之后的p-value，即对NES可能存在的假阳性结果的概率估计，因此FDR越小说明富集越显著；
RANK AT MAX：当ES值最大时，对应基因所在排序好的基因列表中所处的位置；（注：GSEA采用p-value<5%，q-value<25%进行数据过滤）
LEADING EDGE：该处有3个统计值，tags=59%表示核心基因占该基因集中基因总数的百分比；list=21%表示核心基因占所有基因的百分比；signal=74%，将前两项统计数据结合在一起计算出的富集信号强度，计算公式如下：
其中n是列表中的基因数目，nh是基因集中的基因数目

点击Details跳转至对应的详情结果。只有前20个GO富集详情可以查看，想要生成的结果报告可以查看更多的富集信息，可以通过在Advanced fields处设置参数Plot graphs for the top sets of each phenotype。

2）Details for gene set首先是一个选定GOset下的汇总信息表，每一部分意思在上面已做解释，其中Upregulated in class表示该基因集在哪个组别中高表达，这个主要看富集分析后的leading edge分布位置。

接下来是富集分析的图示，该图示分为三部分，在图中已做标记：

第一部分是Enrichment score折线图：显示了当分析沿着排名列表按排序计算时，ES值在计算到每个位置时的展示。最高峰处的得分 (垂直距离0.0最远)便是基因集的ES值。
第二部分，用线条标记了基因集合中成员出现在基因排序列表中的位置，黑线代表排序基因表中的基因存在于当前分析的功能注释基因集。leading edge subset 就是（0,0）到绿色曲线峰值ES出现对应的这部分基因。
第三部分是排序后所有基因rank值得分布，热图红色部分对应的基因在NGT中高表达，蓝色部分对应的基因在DMT中高表达，每个基因对应的信噪比（Signal2noise，前面选择的排序值计算方式）以灰色面积图显展示。

在上图中，我们一般关注ES值，峰出现在排序基因集的前端还是后端（ES值大于0在前端，小于0在后端）以及Leading edge subset（即对富集贡献最大的部分，领头亚集）；在ES图中出现领头亚集的形状，表明这个功能基因集在某处理条件下具有更显著的生物学意义；对于分析结果中，我们一般认为|NES|>1，NOM p-val<0.05，FDR q-val<0.25的通路是显著富集的。最后还有一个该GO基因集下每个基因的详细统计信息表，RANK IN GENE LIST表示在排序好的基因集中所处的位置；RANK METRIC SCORE是基因排序评分，我们这里是Signal2noise；RUNNING ES是分析过程中动态的ES值；CORE ENRICHMENT是对ES值有主要贡献的基因，即Leading edge subset，在表中以绿色标记。

2. Dataset details

芯片原始数据和去重后的数据；如果分析的时候没有用到芯片数据或没涉及到名字转换则前后基因数目一样。

3. Gene set details

我们分析提供的gmt文件中有多个GO条目，每个GO条目里又有多个基因；GSEA分析软件会在每个GO条目中搜索表达数据集gct文件中的基因，并判断有多少个在GO条目中；若经过筛选后保留在GO条目中的基因在15-500（闭区间）时该GO条目才被保留下来进行后续的分析。

此结果显示我们从5917个GO条目中淘汰了了1964个GO，剩下3953个GO条目用作后续分析。

点击gene sets used and their sizes可以下载详细Excel表。

Excel第一列是GO名称，第二列是GO条目中包含的基因数目，第三列是筛选后每个GO中还有多少基因属于表达数据集文件中的基因，不满足参数（15-500）的条目被抛弃，显示为Rejected不纳入后续分析。

备注： 此处的筛选范围15-500是可调参数，在软件的参数basic fields处的Max size和Min size处更改。

4. Gene markers for the NGT versus DMT comparison

这部分展示的是我们提供的表达数据集文件中的基因在两个组别中的表达情况。

输入的文件中总共有15056个基因，其中有7993个基因在正常人（NGT）中表达更高，占总基因数的53.1%；有7063个基因在糖尿病患者（DMT）中表达更高，占总基因数的46.9%。后面一个面积百分比，稍后看图的时候再做解释。

点击rank ordered gene list可以下载一个排序好的基因集Excel表，排序原则是根据Basic fields参数设置处的Metric for ranking genes决定的。我们选的是信噪比（signal2noise），显示在表格中的最后一列。根据NGT_vs_DMT评分得到一个降序排列的基因集，之后便可以做基因的富集分析了。

GSEA基因富集分析的原理就是基于该排列好的基因集，从第一个基因开始判断该基因是否存在于经过筛选的GO功能基因集中，如果存在则加分，反之减分。所以评分过程是一个动态的过程，最终我们会得到一个评分峰值，那就是GO功能富集的评分。加分规则通过Basic fields参数设置处的Enrichment statistic决定的。

接着有一个分析的结果的热图和gene list相关性的图。

热图中展示了分别在两组处理中高表达的前50个基因，总共100个基因的表达情况。

gene list相关性图如下。横坐标是已经排序好的基因，纵坐标是signal2noise的值。虚线左侧的基因是在NGT中高表达，右侧的基因在DMT中高表达。这部分结果报告中的面积比就是基于该图计算的，可以看出面积百分比和基因数目百分比有一定的差异，面积百分比可以从整体上反映组间信噪比的大小。

Butterfly plot显示了基因等级与排名指标评分之间的正相关（左侧）和负相关性（右侧）。左侧蓝色虚线和右侧红色虚线是真实的信噪比结果，其他颜色的线是软件对数据做了随机重排后的结果。默认情况下，图形只显示前100个基因，也就是排名第一和最后100个基因。可以使用运行GSEA页面上Advanced fields处的Number of markers来更改显示的基因数量。

5. Global statistics and plots

这部分包含两个图：1) p值与归一化富集分数(NES)的对比图，这提供了一种快速、直观的方法来掌握有意义的富集基因集的数量。2) 通过基因集的富集分数统计图，提供了一种快速、直观的方法来掌握富集的基因集的数量。

理解了上面各个部分的结果后，再回过头看这张GSEA分析原理图就简单了。

Cytoscape富集网路可视化

在GSEA软件的左侧提供了Enrichment Map Visualization的功能，点击后GSEA软件会自动调用Cytoscape，建议等待Cytoscape启动后再进行接下来的操作，且保证在分析过程中Cytoscape是处于开启状态。

选择一个GSEA分析结果，点击Load GSEA Results，其他项为默认值就行，点击Build Enrichment Map以展示基因富集结果的网络图。（备注：GSEA分析结果用的是和上面演示数据不同的文件，可自行更改）

运行成功之后会弹出下面的提示框，结果直接展现在了Cytoscape中，如下图所示：

Graphpad作图比较多个ES

GSEA富集分析可视化结果是给每个功能基因集富集情况单独出一张图，有的时候我们想要比较基因集在两个不同的GO中的富集情况，利用GSEA软件分析得到的Excel结果表，提取有用的数据结果，在graphpad里进行加工再出图，可以达到我们想要的结果！

效果图如下：

《Graphpad，经典绘图工具初学初探》一文中介绍了graphpad入门的基础知识，基本操作可以单击回看。最近使用graphpad发现其多图排版功能十分强大，不仅可以实现多个图形排版还能实现图层叠加。上面这个图的作图思路也就是把该图拆分为两部分，Enrichment score和基因位置分布条带图。

在GSEA分析结果文件夹里随便找一个感兴趣的GO条目分析结果Excel表，作图需要提取的信息即图中标黄的部分，RANK IN GENE LIST和RUNNING ES。

加工一下已有数据，添加一列high取值都为0.1，设置高度，黄色部分的数据就是用来绘制基因位置分布条带图的；绿色部分用来绘制动态的ES评分曲线。

打开graphpad之后，我们在XY类图下选择Enter and plot a single Y value for each point，将两部分数据分开粘贴到软件不同数据表格中（如下图左侧所示），下图中间展示两个图选择的不同绘图方式，调整参数后最终得到右侧的结果。

在左侧目录树处点击layout创建一个图形排版界面，将Graphs下的图形复制粘贴到layout1下，拖拉移动位置很快就能将两部分图对齐。

之后用同样地方式画另外一个富集结果，粘贴到layout1中便得到最开始展示的图。

注意：设置X轴的范围是1到总排序基因数，Y轴是0到多个富集分析得分的最大值。

GO、GSEA富集分析一网打进
GSEA富集分析 - 界面操作
无需写代码的高颜值富集分析神器
去东方，最好用的在线GO富集分析工具
没钱买KEGG怎么办？REACTOME开源通路更强大
超简便的国产lncRNA预测工具LGC
我想做信号通路分析，但我就是不想学编程
这个只需一步就可做富集分析的网站还未发表就被CNS等引用超过350次

往期精品(点击图片直达文字对应教程)

后台回复“生信宝典福利第一波”或点击阅读原文获取教程合集

你可能感兴趣的:(一文掌握GSEA，超详细教程！)

三大师传 beca酱
巴尔扎克的作品被誉为“法国社会的一面镜子”。文学大师维克多·雨果对巴尔扎克的评价是：“在最伟大的人物中间，巴尔扎克是名列前茅者；在最优秀的人物中间，巴尔扎克是佼佼者之一。”一个原本寂寂无名的小人物，从地中海的某个海岛上，只身一人来到巴黎，没有朋友，也没有名望。作为一个一文不名的外乡人，凭着赤手空拳赢得了巴黎，征服了整个法兰西，并且赢得了世界。这个人就是十九世纪法国伟大的军事家、政治家，法兰西第一帝
活给自己看，笑容才灿烂听着了么
白岩松说“有时候，我们活得很累，并非生活过于刻薄，而是我们太容易被外界的氛围所感染，被他人的情绪所左右。”心情是自己的。若只是活在别人的眼里、嘴里，便掌握不了让自己开心的主动权。人活着，不是为了活给别人看的，唯有做最真实的自己，活给自己看，笑容才灿烂。诚然，世事纷繁复杂，人人都有一张嘴，管也管不了。永远有人欣赏你，也永远有人批评你，不可能做到让所有人都满意，开心做自己才是最重要的。人生苦短，有太多
WPF中的ComboBox控件几种数据绑定的方式互联网打工人no1 wpf c#
一、用字典给ItemsSource赋值（此绑定用的地方很多，建议熟练掌握）在XMAL中：在CS文件中privatevoidBindData(){DictionarydicItem=newDictionary();dicItem.add(1,"北京");dicItem.add(2,"上海");dicItem.add(3,"广州");cmb_list.ItemsSource=dicItem;cmb_l
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
从鸡肉高汤到记忆的魔法再到有效提示的艺术步子哥人工智能
还记得小时候那些天马行空的白日梦吗？也许只要按下键盘上的某个神奇组合，电脑就会发出滴滴的声响，一个隐藏的世界突然在你眼前展开，让你获得超凡的能力，摆脱平凡的生活。这听起来像是玩过太多电子游戏的幻想，但实际上，间隔重复系统给人的感觉惊人地相似。在最佳状态下，这些系统就像魔法一样神奇。本文将以一个看似平凡的鸡肉高汤食谱为例，深入浅出地探讨如何编写有效的间隔重复提示，让你像掌握烹饪技巧一样轻松地掌握记忆
PHP环境搭建详细教程好看资源平台前端 php
PHP是一个流行的服务器端脚本语言，广泛用于Web开发。为了使PHP能够在本地或服务器上运行，我们需要搭建一个合适的PHP环境。本教程将结合最新资料，介绍在不同操作系统上搭建PHP开发环境的多种方法，包括Windows、macOS和Linux系统的安装步骤，以及本地和Docker环境的配置。1.PHP环境搭建概述PHP环境的搭建主要分为以下几类：集成开发环境：例如XAMPP、WAMP、MAMP，这
Day17笔记-高阶函数 ~在杰难逃~ Python 笔记 python 开发语言 pycharm 数据分析
高阶函数【重点掌握】函数的本质：函数是一个变量，函数名是一个变量名，一个函数可以作为另一个函数的参数或返回值使用如果A函数作为B函数的参数，B函数调用完成之后，会得到一个结果，则B函数被称为高阶函数常用的高阶函数：map(),reduce(),filter(),sorted()1.map()map(func,iterable)，返回值是一个iterator【容器，迭代器】func:函数iterab
走向以教育叙事为载体的教育叙事研究 666小飞鱼
今天我读了吴松超老师的《给教师的68条建写作建议》中的第23条《如何通过教育叙事走向研究》，吴老师在文中与我们分享了一个德育案例，这是一个反面的案例，意在告知我们在处理问题时，不能就考虑的点太窄，思考要全面。走向教育叙事研究，教师要有敏锐的“感知力”，这个感知力来自于背后专业知识的支撑，思维能力以及广阔的视野和见识等。所以对于同一件事处理方法不同，这个就是教师背后“敏锐力”的不同造成的，也就是说是
梁文道《尽头:怎样是好的阅读和书写》片段白夜书摘
1、写小说的人，有时会强烈地感到一种现实的召唤，想去面对和回应现实。这时他们会觉得自己正站在时代中心，就像黑格尔说的，要把时代精神掌握在自己的小说（不是哲学）里面。但是这也很危险，当一个作家像一个时代那样书写，可能就会出现问题了。2、文字是远比语言大块而且湿冷的木头，又距离我们内心的火花稍远，不容易瞬间点燃起来，这处隙缝，给了我们回身的余地，可以再多看一下想一下设身处地一下；人类过往这最后五千年，
穷人做什么生意最赚钱？10个适合穷人赚钱的路子？氧惠爱高省
不管在什么地方，一般都是穷人占大量数，而富人只有少数，但是它们却掌握着大量的财富。对于穷人来说，想要买车、买房等奢侈品就难如登天，因为他们只能通过打工来赚取几千元的月薪。➤推荐网购返利app“氧惠”，一个领隐藏优惠券+现金返利的平台。氧惠只提供领券返利链接，下单全程都在淘宝、京东、拼多多等原平台，更支持抖音、快手电商、外卖红包返利等。（应用市场搜“氧惠”下载，邀请码:521521，全网优惠上氧惠！
2021-07-31 比峰
七月的最后一天，过了今天，就是八月，心脏在颤抖……昨天两点半才睡，一直在以两倍的语速的听之前的课程，虽然隔得时间不长，但是很多知识点已经忘了差不多了，为了让自己能够掌握的稍微全面一点，还是磨刀不误砍柴工的比较好。正因为晚上睡得晚，今天一上午的状态都不好，也可能因为上午都是待在家里，所以多数时间自己是在补觉。既然太累，那就睡觉吧，总比浪费时间的好。下午到咖啡馆做题，一道差错更正一下子让自己的实力暴露
一文掌握python面向对象魔术方法（二）程序员neil python python 开发语言
接上篇：一文掌握python面向对象魔术方法（一）-CSDN博客目录六、迭代和序列化：1、__iter__(self):定义迭代器，使得类可以被for循环迭代。2、__getitem__(self,key):定义索引操作，如obj[key]。3、__setitem__(self,key,value):定义赋值操作，如obj[key]=value。4、__delitem__(self,key):定义
一文掌握python常用的list（列表）操作程序员neil python python 开发语言
目录一、创建列表1.直接创建列表：2.使用list()构造器3.使用列表推导式4.创建空列表二、访问列表元素1.列表支持通过索引访问元素，索引从0开始：2.还可以使用切片操作访问列表的一部分：三、修改列表元素四、添加元素1.append()：在末尾添加元素2.insert()：在指定位置插入元素五、删除元素1.del：删除指定位置的元素2.remove()：删除指定值的第一个匹配项3.pop()：
发现荞麦过敏这件事怪小泊
荞麦在我这里不是常用的谷物。所以前二十年，我以为自己是很正常的，从街头小吃到包装零食到每日三餐，从来没有不能吃的。可是有天我突然病倒了，喉咙火辣辣的肿痛，口水都咽不下去，舌头发麻。当时我以为吃太多零食所致，因为那天我吃了很辣的泡椒凤爪。其实我是不怎么吃辣的。而那个泡椒凤爪真的超辣。当时我以为自己吃多了，并不知道自己对哪个食物过敏。因为不舒服我早早睡了，结果并没有睡着。肚子一阵一阵疼，非常痛苦，终于
白骑士的Java教学基础篇 2.5 控制流语句白骑士所长 Java 教学 java 开发语言
欢迎继续学习Java编程的基础篇！在前面的章节中，我们了解了Java的变量、数据类型和运算符。接下来，我们将探讨Java中的控制流语句。控制流语句用于控制程序的执行顺序，使我们能够根据特定条件执行不同的代码块，或重复执行某段代码。这是编写复杂程序的基础。通过学习这一节内容，你将掌握如何使用条件语句和循环语句来编写更加灵活和高效的代码。条件语句条件语句用于根据条件的真假来执行不同的代码块。if语句‘
Python入门之Lesson2:Python基础语法小熊同学哦 Python入门课程 python 开发语言算法数据结构青少年编程
目录前言一.介绍1.变量和数据类型2.常见运算符3.输入输出4.条件语句5.循环结构二.练习三.总结前言欢迎来到《Python入门》系列博客的第二课。在上一课中，我们了解了Python的安装及运行环境的配置。在这一课中，我们将深入学习Python的基础语法，这是编写Python代码的根基。通过本节内容的学习，你将掌握变量、数据类型、运算符、输入输出、条件语句等Python编程的基础知识。一.介绍1
《 C++ 修炼全景指南：九》打破编程瓶颈！掌握二叉搜索树的高效实现与技巧 Lenyiin C++修炼全景指南技术指南 c++算法 stl
摘要本文详细探讨了二叉搜索树（BinarySearchTree,BST）的核心概念和技术细节，包括插入、查找、删除、遍历等基本操作，并结合实际代码演示了如何实现这些功能。文章深入分析了二叉搜索树的性能优势及其时间复杂度，同时介绍了前驱、后继的查找方法等高级功能。通过自定义实现的二叉搜索树类，读者能够掌握其实际应用，此外，文章还建议进一步扩展为平衡树（如AVL树、红黑树）以优化极端情况下的性能退化。
Spring MVC 全面指南：从入门到精通的详细解析一杯梅子酱技术栈学习 spring mvc java
引言：SpringMVC，作为Spring框架的一个重要模块，为构建Web应用提供了强大的功能和灵活性。无论是初学者还是有一定经验的开发者，掌握SpringMVC都将显著提升你的Web开发技能。本文旨在为初学者提供一个全面且易于理解的学习路径，通过详细的知识点分析和实际案例，帮助你快速上手SpringMVC，让学习过程既深刻又高效。一、SpringMVC简介1.1什么是SpringMVC？Spri
阅读《别说你懂思维导图》21～23章day27 Ling宝尔
合理期待——思维导图的应用效果很多人问我，思维导图真的有用么？我常常回答，如果你觉得是它“没用”，一定是因为你没“用”，有“用”才“有用”。实际上，学习思维导图和学习木工、驾驶等技能型学习一样，都要经历从了解到应用、从应用到受益的过程。在使用前，我们很多人的思维处于“无意识的低效”状态，经过一段时间的学习，虽然掌握了思维导图的基本使用方法，但可能并没有太好的效果，这个阶段可称为“有意识的低效”状态
JAVA学习笔记之23种设计模式学习 victorfreedom Java技术设计模式 android java 常用设计模式
博主最近买了《设计模式》这本书来学习，无奈这本书是以C++语言为基础进行说明，整个学习流程下来效率不是很高，虽然有的设计模式通俗易懂，但感觉还是没有充分的掌握了所有的设计模式。于是博主百度了一番，发现有大神写过了这方面的问题，于是博主迅速拿来学习。一、设计模式的分类总体来说设计模式分为三大类：创建型模式，共五种：工厂方法模式、抽象工厂模式、单例模式、建造者模式、原型模式。结构型模式，共七种：适配器
掌握正确的方法，全面打造更有利于长期学习的“超能大脑” 微微一勺
作为家长，都希望自己的孩子在上学的时候能够拥有优异的成绩，最好能成为班上的学霸，而后考上一所不错的大学。作为孩子，学霸也是非常让大家认可的，是同学们崇拜的偶像。所以，无论是家长还是老师，无论是同学还是亲戚，都想要自己喜欢的人或者自己看好的人成为班级里的学霸。都是寒窗苦读，为什么别人可以成为高考状元、学霸，而有些孩子努力了还是成绩平平呢？为什么课堂上学霸很少开小差？为什么学霸背东西过目不忘？为什么学
但行好事，莫问前程娟恋YOU
下班路上，路过菜市场，突然想吃火锅了。于是于是边去常去批发雪糕的地方去买些涮火锅的丸子类的菜，选了一些后，结算是24.9，老板爽快的说，给我24.5就行，正好钱包有现金25元，超递给老板结账，老板又给我一元钱，说24就行，我说那怎么可以，我又沾光了，总沾你的光，多不好意思！老板说你常来我就是沾你的光了！最后还是收了我24块钱，心里还是很开心的。不是因为沾光而开心，而是被让的开心！这样的老板做生意闻
干货|自我介绍这三个坑，99%的概率你踩过！夏麦生命的魔术师
自我介绍——每个人都需要的一张名片。图片源自网络从2018年到现在，在做演讲俱乐部的2年时间里，我在演讲活动现场听过1000+人的自我介绍，自我介绍做得超棒的人真不多！最近，我花了近几个月时间，仔细研究了500+人线上场景的自我介绍，发现优秀的自我介绍也不多！为什么做一张优秀的自我介绍就这么难呢？这个问题，在我帮几十个人打造了自我介绍的过程一直困扰着我。经过了几个月的时间思考与实践，终于发现三个—
字节二面 Redstone Monstrosity 前端面试
1.假设你是正在面试前端开发工程师的候选人，面试官让你详细说出你上一段实习过程的收获和感悟。在上一段实习过程中，我获得了宝贵的实践经验和深刻的行业洞察，以下是我的主要收获和感悟：一、专业技能提升框架应用熟练度：通过实际项目，我深入掌握了React、Vue等前端框架的使用，不仅提升了编码效率，还学会了如何根据项目需求选择合适的框架。问题解决能力：在实习期间，我遇到了许多预料之外的技术难题。通过查阅文
7号卢秀梅《给教师的建议》第6篇读后感星辰85
思考中获得活的知识一一《知识既是目的又是手段》读后感学生掌握的知识越多，学习就应该越省劲。可惜实际情况往往相反:总有些学生的学习一年比一年困难。苏霍姆林斯基在《知识既是目的又是手段》一文中分析说:知识对有些学生来说成了滞销的货物，得不到运用。知识似乎与学生的精神生活和智力兴趣不相干。掌握知识对学生来说变成了讨厌的事，学生没有了兴趣，更缺乏思考。我们教师要努力使学生把获得知识不当成最终目的，而当成一
身体乳哪个牌子的好用?口碑超好的身体乳排行榜前十名高省APP珊珊
做小仙女真不容易啊~不仅脸蛋要漂亮精致，连身体每一寸肌肤都不能放过！天气变冷后，稍不注意身上的皮屑就开始“下雪”了~网上购物用高省APP更优惠！高省APP，是2021年推出的平台，0投资，0风险、高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，也期待你的加入。珊珊导师，高省邀请码666123，注册送2皇冠会员，送万元推广大礼包，
C++常见知识掌握 nfgo c++开发语言
1.Linux软件开发、调试与维护内核与系统结构Linux内核是操作系统的核心，负责管理硬件资源，提供系统服务，它是系统软件与硬件之间的桥梁。主要组成部分包括：进程管理：内核通过调度器分配CPU时间给各个进程，实现进程的创建、调度、终止等操作。使用进程描述符（task_struct）来存储进程信息，包括状态（就绪、运行、阻塞等）、优先级、内存映射等。内存管理：包括物理内存和虚拟内存管理。通过页表映
metaRTC/webRTC QOS 方案与实践 metaRTC metaRTC 解决方案 webrtc qos
概述质量服务(QOS/QualityofService)是指利用各种技术方案提高网络通信质量的技术，网络通信质量需要解决下面两个问题：网络问题：UDP/不稳定网络/弱网下的丢包/延时/乱序/抖动数据量问题：发送数据量超带宽负载和平滑发送拥塞控制是各种技术方案的数据基础，丢包恢复解决丢包问题，抗乱序抖动解决网络乱序抖动问题，流量控制解决平滑发送数据/数据超带宽负载/延时问题。拥塞控制(Congest
2020年最新程序员职业发展路线指南，超详细！编程流川枫 11 编程语言程序员互联网 IT 职业
【文章来源微信公众号：每天学编程】01、程序员的特性技术出身的职场人特性很明显，与做市场、业务出身的职场人区别尤其明显。IT行业中常见的一些职场角色：老板、项目经理、产品经理、需求分析师、设计师、开发工程师、运维工程师等。开发工程师具有如下特征：1、逻辑思维清晰、严谨和细腻；但是有时不容易转弯，有些程序员容易较劲、钻牛角尖。2、性格偏内向、不善于沟通、表达和交际；但是在网络聊天工具上，有些显为幽默
2019-02-26 一枚_铜钱
今天是实习第一节课，昨天已经和同学们交流过了，对于新老师，让学生适当地了解你是很有必要的。这第一节课嘛，孩子们表现也还可以大部分孩子都是很认真听讲的，也有几个上课会说话。但是我觉得孩子们对知识点的掌握速度还是很慢的，有的地方讲很多遍还是不太懂的样子。当然我自己可能也要反省，重点地方一定要明明白白告诉大家。明天切正题要快，要让学生读题，要让学生多写多练。话要尽量说得少，但句句在点子上，还得全面。下午
tomcat基础与部署发布暗黑小菠萝 Tomcat java web
从51cto搬家了，以后会更新在这里方便自己查看。做项目一直用tomcat，都是配置到eclipse中使用，这几天有时间整理一下使用心得，有一些自己配置遇到的细节问题。 Tomcat：一个Servlets和JSP页面的容器，以提供网站服务。一、Tomcat安装安装方式：①运行.exe安装包 &n
网站架构发展的过程 ayaoxinchao 数据库应用服务器网站架构
1.初始阶段网站架构：应用程序、数据库、文件等资源在同一个服务器上 2.应用服务和数据服务分离：应用服务器、数据库服务器、文件服务器 3.使用缓存改善网站性能：为应用服务器提供本地缓存，但受限于应用服务器的内存容量，可以使用专门的缓存服务器，提供分布式缓存服务器架构 4.使用应用服务器集群改善网站的并发处理能力：使用负载均衡调度服务器，将来自客户端浏览器的访问请求分发到应用服务器集群中的任何
[信息与安全]数据库的备份问题 comsci 数据库
如果你们建设的信息系统是采用中心-分支的模式,那么这里有一个问题如果你的数据来自中心数据库,那么中心数据库如果出现故障,你的分支机构的数据如何保证安全呢? 是否应该在这种信息系统结构的基础上进行改造,容许分支机构的信息系统也备份一个中心数据库的文件呢? &n
使用maven tomcat plugin插件debug关联源代码商人shang maven debug 查看源码 tomcat-plugin
*首先需要配置好'''maven-tomcat7-plugin'''，参见[[Maven开发Web项目]]的'''Tomcat'''部分。 *配置好后，在[[Eclipse]]中打开'''Debug Configurations'''界面，在'''Maven Build'''项下新建当前工程的调试。在'''Main'''选项卡中点击'''Browse Workspace...'''选择需要开发的
大访问量高并发 oloz 大访问量高并发
大访问量高并发的网站主要压力还是在于数据库的操作上，尽量避免频繁的请求数据库。下面简要列出几点解决方案： 01、优化你的代码和查询语句，合理使用索引 02、使用缓存技术例如memcache、ecache将不经常变化的数据放入缓存之中 03、采用服务器集群、负载均衡分担大访问量高并发压力 04、数据读写分离 05、合理选用框架，合理架构(推荐分布式架构)。
cache 服务器小猪猪08 cache
Cache 即高速缓存.那么cache是怎么样提高系统性能与运行速度呢？是不是在任何情况下用cache都能提高性能？是不是cache用的越多就越好呢？我在近期开发的项目中有所体会，写下来当作总结也希望能跟大家一起探讨探讨，有错误的地方希望大家批评指正。　　1.Cache 是怎么样工作的? 　　Cache 是分配在服务器上
mysql存储过程香水浓 mysql
Description:插入大量测试数据 use xmpl; drop procedure if exists mockup_test_data_sp; create procedure mockup_test_data_sp( in number_of_records int ) begin declare cnt int; declare name varch
CSS的class、id、css文件名的常用命名规则 agevs JavaScript UI 框架 Ajax css
CSS的class、id、css文件名的常用命名规则 (一)常用的CSS命名规则　　头：header 　　内容：content/container 　　尾：footer 　　导航：nav 　　侧栏：sidebar 　　栏目：column 　　页面外围控制整体布局宽度：wrapper 　　左右中：left right
全局数据源 AILIKES java tomcat mysql jdbc JNDI
实验目的：为了研究两个项目同时访问一个全局数据源的时候是创建了一个数据源对象，还是创建了两个数据源对象。 1：将diuid和mysql驱动包（druid-1.0.2.jar和mysql-connector-java-5.1.15.jar）copy至%TOMCAT_HOME%/lib下；2：配置数据源，将JNDI在%TOMCAT_HOME%/conf/context.xml中配置好,格式如下：&l
MYSQL的随机查询的实现方法 baalwolf mysql
MYSQL的随机抽取实现方法。举个例子，要从tablename表中随机提取一条记录，大家一般的写法就是：SELECT * FROM tablename ORDER BY RAND() LIMIT 1。但是，后来我查了一下MYSQL的官方手册，里面针对RAND()的提示大概意思就是，在ORDER BY从句里面不能使用RAND()函数，因为这样会导致数据列被多次扫描。但是在MYSQL 3.23版本中，
JAVA的getBytes()方法 bijian1013 java eclipse unix OS
在Java中，String的getBytes()方法是得到一个操作系统默认的编码格式的字节数组。这个表示在不同OS下，返回的东西不一样！ String.getBytes(String decode)方法会根据指定的decode编码返回某字符串在该编码下的byte数组表示，如： byte[] b_gbk = "
AngularJS中操作Cookies bijian1013 JavaScript AngularJS Cookies
如果你的应用足够大、足够复杂，那么你很快就会遇到这样一咱种情况：你需要在客户端存储一些状态信息，这些状态信息是跨session(会话)的。你可能还记得利用document.cookie接口直接操作纯文本cookie的痛苦经历。幸运的是，这种方式已经一去不复返了，在所有现代浏览器中几乎
[Maven学习笔记五]Maven聚合和继承特性 bit1129 maven
Maven聚合在实际的项目中，一个项目通常会划分为多个模块，为了说明问题，以用户登陆这个小web应用为例。通常一个web应用分为三个模块： 1. 模型和数据持久化层user-core, 2. 业务逻辑层user-service以 3. web展现层user-web， user-service依赖于user-core user-web依赖于user-core和use
【JVM七】JVM知识点总结 bit1129 jvm
1. JVM运行模式 1.1 JVM运行时分为-server和-client两种模式，在32位机器上只有client模式的JVM。通常，64位的JVM默认都是使用server模式，因为server模式的JVM虽然启动慢点，但是，在运行过程，JVM会尽可能的进行优化 1.2 JVM分为三种字节码解释执行方式：mixed mode, interpret mode以及compiler
linux下查看nginx、apache、mysql、php的编译参数 ronin47
在linux平台下的应用，最流行的莫过于nginx、apache、mysql、php几个。而这几个常用的应用，在手工编译完以后，在其他一些情况下（如：新增模块），往往想要查看当初都使用了那些参数进行的编译。这时候就可以利用以下方法查看。 1、nginx [root@361way ~]# /App/nginx/sbin/nginx -V nginx: nginx version: nginx/
unity中运用Resources.Load的方法？ brotherlamp unity视频 unity资料 unity自学 unity unity教程
问：unity中运用Resources.Load的方法？答：Resources.Load是unity本地动态加载资本所用的方法,也即是你想动态加载的时分才用到它,比方枪弹,特效,某些实时替换的图像什么的,主张此文件夹不要放太多东西,在打包的时分,它会独自把里边的一切东西都会集打包到一同,不论里边有没有你用的东西,所以大多数资本应该是自个建文件放置 1、unity实时替换的物体即是依据环境条件
线段树-入门 bylijinnan java 算法线段树
/** * 线段树入门 * 问题：已知线段[2,5] [4,6] [0,7]；求点2,4,7分别出现了多少次 * 以下代码建立的线段树用链表来保存，且树的叶子结点类似[i,i] * * 参考链接：http://hi.baidu.com/semluhiigubbqvq/item/be736a33a8864789f4e4ad18 * @author lijinna
全选与反选 chicony 全选
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <html> <head> <title>全选与反选</title>
vim一些简单记录 chenchao051 vim
mac在/usr/share/vim/vimrc linux在/etc/vimrc 1、问：后退键不能删除数据，不能往后退怎么办？答：在vimrc中加入set backspace=2 2、问：如何控制tab键的缩进？答：在vimrc中加入set tabstop=4 (任何
Sublime Text 快捷键 daizj 快捷键 sublime
[size=large][/size]Sublime Text快捷键：Ctrl+Shift+P：打开命令面板Ctrl+P：搜索项目中的文件Ctrl+G：跳转到第几行Ctrl+W：关闭当前打开文件Ctrl+Shift+W：关闭所有打开文件Ctrl+Shift+V：粘贴并格式化Ctrl+D：选择单词，重复可增加选择下一个相同的单词Ctrl+L：选择行，重复可依次增加选择下一行Ctrl+Shift+L：
php 引用(&)详解 dcj3sjt126com PHP
在PHP 中引用的意思是：不同的名字访问同一个变量内容. 与Ｃ语言中的指针是有差别的．Ｃ语言中的指针里面存储的是变量的内容在内存中存放的地址变量的引用 PHP 的引用允许你用两个变量来指向同一个内容复制代码代码如下: <? $a="ABC"; $b =&$a; echo
SVN中trunk,branches,tags用法详解 dcj3sjt126com SVN
Subversion有一个很标准的目录结构，是这样的。比如项目是proj，svn地址为svn://proj/，那么标准的svn布局是svn://proj/|+-trunk+-branches+-tags这是一个标准的布局，trunk为主开发目录，branches为分支开发目录，tags为tag存档目录（不允许修改）。但是具体这几个目录应该如何使用，svn并没有明确的规范，更多的还是用户自己的习惯。
对软件设计的思考 e200702084 设计模式数据结构算法 ssh 活动
软件设计的宏观与微观软件开发是一种高智商的开发活动。一个优秀的软件设计人员不仅要从宏观上把握软件之间的开发，也要从微观上把握软件之间的开发。宏观上，可以应用面向对象设计，采用流行的SSH架构，采用web层，业务逻辑层，持久层分层架构。采用设计模式提供系统的健壮性和可维护性。微观上，对于一个类，甚至方法的调用，从计算机的角度模拟程序的运行情况。了解内存分配，参数传
同步、异步、阻塞、非阻塞 geeksun 非阻塞
同步、异步、阻塞、非阻塞这几个概念有时有点混淆，在此文试图解释一下。同步：发出方法调用后，当没有返回结果，当前线程会一直在等待（阻塞）状态。场景：打电话，营业厅窗口办业务、B/S架构的http请求-响应模式。异步：方法调用后不立即返回结果，调用结果通过状态、通知或回调通知方法调用者或接收者。异步方法调用后，当前线程不会阻塞，会继续执行其他任务。实现：
Reverse SSH Tunnel 反向打洞實錄 hongtoushizi ssh
實際的操作步驟： # 首先，在客戶那理的機器下指令連回我們自己的 Server，並設定自己 Server 上的 12345 port 會對應到幾器上的 SSH port ssh -NfR 12345:localhost:22 [email protected] # 然後在 myhost 的機器上連自己的 12345 port，就可以連回在客戶那的機器 ssh localhost -p 1
Hibernate中的缓存 Josh_Persistence 一级缓存 Hiberante缓存查询缓存二级缓存
Hibernate中的缓存一、Hiberante中常见的三大缓存：一级缓存，二级缓存和查询缓存。 Hibernate中提供了两级Cache，第一级别的缓存是Session级别的缓存，它是属于事务范围的缓存。这一级别的缓存是由hibernate管理的，一般情况下无需进行干预；第二级别的缓存是SessionFactory级别的缓存，它是属于进程范围或群集范围的缓存。这一级别的缓存
对象关系行为模式之延迟加载 home198979 PHP 架构延迟加载
形象化设计模式实战 HELLO!架构一、概念 Lazy Load：一个对象，它虽然不包含所需要的所有数据，但是知道怎么获取这些数据。延迟加载貌似很简单，就是在数据需要时再从数据库获取，减少数据库的消耗。但这其中还是有不少技巧的。二、实现延迟加载实现Lazy Load主要有四种方法：延迟初始化、虚
xml 验证 pengfeicao521 xml xml解析
有些字符，xml不能识别，用jdom或者dom4j解析的时候就报错 public static void testPattern() { // 含有非法字符的串 String str = "Jamey친Ñ&#1282
div设置半透明效果 spjich css 半透明
为div设置如下样式： div{filter:alpha(Opacity=80);-moz-opacity:0.5;opacity: 0.5;} 说明： 1、filter：对win IE设置半透明滤镜效果，filter:alpha(Opacity=80)代表该对象80%半透明，火狐浏览器不认2、-moz-opaci
你真的了解单例模式么？ w574240966 java 单例设计模式 jvm
单例模式，很多初学者认为单例模式很简单，并且认为自己已经掌握了这种设计模式。但事实上，你真的了解单例模式了么。一，单例模式的5中写法。（回字的四种写法，哈哈。） 1，懒汉式（1）线程不安全的懒汉式 public cla