DESeq双因素交互项

DESeq

DESeq这款软件是怎样将基因表达谱与设计矩阵联系起来的呢?是通过广义线性模型建立的



那么,Y表示不同因素影响下的基因表达谱,Xn即为设计矩阵的不同因素,一般2-3个因素较多

线性模型里的交互项

那么,我们先介绍下线性模型的交互项
我选了个知乎的例子:https://www.zhihu.com/question/21152574

如果我们想研究性别与学历对收入的影响,相应建立线性模型“
Y = β0 + β1•A +β2•X+β3•A•X+ ε
其中A表示性别,男性为0,女性为1;由于这是分类变量,通常用0,1 区分
X表示学历,Y表示收入
并且考虑性别与学历之间可能存在某种关系,因此引入交互项

那么,我们单独看学历是如何和影响收入的,我们即会得到两条直线方程,



很显然,对于橙色直线:

Y = β0 + β2•X + ε

对于紫色直线:

Y = β0 + β1•A + β2•X + β3•A•X + ε

所以对于女性,学历影响的变化率为:β2+β3•A
对于男性,学历影响的变化率为:β2
那么交互项刻画了什么呢?刻画的是一个人的学历对工资的影响是否受性别的影响,显然男女有别,固然是受性别影响的;反过来计算可以刻画一个人的性别对工资的影响是否受学历的影响

再举个例子
假设模型(不含交互项):

x1,x2为两个影响因素
ε 为随机扰动

那么当我们只研究影响因素 x1 的效应时(x2也一样)
我们对 x1 求偏导:



显然 β1 是个常量

如果考虑交互项:



同样,我们只研究影响因素 x1 的效应时(x2也一样)
我们对 x1 求偏导:



我们可以把x1,x2看成多元函数的两个坐标轴;x1方向可以看成固定x2,x1对y的贡献,x2方向可以看成固定x1,x2对y的贡献。

若无交互项,那么固定x1,研究x2的变化,那么x1这一项对y的变化是没贡献的,因为x1方向的变化率为β1,为常数,无论x2怎么变化,x1都对y的变化都是没贡献的;如果有交互项,那么固定x1,研究x2的变化,那么x1这一项对y的变化是有贡献的,因为x1方向的变化率为β1+β3•x2,x2对x1的影响体现在影响了x1方向的变化率,使得x1对y的变化有贡献,当x2改变了,那么,x1的变化率也改变了,从而使得x1有了贡献
无交互项:


有交互项,做一个恒等变形:


首先声明,无论是否含有交互项,线性模型都可以拆成 m•x1+ n•x2 形式,m,n为系数,x1所在的项代表x1的贡献;x2所在的项代表x2的贡献

引入交互项以后,从数学上来说,固定x1,而仅仅改变x2,使得x1的变化率发生改变,再使y发生改变,等效于将x1的系数看成常量(β1+β3*x2此时视为常量),x2发生改变,带动x1发生了改变,再使y发生改变

事实上,x1的变化率受到x2的影响,也就是说x2通过影响x1的变化率来影响结果,即x2影响x1进而再影响y的结果

差异表达的交互项

对于DESeq的线性模型引入交互项也是同样的道理
geneExpression = genotype + condition + genotype:condition
基因的表达量受基因型和处理条件的影响,并且考虑处理条件和基因型的交互作用,即处理条件对基因表达量的影响是否受基因型影响,不同的基因型,在不同处理下得到的差异不同

那么在DESeq里面引入交互项,其目的是为了检验某个因素对基因表达量的影响是否也受另一个因素的影响


我们注意到,引入交互项后,不管是不是交互项,所比较的都是与对照比较(比方说condition_A/ genotypeI),这里的对照是默认的,也可以人为设置
交互项例如genotypeII.conditionB,FC = [(genotypeII in conditionB) / (genotypeII in conditionA)] / [(genotypeI in conditionB ) / (genotypeI in conditionA)]
例如genotypeIII.conditionB,FC = [(genotypeIII in conditionB) / (genotypeIII in conditionA)] / [(genotypeI in conditionB ) / (genotypeI in conditionA)]
其实比较的是condition这个因素分别对genotypeII(genotypeIII)和genotypeI 的影响有何差异

参考:
http://www.360doc.com/content/19/0303/08/39103730_818734253.shtml

你可能感兴趣的:(DESeq双因素交互项)