三因子两水平doe_温故而知新 | DOE实验设计学习系列之(三):多因子DOE的魅力 (附视频)...

亲爱的小伙伴们,通过前两期的介绍,我们已经初步认识到了DOE的强大功能。但有的小伙伴可能会不以为然:因为在此前的两个案例中因子的数量太少(只有3个),而实际需要解决的问题中涉及的因子数量可能很多(比如6个以上)。

因此,部分小伙伴可能会得出一个结论:DOE只适合少数因子的问题分析,至于处理多因子问题时,就显得无能为力了。这个结论显然有失偏颇。其实DOE的一大特点就是可以处理包含高达50个(并不限于50个)因子的复杂问题,今天,我们就一起来探索一下多因子DOE的方法和应用!从理论上讲,上一期的DOE案例实质上采用的是完全析因设计(Full Factorial Design),这类方法在因子数量较少的时候实施起来比较方便。

但是正如表-1所示,当实验中的因子数量逐步增加时,实验次数将呈指数级增加,庞大的实验规模不仅意味着巨额的实验成本,也意味着实施DOE的可行性越来越小。表-1     完全析因设计的局限性肿么办?为了缓解这个矛盾,这个时候我们可以选择另一种经典的实验设计方法——筛选设计(Screen Design),即部分析因设计,来替代完全析因设计。网页地图百科应用更多关键词:什么是部分析因设计?什么是部分析因设计?的搜寻结果1个回答-提问时间:2017年5月5日

[最佳回答]顾名思义,部分析因设计源于完全析因设计,是与其对应的完全析因设计中的一部分。但究竟是哪一部分,是否可以随机选取?我们举一个简单的栗子来说明...JMPChina                  9999……999条好评如下所示,表-2显示的是一个完全析因设计的计划表。A、B和C表示三个因子,+1和-1表示因子的两个不同水平,AB、AC和BC表示二阶交互作用,ABC表示三阶交互作用,总共需要进行8次不同水平组合实验来完成1次完全析因设计的实验计划。表-2    3因子的完全析因设计计划表以上这个实验计划适用于3个或以下因子,可支持8次实验运行的DOE。

如果想增加第4个因子D,但依然只能支持8次实验运行时,这个时候我们该肿么办呢?

还是参考上面的表-2,可以看到,计划表有8行7列,任意两列间是相互正交的。我们希望增加一列来安排因子D,而且希望此列仍然能与前面各列保持正交。但数学上可以证明,“找出一个既与前7列不同,又与前3列正交的列”是不可能的。换句话说,D列必须与第4、5、6、7列中的某列完全相同。完全相同意味着这两列的效应会被“混杂”(Confounded),即获得计算所得的分析结果后,分不清两种效应各是多少。

权衡之下,我们认为取D=ABC是最好的安排,因为通常主因子作用与三阶交互作用混杂的可能性最小。

根据上述决策,将D列取值设定与ABC列相同,并将其前移至第4列,可以得到表-3所列的计划表。表-3    4因子的部分析因设计计划表聪明如你一定会猜到,还可以使用表-2继续构建出第5、第6乃至第7个因子,但实验的规模依然保留在8次。当然,同等规模的实验中所涉及的因子数量越多时,产生“混杂”的概率也会越大,后期分析结果的精确程度也会有所降低。这就是实验成本与分析精度这对矛盾的平衡,也是“部分析因设计”产生的基本原理。值得一提的是,在制定部分析因设计的具体方案时,不必如此繁琐地逐一推算,成熟的统计分析软件JMP早已能够自动地实现这一过程。除了经典的部分析因设计外,JMP研发人员还于2011年开创性地提出了一种新型实验设计方法——确定性筛选设计(Definitive Screening Design),它不仅能够在实验规模和因子筛选间取得良好的平衡,还兼具一些相对于传统析因设计的差异化优点。

其整体设计方案如表-4所示。表-4    因子数为偶数的确定性筛选设计方案示意“确定性筛选设计是一种小型设计,

它对每个连续因子取3水平,

同时也支持分类因子。

对于m个因子,

当m为偶数时,

标准实验次数为2m+1;

比如6因子的确定性筛选设计

的标准实验次数仅为13次。

当m为奇数时,

标准实验次数为2m+3。”确定性筛选设计

有何优势?对比传统的析因设计☑通过将各个连续因子设定在3水平,它可以识别所有强非线性效应因子,而无论是完全析因设计,还是部分析因设计,都无法做到这点;

☑它可以避免二阶(含)以下的任何效应之间的完全混杂,但在近似实验规模的部分析因设计中都会出现完全混杂;

☑进一步减少多因子筛选实验设计的高昂成本。现在,想必小伙伴们或多或少地对于传统的部分析因设计以及确定性筛选设计已经有所了解。

下面,是时候上主菜了!

我们通过一个虚拟案例,来说明确定性筛选设计在多因子DOE中的功效。场景某研发团队通过一种混合萃取剂来分离混合物,经过初步讨论,认为混合萃取剂中甲醇、乙醇、丙醇和丁醇的成分、萃取剂的PH值、以及萃取时间是最有可能影响标的物产量的关键因子,并计划通过DOE来对其进行量化识别。但是如果按照传统的完全析因设计思路,至少要做2的6次方=64次实验,时间和经济成本都无法接受,那有什么好办法来克服这个困难呢?显然,这个案例用确定性筛选设计的DOE来实现是再合适不过了。针对所关注响应变量和已知的6个潜在关键因子,通过JMP确定性筛选设计平台进行相关设定,获得相应实验设计计划表,进行实验,并记录萃取标的物产量结果,分别如图-1、图-2所示。图-1   设定确定性筛选设计的响应和因子图-2   确定性筛选设计计划表和实验结果接下来,JMP就可以帮助我们轻松地进行具体详尽的建模定量分析了,详细操作步骤可以点击最下方视频查看哦!

同时,小编也不想强调过多的统计概念,只借用JMP形象直观的图形化输出报表来说明分析结果。图-3   模型“预测值-实际值”图和效应汇总报表通过“逐步”建模,如图-3所示,我们获得了包含3个主效应、1个二阶效应和1个交互作用效应在内的模型,它们分别是:甲醇、乙醇、时间、甲醇×甲醇和乙醇×时间,即甲醇、乙醇和时间是影响标的物产量的关键因子。

图-4    关键因子交互作用图和预测刻画器图-4的关键因子交互作用图表明,乙醇×时间交互作用显著,而预测刻画器清晰地表明了甲醇对标的物产量存在非线性二阶效应。

这里需要特别强调的是,确定性筛选设计对所有二阶交互作用的识别不存在完全混杂的困扰,而假如在先验未知的情况下,我们选用2的(6-2)次方,6因子分辨率为IV的部分析因设计(共需16次实验),则会发现乙醇×时间和甲醇×pH存在完全混杂,即当其中任一者效应显著时,我们无法区分两者究竟谁在发挥作用,还需要额外实验来进一步区分。

此外,甲醇×甲醇的非线性二阶效应也不是部分析因设计所能一次识别的。图-5是对上述两点说明的图形化呈现。可见,这个13 次实验的确定性筛选设计不仅提供了比16次实验的部分析因设计更多的信息,还极大地避免了追加实验的必要,这既是确定性筛选设计的优势所在,也是JMP相对于其它统计分析软件在实验设计领域的一处优势体现。

图-5    部分析因设计效应别名表和两种实验设计方案下的因子效应相关性色图由此可见,在部分析因设计和确定性筛选设计等解决方案下,多因子DOE的时间成本和经济成本得以显著下降,而以筛选为主的实验目的却没有受到丝毫的影响,多因子DOE的魅力正在吸引更多的工程技术人员将其推广到更多的应用领域。3分钟小视频,学会确定性筛选设计以上就是我们“温故而知新DOE学习系列”

之第(三)篇;

感兴趣的小伙伴们,

可以下载JMP30天免费试用版亲自练习。

这其中的乐趣,只有当你真正

拥抱JMP时才能切身体验!

有关DOE更加深入的理论和应用,

我们会在今后的文章中

继续与大家探讨交流。

你可能感兴趣的:(三因子两水平doe)