你的位置:亚洲国际娱乐平台 > 新闻动态 >
DOE详细学习手册
发布日期:2025-04-12 20:57    点击次数:81

图片

主讲人介绍

图片

图|fznm

为啥要学DOE?几年前在一家人药企业做药品研发,做工艺研究时发现新药申报资料要求做工艺考察的时候要用到实验设计(DOE),那时候没接触过DOE以为就做个正交实验就可以了。

随着知识面的拓宽,经常听领导和同事说DOE,感觉很高大上。偶尔实验中领导也会提出做个多因素考察实验,发现自己还是只会使用正交小助手做最简单的正交实验,感觉很LOW,于是在2024年制定了个目标,一定要学会DOE。很幸运报名参加了星辰君的疯狂DOE,虽然花了499大洋,但是感觉很值。张老师讲的很细,从原理到实操,很实用,强烈推荐感兴趣的同学去听听,物超所值。话不多说,下面我给大家分享下我的学习心得。

非常详细,建议点赞收藏

DOE是啥?

DOE全称Design of experiment,中文名称:实验设计。首先我们来看看什么是实验?实验就是通过对某一过程或系统的可输入变量做一些有目的改变,来观测和识别输出响应中变化的缘由(图1)。

图片

图1 实验的定义

实验设计就是研究正确的设计实验计划和分析实验数据的理论和方法,目的是通过对实验进行合理安排,以较少的实验次数,较短的实验周期获得理想的实验结果和正确的结论。看到这一大堆词,我和大家的反应一样,晕。

学完DOE后,我觉得可以用个生活中简单的例子来解释下。我们要做一顿色香味俱全的大盘鸡,这就好比做一个实验,这里面大盘鸡的色、香、味就是响应,因子变量就是我们加入盐、糖、老抽、土豆、鸡肉的量,还有炖鸡的时间和温度。因子水平就是我们具体加入盐等佐料的量(低中高的水平)。实验设计就是做一个炒好大盘鸡的计划,在炒的过程通过调整变量(盐、糖、老抽。。。。),观察和测试大盘鸡的色香味,过程中我们一次可以考察多个变量,这样我们就能在最短的时间内研究出做好大盘鸡的秘诀,这样是不是感觉明白多了。

图片

图2 色香味俱全的大盘鸡

DOE发展历史

在没有DOE之前,大家都是怎么做实验研究的。有用试错法的,也有用单因素实验,这些做法效率低,且很大程度上要碰运气。直到1920年,英国的Ronald A.Fisher 爵士提出析因实验法、方差分析、P值的原理,正式开启DOE的时代。Geroge BOX在析因设计的基础上又提出响应曲面设计,随着近代工业革命,尤其是信息技术的发展,又发展出稳健参数设计、混料设计等,这些都属于DOE,正在帮助我们解决不同领域中的各种问题。

图片

图片

图3 DOE的发展史

DOE的优势

使用DOE有哪些好处呢?举个例子:我们在做一个离子交换层析,发现pH和电导可能影响收率,于是安排实验进行考察,如果按照单因素的方法考察,那就是固定pH(7.5)考察电导(5-25mS/cm)对收率的影响,或者固定电导考察pH,这样下来要做9次实验(见表1),测定收率发现才77%,没达到我们预期的收率。怀疑可能是不是pH和电导的点选的不合适、不够,于是增加pH和电考察的点(表2),做了25次实验终于找到收率理想的点。看着实验的次数感觉是不是很吓人,25次层析!有没有更简单的办法呢?

表1 pH、电导对收率的影响(9次实验)

图片

表2 pH、电导对收率的影响(25次实验)

图片

来看看DOE是怎么做的:其实这就是一个2因素2水平的实验,加上中心点,最多只需要做7次实验(图4),我们就能找到理想收率的区间,我们可以利用软件预测获得收率最大值时的pH和电导(图5)。是不是瞬间感觉DOE好香啊!

图片

图4 两因素两水平DOE实验

图片

图5 DOE实验结果

DOE的术语和流程

了解了DOE的优势后,是不是迫切想知道该怎么做DOE呢?不着急,我给大家慢慢道来。因为DOE设计很多统计学的知识和原理,这些内容又并非一两句就能说的清楚,我这里就只讲具体怎么做,关于原理大家可以去星辰君的课程上学习。我这里主要使用Minitab软件的DOE工具。讲设计之前先讲几个基本概念:

响应:也称指标、质量特性,是在实验设计中可以测量的系统输出,一般以Y表示,可以是定量(如收率、纯度),也可以是定性(如质量低中高)。可以理解成大盘鸡的色香味。

因子:对响应有影响的那些变量,是因变量,常用X表示,有定量因子(温度、pH、电导),定性因子(缓冲液种类)。做大盘鸡过程中加入的盐、油、加热时间等。

水平:研究因子的不同层面,水平数至少取2,高水平﹢1,低水平-1。3个水平以1、2、3表示。大盘鸡中盐的加量(10g、20g、30g)

效应:一个因素对输出响应值的影响(图6),加盐多少对大盘鸡口味的影响。

图片

图6、A、B、C因子对收率的效应

交互作用:两种或以上的因素对输出响应值的影响,因子之间可能存在交互作用,也可能无交互作用,或者相反作用(图7)。

图片

图7 因子间交互作用

DOE的流程一般包括三大模块、9大步骤(如图8)。

图片

图8 DOE的流程

图5 DOE实验结果

DOE的内容和用途

根据DOE的用途大致可以分为4部分:

首先是因子筛选研究,就说从众多因子中筛选出对我们实验或工艺影响最显著、最关键的因子。通常有三种方法:①、Plackett Burman 设计,一般可筛选因子数>8个;②、部分析因设计,一般可筛选4-8个因子;③、完全因子设计,一般可筛选2-4个因子。

第二就是回归研究,在搞清楚哪些因子是影响我们实验或工艺的关键因子之后,我们又想进一步搞清楚这些因子对我们的目标(响应)有啥影响,多大影响?这些因子在什么水平时能达到我们预期的目标,这就需要建立模型做回归研究。对于可以拟合线性模型的就使用完全析因设计,非线性的模型就使用响应曲面设计。

第三,稳健性研究,包含工艺稳健性和稳健性参数研究,工艺稳健性研究是指工艺在受到物料波动、工艺设备改变而造成的波动时,我们可以将物料和设备作为因子,进行部分析因或完全析因分析,如果物料或设备不是影响工艺的显著因子,工艺稳健性较好。如果显著影响,说明工艺不稳建,需要提高工艺稳健性。如何提高?需要做工艺稳健参数研究,通过选择可控因子水平面和组合来减少一个系统或者过程对噪音变化的敏感性,从而达到减少系统波动的目的。

第四,混料研究,对于需要研究一些配方配比问题,比如培养基配方,一般由多种成分按照相应的比率制作而成,混料中所有成分或者分量之后总是为1,这种类型实验设计称为混料设计。

图片

图9 DOE的内容

这里主要介绍使用较多的完全析因设计,以张老师讲的案例讲解做完全析因设计的全过程,我讲的是最基本的完全析因设计,关于一些特殊案例:比如带有区组、不含中心点的、包含离散变量的完全析因设计,还有关于部分析因设计、响应曲面设计,推荐大家到张老师的疯狂DOE上去学习。

完全析因设计基础理论

什么是完全析因设计?就是包含所有实验组合的设计,可估计主效应、各阶交互效应。这里主要给大家讲2K加中心点的完全析因设计,K代表K个因子,2代表2个水平,也可以做3个水平,因为高低两个水平加中心点足以解决实际问题,一般都采用这种设计。2K加中心点的完全析因设计的实验次数为2K+3(如图9)。24的完全析因设计中的主效应、各阶交互效应如图10,一般高阶交互效应无实际物理意义,所以一般3阶及3阶以上交互效应可忽略不做分析。

图片

图10 2K加中心点的完全析因设计的实验次数

图片

图 11 24的完全析因设计中的效应

图片

案例分析:

我们正在开发一个阴离子交换层析的流传模式纯化某单抗产品,前期实验发现pH、电导率和上样载量对该工艺有影响,为确定上述因子对回收率的影响是否具有显著性,同时尝试是否可获取最优回收率的取值范围。

下面我按照DOE的流程来设计分析:

1. 实验设计准备

图片

打开Minitab软件:选择“统计→DOE→因子→创建因子设计:

图片

弹出创建因子对话框,按下图设置,点击确定。

图片

得到一个工作表,包含所有因子水平组合,实验标准序、运行序及相关的信息。

图片

可以显示的设计进行设置,比如说可以让工作表中的顺序按设计的标准顺序排列,具体设置方法:DOE→显示设计→选择设计的标准顺序。

图片

如果觉得运行序的分布不够随机,也可以进行随机化设计。点击DOE→修改设计→随机化设计。

2. 实验设计执行

按运行序执行实验,注意要随机。此外选择测定响应的分析方法的准确性、精密度、稳定性要好。分析方法的误差会带入到实验设计整个的系统误差中,交差的分析方法会高估或低估工艺参数的效应显著性。一般工艺的误差与分析方法误差>20可接受,<2不可接受,2-20之间可根据自己对实验的要求决定。

图片

dfv

具体方法举个例子:某层析工艺纯化步骤收率分析

完全重复的三次层析纯化实验,分别检测收率为:0.86、0.89、0.94(均值:0.897)

进行一次纯化实验,样品收率重复检测:0.91、0.91、0.93(均值:0.917)

δ设计2=(0.86-0.897)2+(0.89-0.897)2+(0.94-0.897)2=3.294E-3

δ分析2=(0.91-0.917)2+(0.91-0.917)2+(0.93-0.917)2=2.67E-4

δ工艺2=δ设计2-δ分析2=3.027E-3

δ工艺2/δ分析2=11.34(介于2-20之间)

实验结束,收集、记录、手动在Minitab中输入数据(Yield和SEC)。

图片

3 分析与验证

实验设计的分析验证按以下流程进行。

图片

(1)浏览数据、发现异常数据

采用“散点图”分析数据,Minitab:图形→散点图→包含链接组合。弹出对话框中Y变量选择Yield和SEC,X变量选择运行序(Runder),分组类别变量放入中心点,点击确定。就可以看到Yield和SEC分别与运行序及中心点作图。观察相应Yield和SEC有没有连续的上升或下降趋势,如有说明有其它因素影响实验。此外,三个中心点的数据显示了实验重复的稳定性,若相差较大,甚至超过实验设计的最高和最低的差值,说明实验过程有问题,需要检查是不是数据录入错误或重新做实验。

图片

(2)拟合全模型

全模型是指包含因子全部主效应和全部二阶交互效应项的模型,三阶及三阶以上交互效应忽略不计。

在Minitab中选择统计→DOE→因子→分析因子设计,弹出分析因子设计对话框,按下图设置:

图片

Minitab会话框自动显示:方差分析、模型汇总等信息

图片

如何看方差分析表?

①、看方差分析表中模型是否显著,P值<0.05,模型显著有效。P值>0.05,模型无效,原因:实验随机误差太大、实验中漏掉重要因子、模型本身的问题(出现失拟或者弯曲)。

②、看方差分析表失拟是否显著,P值<0.05,模型有失拟现象;P值>0.05,无失拟现象。失拟项代表的是模型中的缺失项,比如我们建立全模型的时候,默认三阶以上交互效应项忽略不计,那这个忽略不计的三阶交互效应项即为失拟项。同样,后续我们在简化模型时,将不显著的项移除模型,那么这些移除的不显著项也会进入失拟项中。

③、看方差分析表弯曲是否显著,在包含中心点的实验设计中才能进行弯曲检验,P值<0.05,模型有弯曲现象;P值>0.05,无弯曲现象。

如何看模型汇总?

图片

①、s值的分析

s值越小说明模型越好。后续简化模型时,比较两个模型的优劣,最关键的指标就是s值,哪个模型能够使之达到最小,哪个模型就是最好的。 

②、系数R-sq

R-sq代表的是模型所能解释的响应的数据波动占响应的总数据波动的比例。当然,这个数值越接近于1越好,本案例中R-sq为98.04%。

③、系数R-sq(调整)

利用R-sq与R-sq(调整)的接近程度来判定模型的优劣,两者之差越小说明模型越好。

④、预测的R-sq

R-sq(预测)要比R-sq小一些,本案例中的R-sq(预测)为94.62%。如果小的不多,则说明数据中的特殊地位的点不多,将来用回归方程做预测时也比较可信。 

如何看效应的显著性?

P值<0.05,则代表该项的效应是显著的,反之,则代表该项的效应不显著。这个模型中显著的是pH、电导、载量。

如何看帕里托效应图?

图片

此图中显著水平为0.05,T值为2.78,超过T值为显著项(pH、电导、载量)。

(3)简化模型

根据第二步分析的结果,如果模型中不存在不显著的项,同时模型的总效果显著,不存在失拟和弯曲,模型汇总表中的各项(s值,R-sq,R-sq(调整)和R-sq(预测))都合适,那么该全模型可以直接越过第三步,进入第四步的“残差分析”步骤。

如果全模型中还存在效应不显著的项,则可以尝试去掉该项以简化模型。简化模型的原则是先依次去掉P值最大的交互效应项,然后在尝试去除不显著的主效应项,但是,如果交互效应项包含某主效应项,即使主效应项不显著,则也不能去掉。

需要注意的是:每次去掉一个不显著的效应项,其余效应项的F检验和t检验的p值就会发生变化,同时模型汇总表中的各项(s值,R-sq,R-sq(调整)和R-sq(预测))也会发生变化,我们需要根据这种变化来判定简化后的模型是否更优,从而来决定要选择哪一个模型。

简化模型也可以利用Minitab的逐步功能自动简化。

图片

模型简化后方差分析如下:

图片

图片

模型简化前后对比如下:

统计比较结果

全模型

简化后模型

模型总效果

P<0.05

P<0.05

失拟

P>0.05

P>0.05

弯曲

P>0.05

P>0.05

S值

0.0243358

0.0209850

R-sq

98.04%

97.81%

R-sq(调整)

95.10%

96.35%

R-sq(预测)

94.62%

95.90%

判断模型优劣的标准:(1)模型总效果显著,失拟弯曲不显著;(2)S值要更小;(3)R-sq与R-sq(调整)更接近;(4)R-sq(预测)不要比R-sq小太多。结合选择标准可以看出简化后模型更优。

(4)残差分析

观测值与模型预测值之间的差异称为残差(Residual)。针对残差分析主要对四种进行分析:

①、 残差的正态概率图

图片

该图主要是检验残差是否服从正态分布。正常情况,正态概率图中残差应当大致呈一条直线分布。如果不能确认残差是否服从正态分布,可以直接对残差进行正态性检验,根据检验的P值来确定残差的正态性。

②、残差与拟合值图

图片

该图主要考察残差是否保持等方差性和是否缺少一些项。正常情况是残差应当随机的在水平轴(均值0)上下无规则的波动。如果方差不等,则会出现“喇叭口”或者“漏斗形”;如果模型缺少二次项,则会出现“U形”,暗示模型应当增加平方项了。如果图示不能明确的确定是否为“喇叭口”或者“漏斗形”,可以对残差进行正态性检验,根据检验的P值来进行判定。

如果出现“U形”,还容易解释,我们需要在模型中增补平方项,要么补加试验来进行响应曲面研究,或者直接进行响应曲面设计。如果出现“喇叭口”或者“漏斗形”,也就是方差不等的话,那么意味着响应变量需要进行某种变化,比如Box-Cox变换,模型才能进行更好的拟合。

③、 残差与运行序图

图片

该图重点考察残差是否相互独立,是否具有时间独立性。正常情况下,该图上残差各点应当在水平轴(均值0)上下无规则的波动。如果残差出现随时间的某种趋势变化,这意味着该实验过程中混入了某种系统性但是未知的干扰原因,需要对实验过程进行更加仔细的分析,找出原因。这种情况很不幸,常常需要重新设计实验,或者重新收集数据。

④、残差与变量图

图片

残差与各自变量作图,与残差对拟合值作图类似。正常的情况,残差应当在水平轴(均值0)上下无规则的波动。异常出现的情况也是“喇叭口”或者“漏斗形”,或者“U形”图,其中“U形”图会更加明显一些。出现的上述异常情况的处理方式与“残差对拟合值图”相同。

如果以上残差图出现“喇叭口”或者“漏斗形”,这意味着我们对原响应数据变量进行某种变换,还是可以直接再来拟合模型的,这时候就可以进入第五步,改进模型。如果以上残差图分析没有异常情况,则可以判定残差数据服从我们对于回归的基本假定,也就是回归方程的建立在残差分析上没有问题,那么就可以直接进入第六步,解释模型。

(5)改进模型

这一步主要针对残差图中出现“喇叭口”或者“漏斗形”的情况。出现系统性趋势或者U形的残差图,往往意味着实验设计可能需要重新进行或者补加实验点,而出现“喇叭口”或者“漏斗形”的残差图,则可以直接对响应变量进行某种变换来实现模型的更好的拟合。

在Minitab中选择“统计>DoE>因子>分析因子设计”,点击选项,在Box-Cox变换中,勾选“最优λ”,点击确定。软件会自动帮助选择一个最优的λ,来对响应变量进行yλ变换,然后以变换后的响应变量来重新拟合模型。

重新拟合的模型则需要从重新从第二步开始进行判断,所有的统计量,是否需要简化模型以及残差分析是否正常了。如果都合适了,进入第六步,以变换后的响应变量来进行模型的解释。如果模型没有找到最优的λ,那么有些不幸运,该实验还是存在某些未知的影响,大概率需要重新研究,重新设计。

(6)解释模型

经过简化模型和残差分析最终选定合适的模型,确定回归方程,可以利用Minitab的图形和信息解释模型。

①、输出各因子的主效应图和交互效应图

选择“统计>DoE>因子>因子图”,可以得到主效应图和交互效应图,由图可知pH和电导对收率呈负效应,载量呈正效应。pH和电导有交互作用,高电导时,pH变化对收率的变化影响显著。

图片

②、 输出等直线图或响应曲面图

选择“统计>DoE>因子>等值线图/曲线图”,从等值线图上可以确认,响应变量是如何受到所选中的因子的主效应和交互效应影响的,以及它们的变化规律如何。如果响应变量想获得最大,最小或者接近目标值,自变量应该如何变化。一般软件只能同时对两个变量分析,其余变量需要设定。

图片

③、预测

选择“统计>DoE>因子>预测”,我们可以在所研究的因子范围内,选择未做过实验的因子水平的组合,使用选定模型进行预测。软件会给出该点预测的点估计和区间估计。点估计就是回归方程的自变量取所给出的点的值时,响应变量的计算值。区间估计则是给出该计算值的95%置信区间范围。置信区间越窄,预测效果越好。

图片

图片

④、优化

选择“统计>DoE>因子>响应优化器”,对响应变量进行设置,包括望大,望小和望目设置,软件最终会在整个实验区域内求得响应变量的最优值。

图片

(7)目标判断

图片

总结

DOE是一个可以帮我们提高科研效率的工具,包含的内容较多,这里用一个案例结合DOE分析流程给大家介绍了最基本的完全析因设计。我个人的学习体会,不同的设计,原理不同,但分析的过程大同小异。对于初学的小白我们可以先掌握分析过程,把工具用起来,在使用的过程中去进一步搞清楚原理和背后的意义。

本篇学习笔记中引用了很多张老师在DOE课程中的原话和图片,在这里表示感谢,也把张老师的公众号分享给大家,感兴趣的同学可以去搜索学习。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报。

上一篇:没有了

下一篇:没有了

栏目分类
相关资讯