DOE中的区组:它是什么以及它有什么用

职业培训 培训职业 2024-12-28
DOE中的区组是一种类别变量,它是用来解释响应变量中不是由因子造成的变异的。1、区组的定义虽然每个测量值都应在一致的试验条件(而不是作为试验的一部分而改变的条件)下采集,但这并非总是可能的。在试验设计和分析中使用区组可以最小化因多余因子产生的偏倚和误差方差。例

DOE中的区组是一种类别变量,它是用来解释响应变量中不是由因子造成的变异的。

1、区组的定义

虽然每个测量值都应在一致的试验条件(而不是作为试验的一部分而改变的条件)下采集,但这并非总是可能的。在试验设计和分析中使用区组可以最小化因多余因子产生的偏倚和误差方差。

例如,您要检验新印刷机的质量。但是,印刷机的安排要花费数小时,而且每天只能进行四次。因为试验设计要求至少有八个游程,所以至少需要两天时间来检验印刷机。应当使用“天”作为区组变量来解释每天的任何条件差异。

为区别任何区组效应(每天的偶然差异)与由试验因子(温度、湿度和印刷机操作员)导致的效应,必须在试验设计中包括区组(天)。您应当在区组内随机化运行顺序。

2、在模型中是否包含区组

对于带区组的试验设计分析,经常会有这么一个疑问:模型中是否应该包含区组。对于这个问题请参考蓝皮书第二版504页(第三版539页)。

在试验设计中,一般都暗含假定了在试验的整个过程中,一切条件都是不变的,换言之,所有的试验都是在有计划的安排之下,试验中只受到完全随机的试验误差干扰,试验条件的变化是根据设定的因子的变化而给定的,试验材料性能保持不变,人员保持不变等,我们概括地称之为试验条件是“齐性”的。

但在实际工作中,时常会出现在随机干扰的同时,还有系统的干扰,例如材料并非由单个供应商提供,材质可能有不全相同的情况,不同的试验人员和试验工具等,即称为试验条件是“非齐性”的。

如果不考虑这种非齐性的情况,则会使试验误差增大,在进行ANOVA分析及因子响应分析时,由于分母(误差项)变大,而常常不能敏锐地发现已经有显著效应的因子或交互作用。如果我们能事先明确造成非齐性的原因(例如试验中必须使用两批材料,将其作为区组),将这项原因分离出来,即有:SS(误差)=SS(区组)+SS(剩余误差)。

这里把误差项分为“区组”部分和“剩余误差”两部分后,当有“区组”效应出现时,“剩余误差”部分将远小于原来的全部“误差”项。这时,对于总离差平方和的分解式写出示意关系是这样的。

未将区组列人模型:SST=SS(主效应项及交互效应项)+SS(误差),将区组列人模型: SST=SS(主效应项及交互效应项)+SS(区组)+SS(剩余误差),由于有这样的拆分,在进行ANOVA分析和各因子主效应(或交互效应)分析时,将大大减小分母的数值由SS(误差)换成SS,因而会敏锐地发现已经有显著效应的因子或交互作用,提高试验的精度。

有人会问:将全部试验安排在不同的区组内,实际上不也是将区组当成了一个因子了吗?是的,但它与普通的因子并不一样。虽然在试验安排或统计分析过程中,处理起来是都采用相同的按“因子”来处理,但一般来说,我们对研究因子的效应是感兴趣的,而对区组的效应是不感兴趣的。

区组是客观存在的不得不面对的试验条件的不同,我们不必也不能将区组取消掉而让全部试验定在齐性条件下进行。对于这种不得不考虑的因子,常常也称之为“讨厌因子”。在对于含区组的试验设计的处理中主要是要注意:在分析时,区组一定要当作因子来分析(这样分析才能准确、灵敏);在预报时,区组一定不要当作因子,在模型中应予以删除。

标签

版权声明:本文由哟品培原创或收集发布,如需转载请注明出处。

本文链接:http://www.yopinpei.com/20241228/2/970936

猜你喜欢
其他标签