均匀试验设计
唐启义
浙江大学农业与生物技术学院
均匀设计是中国统计学家方开泰教授和中科院院士王元首创,是处理多因素多水平试验设计的首选方法,可用较少的试验次数,完成复杂的科研课题和新产品的研究和开发。
均匀设计将试验点在高维空间内充分均匀分散,使数据具有更好的代表性,为揭示规律创造必要条件。变量和水平数少于4时,试验设计用户易于选择,适用的方法较多,如正交试验设计、回归正交试验设计、旋转设计、D-最优设计等,试验次数通常是十几个,用户能够接受。但当描述复杂自然现象和探讨复杂的规律,实验因素和水平在5个以上时,用上述方法试验次数会剧增,使得用户难于接受,用户只好简化条件或是取消试验考察。
均匀设计的最大特点是,试验次数可以等于最大水平数,而不是实验因子数平方的关系,试验次数仅与需要考察的x个数有关。但一般来说,试验次数选为实验因子个数的3倍左右为宜,有利于建模和优化。
目前,对于一般等水平均匀设计问题,方开泰的有关均匀设计的几部著作,特别是为均匀设计开辟的网页www.math.hkbu.edu.hk/UniformDesign可以得到大量的均匀设计表格。在该网页上,其均匀设
计表是以中心化偏差作为均匀性度量指标,且精度较高,一般应用,如处理数量不大时可以使用该表。
当各个因素的水平不等时,一般是利用数量有限的混合水平均匀设计表,如方开泰教授的专著“均匀设计与均匀设计表”(科学出版社1994年出版)一书附录二;或采用拟水平方法将一般的均匀设计表变换为各个因素水平数不等的混合水平表。这种利用现成的混合水平均匀设计表进行试验,很多情况下都需要我们的设计方案“削足适履”,以符合表格的要求;而利用拟水平法来构造混合水平的均匀设计表,当因素比较多时,如何构造使得生成的混合水平均匀设计表的偏差更小,即更均匀又很难解决。
在DPS数据处理系统中,作者提出了一种新的定向优化算法,初步解决了一般均匀设计表和混合水平均匀设计表的构造问题。运用该方法可以求得设计矩阵优良性能较好,偏差也比较小的均匀试验设计方案。特别适用于构造试验因子和处理(水平)数较大的情形及混合水平的均匀试验设计需求,因为目前几乎所有的现成的均匀设计方案的因子数在30以下,处理(水平)数在31以下。下面介绍该方法的使用技术。同时,在DPS系统中,还提供了对现有的均匀设计进行优化的功能,以及混料均匀设计方案计算的功能等。
一、均匀设计表的构造与性能估计
1、一般均匀设计
在DPS系统中进行一般均匀试验设计非常方便,只需在菜单方式下点击“试验设计”→“均匀设计”→“均匀试验设计”,然后系统出现如下用户界面(图1)。
图1 一般均匀设计参数输入用户界面
在该用户对话框中,输入待设计的因子数、每个因子的水平(处理)数,及控制DPS 系统随机优化过程的最大迭代次数和寻优运行时间(分钟)。然后点击“确认”按钮后即可运行。这里的试验因子为3个,每个因子取7个水平,并控制DPS优化操作的运行次数为1000次,寻优时间在5分钟以内。
因该系统采用随机优化方法,一般需要多运行几次,从中挑选一个较好的结果。例如我们这里运行几次后可能会得到如下3个结果(表1)。
表1 几个均匀设计方案及均匀设计性能参数
均匀性能参数中心化偏差CD= 0.11937
修正偏差MD= 0.13889
对称化偏差SD= 0.49293
可卷偏差WD= 0.19120
条件数C= 1.2308
D-优良性=0.00005
A-优良性=0.1081
中心化偏差CD=0.11937
修正偏差MD= 0.13857
对称化偏差SD=0.50059
可卷偏差WD= 0.18833
条件数C= 1.6286
D-优良性=0.00005
A-优良性=0.11165
中心化偏差CD= 0.12023
修正偏差MD= 0.13959
对称化偏差SD=0.50031
可卷偏差WD= 0.18455
条件数C= 1.1736
D-优良性=0.00005
A-优良性=0.10760
因子x1 x2 x3 x1 x2 x3 x1 x2 x3
N1 1 4 3 7 4 3 4 5 1
N2 4 5 7 1 5 4 7 6 3
N3 5 1 2 6 1 5 2 2 2
N4 3 6 1 2 2 2 1 4 6
N5 2 2 6 4 3 7 5 1 4
N6 7 3 4 5 6 1 3 7 5
N7 6 7 5 3 7 6 6 3 7
这些结果,前面有7个衡量均匀设计方案性能的指标,其中前4个是均匀设计表的均匀性度量指标,后面3个是均匀设计表作为试验设计矩阵,其信息矩阵X’X优良性指标。所有这些指标都是数值越小,试验方案越好。在具体应用时,可以根据试验要求和试验者的偏好,对各个指标综合考虑,选择一个较好的试验方案进行试验。
例如在上面的3个均匀设计表中,如以中心化偏差作为衡量均匀设计表的指标来考虑,可取左边的均匀
设计表进行试验,尽管左边的试验方案和中间的试验方案中心化偏差相等,但条件数要小些。如以可卷偏差或条件数作为指标来取舍,那么可取右边的均匀设计表作为试验方案。
2、混合水平均匀试验设计
在科学研究及产品开发实际工作中,大量的试验设计是各个因素的水平数不相等的情
况。当试验中各个因子的水平数不相等时,需要应用混合水平均匀设计方法构造混合水平的均匀设计表。比起等水平均匀设计来,其均匀设计表的构造要复杂些。在DPS系统中构造混合水平的均匀设计表,先须在DPS的电子表格里输入、定义有关参数(图2)。如设计一个U12(12×6×4×32)的混合水平均匀设计表,须先在DPS电子表格里以如下方式输入、定义混合水平均匀设计表的参数。
项目因子数水平数
1因素12水平 1 12
1因素6水平 1 6
1因素4水平 1 4
2因素3水平 2 3
图2 含混合水平的均匀设计参数定义
然后在DPS系统菜单方式下点击“试验设计”→“均匀设计”→“混合水平均匀设计”,然后系统出现如下用户界面(图3)。
图3 含混合水平均匀设计参数输入用户界面
在该用户对话框中,输入试验处理次数,及要求DPS随机优化运行时间的限制(分钟)后点击“确认”按钮后即可运行。这里的试验次数为12次(注意这里的试验次数应该是各个水平数的最小公倍数的倍数),优化操作最大迭代次数为1000次,时间控制在5分钟以内。
因该系统采用随机优化方法,一般需要多运行几次,从中挑选一个较好的结果。例如我们这里运行几次后可能会得到如下结果:
计算结果当前日期03-3-3 16:44:05
以中心化偏差CD为指标的优化结果。
运行时间0分8秒.
中心化偏差CD= 0.21836
L2 - 偏差D= 0.03501
修正偏差MD= 0.32657
对称化偏差SD= 1.08832
可卷偏差WD= 0.45494
条件数C= 1.3259
D-优良性=0.00000
A-优良性=0.35414
均匀设计方案
因子x1 x2 x3 x4 x5
N1 9 2 3 1 2
N2 5 1 2 1 1
N3 4 2 1 3 2
N4 1 3 2 2 3
N5 12 5 2 3 2
N6 6 6 3 2 3
N7 2 4 3 3 1
N8 11 3 4 2 1
网页界面设计的定义N9 3 5 4 1 2
N10 10 4 1 1 3
N11 8 1 4 3 3
N12 7 6 1 2 1
这里的各个试验是随机排列的,因此可根据该结果直接安排试验。
如果按照传统做法,从已有的混合水平均匀设计表U12(12×6×4×32×22)的前5列安排试验,这时该试验设计表的有关均匀性和设计矩阵优良性的参数计算结果为:中心化偏差CD=0.24781,修正偏差MD=0.36512,对称化偏差SD=1.24889,可卷偏差WD=0.47001,条件数C=13.8707,A-优良性=0.78286。各项指标都比直接生成的要大。
3、U n(q s)类型均匀试验设计
当试验中各个因子的水平数相等时,但试验次数是水平数的倍数时,可借助于构造混合水平的均匀设计功能构造U n(q s)类型均匀设计表。这时也须在DPS的电子表格里输入、定义有关参数。如设计一个U12(43)型均匀设计表,须先在DPS电子表格里以如下方式输入、定义混合水平均匀设计表的参数(图4)。
项目因子数水平数
3因素4水平 3 4
图4 U n(q s)类型均匀设计参数定义
然后在DPS系统菜单方式下点击“试验设计”→“均匀设计”→“混合水平均匀设计”,然后系统出现如下用户界面(图5)。
图5 U n(q s)类型均匀设计参数输入用户界面
在该用户对话框中,输入试验处理次数,及控制随机优化运行时间(分钟)后点击“确认”按钮后即可运行。这里的试验次数为12次(注意这里的试验次数应该是水平数的倍数),控制运行迭代次数为1000次,寻优时间最大为5分钟。
因该系统采用随机优化方法,一般需要多运行几次,从中挑选一个较好的结果。例如我们这里运行几次后可能会得到如下结果:
计算结果当前日期03-3-3 16:49:12
以中心化偏差CD为指标的优化结果。
运行时间0分18秒.
中心化偏差CD= 0.14475
L2 - 偏差D= 0.05400
修正偏差MD= 0.17570
对称化偏差SD= 0.42589
可卷偏差WD= 0.24886
条件数C= 1.0000
D-优良性= 0.00030
A-优良性= 0.20000
均匀设计方案
因子x1 x2 x3
N1 1 1 4
N2 1 4 2
N3 3 3 2
N4 2 3 3
N5 1 2 1
N6 3 2 3
N7 3 1 1
N8 4 1 3
N9 4 4 1
N10 2 2 2
N11 2 4 4
N12 4 3 4
4、大样本容量均匀设计
上面提供的均匀设计,只适用于解决指标(变量)个数50个、处理(或水平)数255个以内的试验设计问题。这虽然对一般的科研、及新产品开发已足够了。但有时需要构造指标或处理数更多的均匀设计方案。例如方开泰(2001)描述了一个例子,即某企业家想开发一个新产品,投资前需要作市场调查,在调查时,下面这些因素(或层)需要考虑:x1,性别:男、女;
x2,教育程度:小学、中学、大学;
x3,采购时间:周日白天、周日晚上、周末、节假日;
x4,地区:分成12个地区;
x5,年龄:分成4个年龄段y1, y2, y3, y4。
为使抽样结论可靠,这些因素在抽样对象中的均衡应与实际相符,例如:
已知抽样对象的各个性别比是2:3;各个教育程度比例为1:3:4;各个采购时间的比例是4:3:3:2;12个地区同等对待;成年人在4个年龄段中的比例分别是4:3:3:2,这样,如希望在调查时,我们的调查对象也符合这样的比例,可以将这些因素转化为多个水平的因子。例如可以将年龄这个指标视为y11, y12, y13, y14, y21, y22, y23, y31, y32, y33, y41, y42,共12个水平。同理,可将性别视为5个水平,教育程度视为9个水平,采购时间视为12个水平;12个地区为12个水平。现要调查1000个对象。在DPS中,可以先定义各个因素的水平(图6)。
项目因子数水平数
性别因素5水平 1 5
教育程度因素8水平 1 8
采购时间、年龄及地区因素12水平 3 12
图6 大样本混合水平的均匀设计参数定义
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论