圆域上的二元二次多项式回归模型的D-最优设计
D-Optimal Design for Duality Quadratic Polynomial Regression Models in Circle Region
DOI: 10.12677/AAM.2019.87143, PDF, HTML, XML, 下载: 1,016  浏览: 3,315 
作者: 孔庆海:东北大学理学院,辽宁 沈阳
关键词: 回归模型D-最优设计测度饱和设计最小二乘估计Regression Model D-Optimal Design Measure Saturation Design The Least Squares Estimates
摘要: 对圆域上的二元二次多项式回归模型在遵循设计点“对称 + 均匀”的前提下,给出并证明其特定的内接正方形的顶点和圆心组成的饱和设计是D-最优设计,并给出了相应设计的最小二乘估计,是把最优设计理论应用到多元多项式回归模型的又一有益的尝试。
Abstract: For duality quadratic polynomial regression models in circle region, D-op designs were given and proved according to the criterion “Symmetry + Uniform” with four vertexes of special square and central angle in Circle, and the least squares estimates were given, It is a very useful attempt to apply optimal design theory to polynomial regression models.
文章引用:孔庆海. 圆域上的二元二次多项式回归模型的D-最优设计[J]. 应用数学进展, 2019, 8(7): 1239-1242. https://doi.org/10.12677/AAM.2019.87143

1. 引言

在试验设计中,令R表示设计利益区域,X是区域R内任一点,回归模型一般形为

y = f T ( X ) β + ε

其中 f T ( X ) = ( f 1 ( X ) , f 2 ( X ) , , f p ( X ) ) 是由模型决定的函数向量,y是响应观测值,而 β T = ( β 1 , β 2 , , β p ) 是模型中的待估参数, ε 是误差,通常假设 E ( ε ) = 0 D ( ε ) = σ 2 σ 是已知的。

如果用 M ( ξ ) 表示测度设计 ξ 的信息矩阵,所谓的D-最优准则就是使得 M ( ξ ) 的行列式达到最大,而且测度设计 ξ 是D-最优设计的充分必要条件 [1] [2] 是方差函数 d = f T ( X ) M 1 ( ξ ) f ( X ) p (模型中待估参数的个数)。

2. 二元二次多项式回归模型的最优设计

多元多项式回归模型可以用来处理一大类非线性问题,在应用数理统计学中占有重要地位。这里讨论的二元二次多项式回归模型

y = β 0 + β 1 x + β 2 y + β 11 x 2 + β 22 y 2 + ε (1)

这里因子空间是圆域 = { ( x , y ) | x 2 + y 2 1 } ,在模型中含有五个待估参数,我们尝试用圆域上的五个设计点去进行饱和设计,同时使得这些设计点的结构既要对称 [3] ,同时分布又很均匀 [4] ,即所谓的“对称 + 均匀”原则。

对模型(1)的饱和设计 ξ 的基本思想是:先取圆周的任意内接正方形的四个顶点和圆心组成的五点设计,不妨取圆心为坐标原点,两个互相垂直的直径分别为x轴,y轴,设五个设计点分别是 ( a , b ) ( a , b ) ( b , a ) ( b , a ) ( 0 , 0 )

而且采用测度设计,记每个顶点的测度为 α ,圆心的测度为 β ,即测度矩阵 D ( ξ ) = d i a g ( α , α , α , α , β ) ,其中 4 α + β = 1 , α > 0 , β > 0

可将模型(1)的函数向量改写为

f T ( X ) = ( 1 , x 2 , y 2 , x , y )

设饱和设计 ξ 的结构矩阵为X,

X = [ 1 a 2 b 2 a b 1 a 2 b 2 a b 1 b 2 a 2 b a 1 b 2 a 2 b a 1 0 0 0 0 ]

相应设计 ξ 的信息矩阵为 M = X T D ( ξ ) X ,利用 a 2 + b 2 = 1 ,则

M = ( 1 2 α 2 α 0 0 2 α 2 ( a 4 + b 4 ) α 4 a 2 b 2 α 0 0 2 α 4 a 2 b 2 α 2 ( a 4 + b 4 ) α 0 0 0 0 0 2 α 0 0 0 0 0 2 α )

要寻求模型的D-最优设计,即使得行列式 | M | 取最大值的设计,而

| M | = 16 α 4 ( 1 4 α ) ( 2 a 2 1 ) 2

{ | M | α = 0 | M | a = 0 ,则有效驻点是 { α = 1 5 a = 0 { α = 1 5 a = ± 2 2

这两组驻点能使得 | M | 取最大值的,只有在驻点 α = 1 5 a = 0 时达到,此时 | M | max = 16 5 5 ,此时 α = β = 1 5 ,说明测度设计是均匀的,设计点呈对称结构,它们是 ( 0 , 1 ) ( 0 , 1 ) ( 1 , 0 ) ( 1 , 0 ) ( 0 , 0 )

下面证明上述五点设计对模型(1)是D-最优设计,由前文知,只要能验证

d = f T ( X ) M 1 ( ξ ) f ( X ) 5

此时

M 1 ( ξ ) = ( 5 5 5 0 0 5 15 2 5 0 0 5 5 15 2 0 0 0 0 0 5 2 0 0 0 0 0 5 2 )

d = 5 15 2 ( x 2 + y 2 ) + 15 2 ( x 4 + y 4 ) + 10 x 2 y 2

在区域 = { ( x , y ) | x 2 + y 2 1 } 的极大值情况为

① 在 的内部 x 2 + y 2 < 1 ,由 { d x = 30 x 3 + 20 x y 2 15 x = 0 d y = 30 y 3 + 20 x 2 y 15 y = 0 ,则

{ x = 0 y = 0 d = 5 { x = 0 y 2 = 1 2 d = 25 8 { x 2 = 1 2 y = 0 d = 25 8 { x 2 = 3 10 y 2 = 3 10 d = 11 4

② 在 的边界 x 2 + y 2 = 1 ,有 d = 5 5 x 2 ( 1 x 2 ) 5 ,当且仅当在 x = 0 , ± 1 的时候取最大值。

由①②知道方差函数,即正定二次型d的最大值是5 (等于模型中的待估参数的个数),而且当且仅当在上述设计点处才取得最大值,这就证明了所采用的饱和均匀的等测度设计是D最优设计。

3. 模型参数的最小二乘估计

由于模型(1)的待估参数向量为 β = ( β 0 , β 11 , β 22 , β 1 , β 2 ) T ,模型(1)可以记为

y = f T ( X ) β + ε

由最小二乘估计公式 [5]

β ^ = ( X T X ) 1 X T Y = 1 5 M 1 X T Y (2)

这里列向量 Y = ( y 1 , y 2 , y 3 , y 4 , y 5 ) T ,其中 y i ( i = 1 , 2 , 3 , 4 , 5 ) 表示第i次试验的响应观测值。把上述的 M 1 , X T , Y 的结果代入式(2),则得到 β 的最小二乘估计为

β ^ = ( β ^ 0 β ^ 11 β ^ 22 β ^ 1 β ^ 2 ) = ( y 5 1 2 ( y 1 + y 2 ) y 5 1 2 ( y 3 + y 4 ) y 5 1 2 ( y 1 y 2 ) 1 2 ( y 3 y 4 ) )

参考文献

[1] Silvey, S.D. (1980) Optimal Design. Chapman and Hall, London, 11-13, 52-53.
[2] 关颖男. 最优回归设计[J]. 数理统计与应用概率, 1987, 2(4): 477-492.
[3] 朱伟勇, 段晓东. D-最优设计的对称性及其对称构造法[J]. 应用数学学报, 1991, 14(3): 360-367.
[4] Wang, Y. and Fang, K. (1996) Uniform Design of Experiments with Mixtures. Science in China, Ser. A, No. 3, 42-53.
[5] 茆诗松, 丁元, 周纪芗, 吕乃刚. 回归分析及其试验设计[M]. 上海: 华东师范大学出版社, 1981: 297-302.