一类正交拉丁超立方体设计二维投影均匀性的研究
Research on Two-Dimensional Projection Uniformity for a Class of Orthogonal Latin Hypercube Designs
摘要: 正交拉丁超立方体设计(Orthogonal Latin hypercube designs, OLHDs)适用于计算机试验,是具有列正交性的一类空间填充设计。本文讨论了试验次数一般的一类正交拉丁超立方体设计在二维空间的投影均匀性,即在二维网格上的分层性质。结果表明该设计的所有列对都可以实现在s × s网格分层;来自相同组连续不相邻的列对可以实现在s × s2s2 × s网格上分层,某些列对还能实现在s2 × s2网格上的分层。
Abstract: The Orthogonal Latin hypercube designs (OLHD), which is a class of space-filling designs with column orthogonality, is suitable for computer experiments. In this paper, the projection uniformity of a class of OLHDs with more general run sizes in two dimensions is discussed, i.e., the grid layering properties. The results show that the design can achieve stratifications on s × s grids in any two dimensions; most column pairs can achieve stratifications on finer s2 × s and s × s2 grids when the two columns are from the same group that are not adjacent to each other, and some column pairs achieve stratifications on s2 × s2 grids.
文章引用:韦金条, 张天芳. 一类正交拉丁超立方体设计二维投影均匀性的研究[J]. 应用数学进展, 2024, 13(8): 3702-3708. https://doi.org/10.12677/aam.2024.138353

1. 引言

计算机试验目前已经被广泛应用于工业、农业等领域。在计算机试验的实际应用中输入变量与输出响应之间的关系通常过于复杂以至于很难进行分析和处理,往往需要寻找一个能够代替真实模型的拟模型。然而用来预测的试验区域往往是未知的,这使得我们无法在收集数据前选择合适的拟模型。因此为寻找适合拟模型的设计,研究工作者提出了空间填充设计,使设计点尽可能均匀地分布在试验区域内。目前最常用的一类空间填充设计是由参考文献[1]提出的拉丁超立方体设计(Latin hypercube design, LHD)。拉丁超立方体设计具有一维投影均匀性,但因子之间可能具有高度相关性。为避免这一现象,参考文献[2]提出正交拉丁超立方体设计(Orthogonal Latin hypercube design, OLHD)。随后,参考文献[3]-[5]等对正交拉丁超立方体设计的构造进行了研究。然而正交拉丁超立方体设计的空间填充性如何,研究相对较少。尽管参考文献[6]-[8]等研究了具有二维投影均匀性的正交拉丁超立方体设计,但他们都是针对试验次数为sdd为2的幂次进行的研究。在本文中,我们将在参考文献[3]的基础上,研究试验次数更为一般的正交拉丁超立方体设计的二维投影均匀性。我们将具体讨论一类正交拉丁超立方设计 OLHD( s 2 u +v ,k s/2 v 2 u+v ) 在二维空间上的投影均匀性,如s × ss × s2s2 × s的网格上的分层性质,其中uv为非零整数。

2. 符号和基础知识

一个n × m矩阵,若每个因子的水平之间是等间距的,且每个因子水平数等于n,那么这个n × m矩阵称为试验次数与水平数都为n,因子数为m的拉丁超立方体设计(Latin hypercube design),记作 OLHD( n,m ) 。如果该拉丁超立方体设计的任意两列元素内积为0,则称其为正交拉丁超立方体设计(Orthogonal Latin hypercube design),记作 OLHD( n,m )

假设A是一个n × m矩阵,它的第 i( 1im ) 列的元素为 0,1,, s i 1 ,如果其任何n × t子矩阵包含所有可能的t元组,且这些t元组出现的次数相同,那么称这个矩阵是试验次数为n,因子数为m,第i个因子的水平数为 s i ,强度为t的正交表,记作 OA( n,m, s 1 × s 2 ×× s m ,t ) 。若 s 1 = s 2 == s m =s ,则称这样的正交表为对称正交表;反之称为非对称正交表。

对于一个 r×c 矩阵D,若对于任意ij ( 1ijc ),第i列和第j列的有序差正好是集合 { 0,1,,s1 } 上的所有元素,且每个有序差都重复出现相同的次数,则称矩阵D是集合 { 0,1,,s1 } 上的差阵,记作 D( r,c,s )

假定Rk × k实矩阵,如果 R R=cI ,那么R称为旋转矩阵,其中I表示单位矩阵,c为常数。进一步的,对于旋转矩阵,有以下定义。

对于一个素数或素数幂s,令

R 10 =( s 1 1 s ) , R u0 =( s 2 ( u1 ) R ( u1 )0 R ( u1 )0 s 2 ( u1 ) ) , u=2,3,

R u0 是个 2 u 阶旋转矩阵。在不考虑符号的情况下,其每列中的非零元素都是 1,s,, s 2 u 1 的一个置换。基于 R u0 ,令

Q 1 =( 1 0 0 1 ) , Q u =( Q u1 0 0 Q u1 ) ,

并定义

R uv =( s R u( v1 ) Q u+v1 Q u+v1 s R u( v1 ) ),v2

是一个 2 u+v 阶的旋转矩阵。在不考虑符号的情况下,其每列中的非零元素都是 1,s,, s 2 u +v1 的一个置换。

3. 二维投影均匀性的讨论

参考文献[3]构造了一类正交拉丁超立方体设计,但是他们并没有讨论这些设计的空间填充性质。在本节中,我们将讨论他们所得设计的二维投影均匀性。为了便于说明,我们先给出几个有用的引理。

引理1 对一个素数s,令A是一个 OA( n,m,s,2 ) D=( d 1 , d 2 ,, d s ) 是一个差阵,则 B=DA 是一个 OA( sn,sm,s,2 ) ,其中 表示直和。

引理1可以根据参考文献[9]中的引理6.27直接得到。下面的两个引理都来自参考文献[3]

引理2 若A是一个完全因子设计,令 B i = d i A 。假设 b i 1 , b i 2 是来自 B i 的任意两个不同列, b j 1 是来自 B j 的一列,则 ( b i 1 , b i 2 , b j 1 ) 必定构成一个 OA( sn,3,s,3 ) ,其中 ij i 1 i 2

引理3 令 A=( A 1 ,, A k ) 是一个强度为2、水平数为s的正交表,并且每一个 A j 都是具有 2 u 个因子的完全因子设计。那么通过旋转矩阵 R uv ,可以得到一个试验次数为 n= s 2 u +v 、因子数为 m=k [ s/2 ] v 2 u+v OLHD( n,m )

为方便研究引理3中所得到设计的二维投影均匀性,我们先给出一个例子简要说明其构造过程。

1 A=OA( 9,4,3,2 ) D=D( 3,3,3 ) 分别为如下矩阵。

A=( 0 0 0 0 0 1 1 2 0 2 2 1 1 1 1 2 2 2 0 1 2 0 1 2 1 2 0 2 0 1 1 0 2 2 1 0 ) , D=( 0 0 0 0 1 2 0 2 1 )

A按连续两列进行分组,即 A=( A 1 , A 2 ) 。令 D=( d 1 , d 2 , d 3 ) ,根据直和有

B i =( d 1 , d 2 ) A i ,其中 i=1,2

因此 B=( B 1 , B 2 ) 是一个 OA( 27,8,3,2 ) ,并且 B 1 , B 2 都是具有22个因子的3水平的 3 41 设计。若考虑使用旋转矩阵R11对中心化后的矩阵B进行旋转,则可以得到 OLHD( 27,8 ) ,其中L1L2分别为中心化后的B1B2旋转后得到的设计,见表1

Table 1. OLHD( 27,8 )

1. OLHD( 27,8 )

序号

L1

L2

1

−13

−5

−11

−7

−13

−5

−11

−7

2

−10

3

−8

3

3

8

3

10

3

−7

11

−5

13

10

−3

8

−3

4

−3

−8

−3

−10

0

0

0

0

5

0

0

0

0

7

−11

5

−13

6

3

8

3

10

−7

11

−5

13

7

7

−11

5

−13

13

5

11

7

8

10

−3

8

−3

−10

3

−8

3

9

13

5

11

7

−3

−8

−3

−10

10

−12

−6

1

−1

−12

−6

1

−1

11

−9

2

4

9

4

10

6

−11

12

−6

13

−2

−8

8

−4

−7

12

13

−2

−9

9

−4

1

−1

12

6

14

1

−1

12

6

5

−12

−10

2

15

4

10

6

−11

−6

13

−2

−8

16

5

−12

−10

2

11

7

−13

−5

17

8

−4

−7

12

−9

2

4

9

18

11

7

−13

−5

−2

−9

9

−4

19

−11

−7

13

5

−11

−7

13

5

20

−8

4

7

−12

2

9

−9

4

21

−5

12

10

−2

9

−2

−4

−9

22

−4

−10

−6

11

−1

1

−12

−6

23

−1

1

−12

−6

6

−13

2

8

24

2

9

−9

4

−5

12

10

−2

25

6

−13

2

8

12

6

−1

1

26

9

−2

−4

−9

−8

4

7

−12

27

12

6

−1

1

−4

−10

−6

11

对于引理3中的设计,接下来我们讨论其二维投影均匀性。为研究二维投影均匀性,下面我们推广参考文献[6]中的映射,证明显而易见,我们在此只给出结论。

性质1 设 n= s k ,则存在映射

h i ( a )= a+ n1 2 n s i s i 1 2 , a{ ( n1 )/2 ,,1,0,1,, ( n1 )/2 } , ik , (1)

可以将一个n水平的列塌陷到成一个 s i 个水平的列。这里的塌陷也常常称为投影。

由于设计 OLHD( n,m ) 的投影均匀性一般可以用网格的分层性来衡量,即若在指定划分的网格上,每个网格出现相同的试验点,则称在该划分网格上实现分层。本文主要研究二维投影均匀性,因此只需要讨论任意两列的分层情况。我们将给出以下分层的定义来阐述二维投影均匀性。

定义1 对于一个设计,若某两列可以塌陷为一个 OA( n,2, s i × s j ,2 ) 或一个 OA( n,2, s j × s i ,2 ) ,则称该列对在 s i × s j s j × s i 网格上实现分层。

在本文中,我们主要讨论的是 i=j=1 i=1,j=2 i=2,j=1 以及 i=j=2 的情况。令L是通过引理3得到的一个正交拉丁超立方体设计 OLHD( n,m ) 。根据参考文献[3]中的构造方法可知,设计L可以划分为h组,每组g列,其中 h=k [ s/2 ] v g= 2 u+v

定理1 引理3中的 OLHD( n,m ) 具有以下性质:

(i) 任意两列可以在s × s的网格上实现分层;

(ii) 当 u1,v1 或者 u2,v0 时,同一组内有 C g 2 g/2 个列对以在s2 × ss × s2的网格上实现分层;

(iii) 当 u2,v1 或者 u3,v0 时,同一组内有 C g 2 g/2 个列对可以在s2 × s2的网格上实现分层。

证明:(i) 为了便于说明,假设 B=( B 1 , B 2 ,, B h ) ,每个 B i 都是一个具有 2 u+v 个因子且强度为 2 u +v 的设计,B是强度为2的正交表,其中 h=k s/2 v 。中心化后的B记为 B 。基于旋转矩阵 R uv 的形式,L的任意一列d均可以表示成

d= s 2 u +v1 b 1 ±±s b 2 u +v1 ± b 2 u +v

b 1 , b 2 ,, b 2 u +v 表示 B 的列。此根据性质1中的映射,通过简单计算易得 h 1 ( d )= b 1 s1 2 = b 1 。因为

b 1 , b 2 ,, b 2 u +v 是水平为s强度为2的正交表B中的列,由正交表的性质可得到结论。

(ii) 类似(i)中的证明,L中任意两列d1d2可以写成

d 1 = s 2 u +v1 b 1 ± s 2 u +v2 b 2 ±±s b 2 u +v1 ± b 2 u +v (2)

d 2 = s 2 u +v1 p 1 ± s 2 u +v2 p 2 ±±s p 2 u +v1 ± p 2 u +v (3)

b 1 , b 2 ,, b 2 u +v , p 1 , p 2 ,, p 2 u +v 均表示 B 中的列,且 b i p i 不完全相同。根据性质1中的映射,得

h 1 ( d 1 )= b 1 s1 2 h 2 ( d 2 )= p 1 s p 2 s1 2 。若要实现 s× s 2 的网格上的分层,则 ( b 1 , p 1 , p 2 ) 必构成强度为3

的正交表。当 u1,v1 或者 u2,v0 ,同一组内的列构成的设计强度为 2 u +v3 的设计,该条件已经满足。同时,由旋转矩阵 R uv 的性质可知,除顺次相连的两个列对,如第一列和第二列,第三列和第四列等等,组内任意两个列对,都不会共用B中的列因此能在s2 × ss × s2的格子上实现分层。组内g列总共有 C g 2 个列对,减去顺次相连的g/2个列对,得证。

(iii) 取L中任意两列 d 1 , d 2 ,如式(2)、(3)所示。映射后得到 h 2 ( d 1 )= b 1 s+ b 2 s1 2

h 2 ( d 2 )= p 1 s p 2 s1 2 。若要实现s2 × s2的格子上的分层,则 ( b 1 , b 2 , p 1 , p 2 ) 必构成强度为4的正交表。

u2,v1 或者 u3,v0 ,同一组内的列构成的设计强度为 2 u +v4 的设计,该条件已经满足。其他类似(ii)中后半部分的证明可以得到。证毕。

不同组内的结论较为复杂,本文在此不讨论其理论结果。但通过实例我们发现不同组内也具有较好的二维投影均匀性。下面我们通过一个例子来说明其二维投影均匀性。

2 (续例1) 对于例1中的 OLHD( 27,8 ) ,首先考虑下面的映射

h 1 ( a )= a+13 9 1 , h 2 ( a )= a+13 3 4 , a{ 13,12,,1,0,1,,12,13 } ,

其中在 h 1 ( a ) h 2 ( a ) 中,分别令式(1)中的 i=1 和2。很容易验证利用映射h1,则 OLHD( 27,8 ) 可以塌陷为一个 OA( 27,8,3,2 ) ,故 OLHD( 27,8 ) 中任意两列可以以在3 × 3的网格上实现分层,即每个网格上均有三个试验点,如图1(a)所示。 OLHD( 27,8 ) 的列可被划分为2组,每组4列,其中第一组为前四列。考虑任意一组中的两列,第一列来自4列中的前两列,第二列来自后两列,对于第一列我们采用映射h1 (或h2),另外一列采用映射h2 (或h1),来自相同组的这两列可以塌陷为一个 OA( 27,2,3×9,2 ) (或 OA( 27,2,9×3,2 ) ),如图1(b)图1(c)所示,即在相同组内的 2× C 4 2 =12 个列对中,有 2×2×2=8 个列对在9 × 3和3 × 9格子上实现分层,即列对(1, 3),(2, 3),(1, 4),(2, 4),(5, 7),(5, 8),(6, 7),(6, 8)在每个网格上均有一个试验点。对于来自不同组的两列,通过计算,在所有的16个列对中有8个列对在9 × 3和3 × 9格子上实现分层,即列对(1, 7),(1, 8),(2, 7),(2, 8),(3, 5),(3, 6),(4, 5),(4, 6)在每个网格上均有一个试验点,如图1(c)所示。

(a) (b) (c)

Figure 1. Stratification of column pairs of OLHD( 27,8 ) in Example 2. (a) 3 × 3 stratification; (b) 3 × 9 stratification; (c) 9 × 3 stratification

1. 例2中设计 OLHD( 27,8 ) 的列对分层性。(a) 3 × 3的网格分层;(b) 3 × 9的网格分层;(c) 9 × 3的网格分层

4. 总结

正交拉丁超立方设计是一类重要的空间填充设计,使设计点尽可能均匀地分布在试验区域内,同时列对之间具有正交性。目前学者对正交拉丁超立方体设计的构造研究较多。对正交拉丁超立方体设计的空间填充性,研究相对较少。尽管有参考文献有文献进行讨论,也只是针对素数的特定幂次进行的研究。本文基于参考文献[3]所构造的一类正交拉丁超立方体设计 OLHD( s 2 u +v ,k s/2 v 2 u+v ) ,研究了该设计的二维投影均匀性,从而解决了试验次数为素数以及素数幂的一般形式的二维投影均匀性,更有利于实际工作者的使用。通过研究,我们发现其所有列对都可以在s × s网格上实现分层,即每个网格上都有相同的试验点数,因此具有良好的投影均匀性。若将其分组,只要 u1,v1 u2,v0 ,则来自相同组的任意两个连续不相邻的列对可以在s × s2s2 × s网格上实现分层。更进一步地,当 u2,v1 u3,v0 时, OLHD( s 2 u +v ,k s/2 v 2 u+v ) 还可以具有更优良的投影均匀性,即在s2 × s2网格上实现分层。不过,本文没有对一般的分层性质进行系统讨论。此外,虽然这种研究方法可以推广到三维及以上的空间,但本文还没有展开相关讨论,这些都将留给感兴趣的学者做进一步的研究。

NOTES

*通讯作者。

参考文献

[1] McKay, M.D., Beckman, R.J. and Conover, W.J. (1979) Comparison of Three Methods for Selecting Values of Input Variables in the Analysis of Output from a Computer Code. Technometrics, 21, 239-245.
https://doi.org/10.1080/00401706.1979.10489755
[2] Ye, K.Q. (1998) Orthogonal Column Latin Hypercubes and Their Application in Computer Experiments. Journal of the American Statistical Association, 93, 1430-1439.
https://doi.org/10.1080/01621459.1998.10473803
[3] Sun, F.S. and Tang, B. (2017) A General Rotation Method for Orthogonal Latin Hypercubes. Biometrika, 104, 465-472.
[4] Pang, F., Liu, M.Q. and Lin, D.K. (2009) A Construction Method for Orthogonal Latin Hypercube Designs with Prime Power Levels. Statistica Sinica, 19, 1721-1728.
[5] Sun, F.S., Liu, M.Q. and Lin, D.K.J. (2009) Construction of Orthogonal Latin Hypercube Designs. Biometrika, 96, 971-974.
https://doi.org/10.1093/biomet/asp058
[6] Wang, C.Y., Yang, J.Y. and Liu, M.Q. (2021) Construction of Space-Filling Orthogonal Designs. Journal of Statistical Planning and Inference, 213, 130-141.
https://doi.org/10.1016/j.jspi.2020.11.009
[7] Li, H., Yang, L. and Liu, M.Q. (2022) Construction of Space-Filling Orthogonal Latin Hypercube Designs. Statistics & Probability Letters, 180, 109245.
https://doi.org/10.1016/j.spl.2021.109245
[8] Liu, S.N., Liu, M.Q. and Yang, J.Y. (2023) Construction of Column-Orthogonal Designs with Two-Dimensional Stratifications. Mathematics, 11, 1549.
https://doi.org/10.3390/math11061549
[9] Hedayat, A.S., Sloane, N.J.A. and Stufken, J. (1999) Orthogonal Arrays: Theory and Applications. Springer.