基于自适应Lasso阈值的EWMA协方差矩阵控制图
An Adaptive Lasso Thresholding-Based Covariance Matrix EWMA Control Chart
摘要: 许多工业多元质量控制应用中通常过程失控时偏移只发生在协方差矩阵中的小部分元素中,即协方差矩阵的偏移具有稀疏性。本文针对这一现实提出一种基于自适应lasso阈值的EWMA (E_ALT)控制图,并通过蒙特卡洛模拟得到该控制图在不同偏移量下的平均运行链长指标,实验结果证明其在中小偏移下监控效率较高。之后进一步对控制图中包含的参数进行优化,以提高控制图性能。
Abstract: In many industrial multivariate quality control applications, when the process is out of control, the offset usually occurs only in a small part of the covariance matrix, which calls that the offset of the covariance matrix is sparse. In view of this reality, this paper proposes an EWMA(E_ALT) control chart based on adaptive lasso threshold, and obtains the average running chain length index of the control chart at different offsets through Monte Carlo simulation, and the experimental results prove that its monitoring efficiency is high under medium and small offsets. The parameters contained in the chart are then further optimized to improve chart performance.
文章引用:高李琳. 基于自适应Lasso阈值的EWMA协方差矩阵控制图[J]. 统计学与应用, 2023, 12(2): 476-783. https://doi.org/10.12677/SA.2023.122052

1. 引言

统计质量控制目前广泛用于生产制造过程和服务产品的质量改进中,其中控制图是最强大的技术,其目的是监控一个正在进行的过程中相互关联的特征情况。在相关工业制造业和服务业中,大多数产品的质量需要多个相关变量的联合结果来描述,随着数据采集系统和计算技术的进步,多元统计过程控制图在监控和改进制造过程中可以发挥更大作用 [1] 。

随着SPC理论体系的成熟,该技术也被广泛应用于信号处理、网络安全、智能制造等领域,在相关应用中往往会出现监控变量特征数远大于获得子组样本数的情况,此时许多传统监控方法由于矩阵的奇异性或接近奇异而无法使用。许多学者针对该问题提出改进方案,如研究在基于单个观测值的情况下设计用于监控协方差矩阵的多元控制图 [2] [3] [4] ,并以实例验证控制图在实际应用中有很好的表现;Li和Wang [5] 通过使用惩罚似然函数得到的估计值替换未知的协方差矩阵后进行假设检验设计一个新的多元协方差矩阵控制图。此外,基于对一些工程和操作原理的理解,在许多工业多元质量控制应用中通常发生失控时偏移只发生在协方差矩阵中的小部分元素中,即协方差矩阵的偏移具有稀疏性。对此Maboudou-Tchao和Diawara [6] 利用Lasso方法求解协方差矩阵逆矩阵的稀疏估计过程设计多元控制图进行协方差矩阵的监控,该控制图被证明在仅方差偏移和方差与相关性同时偏移情况下效果较好;最近,Galal和Jinho [7] 提出了可以使用阈值法估计稀疏协方差矩阵作为正则化估计方法的潜在替代方案,设计出通过自适应lasso阈值估计稀疏矩阵的Shewhart控制图,并验证了该控制图在某些偏移情况下表现优于基于似然比的控制图,然而当监控过程偏移量较小时,其效果并不是十分理想,为此本文将原有的Shewhart控制图推广到EWMA控制图,并重新对各类偏移情况进行充分的模拟研究。

2. 基于自适应Lasso阈值的EWMA协方差控制图

设过程观测值 X = ( X 1 , X 2 , , X p ) 为p维随机向量,独立同分布于多元正态分布,其均值向量和协

方差矩阵分别为 E ( X ) = μ X = ( μ X 1 , μ X 2 , , μ X p ) cov ( X ) = Σ X = E [ ( X μ X ) ( X μ X ) ] ,其中 Σ X

p × p 维对称正定矩阵。假定过程受控时过程均值向量为 μ 0 ,协方差矩阵为 Σ 0 ,且总体参数已知。对于监控阶段,以 X t 表示在多元过程中随机抽取的第 t ( t = 1 , 2 , 3 , ) 个子组,每个子组包含n个独立的样品,则 X t i = ( X t i 1 , X t i 2 , , X t i p ) 表示第t个子组的第 i ( i = 1 , 2 , 3 , , n ) 观测值,其中 X t i j 表示t时刻第i个观测值的第 j ( j = 1 , 2 , 3 , , p ) 个指标值。

首先以样本协方差矩阵 S t = 1 n 1 i = 1 n ( X t i X ¯ t ) ( X t i X ¯ t ) 估计过程协方差矩阵,基于稀疏性假设,过程失控时差异矩阵 Σ Σ 0 中仅有少数元素不为0。记差异矩阵 D t = ( d i j t ) 1 i , j p = S t Σ 0 ,则当过程受控且样本量足够大时 D t 趋于0矩阵。为此我们采取自适应阈值法对差异矩阵进行压缩。通常统计质量控制在监控过程时假设受控协方差矩阵已知或通过阶段I估计得到,记为 Σ 0 = ( σ i j ) p × p ,若样本量为n,正则化参数 φ ,可得到阈值函数

g i j = φ ( σ i i σ j j + σ i j 2 ) n 1 log p (1)

G = ( g i j ) p × p 中每个元素为估计差异矩阵 D t 对应元的阈值,若 d i j t 的绝对值小于对应阈值,则将其压缩为0。采用连续变换将 d i j t 调整为

d ˜ i j t = d i j t max ( 0 , 1 | g i j d i j t | η ) (2)

其中 η 为压缩参数。

同时对矩阵 D ˜ t = ( d ˜ i j t ) 1 i , j p 中各元素进行标准化处理,得到 d ˜ i j t * = d ˜ i j t / n θ i j ,其中 θ i j 为元素 d ˜ i j t 的方差。

检验一个矩阵是否为0矩阵的常用方法是计算其Frobenius范数并检验其是否为0,进而可得到矩阵 D ˜ t * 的F范数为

F t = D ˜ t * F 2 = i = 1 p j = 1 p ( d ˜ i j t * ) 2 = 1 n i = 1 p j = 1 p d ˜ i j t 2 σ i i σ j j + σ i j 2 (3)

对其进行指数加权平均,得到E_ALT控制图的监控统计量。记 M E F 1 = F 1 t > 1

M E F t = ( 1 λ ) M E F t 1 + λ F t (4)

若给定参数 λ ( 0 < λ < 1 ),给定无偏移协方差矩阵 Σ 0 ,给定无偏移时平均链长 L 0 ,进一步确定控制图上控制限。利用 M E F t 的经验分布函数求控制限

F N ( u ) = M E F t u N

H = F N 1 ( 1 α ) = F N 1 ( 1 1 / L 0 ) (5)

记m为 ( 1 α ) N 四舍五入之后的整数,将 M E F 1 , M E F 2 , , M E F N 由小到大排序,则

H = M E F ( m ) (6)

3. 控制图的性能比较

在统计质量控制领域,比较控制图的性能优劣通常使用平均运行链长(Average Run Length,记为ARL)作为指标,即从监控开始至其发出报警信号为止抽取的平均样本组数。我们希望受控时的ARL(记为ARL0)越大越好,而失控时的ARL(记为ARL1)越小越好。通常比较控制图好坏的具体方法是:固定二者的受控ARL0,之后比较失控时的ARL1,ARL1越小则表示该控制图灵敏度更高。

本文主要研究高维情况下的控制图性能,故取样本容量 n = 15 ,变量维数 p = 15 ,在固定受控平均运行链长为200的前提下,通过随机模拟得到各控制图在不同平滑系数以及不同偏移情况下的失控平均运行链长,从而进行性能比较。事实上对于协方差矩阵的监控,我们无法罗列所有失控情况,因为在p维的协方差阵中包含任意 p ( p + 1 ) / 2 种偏移。因此本文不仅基于偏移量大小比较控制图性能,同时也会考虑偏移位置,即按照仅有对角线元素元素偏移,仅有非对角线元素发生偏移,以及对角线元素和非对角线元素共同发生偏移进行控制图性能比较。具体偏移情况分类如下:

1) 仅有对角线元素发生偏移

O C 1 : σ i i O C : = 1 + δ , 1 i p

O C 2 : σ 11 O C : = 1 + δ

2) 仅有非对角线元素发生偏移

O C 3 : σ i j O C : = δ , 1 i , j k p , i j

O C 4 : σ i j O C : = δ , 1 i , j 2 p , i j

3) 对角线元素和非对角线元素同时偏移

O C 5 : σ i j O C : = σ i j I C + δ , 1 i , j k p

O C 6 : σ i j O C : = δ , σ i i O C : = 1 + δ 2 , 1 i , j 2 p

模拟过程中对第三种偏移情况的k取5,对第5种偏移情况的k取3。

当用自适应lasso阈值估计稀疏矩阵时,存在正则化参数 φ 和压缩参数 η ,本文初步选取通过交叉验证法得到的最优参数 φ = 1 η = 4 ,固定参数的情况下,研究偏移量 δ 从0到1时的各控制图性能,为了减少模拟过程中的随机性,对每一个偏移量进行10,000次模拟,得到评价指标平均运行链长,具体结果见图1~3。

图1中为只考虑对角线元素发生变化时各控制图的ARL1。首先由图1分析可知这两类控制图均随着偏移量 δ 的增大灵敏度有所提升。在 Σ O C 1 偏移情况下,随着 λ 的减小,E_ALT控制图也更为灵敏。当所有对角线元素都发生偏移时,E_ALT控制图性能与ALT_norm控制图较为相似;而对于 Σ O C 2 偏移情况,E_ALT具有一致优越性,对于小的偏移效果更为明显,且 λ 越小,控制图灵敏性越高。

Figure 1. ARL comparison of E_ALT and ALT_norm control chart when shift in diagonal elements (ARL0 = 200, n = 15 , p = 15 )

图1. 对角线元素发生偏移时E_ALT和ALT_norm控制图的ARL比较(ARL0 = 200, n = 15 , p = 15 )

图2为仅有非对角线元素发生偏移时各控制图的性能表现,分析可知当协方差矩阵中对角线元素不变,部分非对角线元素发生偏移时,偏移量 δ < 0.4 时,ALT_norm控制图性能较好,而当偏移量较大时,E_ALT控制图比ALT_norm控制图更灵敏,且调节参数越小E_ALT控制图的性能越好。而对于协方差阵中仅有一组非对角线元素发生偏移,当 δ < 1 时E_ALT控制图ARL1小于其他控制图的ARL1,即E_ALT对于中小偏移更灵敏。

Figure 2. ARL comparison of E_ALT and ALT_norm control chart when shift in off-diagonal elements (ARL0 = 200, n = 15 , p = 15 )

图2. 仅有非对角线元素发生偏移时E_ALT和ALT_norm控制图的ARL比较(ARL0 = 200, n = 15 , p = 15 )

图3中则为考虑变量对角线元素和非对角线元素均发生偏移的情况,对于样本对角线元素和非对角线元素均发生偏移的情况,由图3可知当偏移量 δ < 0.4 时,E_ALT控制图更加灵敏,而 δ 0.6 时,较大的调节参数 λ 下E_ALT控制图的ARL1与ALT_norm控制图的ARL1较为接近,也就是说在选取合适的 λ 值后,对于固定的 δ 值E_ALT控制图具有一致的优越性。

Figure 3. ARL comparison of E_ALT and ALT_norm control chart when shift in diagonal and off-diagonal elements (ARL0 = 200, n = 15 , p = 15 )

图3. 对角线元素及非对角线元素同时发生偏移时E_ALT和ALT_norm控制图的ARL比较(ARL0 = 200, n = 15 , p = 15 )

4. 参数优化

在使用自适应Lasso阈值法估计矩阵时,存在正则化参数 φ 与压缩参数 η ,正则化参数 φ 表示由(2)式求出阈值对应方差的正则化水平,压缩参数 η 则决定着压缩过程中的压缩程度。前文使用通过交叉验证法求得的参数进行控制图设计,然而从多元统计过程控制角度来看,参数的选择也与实际偏移情况有关,因此本文进一步按照偏移量情况,对各参数进行讨论。具体结果见表1表2

表1是对正则化参数分析结果,加粗的部分是ARL1最小的情况。对于第一种偏移情况,当偏移量较小,小于0.4时,正则化参数取0.5控制图具有最佳的ARL1,而偏移量达到0.6之后,正则化参数的取值对控制图性能基本没有影响。对于第二、第四及第六种偏移情况,偏移量低于0.2时,越小的正则化参数使得控制图效果越好,而对于较大偏移量则正则化参数越大越好,因为这三种偏移情况相较于其他情况稀疏性更强。对于第三、第五种失控情况,正则化参数取较小值时控制图整体表现更佳。而表2展示了压缩参数变化时的对应指标,正如上文所说,若偏移量较小,则更大的压缩参数对应的控制图效果更好。综上,若某个系统可从历史数据中获得一些相关情况,则可以按照分析预先设定参数,实现更高效的监控。

Table 1. ARL performance of E_ALT according to φ (ARL0 = 200, n = 15 , p = 15 , λ = 0.5 , η = 4 )

表1. 关于正则化参数 φ 的E_ALT控制图ARL表现(ARL0 = 200, n = 15 , p = 15 , λ = 0.5 , η = 4 )

Table 2. ARL performance of E_ALT according to η (ARL0 = 200, n = 15 , p = 15 , λ = 0.5 , φ = 1 )

表2. 关于压缩参数 η 的E_ALT控制图ARL表现(ARL0 = 200, n = 15 , p = 15 , λ = 0.5 , φ = 1 )

5. 结束语

本文将使用自适应Lasso阈值法估计稀疏矩阵的思想与EWMA控制图相结合,提出了一种用于监控协方差矩阵的E_ALT控制图,来监控高维过程中协方差矩阵偏移情况。通过蒙特卡洛模拟得出该控制图的ARL指标,数值模拟结果表明过程失控时,E_ALT控制图对监控过程中可能出现的不同偏移量具有一致优越性,尤其在中小偏移量下优势更为明显。同时对控制图中涉及的相关参数进行模拟分析,在通过历史数据得到相关信息时可以对参数进行调整以提高监控效率。

参考文献

[1] Montgomery, D.C. (2013) Introduction to Statistical Quality Control. 7th Edition, John Wiley and Sons, New York.
[2] Khoo, M.B.C. and Quah, S.H. (2007) Multivariate Control Chart for Process Dispersion Based on Individual Observations. Quality Engineering, 15, 639-642.
https://doi.org/10.1081/QEN-120018394
[3] Ajadi, J.O., Wong, A., Mahmood, T. and Hung, K. (2022) A New Multivariate CUSUM Chart for Monitoring of Covariance Matrix with Individual Observations under Estimated Parameter. Quality and Reliability Engineering International, 38, 834-847.
https://doi.org/10.1002/qre.3017
[4] Omolofe, O.T., Adegoke, N.A., Adeoti, O.A., et al. (2022) Multivariate Control Charts for Monitoring Process Mean Vector of Individual Observations Underregularized Covariance Estimation. Quality Technology & Quantitative Management, 19, 277-298.
https://doi.org/10.1080/16843703.2021.1948952
[5] Li, B., Wang, K.B. and Yeh, A.B. (2013) Monitoring the Covariance Matrix via Penalized Likelihood Estimation. IIE Transactions, 45, 132-146.
https://doi.org/10.1080/0740817X.2012.663952
[6] Maboudou-Tchao, E.M. and Diawara, N. (2013) A LASSO Chart for Monitoring the Covariance Matrix. Quality Technology & Quantitative Management, 10, 95-114.
https://doi.org/10.1080/16843703.2013.11673310
[7] Abdella, G.M., Kim, J., Kim, S., et al. (2019) An Adaptive Thresholding-Based Process Variability Monitoring. Journal of Quality Technology, 51, 242-256.
https://doi.org/10.1080/00224065.2019.1569952