1. 引言
在对产品质量的统计过程控制(Statistical Process Control, SPC)中,由于仪器误差和采样误差[1] [2]等的存在,过程指标样本数据的测量误差(Measurement Error)是不可避免的。特别地,过程指标变量是类别变量时相应的测量误差被称为误分类(Misclassification) (对类别变量的测量带有测量误差[3])。相比于普通的测量误差,误分类的影响几乎存在于所有定性质量控制问题中,如医疗领域对疾病的误诊会引发健康灾难,金融风险误分类会引发信用危机等。
控制图是实现SPC的关键技术,属性控制图[4]-[8]则是针对类别变量设计的定性质量监测控制图,所以误分类是设计属性控制图需要解决的首要问题。文献[9] [10]研究了误分类对于属性控制图监控策略的影响,但是模型修正精度依赖于样本容量,且对于过程的微小变化并不敏感。众所周知,SPC第II阶段监控面临两个重要问题:(1) 采样代价限制,导致小样本常常是必须的,而小样本相对成本低廉但携带信息有限,所以对模型的要求严苛。(2) 过程变化微小,所以过程参数可能的漂移小而持久是监测任务的主要特点。因此,开发基于小样本数据的带有误分类修正的p控制图,制定精准监控策略是一个极具挑战性的问题。
带有误分类修正的EWMA p控制图是小样本意义下的参数小尺度漂移的监控策略[11],但是由于EWMA对大/小偏移的敏感性依赖于平滑参数
的选取,很难选取合适的
既保证监测效率又兼顾到监测灵敏度。Zhang [12]通过对历史与当前样本信息的两次指数加权平均构造DEWMA p图统计量,降低了图统计量对于平滑参数取值(也就是参数漂移)的依赖性。然而,该图是基于精确测量的假设前提下开发的,并未考虑样本数据的误分类以及因误分类带来的负面影响,致使实际控制结果失真。
基于此,针对过程质量检测中观测值存在误分类的问题,本文首先对误分类样本数据建模,修正样本数据,再结合DEWMA对参数小漂移的敏感性以及DEWMA p图对样本量的宽容特性,构建带有误分类修正的DEWMA p (DEWMA p with Misclassification Correction, MisC-DEWMA p)控制图,以实现对过程参数小漂移的更精准检测,最后通过模拟仿真和实际案例来验证所提控制图的有效性和优越性。
本文结构安排如下:第2节,基于误分类数据的DEWMA p (Mis-DEWMA p)控制图建模;第3节,基于误分类数据修正的DEWMA p (MisC-DEWMA p)控制图建模;第4节控制图性能分析;第5节应用实例。
2. 带有误分类数据建模的DEWMA p控制图及其设计
本节首先利用Buonaccorsi [13]的方法进行误分类数据建模,再设计带有误分类的DEWMA p统计量以及控制限,构建Mis-DEWMA p控制图。
在某质量检测的SPC第Ⅱ阶段,以二值随机变量
为检测指标,
(表示产品合格)或1 (表示产品不合格),
为
在
时刻的简单样本,样本容量为
(
,
)。
表示过程受控(in control, IC,
)或者过程失控(out of control, OC,
)时过程中不合格
品的比率,
为合格品比率,
为
时刻样本的不合格品率的无偏估计。
2.1. 误分类数据建模
设
为
的观测值,根据文献[13],记
(1)
其中
。显然,
和
为正确分类概率,
和
为误分类概率,
,
。误分类存在时,
和
不全为零。
令
,
,
它们分别为质量检测过程中和
的观测值,由全概率公式可得
(2)
(3)
整理式(2)和(3)得到
(4)
其中,
为误分类矩阵。
由公式(4)可知,如果观测数据中存在误分类(即
),那么
和
不等于其观测值
和
。且
或
越大时,
,
与
,
的差异就越大。此外,带有误分类的不合格品率无偏估计为
,
。
2.2. 带有误分类数据建模的DEWMA p控制图
2.2.1. DEWMA p控制图
根据文献[12] [14]可知二值型过程指标变量的DEWMA p图统计量如下:
(5)
其中
,
;
是不合格品的比率,
时刻样本的不合格品率
的无偏估计为
,平滑参数
,
。图统计量
的均值和方差分别为
(6)
(7)
如果过程处于OC状态,不合格品比率会向上漂移,高于IC状态,因此可将控制图的下控制限(LCL)设定为0,上控制限(UCL)设为
(8)
其中,
表示控制限系数。
本文称上述监控策略为DEWMA p控制图,当
超出控制上限UCL时,DEWMA p控制图发出失控信号。
2.2.2. 基于误分类数据建模的DEWMA p控制图
当质量过程的样本数据带有误分类时,记带有误分类的样本为
,在公式(5)~(8)所示的DEWMA p控制策略中加入误分类的影响,构造带有误分类数据建模的DEWMA p统计量如下:
(9)
其中
,
;
是误分类样本不合格品的比率,
在
时刻的无偏估计为
,平滑参数
,
。此时,图统计量
的均值和方差分别为
(10)
(11)
对应的上下控制限为
(12)
(13)
其中,
为控制限系数,本文称此图为带有误分类数据建模的(Mis-DEWMA p)控制图,当
超出控制上限
时,Mis-DEWMA p控制图发出失控信号。
通过比较控制图Mis-DEWMA p与DEWMA p的控制限(计算方法见公式(12)与(8))可知,如果生产过
程存在误分类,那么在不合格品率
时,
,这正是原本应处于OC状态的样本可能被错判为处于IC状态的原因,这里对不合格品率
的要求显然是合理的。所以有必要对误分类样本数据
按照误分类概率进行修正,再作为控制图的输入,判断过程是否处于受控状态。
3. 带有误分类修正的DEWMA p控制图及其设计
本节首先根据文献[12]中的方法,利用误分类矩阵
(公式(4))修正样本数据,进而开发带有误分类修正的DEWMA p控制图。
3.1. 误分类修正模型
3.1.1. 误分类矩阵的估计
在公式(2)和(3)中,误分类矩阵
的元素涉及到过程指标变量
,因此通常是未知的。现有文献中
的元素一般可利用辅助信息估计得到,其中一种常见的辅助信息是外部验证数据[15] [16]。这里我们利用外部验证数据
、
,也就是误分类的相对比率来确定误分类概率,估计
中各元素的取值。
当过程指标变量
时,误分类相对比率为
(14)
显然
,
越大,说明产品被正确分类的概率越大。在给定
后,可得
,
。同理,当
时,
,
,给定
,可得
,
。所以,可得到误分类矩阵的估计,为方便起见仍记为
,
(15)
到此,我们利用误分类概率量化了误分类,并借助外部验证数据计算了误分类矩阵
,接下来将应用误分类矩阵进行误分类数据修正[13]。
3.1.2. 误分类修正模型
显然
与其估计值(公式(15))都是可逆矩阵,
(16)
所以公式(4)等价于
(17)
计算可得
(18)
其中
,式(18)给出了不合格品率
的“修正”值,记为
,
对应的修正观察值为
。此外,
在
时刻的无偏估计为
。
3.2. 带有误分类修正的DEWMA p控制图
3.2.1. 带有误分类修正的EWMA p控制图的介绍
2022年Chen和Yang (2022) [11]提出了带有误分类修正的EWMA p控制图,用
修正
,对应的EWMA p修正统计量为
(19)
其中,
,
;平滑参数
。图统计量
的初始值
,上下控制限分别记为
和
,
(20)
(21)
其中,
表示控制限系数。我们把监控策略(19~21)称为MisC-EWMA p控制图,当
超出控制上限
时,MisC-EWMA p控制图发出失控信号。
如前所述,现有的DEWMA p控制图具有小飘移敏感性和小样本的宽容特性,但会受到样本数据误分类的影响;而MisC-EWMA p控制图修正了误分类,但由于EWMA控制图的共有特性对于过程的微小变化没有DEWMA敏感。因此,当样本数据带有误分类时,针对不合格品向上的微小漂移的监测问题,受文献的[11] [12]启发,我们将结合DEWMA p与MisC-EWMA p控制图的优点开发带有误分类修正的DEWMA p控制图。
3.2.2. 带有误分类修正的DEWMA p控制图
根据公式(9) (12) (13) (18),构建基于误分类修正的DEWMA p统计量为
(22)
其中,
,
;平滑参数
,
。图统计量
的均值和方差分别为
(23)
(24)
上下控制限分别为
(25)
(26)
其中,
表示控制限系数
的修正值。
本文称公式(22) (25) (26)为MisC-DEWMA p控制图模型,当
超出控制上限
时,MisC-EWMA p控制图发出失控信号。
4. 控制图性能分析
平均运行长度(ARL)和运行长度标准差(SDRL)是控制图性能的主要评价指标,它们分别表示检测到控制图发出报警信号所需采集的样本数量的均值和方差[17]。一个有效的控制图应当在IC状态下具有较大的ARL (ARL0),以降低虚假警报的发生频率;相反,在OC状态下应当具有较小的ARL (ARL1),以便及时检测到任何异常情况。为了评估MisC-DEWMA p控制图的OC检测性能,我们选取DEWMA p控制图,Mis-DEWMA p控制图以及MisC-EWMA p控制图作为比较。
假设检测时间
,样本大小
,IC阶段不合格品率
,OC阶段不合格品率为
,其中
。此外,对于公式(4)所示的误分类模型,令
,
,其中
。
对于Mis-DEWMA p控制图,用公式(2)计算出
,并利用
生成带有误分类的过程指标变量
,OC状态中带有误分类的ARL和SDRL分别用
和
表示;对于MisC-DEWMA p控制图,用公式(19)计算修正IC和OC修正的概率
和
,用
和
分别表示OC状态中修正的ARL和SDRL;此外,为了便于进行区分和比较,对于MisC-EWMA p控制图,用
表示其控制限系数
,用
和
分别表示其OC阶段的ARL和SDRL。下面我们给定
,
,利用Monte Carlo模拟10,000次,详细的模拟结果对比见表1~6。
Table 1. When
and
, different
values correspond to the control limit coefficient
表1. 当
,
时,不同
值对应的控制限系数
|
|
|
|
|
|
|
|
|
|
|
0.12 |
5.137 |
5.110 |
4.105 |
2.134 |
5.804 |
5.730 |
4.643 |
2.428 |
0.16 |
5.119 |
5.093 |
4.282 |
2.201 |
5.724 |
5.653 |
4.776 |
2.446 |
0.20 |
5.109 |
5.111 |
4.368 |
2.213 |
5.661 |
5.623 |
4.834 |
2.442 |
0.24 |
5.050 |
5.036 |
4.411 |
2.225 |
5.586 |
5.576 |
4.876 |
2.435 |
0.28 |
5.037 |
5.035 |
4.427 |
2.213 |
5.570 |
5.567 |
4.900 |
2.431 |
0.32 |
5.029 |
5.036 |
4.464 |
2.218 |
5.554 |
5.510 |
4.923 |
2.416 |
0.36 |
5.046 |
5.053 |
4.502 |
2.212 |
5.493 |
5.472 |
4.903 |
2.395 |
0.40 |
4.981 |
5.000 |
4.476 |
2.204 |
5.455 |
5.445 |
4.898 |
2.363 |
Table 2. When
and
, different
values correspond to the control limit coefficient
表2. 当
,
时,不同
值对应的控制限系数
|
|
|
|
|
|
|
|
|
|
|
0.12 |
5.088 |
5.100 |
4.070 |
2.096 |
5.702 |
5.627 |
4.559 |
2.326 |
0.16 |
5.092 |
5.048 |
4.260 |
2.147 |
5.620 |
5.591 |
4.700 |
2.373 |
0.20 |
5.047 |
5.057 |
4.333 |
2.171 |
5.594 |
5.557 |
4.774 |
2.387 |
0.24 |
5.042 |
5.027 |
4.386 |
2.190 |
5.542 |
5.545 |
4.828 |
2.397 |
0.28 |
5.030 |
5.033 |
4.419 |
2.196 |
5.521 |
5.502 |
4.856 |
2.390 |
0.32 |
5.006 |
4.993 |
4.440 |
2.196 |
5.479 |
5.481 |
4.874 |
2.392 |
0.36 |
4.996 |
5.005 |
4.458 |
2.202 |
5.458 |
5.451 |
4.873 |
2.376 |
0.40 |
5.014 |
4.974 |
4.498 |
2.190 |
5.450 |
5.439 |
4.891 |
2.369 |
如表1、表2所示,Mis-DEWMA p图的控制限系数
总大于MisC-DEWMA p图的控制限系数
。此外,对于上述四种控制图,给定
后,
和
具有相同的递减规律。
Table 3. When
and
, different
values correspond to the control limit coefficient
表3. 当
,
时,不同
值对应的控制限系数
|
|
|
|
|
|
|
|
|
|
|
0.12 |
0.166 |
0.210 |
0.166 |
0.209 |
0.203 |
0.250 |
0.203 |
0.267 |
0.16 |
0.212 |
0.250 |
0.212 |
0.259 |
0.252 |
0.292 |
0.252 |
0.320 |
0.20 |
0.257 |
0.290 |
0.257 |
0.306 |
0.299 |
0.334 |
0.299 |
0.370 |
0.24 |
0.300 |
0.328 |
0.300 |
0.352 |
0.345 |
0.374 |
0.345 |
0.418 |
0.28 |
0.343 |
0.366 |
0.343 |
0.396 |
0.390 |
0.414 |
0.390 |
0.465 |
0.32 |
0.385 |
0.404 |
0.385 |
0.440 |
0.434 |
0.452 |
0.434 |
0.509 |
0.36 |
0.427 |
0.442 |
0.427 |
0.482 |
0.476 |
0.490 |
0.476 |
0.552 |
0.40 |
0.468 |
0.478 |
0.468 |
0.524 |
0.517 |
0.528 |
0.518 |
0.593 |
Table 4. When
and
, different
values correspond to the control limit coefficient
表4. 当
,
时,不同
值对应的控制限系数
|
|
|
|
|
|
|
|
|
|
|
0.12 |
0.152 |
0.194 |
0.152 |
0.182 |
0.178 |
0.222 |
0.177 |
0.219 |
0.16 |
0.197 |
0.233 |
0.197 |
0.228 |
0.224 |
0.263 |
0.224 |
0.270 |
0.20 |
0.240 |
0.272 |
0.240 |
0.274 |
0.269 |
0.303 |
0.269 |
0.318 |
0.24 |
0.282 |
0.310 |
0.282 |
0.318 |
0.314 |
0.342 |
0.314 |
0.364 |
0.28 |
0.324 |
0.347 |
0.324 |
0.361 |
0.357 |
0.380 |
0.357 |
0.408 |
0.32 |
0.366 |
0.385 |
0.366 |
0.404 |
0.399 |
0.419 |
0.400 |
0.453 |
0.36 |
0.407 |
0.422 |
0.407 |
0.446 |
0.441 |
0.456 |
0.441 |
0.495 |
0.40 |
0.448 |
0.458 |
0.448 |
0.487 |
0.483 |
0.493 |
0.483 |
0.536 |
如表3、表4所示,在相同参数条件下,MisC-DEWMA p图的控制限
的值和
的值几乎相等,这表明MisC-DEWMA p控制图监控策略能够有效地调整控制限;Mis-DEWMA p图的控制限
的值比
、
的值大,这表明当采集到的样本数据中存在误分类时,变量确定的控制范围更广。
Table 5. When
and
, the
and
values under different
values
表5. 当
,
时,不同
值下的
和
值

|
|
|
|
|
|
|
|
|
|
|
0.126 |
250.1 (239.6) |
279.4 (269.5) |
247.3 (237.6) |
256.9 (253.8) |
261.7 (256.1) |
289.2 (285.6) |
259.8 (254.7) |
270.0 (273.5) |
0.168 |
231.5 (224.8) |
259.6 (256.0) |
233.7 (226.3) |
240.4 (239.4) |
246.5 (242.2) |
264.9 (258.7) |
246.5 (242.2) |
254.7 (261.8) |
0.210 |
220.0 (213.5) |
244.3 (239.4) |
219.8 (213.3) |
224.0 (216.8) |
233.6 (223.8) |
250.8 (249.7) |
231.4 (222.0) |
243.5 (241.9) |
0.252 |
200.6 (193.9) |
215.2 210.4 |
203.5 (196.9) |
211.7 (210.6) |
215.8 (212.9) |
230.2 (228.6) |
218.7 (216.0) |
233.6 (232.3) |
0.294 |
188.0 (181.7) |
215.2 (210.4) |
187.3 (181.1) |
197.9 (194.6) |
206.0 (201.5) |
219.8 (215.7) |
205.3 (200.3) |
216.4 (216.3) |
0.336 |
174.6 (167.4) |
200.5 (192.1) |
174.7 (167.5) |
185.6 (181.0) |
197.8 (192.7) |
212.8 (208.2) |
197.0 (192.0) |
211.1 (208.1) |
0.378 |
165.3 (159.3) |
196.9 (190.7) |
165.0 (159.1) |
174.1 (170.0) |
184.1 (177.9) |
202.2 (196.5) |
183.9 (177.8) |
199.9 (196.6) |
0.420 |
152.2 (149.1) |
169.2 (165.5) |
153.4 (150.1) |
165.9 (162.6) |
173.6 (169.0) |
186.7 (181.9) |
174.9 (170.4) |
192.3 (190.3) |
Table 6. When
and
, the
and
values under different
values
表6. 当
,
时,不同
值下的
和
值

|
|
|
|
|
|
|
|
|
|
|
0.126 |
210.8 (206.4) |
250.3 (241.7) |
209.5 (205.0) |
221.6 (222.0) |
227.7 (224.6) |
255.8 (251.0) |
225.1 (221.5) |
238.8 (253.1) |
0.168 |
190.7 (183.9) |
217.1 (211.6) |
192.7 (185.8) |
201.5 (198.7) |
205.9 (200.7) |
232.8 (234.0) |
208.1 (203.5) |
223.0 (230.3) |
0.210 |
170.9 (164.0) |
195.1 (187.0) |
173.1 (166.4) |
182.5 (182.0) |
192.8 (189.8) |
210.3 (205.6) |
190.5 (187.5) |
207.2 (216.5) |
0.252 |
157.3 (151.8) |
171.5 (164.0) |
157.3 (151.9) |
170.0 (168.1) |
174.4 (170.1) |
191.8 (186.0) |
175.5 (171.5) |
194.9 (197.8) |
0.294 |
142.5 (137.6) |
158.1 (152.5) |
141.6 (136.4) |
154.4 (152.6) |
163.4 (159.7) |
175.9 (173.0) |
163.1 (159.6) |
181.2 (191.5) |
0.336 |
130.1 (126.2) |
152.9 (147.1) |
129.9 (126.2) |
144.7 (140.5) |
150.1 (146.7) |
170.6 (165.8) |
151.3 (147.8) |
169.3 (169.5) |
0.378 |
118.6 (113.9) |
139.5 (134.3) |
118.4 (113.6) |
132.2 (130.2) |
139.4 (136.1) |
154.2 (149.6) |
139.3 (135.9) |
157.0 (162.6) |
0.420 |
108.6 (104.9) |
121.7 (116.2) |
108.9 (105.0) |
121.2 (119.2) |
130.3 (126.8) |
141.9 (135.7) |
130.8 (127.1) |
146.4 (144.9) |
如表5、表6所示,对于上述四种控制图,增加
和
中任意一个值,都会使
和
的值减小;其次,在相同参数条件下,MisC-DEWMA p图的
和
的值非常接近
和
的值,Mis-DEWMA p图的
和
的值分别大于
和
、
和
的值,且随着
和
的增加,这种差异会越来越大,说明Mis-DEWMA p控制图不适合用来检测OC状态;此外,在相同参数条件下,MisC-EWMA p图的
和
的值分别大于
和
的值、小于
和
的值,这说明MisC-EWMA p图可以降低误分类的影响,但MisC-DEWMA p图检测效果更好。
5. 案例应用
考虑某工厂生产印刷电路板的过程,数据集来源于Montgomery [2],具体数据可见表7。表7中第1至26号样本记录了OC状态下连续采集的26个样本中的不合格品数量;27至46号样本数据记录了过程由OC转为IC状态后的20个新样本对应的不合格品数,样本容量
。因此,可取OC状态运行时间长度为T = 26,IC的为20。又假设样本数据存在误分类(即将合格(不合格)印刷电路板质量特征被错误地记录为不合格(合格)的),所以由OC状态数据(样本号1-26)计算的不合格品率
是带有误分类的。
Table 7. The number of defective printed circuit boards before and after repair
表7. 维修前和维修后的不合格印刷电路板数
样本号 |
不合格品数 |
样本号 |
不合格品数 |
样本号 |
不合格品数 |
样本号 |
不合格品数 |
1 |
21 |
13 |
16 |
25 |
17 |
37 |
18 |
2 |
24 |
14 |
19 |
26 |
15 |
38 |
21 |
3 |
16 |
15 |
10 |
27 |
16 |
39 |
16 |
4 |
12 |
16 |
17 |
28 |
18 |
40 |
22 |
5 |
15 |
17 |
13 |
29 |
12 |
41 |
19 |
6 |
5 |
18 |
22 |
30 |
15 |
42 |
12 |
7 |
28 |
19 |
18 |
31 |
24 |
43 |
14 |
8 |
20 |
20 |
39 |
32 |
21 |
44 |
9 |
9 |
31 |
21 |
30 |
33 |
28 |
45 |
16 |
10 |
25 |
22 |
24 |
34 |
20 |
46 |
21 |
11 |
20 |
23 |
16 |
35 |
25 |
|
|
12 |
24 |
24 |
19 |
36 |
19 |
|
|
选取平滑参数
,
,用公式(4)来表征误分类对不合格品率的影响,规定
,
,其中
(易知,
值越小误分类问题越严重,当
时,
)。利用Monte Carlo方法,模拟计算出上述三种控制图相应的控制限和控制限系数,具体结果见表8。
Table 8. Simulation results of control limit parameters
and control limit values
表8. 控制限参数
和控制限
数值模拟结果
|
Mis-DEWMA p |
MisC-DEWMA p |
MisC-EWMA p |
|
|
|
|
|
|
0.2 |
5.464 |
0.204 |
4.492 |
0.167 |
2.219 |
0.215 |
当系统处于IC状态时,我们计算三种控制图的图统计量样本观测值,如图1所示,三种控制图均作出系统处于IC状态的推断,而且Mis-DEWMA p图和MisC-DEWMA p图的图统计量观测值呈现相似的波动模式,说明MisC-DEWMA p控制图对IC阶段具有鲁棒性,并不影响对IC状态的判定。
Figure 1. Comparison of the application of three control charts in the IC stage
图1. 三种控制图IC阶段的应用对比
而当系统处于OC阶段时,如图2所示,MisC-DEWMA p控制图在第21个观察点处检测到失控信号,Mis-DEWMA p控制图在第22个观察点处检测到失控信号,MisC-EWMA p控制图则未发出报警信号。这说明在MisC-EWMA p和Mis-DEWMA p监控策略下,误分类会淹没或者延迟失控信号,而MisC-DEWMA p控制图监控策略能够有效改善这种不足。
Figure 2. Comparison of the application of three control charts in the OC stage
图2. 三种控制图OC阶段的应用对比
6. 结论
本文主要研究数据存在误分类的小样本过程质量监控问题,首先通过构建误分类修正模型实现误分类的修正,再结合DEWMA p图对过程参数小漂移和小样本量的敏感性,设计了MisC-DEWMA p控制图。模拟仿真和实际应用结果表明:MisC-DEWMA p控制策略显著降低了误分类对控制图检测性能的负面影响,提高了对不合格品率小漂移检测的准确性,减少了检测失控信号所需的次品数量,降低了质检成本,具有重要的应用价值;且相较于Mis-DEWMA p控制图和MisC-EWMA p控制图,MisC-DEWMA p控制图具有更高的准确性和灵感度。
另外,本文假定过程参数漂移大小已知,在实际生产过程中,过程参数漂移大小往往是未知的,后续研究工作可以探讨带有误分类修正的自适应控制图策略,以适应实际生产环境的复杂性。
基金项目
陕西省自然科学基础研究计划资助项目(2024JC-ZDXM-23);长安大学中央高校基本科研业务费专项资金资助项目(310812163504)。
NOTES
*通讯作者。