1. 引言
随着互联网的迅猛发展,电子商务在国民经济中扮演着日益重要的角色。然而,随之而来的是电子商务产品质量问题层出不穷 [1] [2] 。因此,对电子商务产品进行抽样检验变得尤为必要。这种抽样检验不仅确保了电子商务产品的质量状况,也是为了捍卫消费者的合法权益。在这一背景下,设计一套有效的抽样检验方案显得至关重要。
截尾序贯检验方案指样本量不必事先固定,而是根据抽样过程出现的情况来决定何时停止抽样的检验方法。相较于传统固定试验样本量的抽样检验方案方法,截尾序贯检验能够有效的减少平均试验次数,从而减少抽样检验的试验成本 [3] 。许多学者对截尾序贯检验进行了研究。Lorden [4] 提出了两次序贯概率比检验(简称2-SPRT),在渐近意义下解决Modified Kiefer-Weiss问题。此外,文献 [5] [6] [7] 讨论了2-SPRT的渐近有效性等性质。濮晓龙 [8] 等设计了序贯网图检验。Donnelly [9] 解决了序贯检验无法确保最大样本量问题的截尾序贯检验。张可数 [10] 提出了一种基于Neyman-Pearson型序贯概率比检验方法的截尾序贯检验,并通过模拟说明效果比一般的截尾序贯检验要好。但上述方法所得截尾序贯检验方案并不是最优的,那么什么才是截尾序贯最优检验方案呢?在严格控制犯两类错误的概率不超过给定检验水平的情况下,具有最小的平均试验次数的检验方案才是最优的截尾序贯检验方案。
关于截尾序贯最优检验方案的研究中,马海南 [11] 利用穷举法对序贯样本空间进行了全搜索从而求截尾序贯最优检验。Chang, M.N [12] 则在可容许解范围内进行收索求解出截尾序贯最优检验,但是两种方法都存在搜索工作量很大的问题。胡思贵 [13] 建立样本空间排序法(Sample Space Sorting Method, SSSM),该方法是通过在样本空间逐点优化求解最优方案,避免了对序贯样本空间的全搜索,减小了计算工作量,提高了精确性。胡思贵 [14] 表明,采用SSSM求解的截尾序贯最优检验能严格控制两类错误的概率不超过给定检验水平并且充分利用给定的检验水平,有效地降低试验的平均试验次数。对此,本文将采用样本空间排序法设计测量指标服从Poisson分布的电子商务产品的截尾序贯近似最优检验方案,并采用模拟仿真试验对其准确性和可靠性进行验证。
本文余下内容安排如下:在第2节介绍Poisson分布截尾序贯检验的基本概念定义;在第3节采用样本空间排序法求解截尾序贯近似最优检验方案的具体步骤;在第4节算例分析及模拟仿真;第5节为总结部分。
2. Poisson分布截尾序贯检验
设待检验电子商务产品的测量指标发生次数x服从参数为λ泊松分布,概率密度函数为:
(1)
讨论如下假设检验问题:
(2)
设
表示第i个电子商务产品测量指标的发生次数,则
表示试
验进行到n个阶段电子商务产品测量指标的累积发生次数,其服从参数为mλ的Poisson分布,称Sm为Poisson分布的序贯计数检验统计量。
现给出参数为λ泊松分布截尾序贯检验方案的定义
定义1设给定两列单调递增整数列
,且满足
(3)
其中,N是试验次数截尾值,RN为进行到N次试验时拒绝H0所需要的最小累计发生次数,
为截尾序贯检验方案的下上边界点,记
为截尾序贯检验方案,简记为T。
当采用序贯方法对统计假设(1)进行检验时,则停止法则和判断法则为:
当试验次数
时,如果Sn ≤ An,停止实验,接受原假设H0,拒绝备择假设H1;如果An < Sn < Rn,尚不能做出判断,继续实验;如果Sn ≥ Rn,停止实验,拒绝原假设H0,接受备择假设H1。
当试验次数n = N时,如果SN ≤ AN,停止实验,接受原假设H0,拒绝备择假设H1;如果SN ≥ RN,停止实验,拒绝原假设H0,接受备择假设H1。
对截尾序贯检验方案T而言,其犯两类错误的实际概率及平均试验次数为判断检验方案优劣的基本统计特征量。给定检验水平
,其中,α0为H0成立时被拒收的概率上限;β0为H1成立时却被接收的概率上限。则在假设检验(1)下,截尾序贯检验方案T实际犯两类错误的真实概率表示如下:
(4)
其中,犯两类错误的真实概率满足以下条件:
(5)
截尾序贯检验方案T在参数λ下的平均试验次数
的计算表达式如下:
(6)
其中
(7)
其中M表示试验结束时的累计试验次数。
在假设检验中,我们总是希望检验方案犯错误的概率小于给定水平
时,在
处具有最少的平均试验次数。对此给出截尾序贯最优检验方案的定义如下:
定义2设
为检验水平为
的截尾序贯检验,若对任意检验水平为
的截尾序贯检验
均有
(8)
则称
为统计假设(1)的截尾值为N,拒绝H0所需要最小累计计数数目为RN,检验水平为
时的平均试验次数最优的截尾序贯检验。
3. 样本空间排序法求解Poisson分布截尾序贯近似最优检验方案
上一节中,已经给出截尾序贯检验方案实际犯两类错误的概率、平均试验次数的计算表达式以及截尾序贯最优检验的相关定义。接下来将介绍采样本空间排序法求解Poisson分布的截尾序贯检验近似最优方案TS的步骤。
第1步:确定初始解
试验次数截尾值N以及拒绝H0所需要最小累计计数数目RN是事先需要确定的量。对于统计假设(1),给定检验水平
,采用传统假设检验进行抽样检验,检验统计量为Sm。此时当检验犯两类错误的概率均小于检验水平
时,可得试验次数N和初始样本量判别值RN,记为
,对应求解公式如下所示:
(9)
在此基础上,构造满足
的初始方案Tc,将方案Tc记为如下形式。
(10)
第2步:构造边界点的权重函数
在对边界点进行优化之前,需要对边界点的优化先后进行排序,即通过构造权重函数确定“最先需要”优化的边界点。权重函数可表示如下:
(11)
根据Tc的检验边界可分为对上边界点与下边界点的优化两种情形,表示如下:
(12)
其中,
。当优化上边界点会增加犯第一类错误的概率,当优化下边界点会增加犯第二类错误的概率,但无论优化上边界点还是下边界点,都将会减少截尾序贯检验方案的平均试验次数。故当检验犯两类错误的真实概率小于并接近检验水平时,其平均试验次数会尽可能的达到最小。
第3步:迭代求解TS方案
截尾序贯检验方案的检验边界点
与试验设计所要达到的期望风险
相关。在将对点Ui或Lj改进后的方案记为Tc1,重复步骤2直到检验方案犯第一类错误的概率大于α0,或检验方案犯第二类错误的概率大于β0为止。当满足犯两类错误的概率均小于或等于检验水平
的最后一个检验方案即为所求的截尾序贯最优检验方案TS。
4. 算例分析以及模拟仿真
算例1给定检验水平
时,考虑如下统计假设的截尾序贯检验问题:
(13)
当试验次数截尾值N = 10,试验进行到N阶段,拒绝H0所需要的最小累计计数数目RN = 40时,若此时采用经典的固定试验样本量的抽样检验法,实际犯两类错误的概率
,显然此时的平均试验次数为10。若采用样本空间排序法设计的截尾序贯检验方案TS表示如下:
(14)
方案TS实际犯两类错误的概率分别为:
,方案TS在原假设H0以及备择假设H1下的平均试验次数分别为
(15)
对应的方案TS在参数λ下的平均试验次数为
。可以看出,检验方案TS所需要的平均试验次数相较与经典的规定试验样本量的假设检验减少明显,减少61%左右。此外,我们针对在不同检验水平
下,
不同取值组合时的多组试验方案进行计算。此外,为了验证TS方案基本统计指标的准确性和可靠性,采用蒙特卡洛方法模拟计算TS方案统计指标值,并计算TS方案统计指标值与真实值之间的均方误差(Mean Square Error, MSE),计算结果见表1。

Table 1. TS statistical indexes of the truncated sequential approximate optimal test scheme under different test levels and its simulation
表1. 不同检验水平下的截尾序贯近似最优检验方案TS统计指标及其模拟仿真
从表1中可以看到,不同检验水平
下,
不同取值组合时的多组试验方案所犯两类错误的概率均能小于给定的检验水平
,此外相较于固定试验样本量的抽样检验,其平均试验次数减少明显。如NO.21的截尾序贯检验方案平均试验次数减少75%,一半以上的截尾序贯检验方案平均试验次数减少50%以上,从而很大程度上减少抽样检验的试验成本。
当MSE越小,误差越小,越接近于0,即统计指标值与真实值之间越是吻合,表示方案的可靠性越高。从表1中我们可以看出,MSE[α'(TO)]、MSE[β'(TO)]、
的最大值也就在0.0000左右波动,可见本文提出的TO方案具有可靠性和优良性。
5. 总结
本文对测量指标服从Poisson分布的电子商务产品截尾序贯近似最优检验进行了研究。在给定Poisson分布截尾序贯检验的相关定义、评价指标等基础上,采用样本空间排序法对Poisson分布的截尾序贯检验进行求解,所得截尾序贯检验近似最优方案TS具有以下性质:
1) 截尾序贯检验方案TS,实际犯两类错误的概率与设定的检验水平之间差异较小,即对检验水平能充分的利用。因此,其设计的Poisson分布截尾序贯检验方案TS的平均试验次数能尽可能达到最少。
2) 截尾序贯检验方案TS严格控制了实际犯两类错误的概率小于给定的检验水平
。当截尾序贯检验方案中实际犯两类错误的真实概率超过序贯检验水平
的情形,已不是对应检验水平
的检验了。可见,此时所设计的截尾序贯检验方案保证了检验方以及被检验方的利益。
3) 截尾序贯检验方案TS可设置检验水平不相等的情形,实用性更强,为检验者停供一种行之有效的检验方案。