1. 引言
电子商务让消费者通过网络实现了足不出户可网上购物和网上支付。与传统线下购物相比,电子商务节省了客户与企业、消费者和商家的时间和空间,大大提高了交易效率 [1] 。现如今,随着网络渠道(如淘宝、京东、抖音电商、天猫、拼多多以及多多买菜等)层出不穷,中国电商交易规模呈线性增长,其中,2016年到2022年中国电商交易规模统计见图1。然而,在电子商务迅猛发展的同时也存在一系列的问题,如电子商务产品质量参差不齐 [2] 、假货率高 [3] 、直播退货率高 [4] 、质量满足不了客户和消费者要求以及产品信息虚假等问题,其实质为产品质量不过关。电子商务产品作为电子商务的核心内容,在如此“卷”的局面中,满足消费者需求才是核心竞争力 [5] 。为保证消费者合法权益不受侵害以及从商家和企业长久利益来看,在产品售卖前和产品验收时对其进行质量检验实验是十分必要的。因此,如何设计一个优良的抽样检验方案成为降低实验成本的关键。
在实际生活中,很多产品的质量指标服从或近似服从正态分布,非常普遍,如机械零部件的尺寸,药品的有效性指标以及设备的误差等。对于该类产品标准差
参数的抽样检验,常用的检验方法有传统固定实验样本量的抽样检验(SN检验)和截尾序贯概率比检验(T-SPRT) [6] [7] [8] [9] 。序贯检验采用“试试看,看试试”的实验策略,由于在实验过程中就能做出统计决策,因此,与SN检验相比,序贯检验方案能大幅度地缩减产品抽样检验的平均试验样本量或平均试验时间 [10] [11] [12] [13] 。

Figure 1. Statistics on the scale of e-commerce transactions in China (100 million yuan)
图1. 中国电商交易规模统计(亿元)
众所周知,在第二次世界大战后期,为提高军工产品的抽样效率和降低抽样成本,Wald提出了一种一般性的序贯检验方法,即序贯概率比检验(SPRT) [14] 。SPRT检验示意图如图2所示,其检验方案由两条平行的直线构成。由于SPRT继续实验区为开放式区域,使其缺乏最大实验样本量的上限值 [10] 。这对试验预算试验成本和控制都带了困难。因此,在实际应用中采用的序贯检验方案一般都是截尾的,例如T-SPRT、2-SPRT、SMT等等。T-SPRT因其构造简单,使用范围广,例如国际标准IEC61124、俄罗斯国准GOSR27.402、我国国家标准GBT2828、国际标准IEC1123等均采用T-SPRT,T-SPRT检验示意图如图3所示。需要说明的是,T-SPRT仍有不足,该检验方案存在检验水平利用不充分或超用的现象。同时,当给定检验水平相同时,方案犯两类错误的概率相差值较大,平均实验样本量达不到最优。
为此,本文对质量指标服从正态分布的产品在均值参数已知时,对标准差
参数的抽样截尾序贯检验进行了研究,给出了改进T-SPRT方案的方法步骤,使得在误差允许范围内对应的截尾序贯检验方案拥有更少的综合平均实验样本量,从而达到提高产品抽样效率,减少抽样检验试验成本的效果。
本文余下内容安排如下:第2节介绍正态分布下标准差
参数的SN检验、SPRT检验以及T-SPRT检验;第3节给出正态分布下标准差
参数的T-SPRT方案的定义,以及建立方案的评价指标体系,在T-SPRT的基础上,对T-SPRT进行改进,给出改进方案的搜索步骤,并进行仿真实验验证其方案的可靠性;第4节将改进的T-SPRT方案与T-SPRT方案进行对比分析;第5节为总结部分。
2. 基本检验方法
设X为产品的质量指标,服从均值为
,标准差为
的正态分布,即
。其中
已知,
未知,对于该类产品标准差
参数的计量型抽样检验,常讨论的假设检验为:
(1)
如(1)式的计量型检验问题,常采用的检验方法有固定样本量的检验法(SN检验)和截尾序贯概率比检验(T-SPRT)这两种。下面对这两种检验方法进行介绍。
2.1. SN检验
若有检验样本
,记检验统计量
,则
,密度函数如(3)式所示:
(2)
设拒绝原假设的临界点为
,则拒绝域为
,给定检验水平
,可建立方程组:
(3)
取定检验水平
后,求解(3)式即可得到
。此时,必须对
个样本进行检验,才能做出实验决策,故该方法称为固定样本量的检验,即SN检验。
2.2. SPRT检验
设
为序贯检验第i次实验时样本
的密度函数,
为似然比,计算公式如下:
(4)
取满足条件
的常数A和B,对不等式
进行对数变换,即可得到序贯概率比检验(SPRT)方案接受线l和拒绝线u的表达式,其表达如下:
(5)
其中,
(6)
此时检验方法的判断规则为:进行到第k次实验,若
,则接受原假设,实验结束;若
,则继续实验;若
,则拒绝原假设,实验结束。该方法称为序贯概率比检验(SPRT),其检验示意图见图2。

Figure 2. Schematic diagram of SPRT inspection plan
图2. SPRT检验方案示意图
2.3. T-SPRT
T-SPRT是在SPRT的基础上进行了强制截尾。当给定样本量截尾值
和成功判别值
后,作直线
与接受线l和拒绝线u相交,作直线
与拒绝线u和直线
相交。此时,SPRT继续实验区域得到了限制,得到的检验方案即为T-SPRT检验方案,其检验示意图见图3。

Figure 3. Schematic diagram of T-SPRT inspection plan
图3. T-SPRT检验方案示意图
当给定
后,
的取值可取为 [15] :
(7)
T-SPRT检验方法的序贯检验准则为,当
时:若
,则接受原假设,实验结束;若
,则拒绝原假设,实验结束。若
,则继续实验;当
时:若
,接受原假设,实验结束;若
,拒绝原假设,实验结束。
3. 改进的T-SPRT
3.1. 方案评价指标
为了更好地评价T-SPRT算法,根据T-SPRT检验示意图和检验准则,定义关于T-SPRT的截尾序贯检验方案如下:
定义1设
和
为(5)式计算出的两列单调不减的实数列。当
,令
。设存在非零常数
满足
。若
时,令
,若
,令
,则称
(8)
为样本量截尾值为
,实验成功判别值为
时,关于T-SPRT的截尾序贯检验方案,简记为T。
记
为第k次实验时,接受原假设的情况。同理可得
为第k次实验时,拒绝原假设的情况。此时,方案T犯两类错误的实际概率计算公式如下:
(9)
其中,
表示截尾序贯检验方案上的概率转移密度函数,其计算公式如下:
(10)
设
。此时,方案T在
和
成立时的平均实验样本量(平均实验次数)
与
的计算公式如下所示:
(11)
对
和
给予相同的权重得到平均实验样本量的综合指标
,计算公式为:
(12)
3.2. 改进T-SPRT的步骤
由图3和公式(9)可知,在不改变斜率a和成功判别值
的情况下,当截距项b2减小(增大)时,拒绝线u往下(上)移,此时拒绝域增大(减小),犯第I类错误的概率会增大(减少);当截距项b1减小(增大)时,接受线l往下(上)移,此时接受域减小(增大),犯第II类错误的概率会减少(增大)。据这一规律,本文考虑对截距项b1和b2分别进行上调和下调处理,具体步骤如下:
第1步:给定检验水平
,根据(3)式和(6)式确定初始值k0、a、b1、b2;
第2步:令
;
第3步:令
为截距项b1初始的变化率;
第4步:令
,此时接受线l的表达式为
,根据该表达式计算出
时对应的接受边界点;
第5步:令
为截距项b2初始的变化率;
第6步:令
,此时拒绝线的表达式为
,根据该表达式计算出
时对应的拒绝边界点;
第7步:按式(13)式计算成功判别值
;
(13)
第8步:根据定义1计算截尾序贯概率比检验方案T;
第9步:根据(9)式计算方案T犯第I类错误的概率和第II类错误的概率;
第10步:若
(当给定的检验水平
时,为保证生产方和使用方双方承担的风险相同,应再增加条件
)时,计算方案T所需的综合平均实验样本量,并储存于集合C,之后令
,重复第6步到第10步,直到
。若
或
,则令
,重复第6步到第10步,直到
;
第11步:若
,则令
,重复第4步到第11步,直到
;
第12步:若
,计算集合C的长度L,若
,则令
,重复第2步到第12步,若
,则跳到第13步;
第13步:找到满足
条件下综合平均实验样本量最小的方案,记为
。
3.3. 应用及仿真验证
例1. 自动机床的加工精度,设计误差指标的均方差
、
、
,取
,
。给出下式检验问题的检验方案。
(14)
解:由(3)式计算SN检验所需的实验样本量
,临界值
。再根据(6)式有
,
,斜率
,截距项
,
。当
时,根据改进的T-SPRT计算可得
,
,
,对应的
方案如下:
(15)
此时,
方犯两类错误的实际概率以及综合平均实验样本量(综合平均实验次数)依次为
,
,
。
令
,根据SPRT检验理论,计算可得SPRT检验方案
为:
(16)
例2. 自动机床的加工精度,设计误差指标的均方差
、
、
,取
,
。给出下式检验问题的检验方案。
(17)
根据(3)式解出的
。当
,取
时,由(6)式有
,
,
。公式(7)得此时的成功判别值
。根据改进的T-SPRT检验法求解出的
,
,
,此时对应的成判别值
,方案
如表1所示。
表2展示的
、
方案的评价指标值及其仿真实验结果,其中SD表示50组仿真实验值的标准差。由该表可知,改进的T-SPRT方案
、
在犯两类错误的概率和综合平均实验样本量的统计计算值和仿真实验值基本一致,表明本文建立的评价指标计算表达式和改进的T-SPRT方案是正确的。此外,
、
方案犯两类错误的概率小于给定检验水平,保护了商家和消费者权益。

Table 2. The evaluation index values and simulation results of T '
表2.
方案的评价指标值及其仿真结果
4. 对比分析
为了更全面直观的比较
与
方案以及
和
方案,绘制了这两组方案综合平均实验样本量
随着待检验参数值
变化的曲线图,其结果如图4所示。

Figure 4. Comparison between T and
on
图4. T、
方案关于
的比较
由图4可知,当待检验参数值
的真实取值在原假设和备择假设的之间时,与方案
和
相比,方案
和
所需的综合平均实验样本量(综合平均实验次数)更少,节省的成本更多。

Table 3. Comparison between T ' and T
表3. T、
方案的比较
表3展示的是在不同检验问题和检验水平下,当样本量(实验次数)截尾值
相等时,求解出的
和
方案。根据该表可知,与
方案相比,
方案能更好的控制犯两类错误的概率,同时所需的综合平均实验样本量也较少,其下降的幅度在10%左右。
5. 总结
为保证消费者合法权益不受侵害以及从商家和企业长久利益来看,本文对质量指标服从正态分布的电子商务产品在均值参数已知时,对标准差参数的截尾序贯检验方案进行了研究。给出了关于标准差
参数T-SPRT的截尾序贯检验方案的定义、方案犯两类错误的概率以及综合平均实验样本量等统计指标的计算表达式。并给出了改进的T-SPRT方案截距项的搜索步骤,并对得到满足要求的截尾序贯检验方案
进行仿真实验。研究表明,其仿真实验评价指标值与统计计算得到的评价指标值基本保持一致,表明本文建立的评价指标计算表达式和改进的T-SPRT方案是正确的。同时,与原有的T-SPRT方案相比,改进的方案
不仅满足了犯两类错误的概率小于给定检验水平的要求,在样本量截尾值相等时,其拥有的综合平均实验样本量(综合平均实验次数)也得到了下降,下降的幅度在10%左右。