1. 引言
在抽样调查中,对于调查变量Y,常用样本均值
来估计总体均值
,称为一般简单估计,而得到调查变量Y的最优估计一直是抽样调查的重要研究课题。Singh与Pal [1] 研究应用指数估计法在两种情况下的连续性抽样的最优估计。Singh与Priyanka [2] 提出了基于两次抽样结果的可提高估计精度的估计模型。Priyanka [3] 等为了解决无响应问题,提出了一类单参数插补技术,并提出了相应的点估计。Nath [4] 在两相抽样中使用折衷插补方法,并用比率加乘积估计人口平均数,进一步讨论了所提出估计量的优良性。
当已知一些辅助信息,并满足一些特定条件时,例如基于与调查变量Y相关性较强的辅助变量X,可用比估计
,回归估计
来估计总体均值
,在一定条件下,比估计与回归估计的估计量的均方误差小于一般简单估计的方差,即提高了估计的精度 [5] [6] [7]。文献 [8] - [16] 分别提出了估计总体均值时改进的比估计与回归估计方法,各种估计结果如表1所示。

Table 1. Various estimators of population mean and mean squared error of the estimators
表1. 各种总体均值估计值与估计值的均方误差
其中a,b为任意实数,
,
分别为调查变量Y与辅助变量X的变异系数,
为调查变量Y与辅助变量X相关系数,一般简单估计和比估计均可以看作是这些估计值的特例,文献 [8] - [17] 均进一步讨论了这些估计值的性质及最优的估计量。若在抽样框中不已知辅助变量X的值,或者不存在与调查变量相关性较高的辅助变量X,基于调查变量Y的变异系数
,其中
是调查变量Y离散程度的一个归一化度量值,本文给出广义均值估计的定义,而且一般简单估计也可以看作广义均值估计的特例,进而进一步讨论广义均值估计的最优估计量。
2. 广义均值估计
2.1. 广义均值估计的定义及性质
定义1. 调查变量Y的均值的广义均值估计为
,其中
为样本均值,k为任意实数。
定理1. 调查变量Y的均值的广义均值估计
是总体均值
的有偏估计。
证明:
,其中k为任意实数。□
可见,当广义估计
中的k = 1时,广义估计即为简单随机抽样中的一般简单估计,并且是总体均值
的无偏估计。
定理2. 调查变量Y的均值的广义均值估计
的均方误差
为
其中N为总体中个体的个数,n为样本容量,
为调查变量Y的变异系数。
证明:
□
2.2 广义均值估计的最优估计量及均方误差
定理2. 设调查变量Y的变异系数为
,则总体均值的广义均值估计
的最优估计
为
证明:由定理2中的结论可知,当
时,可解出广义均值估计
均方误差
的极值,
即
。□
推论1. 调查变量Y总体均值的广义均值估计的最优估计
的均方误差
为
证明:
□
可见广义均值估计的最优估计量的设计效率Deff为
3. 一个应用例题
若调查某高校学生的月消费情况Y(单位:元),该高校共有在校学生30,000人,现采用简单随机抽样方案,随机调查1000名学生,得到数据
· 按照一般简单估计,估计每位高校学生每月的月消费情况的平均值为
并且一般简单估计的均方误差的估计值为
· 按照广义均值估计,首先调查变量Y的变异系数
的估计值为
则应用广义均值估计的最优估计量,来估计每位高校学生每月的月消费情况的平均值为
并且广义均值估计的最优估计量均方误差的估计值为
由此可见广义均值估计的最优估计量与一般简单估计比较,偏差不大,并且广义均值估计的最优估计量的均方误差小。
4. 总结
1) 本文讨论广义均值估计,显然一般简单估计是广义均值估计的特例,并且基于调查变量Y的变异系数为
,可确定广义均值估计中参数k的值,使得广义均值估计的均方误差达最小,即解出广义均值估计的最优估计量。与一般简单估计的抽样误差相比,广义均值估计的最优估计量的设计效率Deff ≤ 1,因此广义均值估计的最优估计量是优于一般简单估计的。在实际应用中若不已知调查变量Y的变异系数为
,可用样本变异系数来估计总体的变异系数
。
2) 若在抽样框中已知与调查变量相关性较高的辅助变量X的值,今后工作中还可以进一步结合文献 [8] - [17] 中的结论,讨论广义均值比估计
,
,或者广义均值回归估计
,
等等。
3) 若在抽样框中已知与调查变量相关性较高的两个辅助变量
与
的值,结合文献 [17] 中的结论今后工作中还可以进一步讨论广义均值比估计
,
等等。
基金项目
国家自然科学青年基金《不定度量子流形的相关问题研究》,项目批准号:NSFC 1180106。