分层随机抽样中九个非常实用的R函数
Nine Very Practical R Functions in Stratified Random Sampling
DOI: 10.12677/AAM.2022.111062, PDF,    国家自然科学基金支持
作者: 崔 娅*:重庆大学数学与统计学院统计与精算学系,重庆;张应应*#:重庆大学数学与统计学院统计与精算学系,重庆;重庆大学分析数学与应用重庆市重点实验室,重庆
关键词: 分层随机抽样总体均值和总体比例点估计和区间估计样本量的确定及分配R函数Stratified Random Sampling The Population Mean and Population Proportion Point Estimation and Interval Estimation Determination and Distribution of Sample Size R Function
摘要: 分层抽样技术是在实际工作中应用得非常广泛的抽样技术之一。但在文献中,还没有方便地可以用于在分层随机抽样中仅给定基本的样本数据时就能解决总体均值和总体比例的点估计和区间估计问题,计算总体均值时样本量的确定及分配问题,计算总体比例时样本量的确定及分配问题,事后分层抽样下总体均值和总体比例的点估计和区间估计等问题通用的R函数。本文自编了九个通用的R函数:Compute_Y_bar_st()、Compute_Y_bar_prop_from_y_bar_h_s_h_st()、Compute_Y_bar_srs_pst()、Compute_P_st()、Compute_P_from_a_h_st()、Compute_P_srs_pst()、Compute_nh_given_n_Y_bar_st()、Compute_n_nh_Y_bar_st()及Compute_n_nh_P_st(),它们将会为需要使用分层抽样技术以提高估计精度进行实际问题分析的使用者提供极大的方便。
Abstract: Stratified sampling technique is one of the sampling techniques widely used in practical work. But in the literature, there are no convenient generic R functions to solve the problem of point estimation and interval estimation of population mean and population proportion, the problem of total sample size and each layer sample size when calculating population mean, the problem of total sample size and each layer sample size when calculating population proportion, and the problem of point estimation and interval estimation of population mean and population proportion in post-stratification sampling, in stratified random sampling when only basic sample data are given. We compile nine generic R functions: Compute_Y_bar_st(), Compute_Y_bar_prop_from_y_bar_h_s_h_st(), Compute_Y_bar_srs_pst(), Compute_P_st(), Compute_P_from_a_h_st(), Compute_P_srs_pst(), Compute_nh_given_n_Y_bar_st(), Compute_n_nh_Y_bar_st(), and Compute_n_nh_P_st(), which will provide great convenience for users who need to use stratified sampling technology to improve the estimation accuracy for practical problem analysis.
文章引用:崔娅, 张应应. 分层随机抽样中九个非常实用的R函数[J]. 应用数学进展, 2022, 11(1): 546-565. https://doi.org/10.12677/AAM.2022.111062

参考文献

[1] 金勇进, 石可. 极小信息量下分层抽样的样本分配的一个案例[J]. 统计研究, 2000, 17(2): 56-60.
[2] 闫在在, 马俊玲. 分层抽样下的分别乘积估计和联合乘积估计(英文) [J]. 工程数学学报, 2001(3): 133-135+109.
[3] 苟鹏凰. 关于分层抽样的一点思考[J]. 统计研究, 2005(11): 16-17.
[4] 黄莺, 李金昌. 双重分层抽样中的校正估计[J]. 统计研究, 2008(7): 66-69.
[5] 张宁. 分层抽样下的样本轮换理论研究[J]. 统计与信息论坛, 2008, 23(4): 33-36.
[6] 王克林. 存在测量误差时分层抽样层均值方差的估计[J]. 统计与信息论坛, 2011, 26(3): 16-20.
[7] 张建军, 乔松珊. 辅以排序集样本的分层抽样方法研究[J]. 统计与信息论坛, 2012, 27(5): 14-18.
[8] 陈兵, 吕恕. 有辅助信息可利用时的分层抽样下样本轮换研究[J]. 统计与决策, 2014(15): 13-15.
[9] 李林蔓. 分层抽样下样本量的分配方法研究[J]. 统计与决策, 2015(19): 18-20.
[10] 梁敏, 刘建平. 敏感问题的分层抽样方法探讨[J]. 统计与决策, 2017(5): 12-15.
[11] 李广丽, 朱涛, 袁天, 滑瑾, 张红斌. 混合分层抽样与协同过滤的旅游景点推荐模型研究[J]. 数据采集与处理, 2019, 34(3): 566-576.
[12] 金勇进, 蒋妍, 李序颖. 抽样技术[M]. 北京: 中国人民大学出版社, 2002.
[13] 孙山泽. 抽样调查[M]. 北京: 北京大学出版社, 2004.
[14] 杜子芳. 抽样技术及其应用[M]. 北京: 清华大学出版社, 2005.
[15] 杜智敏. 抽样调查与MATLAB和SPSS应用[M]. 北京: 电子工业出版社, 2010.
[16] 李金昌. 应用抽样技术[M]. 第三版. 北京: 科学出版社, 2015.
[17] 杨贵军, 尹剑, 孟杰, 王维真. 应用抽样技术[M]. 第二版. 北京: 中国统计出版社, 2020.
[18] R Core Team (2022) R: A Language and Environment for Statistical Computing. R Foundation for Statistical Computing, Vienna.
https://www.R-project.org
[19] 薛毅, 陈丽萍. 统计建模与R软件[M]. 北京: 清华大学出版社, 2007.
[20] 崔娅. 分层抽样的R软件实现[D]: [学士学位论文]. 重庆: 重庆大学, 2021.