2024年5月1日发(作者:)
抽样方法的比较与应用
彭兴俊 江苏省大丰高级中学224100
统计的基本思想方法是用样本估计总体,即当总体容量很大或检测过程具有一定的破坏
性时,不直接去研究总体,而是通过从总体中抽取一个样本,根据样本去估计总体的相应情
况.因此,样本的抽取是否得当对研究总体来说十分关键,掌握正确的抽样方法是十分重要的.
抽样方法主要有三种:简单随机抽样、系统抽样和分层抽样,它们的特点、联系及适用
范围参见下表:
类别 共同点 特 点 相互联系 适用范围
简单
系统抽样、分层抽样的基
随机从总体中逐个抽取 容量较小的总体
础
抽样过
抽样
程中每
将总体平均分成几部
个个体
系统分,按事先确定的规在起始部分抽样时采用简
被抽取容量较大的总体
抽样 则分别在各部分中抽单随机抽样
的可能
取
性相同
分层将总体分成几层,按各层抽样时采用简单随机总体容量较大且由差异
抽样 各层个体数之比抽取 抽样或系统抽样 明显的几部分组成
下文将具体分析三种抽样方法的特点、区别与联系、适用范围等等.
一、简单随机抽样 设一个总体的个体数为N.如果通过逐个抽取的方法从中抽取一个样
本,且每次抽取时各个个体被抽到的机会相等,就称这样的抽样为简单随机抽样.
简单随机抽样是系统抽样和分层抽样不可或缺的基础,如何实施简单随机抽样有两种常
用方法:抽签法和随机数表法.用抽签法抽取样本过程中,每一个个体被抽到的机会是均等
的,这也是一个样本是否具有良好的代表性的关键前提.没有每个个体机会均等,就没有样本
的公平性和合理性.同抽签法抽取样本一样,用随机数表法抽取样本的过程中, 关键也是要保
证每一个剩余个体被抽到的机会是均等的,这就要求:随机数表的确是随机产生的,不含人为
因素在内;在选择随机数表中开始位置和方向时,也要保证随机性,如果在看过随机数表后再
使用,所抽取的样本就失去了公平性,也就没有实际意义了.
对简单随机抽样的说明:
它是不放回抽样;它是逐个地进行抽取;它是一种个体机会均等的抽样;简单随机抽样
适用于总体中的个体数不多的情况.
生活中有许多用抽签法或类似抽签法的案例,如彩票摇奖、电视节目中电话号码抽奖、
纳税凭证抽奖等.
抽样时也要防止出现貌似合理的抽样方法,如到某星级宾馆问卷调查客人的收入情况来
推断该地区的人均收入,或每隔一周到某一路口调查当地车流量等等.
二、系统抽样 当总体中的个体数较多时,可将总体平均分成几个部分,从每个部分抽取
一个个体,得到所需的样本,这样的抽样方法称为系统抽样.
从总体中抽取一个样本来估计总体,样本的抽取是否公平合理固然重要,样本抽取的方
法是否经济可行也是十分重要的.面对容量很大的总体,抽取的样本容量显然不可太小,此时
采用简单随机抽样是不经济也不可行的,这种情况下采用系统抽样也就更为合理可行.系统抽
样以简单随机抽样为基础,通过将容量很大的总体分组,只需在某一个组内用简单随机抽样方
式来抽取一个个体,然后在一定规则下就能抽取出全部样本,在保证公平客观的前提下简化抽
样过程.
案例1 某校高一年级有20个班,每班有50名学生.为了了解高一学生的视力状况,从这
1000人中抽取一个容量为100的样本进行检查,应该怎样抽样?
分析 抽取方式可能有:1)以班级为单位,在每个班级内采用随机抽样方法来获取5人
样本,最后汇总形成100人的所需样本;2)在班级抽样时,可以将50人按学号分成10组,
分别由每组随机抽出一个个体来组成10人样本.
这两种抽样方式,虽然总体工作量还是大,但每个班级的每个小组的工作量却很小,也
基本能保证样本的公平性.主要因为参与抽样的人多了,易受到人为因素影响.
进一步分析 如果在某个班级由学号分成的10个小组中任取一个小组来,采用随机抽样的
方式抽出一名学生,其他小组直接抽出与这位学生学号个位数一致的学生,最后在其余班级中
找出与该班级学号一致的学生共同组成样本.思考:这样做是否合理? 对其他小组的其他学生
而言是否公平?
从而,系统抽样方法为:先将容量较大的总体平均分成容量较小的几个小组,在某一个
小组内用简单随机抽样的方法来抽取一定个体,再按一定规则从其他小组抽出同样数量的个
体,最后组成样本.这样,使得整个抽样过程大大简化.
对系统抽样的说明:
①系统抽样适用于总体中的个体数较多的情况,它与简单随机抽样的联系在于:将总体均
分后的每一部分进行抽样时,采用的是简单随机抽样;
②与简单随机抽样一样,系统抽样是等可能抽样,它是客观的、公平的;
③总体中的个体数恰好能被样本容量整除时,可用它们的比值作为系统抽样的间隔;当总
体中的个体数不能被样本容量整除时,可用简单随机抽样先从总体中剔除少量个体,使剩下的
个体数能被样本容量整除在进行系统抽样.
案例2 某单位在岗职工共624人,为了调查工人用于上班途中的时间,决定抽取10%的
工人进行调查.如何采用系统抽样方法完成这一抽样?
分析 因为624的10%约为62,624不能被62整除,为了保证“等距”分段,应剔除4人.
解 1) 将624名职工用随机方式进行编号;
2) 从总体中剔除4人(剔除方法可用随机数表法),将剩下的620名职工重新编号(分
别为000,001,002,……,619),并分成62段;
3) 在第一段000,……,009这十个编号中用简单随机抽样确定起始号码i
0
;
4) 将编号为i
0
,i
0
+10,……,i
0
+610的个体抽出,组成样本.
系统抽样适合于容量较大而差异不太大的总体,而现实生活中,许多总体的容量非常庞
大,甚至不可数,如测量某一棉田中棉株的平均高度,测量某一路口在某一时段的车流量等,
这时用简单随机抽样已无法完成抽样,那么可以用系统抽样的方法.测量某一棉田中棉株的平
均高度,其样本的抽取可采用如下方式:先确定所要测量的样本容量大小(n),测量这块棉
田中所有行的长度之和(S),然后从第一行第一株开始,每隔S/(n-1)距离就测一株棉花的高
度,也就能得到全部样本的高度.测量某一路口在某一时段的车流量,其样本采集可用类似方
式:每隔3天(从测量的第一天开始,在第1,4,7,……天测量),测量n次后,就可获得
一个容量为n的样本.在确定时间间隔时,要考虑如下因素:车流量变化一般以周为周期,还
受季节气候的影响.
三、分层抽样 一般地,当总体由差异明显的几部分组成时,为了使样本更客观地反映
总体情况,常将总体中的个体按不同的特点分成层次比较分明的几部分,然后按照各部分所占
的比实施抽样,这种抽样方法叫做分层抽样,其中所分成的各个部分叫做层.
分层抽样同样以简单随机抽样为基础的一种抽样方式,对于容量较大、个体差异不明显
的总体通常采用系统抽样方法,但对于许多容量较大、个体差异较大且明显分成几部分的总
体,系统抽样虽然保证公平性和客观性,但样本还是不具有良好的代表性,这时就考虑用分层
抽样的方法来抽取样本.
案例3 某电视台在因特网上就观众对某一节目的喜爱程度进行调查,参加调查的总人数
为12000人,其中持各种态度的人数如下表所示:
很喜爱 喜 爱 一 般 不喜爱
2435 4567 3926 1072
电视台为进一步了解观众的具体想法和意见,打算从中抽取60人进行更为详细的调杳,
应怎样进行抽样?
分析 因为总体中人数较多,所以不宜采用简单随机抽样,又由于持有不同态度的人数差
异较大,故也不宜用系统抽样方法,而以分层抽样为妥.
解 可用分层抽样方法,其总体容量为12000.
“很喜爱”占2415/12000,应取60×2415/12000≈12人;
“喜爱”占4567/12000,应取60×4567/12000≈23人;
“一般”占3926/12000,应取60×3926/12000≈20人;
“不喜爱”占1072/12000,应取60×1072/12000≈5人.
发布者:admin,转转请注明出处:http://www.yc00.com/web/1714506070a2459518.html
评论列表(0条)