广播收听率调查方法与应用(三)
发布日期:2007年05月10日 14:16 来源:赛立信
样本抽取方法
(一)常用的抽样方法
在市场调研中,存在各种可选择的抽样方法,可根据总体的特征、调研的目标、费用预算以及运作的可行性选择一个适当的抽样方法。
1.简单随机抽样(SRS)
简单随机抽样是最基本的概率抽样,是对总体中所有单位按照完全符合随机原则的方法抽取样本。对于简单随机抽样,一个可操作的定义为:从一个随机数字表中按等概率选出n个不同数字,它对应于N个总体元素号码中的n个不同号码。简单随机抽样是统计学抽样理论的基础,总体中的每一个个体都有一个被选做样本的已知的独立的机率。
例如,在N=500个居民户中抽取一个n=10户的简单随机样本,抽样的过程为——
第一步,将总体抽样框中的500户按001-500编号;
第二步,从表2.2.3随机表中的一个随机位置(画框的位置)开始抽样(见随机数字表);
第三步,向下连续地以三个数字为一组摘取数字。
这样,便得到10个三位数字组的简单随机样本:171,102,393,……
不过,在现实的调研中,很少采用简单随机抽样设计。在实际收听率调查中,总体N往往非常大,简单随机抽样不易于做到,首先难以构建一个包含全部所有抽样单元的抽样框,其次采用该方法得到的样本单元比较分散,调查难以实施。另外,考虑到不同样本在年龄、居住地区等方面存在同质性,简单随机抽样所取得的效果也往往不能达到最优。
2.系统抽样(Systematic Sampling)
系统抽样又称等距抽样,其基本方法是:首先将总体中的单位按照某一标识排列,然后随机选定一个起点,以一个固定的间隔选取单位作为样本。
例如,假定要在一座拥有N=640户的居民楼内抽取n=12户进行调查,应用系统抽样法的抽样步骤是:
第一步,计算抽样间距:k=[640/12]=[53.33]=53;
第二步,按照右手规则,确定640户的编号顺序。右手规则是指在行走编号的过程中,始终保持房门在行走者的右端,而且没有遗漏任何一户;
第三步,随机地确定一个编号(假定是84)为样本的第一个单元,每隔53户抽取1户(即间距、步长为53);
这样,所抽取的n=12户样本的编号分别是:84,137,190,243,296,349,402,455,508,561,614,27。
3.整群抽样(Cluster Sampling)
当个别的抽选样本过于复杂,或为了节约运作成本时,可以通过整群抽样来进行,即每个抽样单位中包含若干个样本。简单地说,整群抽样是指将总体按照某种标准划分为一些子群体,以每个子群体作为一个抽样单位。例如,学校学生可以按班级抽选,公司职员可以按工作的群体抽选,城市住户可以按街区抽选,等等。
整群抽样在视听率调查特别是电视收视率调查中被广泛应用。在电视收视率调查中,一般采用以户为抽样单元的整群抽样,对抽中户内的所有符合条件的居民进行调查。例如,央视•索福瑞公司的电视收视率调查,就是对所抽中家庭所有4岁以上的成员,利用人员测量仪或日记法进行调查的。在广播收听率调查中,有时也采用以户为抽样单位的整群抽样,即对抽中户内的所有符合条件的居民进行调查。例如,调查一个地区居民的广播接触率,赛立信的做法通常是对所抽中的家庭所有6岁以上具有收听广播能力的成员进行调查。
4.分层抽样(Stratified Sampling)
分层抽样又称类型抽样,是指先对总体单位分层,然后每一层都按照一定的方法随机抽取部分单位构成样本的一种抽样形式。大体上说,分层抽样包括以下步骤:(1)将整个总体划分成多个相互区别的次级总体,称为“层”;(2)在每一层中,从构成该层的抽样单位中选出一个独立的样本;(3)用每一层得到的样本计算一个单独的层平均数(或其它统计量)。层的平均数经过适当加权就可以得到对整个总体的估计值。
【案例】某年度进行的广东省广播收听率调查
在某年底进行的广东省广播收听率调查项目中,n=2300户的全省代表性样本也采用了分层、多级PPS整群抽样技术。其中,一级分层指标为“地理位置”,将总体划分为四大区域:珠江三角洲、粤东、粤北和粤西;二级分层指标为“非农业人口比例”,将各区域以县(区)为单位划分为城市域(非农业人口≥70%)和农村域(非农业人口<70%);三级分层指标包括:人口规模、6岁以上人口比例、非农业人口比例、人均GDP、人均收入水平等五个指标,将各地区的城市域和农村域划分成若干个小层。
5.多级抽样(Multi-stage Sampling)
多级抽样法也被称为多阶段抽样法,就是在总体单位比较多的情况下,根据总体单位中既定的层次或级别,然后在各个不同的级别(或“层”)中,分多个阶段采取不同的抽样方法进行抽样。先抽大单位,再在大单位中抽小单位,小单位中抽取更小的单位。多级抽样通常结合分层抽样或整群抽样等方法进行,在收听率调查中被广泛应用。例如,赛立信2005年全国50城市广播收听率调查中,就是采用了与分层抽样、等距抽样、整群抽样结合的多级抽样方法(具体做法见“赛立信城市广播收听率调查网的样本抽取方法实例”)。
6.PPS抽样
PPS抽样全称为“与规模的度量成比例的概率抽样”(sampling with probability proportional to size)。在第一阶段,根据所在群的大小,给予各个群不同的中选概率,然后在第二阶段的各个群内以等样本量的方法抽取样本。
例如,要在某一个城市抽选1000户家庭进行家庭收入状况调查,该城市共有50个居委会,拟从5个居委会中各抽200户作为样本。应用PPS法的抽样步骤是:
第一步,以最小户数的居委会为1,按照户数计算第 个居委会的权重 ,即 =该居委会户数/最小居委会的户数;
第二步,计算第i个居委会的中选概率Mi (Mi=Ki/∑Ki ),并据此随机抽取5个居委会;
第三步,在抽中的每个居委会中分别抽取1000/5=200个家庭作为调查样本。
7.非随机抽样(Nonrandom Sampling)
非随机抽样(Nonrandom Sampling)主要包括三种抽样法,即任意抽样、判断抽样和配额抽样,这三种抽样法的共同特点是在抽选样本过程中或多或少地增加了调查者的人为意愿因素,使可能被抽中的样本在调查者事前设定的或可控的范围内。当然,为达到调研目标,调查者使用非随机抽样法,令调查样本的确定带有人为因素,但并不是以调查者操纵调查结果为目的。因此,非随机抽样不适用于收听率调查中。
(1)任意抽样
在任意抽样法中不存在样本设计。这种抽样方法近似于调查人员对他们在街上、商场或者其其它地方偶然碰到的人提问,对调查对象的选择完全由调查者决定。例如,我们在某次乘坐出租车时,询问出租车司机平时习惯收听哪个电台,并了解当时正在收听哪个电台等信息,调查及选择调查对象都是随意的,其抽样方法为任意抽样。
任意抽样法在小样本或小范围调查中常常被用到,而且也很管用。比如,记者需要了解市民对某一事件的态度,随意在街上对行人进行采访。再比如,如果需要寻找使用某一品牌化妆品的消费者,那么以纯粹的随机抽样为基础来进行调查就可能成本太高,采用任意抽样方式相对更为适宜。
(2)判断抽样
在判断抽样法中,调查者对调研中所要求包括的样本作一个简单的判断。这些判断通常由调查者或调研公司去做。例如:需要了解家庭主妇购买食用油的行为习惯和喜好,调查者可以直接在超市购物人群中抽样;需要了解白领收听广播的习惯,邀请一些白领人士参加小组座谈会,调查者可以在大型写字楼实施抽样等等。
判断抽样法在一些对特定群体进行调查的定量研究和小组座谈会形式的定性研究中被经常使用。但是,由于需要调查者在抽样过程中做出某些判断,因此,调查者的调研经验和调研实施方案的合理性,往往对调查能否实现调研目标产生决定性的作用。
(3)配额抽样
在抽样调查中,为了减少或避免因小概率事件造成样本的重大偏差,或者增加对样本的控制和把握,调查者会依据相关的数据及其经验判断,在抽样之前对调查样本做出一些条件限制或量化定额,这种抽样方法称为配额抽样。
配额抽样与判断抽样的区别在于,其对样本结构与总体结构在“量”方面的质量控制,能够保证样本具有较高的代表性。在实际调研中,这种抽样方法通常与其他的随机抽样方法结合起来使用,而且应用十分广泛。如果对总体单位特征(如听众特征)比较明确,并且有相关的数据可以参照,当抽取的样本量不是足够大的话,使用配额抽样法,就能够保证在一定程度上控制调查数据的偏差。有时基于研究目标的需要,例如比较听众对各个电台的满意度,使用配额抽样法设置配额,规定收听各个电台的听众样本量,不仅可以满足研究分析的需要,而且可以节省调研时间和费用。
【案例】某城市的收听率调查,要求记录日记卡的听众样本量n=400,采用分级抽样、配额抽样结合的方式抽样,根据当地的人口结构和以前调查所得到的听众结构数据,确定受访者的配额要求如下:
(二)城市一次性的广播收听率调查的样本抽取方法
在城市一次性进行的收听率调查中,调查总体是市辖区内6岁及以上的、有广播收听能力的人口,样本抽取方法主要是采取分层抽样、系统抽样、整群抽样相结合的多级抽样方法。具体做法是:
第一阶段:随机抽出抽样小区
1.取得调研城市的人口及各区的人口分布数据,将该城市的样本量按各区人口比例分到各区;
例如:在广州市抽取500户进行收听率调查,分配到各区的样本为:
2.通过城市地图,将所在城市的各个区划分成面积大致相等的N个地块,为抽样小区,并将各抽样小区按照一定的顺序排列;
3.为了保证样本的地区分布比较均匀,规定每个抽样小区的样本量为10户,则每个区需抽出的小区数量n=该区的样本数量÷10;
4.以K=N/n为步长,随机起点,每隔K抽出一个小区,作为抽中的抽样小区。
例:广州市东山区,需抽样75户,共划分出35个抽样小区,则需抽出的小区为n=75÷10≈8个,步长K=35÷8=4.375(4),若以9为起点,抽中的小区如下:
第二阶段:实地抽样,随机抽出家庭样本
1.在抽中的小区范围内,以任意点为起点,右手原则,按住户地址顺序,每隔五户抽一户(即步长为5);
2.抽样员敲门进入被抽中的住户,说明来意,请求其配合接受访问;
3.若抽中的住户不接受访问,则放弃该样本,然后再间隔5户抽选下一住户,直至完成该小区的5户抽样。
第三阶段:入户访问,抽取家庭样本
1.根据甄别问卷规定的程序和要求实施抽样,首先将家庭人口按照年龄从大到小列出。
例如:某项收听率调查甄别问卷(摘选)
2.若使用配额抽样,则根据配额情况在该户中选出符合条件的受访者;若使用随机表抽样,则根据随机表抽出受访者。
例如:某项收听率调查甄别问卷(摘选)
访问员注意:根据以上抽样表按照要求抽出受访者,并在相应的家庭成员序号上划圈。
(三)城市固定样本组的样本抽取方法
在进行全年连续不间断或每月一次的收听率调查时,往往需要采用固定样本组的方式,即一次性抽取足够的样本户(包括正式样本户和备用样本户),首先将正式样本户相对固定下来连续记录日记卡,然后定期按照一定的比例从备用样本中更换。利用固定样本组进行收听率调查,样本抽取通常分两个阶段进行,第一阶段是从全部城市居民家庭中抽取基础研究样本,建立样本库,作为第二阶段抽样的样本框;第二阶段,从样本框中抽出用于实施收听率调查的样本,生成固定样本组。
1.基础样本库的样本抽取方法
建立基础样本库的作用在于,一是用于收听率调查前及定期(通常为一年一次)进行的基础研究,二是作为抽取固定样本组的样本框,三是为固定样本组的轮换和控制提供依据。
基础样本库的样本抽取方法主要是采取多阶段PPS抽样方法。具体做法是:
(1)抽取居委会或村委会
第一步:从当地民政局、统计局、公安局(派出所)等机构取得全市调查总体范围内的居委会或村委会名单,以及各个居委会或村委会的总户数;
第二步,将所有的居委会或村委会按照一定的标志(如按照行政区划、所在位置等)排列,形成抽样框。例如表2.2.4;
第三步:计算抽样间距K=N/n。即计算每隔多少户抽选一个居委会或村委会,在这里,K=全市调查总体范围内的居委会或村委会总户数÷需抽选的居委会或村委会数。例如,某城市居民总户数为114280户,需抽选的居委会或村委会数为10个,则K=114280÷10=11428,即抽样间距K为11428。
第四步:确定抽样起点。在抽样间距范围内随机选取一个数字,作为抽样起点。在上例中,是在0–11428之间随机选取一个数字,如以K/2=11428÷2=5714为抽样起点。
第五步:抽取居委会或村委会。首先通过抽样起点找到第一个居委会或村委会,然后按照抽样间距K分别抽出其他的居委会或村委会。在上例中,首先在表2.2.4中“累计户数”栏找到第一个大于或等于5714的累计户数,其对应的居委会或村委会即为第一个被抽中的居委会或村委会;然后,按公式:Li=5714+i×11428(i=1,2,3,…,9),分别计算出第二至第十个抽样点数值为5714、17142、28570、39998、51426、62854、74282、85710、97138、108566,再分别在“累计户数”栏找到的大于或等于上述数值的累计户数,各自在其对应的居委会或村委会即是被抽中的居委会或村委会。如表2.2.4。
(2)抽取家庭户
第一步:将以上抽中的居委会或村委会重新排列,如表2.2.5;
第二步:按照各居委会或村委会的户数占总户数的比例,计算出各居委会或村委会需抽的样本数,如表2.2.5。
第三步:计算抽样间距K=N/n。在这里,K=抽中的居委会或村委会总户数÷需抽选的样本户数。例如需抽取的样本总数为2000户,则K=26107÷2000=13.05,即抽样间距K为13。
第四步:实施实地抽样,抽出家庭户地址。实地抽样的具体做法是:在抽中的居委会或村委会范围内,以任意点为起点,右手原则,按住户地址顺序,每隔一个抽样间隔(本例中抽样间隔K即步长为13)抽一户,详细询问并记录家庭地址及家庭基本情况,如户主姓名、家庭人口数、电话等。
第五步:将所有抽中的家庭户按照居委会或村委会的顺序和抽样顺序登录到表格中(如表2.2.6),并输入到电脑,生成样本库。
江南区第4居委会
2.固定样本组的抽样方法
当有了城市基础样本库以后,利用基础样本库进一步抽取作为固定样本组的样本,便是轻而易举的事情了。抽样的基本步骤如下:
第一步:根据所需的样本量,确定抽样间隔K。在上例中,若城市固定样本组收听率调查的样本总数为300户,考虑到可能出现的不符合条件(比如没有收听广播的家庭等)、拒访以及样本轮换等因素,一般需要增加100个备用样本。因此,抽样间隔K=2000÷400=5。
第二步:按照基础样本库的排列顺序,随机确定抽样起点,每隔5户抽选1户,直至抽够所需的样本数量为止。
第三步:依据样本甄别条件对抽中的家庭户进行甄别,对于符合条件、愿意接受调查者,可作为收听率调查的正式样本,构成固定样本组。
——转载自黄学平主编的《广播收听率调查方法与应用》
作者单位:赛立信媒介研究有限公司
出版社:中国传媒大学出版社出版