我们知道了在社会调查与研究中,由于多种因素, 使得研究者不可能,常常也不需要对所有调查对象搜集数据,
而只需要从调查对象的群体中抽取代表来搜集数据,
问题是怎么样抽取才有代表性,代表什么呢? 为了获得代表的方法,抽样方法,我们先要
有一些基本的约定,这些约定呢,不仅是抽样的基础工作,
也是人们对样本代表性进行评价的基础,这就是抽样的要素。这一节, 我们讲抽样的要素。
抽样的要素,主要是约定性的, 对约定性的东西,我们学习的方法也有不同,以记忆为主。
希望大家分一些时间,讲授中呢,我也尽可能地想办法,让大家容易记。
第一个要素是总体,什么叫总体,社会调查与研究 有具体的调查对象,研究对象,对吗?通俗地说,
所有对象的集合 就是总体。可是什么是对象呢,社会调查与研究的对象与研究问题又关联在一起,
严格地说,总体指的是研究问题指涉对象的集合体, 也就是研究问题涉及的全部对象。
抽象概念听起来总是不那么容易理解,我们还是来看例子。
CFPS的总体,就是中国所有的家庭户。CGSS的总体呢,
就是中国所有的个体。入学机会的地区不平等的总体,
就是某年所有的高中毕业生。听起来满清楚的对吗? 不过我心里不大有底,这些界定真的很清楚吗?
如果让你马上去操作,你真的觉得
清楚吗?其实,我们还是有不少疑问的,比如说,什么叫中国所有的家庭户,中国所有的个体,
什么叫所有,台湾算不算?香港和澳门算不算?
住在中国的还是有中国户籍的?住在中国的外国人算不算? 长期出国却依然有着中国户籍的人算不算?
什么叫家庭户?没有生活在一起,户口在一起算不算?生活在一起,
户口不在一起的,算不算?怎么才算是某个地方的家庭户?
户口在甲地,却很少在甲地居住,算不算甲地的家庭户? 什么叫所有高中毕业生?没有参加高考的算不算?
在没有参加高考的人中,因为非主观原因而没有参加高考的算不算?等等。
大家课后做做练习,慢慢地,对这类问题就会有敏感性了。
第二个要素,研究总体。
研究总体指什么呢?指可操作的研究对象,可及的总体。
我们还是用前面的例子。CFPS我们把总体定义为中国的家庭户,
指有中国户籍的家庭户,指住在一起的,不管户籍是不是在一起的家庭户。
理论上,既然对象是中国所有家庭户, 我们就应该以中国境内所有的家庭户
为研究对象。问题是,我们有资源找到所有的家庭户吗?
这样,在理想与现实之间就出现了冲突。社会调查与研究活动总是会遇到
这样的问题的。我当年的选择是,选择自愿许可条件下的可及的总体。
我选择了二十五个省市自治区的居住家庭户,为什么把其它的省级单位扔掉了呢?
比如说,西藏、青海、宁夏、内蒙、新疆、海南、
港澳台都不在其中,港澳台属于特殊情况,我们可以暂时不管。
其它的六个省级单位为什么不管呢?理由是地广人稀, 调查一个家庭户的成本实在是太高了,我没有那么多的资源,
那么扔掉以后对整体的推论有多大影响呢?
在当时,六个省级单位的总人口占大陆总人口的比例不到百分之五,
二十五个省级单位的总人口呢,已经覆盖了
大陆总人口的百分之九十五,够了,不会影响到推论的大局。
CGSS的研究总体,覆盖了大陆的所有省级单位,却不一定能覆盖所有的个体。
入学机会的地区不平等研究,研究总体就是中国大陆
某年的高中毕业生,与总体是重叠的,问题是,这些界定真的很清楚吗?
以CFPS为例,家庭户指居住在二十五个省级单位内的家庭户吗?
户籍不在本地的算不算?住又是什么意思呢?住多长算是住? 一个人打工住在本地算是一户吗?
同学们课后继续做一做练习,看还有哪些问题不清楚。
明确了研究总体,接下来要做的就是制定抽样框,又叫抽样总体、框总体。
抽样框,就是从研究总体中获得的用于抽取样本的
研究对象的集合。从确定总体开始,我们再一步一步地 缩小操作范围,总体最大,研究总体呢?比总体要小,
当然有时候,也与总体一样大。现在抽样框可能与研究总体一样大,
也可能,又要小一点。还是用前面的例子,cfps总体是中国所有的家庭户,
研究总体呢,是二十五个省、市、自治区的常住户, CFPS的研究目标是对一个家庭户的综合情况进行调查,
因此呢,家庭户的相对稳定性, 就是确定抽样总体非常重要的参考因素。
有鉴于此,我们选择了常住户。
按照中华人民共和国户籍法的规定和相关的规则, 在一个地方连续居住六个月或以上的家庭户
被叫做常住户,也就是这个家庭户, 会让我们在抽样的时候遇到一些麻烦,比如什么叫户,什么不叫户,
就不是很清楚。CGSS的抽样框呢,则是大陆的常住人口,
入学机会的地区不平等的抽样框呢,则是某年可及的高中毕业生,
抽样框与研究总体是重叠的,与总体呢,也是重叠的。
显然这里又有问题出现了,比如说什么叫常住户,什么叫常住人口。
户籍在本地,工作在外地的算哪呢?偶尔回家又算哪的? 户籍在外地经常来本地居住的算不算?
集体单位算不算?比如军营、学校、监狱等等,依然请同学们课后做一些练习。
到这里,有些同学可能有点糊涂了,没关系,我们来做一个整理,捋一下三者之间的关系。
从覆盖面和覆盖的对象数量出发,
把总体、研究总体、抽样框放在一起,就会发现总体大于或等于研究总体,
研究总体呢,大于或等于抽样框,抽样框的制作,
是一项专门的技术,在抽样技术部分会有所涉及,不过呢,我们这里讲的不会很详细,
理由是过于详细的技术细节超出了 基础课的范围。现在,假设我们有了抽样框,
抽什么呢?CFPS是要抽家庭户的,CGSS呢,要抽个体,入学机会课题
要抽毕业生,这些不同的对象,我们是否可以有一个概念来概括呢? 有的,这就是抽样单位。
抽样单位,就是抽样指涉的基本单位,或包括基本单位的单位集合体。
在抽样中呢,就是样本单位。我们来看例子。
CFPS在抽到家庭户之前还要 抽样本区县,样本村居,每一次抽样面对的基本单位
就是抽样单位。同样CGSS在抽到个体之前,还要抽 样本区县,样本村居,样本家庭户,
每一次抽样面对的基本单位呢,也是抽样单位。
这些界定看起来也很清楚,不急,稍后等到进入抽样实践的时候,大家
又会遇到问题的。为此我还是请大家课后做一些练习,用一个例子试一下,
看会遇到怎样的问题。假设我们已经明确了抽样框、抽样单位,现在是不是就可以进入抽样了?
稍等,在操作之前我们依然需要把原则方法弄清楚。
抽样,就是从抽样框抽取样本的过程。听起来很简单对吗? 同学们可能会反问,有什么困难吗?
有的。抽样之前,我们得知道采用什么样的策略
进行抽样,这就是抽样程序抽样方法的结合。还有呢,采用什么方法抽样。
CFPS和CGSS是大型调查,它的抽样我们会做例子进行讨论,
大家课后呢,可以拿入学机会的课题作为例子来做练习, 除此以外,
同学们最好用自己选定的课题作为例子 来做练习,即使有同学选定的是案例研究的题目,
现在,你也把它修改为抽样调查的题目,练习制定抽样策略和选择抽样方法。
有同学可能马上要问,老师,我的题目怎么改, 既能保证是我的研究兴趣又能够做抽样的练习呢?
原则是,需要用抽样的题目一定是涉及到总体的题目,
具体的建议,请有问题的同学把问题提到研究实践的讨论版上,我们一起来讨论。
一旦我们制定了抽样的策略,选定了抽样的方法,
就可以运用抽样策略和抽样方法抽取样本了。样本是什么,就是从抽样框中运用抽样策略
和抽样方法获取的样本单位的集合,简称样本。
CFPS的样本,就是从二十五个省市自治区
抽取的一百六十个区县样本,从一百六十个区县样本中抽取的
六百四十个村居样本,从六百四十个村居样本中抽取的 一万六千个家庭户样本。
CGSS的样本呢,同样,也是从区县样本
到村居样本,到一万户家庭户样本,再到一万个个体样本。
入学机会课题的样本是什么?是不是高中毕业生样本? 你自己课题的样本又是什么呢?
下面我们对这一节的内容做一个小节,
同学们首先要明白的是,抽样是对研究问题涉及的总体进行调查,搜集数据的一种方法,
涉及抽样的过程呢,也是一个理清楚搜集数据对象的过程,
需要知道到哪里搜集,找谁搜集数据,
在理解抽样原理,掌握抽样方法之前,我们必须明白抽样涉及的基本要素,总体、
研究总体、抽样总体、抽样单位、抽样策略以及样本,
这是一些基本约定,也是我们之间的共识。有了这些基本的共识,后面的活动才好展开。
这一节的内容就到这里,谢谢大家。