多选题又称多重应答(Multiple Response),即针对同一个问题被访者可能回答出多个有效的答案,它是市场调查研究中十分常见的数据形式。对多选题数据的分析除了使用SPSS中的“Multiple Response”命令进行频数分析和交叉分析之外,还可以使用“Data Reduction”命令中的“Optimal Scaling”(最优尺度分析)进行多重对应分析,用以挖掘该数据与其他若干个变量之间的相互关系。
一、多选题数据在SPSS中的录入方式
SPSS软件中对于多选题答案的标准纪录方式有两种:(1)多重二分法(Multiple dichotomy method)即把本道多选题的每个候选答案均看作一个变量Variable来定义,0代表没有被选中,1代表被选中。(2)多重分类法(Multiple category method)即根据被访者可能提供的答案数量来设置相应个数的变量Variable(假设被访者最多只能选择n个不同答案,则在SPSS中设置n个变量用以录入本道多选题数据)。
实际操作中我们基本都会采用第二种数据录入方式,因为大多数被访者只会选择相对少数几个候选答案作为自己所提交的答案,如果我们采用第一种录入方式就显得繁琐,输入数据时也容易出错,尤其是当样本量增大时,不利于提高工作效率。
二、案例介绍
某次市场调研项目中向被访者收集以下数据,A1题为多选题,把上述数据以第二种方式录入进SPSS软件中,其中设置a101、a102、a103三个变量用来录入多选题A1,并定义好相应的变量值标签(Values)如图1。
三、多选题两种数据录入格式的转换
由于只有第一种数据录入方式才是符合统计分析原则的数据排列格式,能够直接进行后续的统计推断,而第二种录入方式只是一种简化纪录方式,需要转化为前者。其转化方法操作如下:
选择菜单File→New→Syntax,在弹出的Syntax对话框中输入相应的命令,其中新变量“a”代表被访者是否选择了“A牌”这个选项(1代表选择,0代表未选择)这样通过上述数据转换,我们就把a101、a102、a103三个旧变量(以第二种录入方式)的数据转化成了a、b、c、d、e 5个新变量(以第一种数据录入方式)的数据,并定义好新的变量值标签(Values),如图2。
四、多重对应分析
现在我们运用多重对应分析方法来研究“购买品牌”(A1题)、“性别”和“年龄”三个变量之间的联系。
选择菜单Analyze→ Data Reduction→ Optimal Scaling ,默认弹出对话框中的设置(如图3),点击Define,选中变量“a”、“b”、“c”、“d”、“e”、“性别”和“年龄”,然后通过点击Define Range ,为每个变量设置取值范围:“a”、“b”、“c”、“d”、“e”、“性别”的取值范围在1~2之间,“年龄”的取值范围在1~5之间(如图4),点击OK 后得到多重对应分析图(如图5)。
在解释多重对应分析图(图5)时要遵从的原则和简单对应分析图类似,具体来说就是:由原点(0,0)出发做四象限图,落在同一象限内的各个变量类别间可能有联系。