在市场细分研究实践中,我们往往遇到的问题就是到底是哪些不同背景(受教育程度、收入、职业等)的消费者在使用我们的产品,他们在消费行为上有什么差异,我们的产品品牌形象与竞争对手相比在消费者心目中究竟是怎样的等等。以往在分析时只是通过交叉列表来表现他们之间的关系。如果仅仅是两个变量,且每个变量类别较少的时候表现的比较清楚,但在每个变量划分有多个类别的情况下就很难直观的揭示出变量之间的内在联系。近年来,对应分析方法的运用则有效的解决了这些问题。
对应分析方法(Correspondence Analysis)又称相应分析是一种多元相依变量统计分析技术,是通过分析由定性变量构成的交互汇总数据来解释变量之间的内在联系的。同时,使用这种分析技术还可以揭示同一变量的各个类别之间的差异以及不同变量各个类别之间的对应关系。而且,变量划分的类别越多,这种方法的优势就越明显。该统计研究技术在市场细分、产品定位、品牌形象以及满意度研究等领域正在越来越广泛的运用。
本文结合啤酒市场细分案例简述对应分析的运用及注意的几个问题。
一、使用SPSS进行分析的基本步骤
1、选择要进行分析的相关变量,调用Crosstab形成交叉汇总表在分析不同消费者对不同啤酒品牌的偏好时,可以把啤酒品牌与消费者的性别、年龄、职业和收入等进行交叉汇总。如得出的下列频次交叉表,如图表1
华丹干啤
华丹11度
雪花
金士百干啤
金士百
哈啤
其它
20-29岁
75
30
9
5
7
1
1
30-39岁
76
42
12
9
7
2
40-50岁
59
46
5
9
3
2
高中/技术学校/中专/职高
119
68
11
14
11
1
大专
54
24
8
8
4
1
1
大学本科
34
25
7
1
2
2
1
研究生及以上
3
1
专业技术人员/教师/医生
46
25
6
2
2
机关事业单位管理人员
15
9
2
1
1
1
机关事业单位一般职员
12
8
2
3
4
企业管理人员
25
15
5
4
5
1
企业普通员工
55
30
5
6
1
1
1
个体/私营业主
32
20
3
5
1
学生
15
6
3
2
1
离退休
3
1
其他
7
5
1
2
2、对交叉表进行整理,调整“野点子”。汇总表中的每一个单元格不能为负数或零,如果有则必须进行必要的类别调整。如本例中离退休与雪花、华丹11度的交叉分析,其结果为零或相比之下极小的频次都会产生偏差,不具有代表性,因此必须采取合并类项的方式加以调整。调整后的交叉表如下表2
SX(属性)\PP(品牌)
华丹干啤
华丹11度
雪花
金士百干啤
金士百
其它
20-29岁
75
30
9
5
7
2
30-39岁
76
42
12
9
7
2
40-50岁
59
46
5
9
3
2
高中/技术学校/中专/职高
119
68
11
14
11
1
大专
54
24
8
8
4
1
大学本科及以上
37
26
7
1
2
2
专业技术人员/教师/医生
46
25
6
2
2
1
机关事业单位管理人员
15
9
2
1
1
1
机关事业单位一般职员
12
8
2
3
4
1
企业管理人员
25
15
5
4
5
1
企业普通员工
55
30
5
6
1
2
个体/私营业主
32
20
3
5
1
1
其他(学生、离退)
25
11
3
2
4
1
3、编制对应分析程序:调用对应分析命令格式编写程序,进行参数设定。
data list free/SX(属性) PP(品牌) freq.
begin data
1 1 75 1 2 30 1 3 9 1 4 5 1 5 7 1 6 2
… … …… ……
11 1 55 11 2 30 11 3 5 11 4 6 11 5 1 11 6 2
12 1 32 12 2 20 12 3 3 12 4 5 12 5 1 12 6 1
end data.
variable labels
SX\'属性\' /PP\'品牌\'.[以属性和品牌这两个变量做对应分析]
value labels
SX 1\'20-29岁\' 2\'30-39岁\' 3 \'40-50岁\' 4\'高中\' 5\'大专\' 6\'本科及以上\' 7\'专业人员\' 8 \'干部\' 9\'事业单位\'
10\'企业管理人员\' 11\'员工\' 12\'其它\'
/PP
1\'华丹干啤\' 2\'华丹11度\' 3\'雪花\' 4\'金士百干啤\' 5\'金士百\' 6\'其它\'.
weight by freq.[以“FREQ”值为权重。]
anacor tables=SX(1,12) by PP(1,6)[属性中包含12个类别、品牌有6个]
/dimension=5
/plot joint.
对应分析中的最大维度数是由变量的最小类别数决定的。行数与列数的最小值减1就是最大维度数。本例最大维度数为6-1=5。
二、对输出结果进行市场细分分析
在以往的分析研究中,我们只能知道某一年龄段不同职业、不同学历的被访者对啤酒品牌偏好的频次,依此进行对比,而在对应分析中结合以下列表和图形就可以更深入、更形象的分析变量类别间的关系。
A N A C O R - VERSION 0.4 BY DEPARTMENT OF DATA THEORY UNIVERSITY OF LEIDEN, THE NETHERLANDS
The table to be analyzed:
1
2
3
4
5
6
华丹干啤
华丹11度
雪花
金士百干啤
金士百
其它
1
20-29岁
75
30
9
5
7
2
2
30-39
76
42
12
9
7
2
3
40-50
59
46
5
9
3
2
4
高中
119
68
11
14
11
1
5
大专
54
2
8
8
4
1
…
…
…
…
…
…
…
…
12
其它
32
20
3
5
1
1、 以上是根据原始数据形成的交叉汇总表。
2、下表为维度关系表或称特征向量表,主要用来表示行分值与列分值之间的相关系数。
Dimension
Singular
Inertia
Proportion
Cumulative
Value
Explained
Proportion
1
.13181
.01737
.452
.452
2
.09635
.00928
.242
.694
3
.08315
.00691
.180
.874
4
.05304
.00281
.073
.947
5
.04495
.00202
.053
1.000
---------
---------
---------
Total
.03840
1.000
1.000
3、由上表可以看出,本例中到第四个维度才可解释全部变量的94.7%以上,因此前两个维度代表的信息量有较多的损失。但考虑到金士百、金士百干啤和雪花的比例并不高,因此从总体上看其绝对作用还是很小的。
4、下表Row Scores:行变量的每一个类别在5个维度的中的分值,该值就是对应分析图中的坐标,分值的大小受每一类别所占比重的影响。
SX
Marginal
Dim
Profile
1
2
3
4
5
1 20-29
.107
.211
.378
-.304
-.080
-.200
…
…
…
…
12 QITA
.038
.594
.244
-.021
-.272
-.351
1.000
1.000
1.000
1.000
1.000
5、对图形的统计分析
下表是对应分析的一个最主要统计结果,形象的把行变量和列变量类别分值分布用坐标图示表示出来。红色(圆点)分布表示属性类别间的差异,绿色(方点)表示品牌类别之间的差异;同时也更加直观的把属性和品牌这两个变量之间的类别联系形象的表现出来。在对应分析中,特征相似的类别会聚集到一起,差异很大的类别会相距较远。

从以上图示可以看出:当地普通啤酒品牌与消费者背景情况之间、品牌与品牌之间、不同的消费者之间的关系。
年龄在30-39岁、学历为高中或中专以上的企业普通员工,机关事业单位的普通干部距离华丹干啤和华丹11度较近,换句话说,这些人比较喜欢华丹;金士百与金士百干啤距离较远,这表明喜欢金士百的消费者与喜欢金士百干啤的人差别较大;华丹干啤、华丹11与金士百和金士百干啤距离较远,说明金士百品牌与华丹品牌有较大差异;从职业来看,事业单位职工与其他职业的消费者之间有较大差异。相比较之下,40-45岁的被访者更偏好金士百干啤;20-29岁的年轻人更喜欢雪花。
应该说,在被访者背景资料的纵向对比中所占比例不大,而在横向对比中所占比例较大;同样对于品牌之间的丛向对比与横向对比所占比例基本一致;本例中的大部分信息主要体现在第一维度上。由于对应分析综合考虑了行比例与列比例的差异,因此在同一图形中表现了品牌与消费者背景间的内在联系。
当然,如果使用SAS软件中的对应分析程序,则会把两个维度所占的行、列比例数值清楚的表现出来。
三、运用对应分析应注意的几个问题
不能用于相关关系的假设检验。它只能说明两个变量之间的联系,而不能说明这两个变量存在的关系是否显著。只是用来揭示这两个变量内部类别之间的关系。
维度由研究者根据变量所含的最小类别数决定,但由于维度取舍不同其所包含的信息量也有所不同,一般来讲如果各变量所包含的类别较少,则在两个维度进行对应分析时损失的信息量最少。
对极端值敏感。
研究对象要有可比性。
变量的类别应涵盖所有可能出现的情况。
对应分析的基础是交叉汇总表,表中的每一个单元格都代表被调查者选择某一答案的频数,也表示行、列的对应关系。对应分析的一个重要前提条件就是表中的每个单元格不能为零或负数。
对应分析、因子分析或主成份分析虽然都是多元统计分析,但对应分析的目的与因子分析或主成份分析的目的是完全不同的。前者是通过图形直观的表现变量所含类别间的关系,后者则是为了降维。
在解释图形变量类别间关系时,要注意所选择的数据标准化方式,不同的标准化方式会导致类别在图形上的不同分布。
公司:吉林省广深市场调查顾问有限责任公司
姓名: 崔胤
职务:总经理
电话:0431-2707651 2707652 13804323869
传真:0431-8906265转804
邮箱:jcmr@263.net jcmr@3see.com
|