首  页 调研公司 培训会议 行业情报 付费报告 免费报告 调研文库 求职招聘 执行峰会 邮  箱 论  坛 搜  索
IT、液晶 | 电信增值 | 网络无线 | 饮食烟酒 | 家电、3C | 电子电工 | 2008报告预订(|)
我的帐户 | 购买帮助 | 购物车 | 忘记密码
              
3see网首页  >>  调研文库
房地产行业顾客客户信息的数据挖掘
出处:北京大视野社会经济调查有限公司  发布日期:2003年01月11日 00:00

  文章摘要:信息资源的分析、整合在房地产行业的竞争中起着越来越重要的作用。数据挖掘作为一种系统地检查和理解大量数据的工具,能有效地帮助房地产企业从不断积累与更新的数据中提取有价值的信息。因此,数据挖掘被引入到房地产市场研究领域,并日益受到重视。本文从数据挖掘在房地产行业中的市场研究价值入手,分析了数据挖掘在房地产市场研究尤其是客户信息中的应用,并加以举例说明。

关键词:数据挖掘 关联分析 分类


  Abstract: Information analysis and integration plays a more important role than before in the Real Estate competition. As a kind of effective data analysis tools, Data Mining can be very helpful to pick-up the valuable information from the continually increasing data store of Real Estate company. So Data Mining is gained more and more focuses in Real Estate market research. This article introduce the application value of Data Mining in Real Estate. And presenting with a case, this article analyze the actual application of Data Mining in Real Estate market research especially in its customer information research .

Key words: Data Mining Association Analysis Classification

一、房地产行业需要数据挖掘技术的支持

  随着房地产行业竞争的加剧,房地产企业要想在竞争中制胜,必然需要充分的信息支持和准确的市场判断。房地产行业拥有大量的数据积累,包括行业信息、经济环境信息、客户信息等。这些数据是房地产企业市场运作的重要参考。面对快速增长的海量数据收集,企业需要有力的数据分析工具将“丰富的数据”转换成“有价值的知识”,否则大量的数据将成为“数据丰富,但信息贫乏”的“数据坟墓”。

  数据挖掘(Data Mining)是从大量数据中发现潜在关联、模式,做出预测性分析的有效工具,它是现有的一些人工智能、统计学等技术在数据库领域中的应用。应用数据挖掘有助于发现业务发展的趋势,揭示已知的事实,预测未知的结果,并帮助企业分析出解决问题所需要的关键因素,使企业处于更有利的竞争位置。

二、数据挖掘在房地产行业的应用

1.数据挖掘的概念

  对于企业的海量信息存储,数据挖掘是一种系统地检查和理解大量数据的工具。数据挖掘根据预定义的商业目标,对大量的企业数据进行探索和分析,揭示其中隐含的商业规律,并进一步生成相应的分析、预测模型。

  数据挖掘发现的是以前未知的、可理解的、可执行的信息,所以也被称为“知识发现”(Knowledge Discovery in Databases)。与统计分析技术相比,数据挖掘技术能很好地和数据库技术相结合,而且数据挖掘工具用以发现数据中隐含的商业规律的方法已不局限于统计技术,还包括神经网络、遗传算法、自组织图、神经模糊系统等统计学科以外的方法。数据挖掘发现的“知识”一方面可以用于构建预测模型,另一方面可以被用于丰富统计分析师的背景知识,再被统计分析师应用到数据分析中。

  数据挖掘任务一般可以分两类:描述和预测。描述性挖掘任务刻划数据库中数据的一般特性。预测性挖掘任务在当前数据上进行推断,以进行预测。具体来讲,数据挖掘主要用于解决以下几种不同事情:

  (1)关联分析(Association analysis),是寻找属性间的相关性。两种常用的技术是关联规则和序列模式。关联规则是寻找在同一事件中出现的不同项的相关性,比如某个住宅项目的目标客户对该项目各方面评价之间的相关性序列分析寻找的是事件之间时间上的相关性,如对股票涨跌、房地产周期的分析。

  (2)分类 (Classification)和预测(Prediction)。分类根据某种标准将数据库记录分类到许多预先定义好的类别中。例如,将房地产企业客户根据消费决策模式进行分类;同时可以建立预测模型,给定潜在客户的收入、职业、家庭构成等个人属性,预测他们在购房支出;如将房地产企业客户分为潜在客户、购买者和实际客户。分类系统可以产生这样的规则:“如果客户可以并且愿意承担每月2000元的月供,计划在1年内在某地区买房,那么他/她是一个潜在客户;如果客户至少进行过一次业务访问,那么他/她是一个购买者。”

  (3)聚类(Clustering)是把整个数据库分成不同的群组。它的目的是要群与群之间差别明显,而同一群之间的数据尽量相似。聚类与分类不同:分类之前已经知道要把数据分成哪几类,每个类的性质是什么;聚类则恰恰相反。

  (4)演变分析(evolution analysis)描述行为随时间变化的对象的规律或趋势,并对其建模。例如,结合人口构成变动趋势、教育水平发展趋势、社会经济发展趋势进行房地产消费趋向的分析。

  (5)描述和可视化(Description and Visualization),对数据进行归约、概化或图形描述等。例如,通过空间聚集和近似计算对一些具体的地理位置概化聚类,形成对某区域的形象化描述。


2.数据挖掘的市场研究价值

  数据挖掘技术在商业上实际应用十分丰富。应用数据挖掘技术,可以帮助房地产行业找出有价值的信息,十分有助于企业发现商机、制定开发计划与营销策略。对于房地产市场研究,数据挖掘可以应用于宏观经济形势研究、市场发展趋势研究、楼盘供应研究、竞争对手研究、客户研究。包括但不局限于以下几个方面:

  (1)宏观经济形势研究——1)房地产周期时序分析中的相似搜索:可找出已有房地产周期数据库中与给定查询序列最接近的数据序列。比较识别两个相似时间段间数据系列的主要差异,对房地产市场的宏观分析很有参考价值。2)宏观经济形势研究——房地产周期一般性因素关联分析:一般而言,房地产周期是影响不动产收益的一系列因素组成的总体概念。各因素均会对总体房地产周期起决定作用。关联分析方法可用于帮助发现各因素和房地产周期间的交叉与联系。

  (2)市场发展趋势研究——1)销售量的增长与人均可支配收入的回归分析;2)个人购买与集团购买房地产比重的拟合与分析;3)对房地产销售波动率的回归分析。通过对市场总体状况、市场占有率、发展水平等动态的分析、总结和评价,及时获得准确数据,辅助经营决策。

  (3)楼盘供应研究——地理发展空间的多维分析:综合人口住房条件及分布、土地利用现状及政府规划、交通现状分布信息,通过聚集及层次化描述,发掘区域内需建立的高档别墅、高、中、低档公寓的数量及各自的地理位置和发展计划。

  (4)客户研究——客户信息的多维关联和序列模式分析:关联分析可在客户信息中发现客户的消费行为模式,帮助营销人员找出影响消费者的机会与方式。

  目前,专业市场研究公司对房地产行业的调研主要集中在客户需求分析方面,并积累了一定的经验,因此,本文主要探讨房地产客户信息的数据挖掘。


3.数据挖掘在房地产客户研究中有着广泛的应用

  房地产行业的客户信息有许多特点,如下图所示,一方面房地产行业面对的客户群广泛,而且客户的特征描述的结构复杂,另一方面房地产客户需求的层次不一,且易受外界因素影响,具有多层次性和多变性。


  对于复杂、多样而且擅变的客户信息,房地产行业客户信息的数据挖掘有助于识别客户购买行为,发现客户购买模式和趋势。从而,帮助房地产企业改进服务质量,取得更好的客户关系和满意程度,设计更好的营销方案,减少商业成本。根据已有的数据挖掘经验,数据挖掘在房地产行业的应用可以归纳成以下几个方面:







































数据挖掘应用 解决的问题
客户细分 聚类,有效的划分目标客户群
客户保留 分类回归、关联分析,识别无效的客户及流失的客户的消费决策模式,帮助企业识别现有客户中相似的潜在流失客户,以便采取预防措施。
客户拓展 分类,关联分析,有针对性的发现客户的反应行为模式,用来将潜在客户列表中的客户排序,以便找出哪些是对所提供的服务最感兴趣的客户。
升级服务 分类,预测,通过对客户行为特点的跟踪分析,对客户将来的行为进行预测分析,用预测得到的评分为每个客户选出最合适的几种服务方案。
活动分析 多维分析,通过比较热销期间的销售量和交易数量等有关情况,分析营销手段的有效性。
销售预测 特征化、关联分析,在项目开发的不同阶段,如:开盘、热销、封顶、现房,成交客户和意向客户的属性特点。
需求描述 特征化、多维分析,提供强有力的多维分析和可视化工具,方便企业进行带有复杂条件的聚集上的分析
需求预测 层次分析、关联分析,通过比较出不同类型的消费者对各种价值构成的排序,找出各价值构成中的相关性。


  

三、如何在房地产行业应用数据挖掘技术

4.明确商业目标

  应用数据挖掘的首要任务就是明确需要达到什么样的商业目标,并描述出需要解决的问题。目标的描述应该细化、清楚,以便于选择合适的挖掘方法,也方便检测数据挖掘效果,判断建立的模型的有效性。

  例如,下列目标是大而空的目标:获得客户行为的了解;在数据中发现有用的模型;发现一些有意思得东西。而另外一些目标有较强操作性:发现哪些客户不受某种促销手段的影响;找出项目封顶时哪类客户成交率增加。


5.数据准备

  基于数据挖掘的商业目标,提取所需要的数据。为了保证数据的质量,除了对数据进行必要地检查和修正外,还需要考虑不同源之间数据的一致性问题。

  如果数据集包含过多的字段,需采用一定的方法找到对模型输出影响最大的字段,适当的减少输入的字段。常用的方法包括:“描述型数据挖掘”、连结分析等。

  很多变量如果组合起来(加、减、比率等)会比这些变量自身影响力更大。一些变量如果扩大它的范围会成为一个非常好的预测变量,比如用一段时间内收入变化情况代替一个单一的收入数据。因此,在数据准备阶段需考虑是否创建一些新的变量。

  处理缺失数据也是数据准备阶段的一个重要工作。有些缺值本身就非常有意义。例如:富有的顾客会忽略“收入”,或者不在乎价格的影响。


6.建立模型

  建立模型是一个反复的过程。首先需要选择适合解决当前问题的模型。对模型的选择过程可能会启发对数据的理解并加以修改,甚至改变最初对问题的定义。

  一旦选择了模型的类型及应用的方法,所选择的模型将决定对数据的预处理工作。例如,神经网络需要做数据转换,有些数据挖掘工具可能对输入数据的格式有特定的限制等。

  接下来是建立模型的工作。对于通过数据挖掘建立的模型需要有一定的数据来测试和验证。对于预测性任务,需通过反复的测试、验证、训练,才能不断提高模型的准确率。


  大部分数据挖掘模型不是专为解决某个问题而特制的,模型之间也并不相互排斥。不能说一个问题一定要采用某种模型,别的就不行。例如:Cart决策树算法、神经网络既可以用于建立分类树,也可建立回归树。


7.输出结果的评价和解释

  模型建立好之后,必须评价其结果,解释其价值。在实际应用中,模型的准确率会随着应用数据的不同发生变化。但准确度自身并不一定是选择模型的正确评价方法。对输出结果的理解需要进一步了解错误的类型和由此带来的相关费用的多少。如果模型每个不同的预测错误所需付出的代价(费用)也不同的话,代价最小的模型(而不一定是错误率最小的模型)将是较好的选择。

  直接在现实世界中测试模型很重要。先在小范围内应用,取得测试数据,觉得满意后再向大范围推广。


8.实施

  模型在建立并经验证之后,可以有两种主要的使用方法。一种是提供给分析人员做参考,由他通过查看和分析这个模型输出,并做出解释和方案建议;另一种是把模型应用到不同的数据集上。模型可以用来标示一个事例的类别,给一类客户打分等,还可以用模型在数据库中选择符合特定要求的记录,以用其他工具做进一步分析。

  在应用模型之后,还要不断监控模型的效果。即使模型的运用很成功,也不能放弃监控。因为事物在不断发展变化,很可能过一段时间之后,随着购买方式、消费观点的变化,模型就不再起作用。因此随着模型使用时间的增加,要不断的对模型做重新测试,有时甚至需要更新建立模型。

四、应用举例:基于客户分类的关联分析

1.商业目标

  为了更详尽地了解客户的消费决策,本案例设计的问题是:“给客户分类,并了解不同类的客户有什么特点?”针对此类问题挖掘出的结果可以被用于预测性分析,例如预测客户最倾向于做出哪种购买行为。

2.数据准备

  本案例中采用某一时点上的房地产消费者需求抽样调查,取出描述消费者个人属性和消费特点的字段。

3.建立模型

 (1)对数据进行分类

  本案例中由购房者选择最多五个自己在购房决策过程中比较看重的因素,并以总评分100分为前提给出每个因素的看重程度的评分。

  案例得到的抽样数据显示,尽管地理位置是影响一个房地产项目定位的重要因素,人们对地理位置的看重程度仍有较大的差异。因此,以客户对地理位置的关注程度为分类标准,构建了一个简单的决策树。


  决策树中根据购房者对地理位置的看重程度,将购房者分为:地理位置决定型、地理位置重要参考型、地理位置参考型、地理位置不重要型、地理位置无关型五种类型。下表是应用决策树得到的客户分类结果。从各客户群评分的均值和标准差可以看出,各客户群具有较好的组内相似性和组间差异性,说明所构建的决策树的分类结果比较理想,可用于进一步的分析。

  
















































































客户分类 购房者对地理位置的评分 比率 比率
(合计)
评分的均值 组内
标准差
位置无关型 0.00 32.0 32.0 0 0
地理位置不重要型 15.00 1.9 12.6 19.23 1.88
20.00 10.7
地理位置参考型 25.00 3.9 27.2 29.8 1
30.00 23.3
地理位置重要型 30.00 4.7 26.2 47.7 12
40.00 5.2
50.00 10.7
60.00 2.6
70.00 3.1
地理位置决定型 100.00 1.9 1.9 100 0
合计 100 100    

 (2)关联分析

  运用关联分析的目的是寻找数据库中值的相关性。本例采用基于兴趣度的关联规则挖掘算法,挖掘每类客户不同属性间的相关性。经过挖掘,发现一些值得深入探讨的关联,见下表:















































































关 联 规 则 支持率 可信度 兴趣度
地理位置无关型客户 =≥ 重视物业管理 9.7% 30.3% 2.4
地理位置无关型客户 =≥ 购买商品房总预算在90-100万之间 5.8% 18.2% 2.56
地理位置不重要型客户 =≥ 商务活动比较频繁 4.9% 38.5% 2.3
地理位置不重要型客户 =≥ 比较了解市场楼盘供应 5.8% 46.2% 3.66
地理位置参考型客户 =≥ 四人的家庭结构 6.9% 25% 3.15
地理位置参考型客户 =≥ 较关注户型 4.9% 17.9% 2
地理位置重要型 =≥ 希望社区规模较小 4.9% 18.5% 2.1
地理位置重要型 =≥ 不了解购房手续 3.9% 15% 2.3
地理位置重要型 =≥ 在市场公关、外联部门工作 4.9% 18.5% 2.1


  注:

  a)支持率反映了关联是否是普遍存在的规律。例如:支持率=5%,表示在1000个客户中有50个客户符合关联规则描述。

  b)可信度反映了关联规则前提成立的条件下结果成例的概率。本例中,可信度=15%可以解释为,对应的客户群中有15个人符合关联规则的描述。

  c)兴趣度反映了关联规则中元素的关系的密切程度。兴趣度越大于1说明该规则中的元素的关系越密切,该规则的实际利用价值越大。

  d)最小支持度阈值、最小可信度和最小兴趣度的阈值可以由用户和领域专家设定。此例中以支持度>3.5%,可信度>15%,兴趣度>2为阈值。


  上表中列出的关联规则均有较高的支持率、可信度和兴趣度。为了更加准确地挖掘关联规则。对挖掘出的关联规则更换因果关系,形成新的关联规则与之进行对比。如下例:

  关联规则A1:地理位置无关型客户=≥重视物业管理

  支持率=9.7% 可信度=30.3% 兴趣度=2.4

  与

  关联规则B1:重视物业管理 =≥地理位置无关型客户

  支持率=9.7% 可信度=76.9% 兴趣度=2.4

  对比两个关联规则将发现,“重视物业管理的人不关心地理位置”的可能性(76.9%)高于“不关心地理位置的人重视物业管理”的可能性(30.3%)。说明关联规则B1:重视物业管理=≥地理位置无关型客户是一条更有意义的关联规则。

  其他被发掘的关联也可以通过类似的比较,进行深一步的挖掘。在此不再全部做出详细分析。

  从本例挖掘出的信息可以看到,如果仅依赖于已有行业经验进行统计分析,往往会因为分析人员的主观性或者数据量太大难以实施而存在信息提取的局限性。而通过数据挖掘得到的信息,一方面能弥补直接应用统计分析时的局限性,开拓分析人员的思维,丰富分析人员的行业背景知识;另一方面可以通过反复的验证、机器学习建立模型,直接成为分析人员的分析、预测的工具。


需要说明:

  a)本案例的目的在于说明数据挖掘算法的应用价值,得到的结果仅供参考,并不作为定论,而且数据挖掘的结果需要由行业内的商业分析人员判断:是否真的具有意义,是否有进一步分析、探讨的价值。也就是说数据挖掘作为信息提取的工具,其输出是决策分析的参考,不能代替行业内商业分析人员的分析工作。

  b)案例中的数据挖掘作为方法应用的探讨,如要生成一个可操作的模型工具还需足够的数据集支持进行测试、验证、训练才能不断提高模型的准确率。

  c)本案例中解决问题的方法不是唯一的,可能应用其他的分类手段、分类标准能得到更好的结果。具体方法的应用要取决于实施人员的建模能力、行业经验。也就是说,数据挖掘对人员有较高的要求。数据挖掘的人员不仅要有良好的统计概念、建模能力,还要懂得基本的商业和行业概念。

五、房地产行业数据挖掘的应用前景

  随着IT/Internet等新技术发展,市场研究在房地产行业的应用已经不再局限于数据采集和简单的归纳、数据分析。更高的决策服务是建立在更大量的“数据——信息——知识”的基础上的,因此数据挖掘、商业智能等概念与技术的引入促进了数据挖掘在房地产行业的应用。与此同时,随着房地产企业数据挖掘应用的深入,数据、数据挖掘的任务和数据挖掘方法的多样性将给数据挖掘提出了许多挑战性的课题。例如:

  1、应用地理信息系统(GIS)寻求数据挖掘过程中的可视化方法,使得知识发现的过程能够被用户理解,也便于在知识发现过程中的人机交互。

  2、web挖掘:由于web上存在大量信息,随着web的发展,有关web内容挖掘、web日志挖掘等网络上的数据挖掘将成为数据挖掘中一个最为重要和繁荣的应用领域。房地产公司的企业形象宣传、营销、客户维护等工作都将离不开网络,也必然将需要web挖掘数据支持。


参考文献:

  1、范明,孟小峰等译.数据挖掘概念与技术.北京:机械工业出版社,2001

  2、Alex Berson, Stephen Smith, Kurt Thearling.Building Data Mining Applications for CRM.北京:人民邮电出版社,2001

  3、尹伯成,边华才.房地产投资学.北京:复旦大学出版社,2002

  4、朱建秋.一个基于关联规则的数据采掘工具的设计和实现. www.dmgroup.org.cn

  5、叶剑.平房地产市场营销.北京:中国人民大学出版社.2000

  注:本文作者 马云霞,系北京大视野社会经济调查有限公司·房地产行业研究咨询部 研究员

返回】     【关闭
会员公司 付费报告 免费报告 调研文库
friend link Moncler jackets discount ugg boots wholesale nhl jerseys ed hardy bags down jacket women UGG 5815 Classic Tall Boots nhl jerseys cheap ed hardy shoes down jacket men down jacket men UGG 5803 Bailey Button Boots UGG 5803 Bailey Button Boots Wholesale discount jerseys Wholesale discount jerseys discount ed hardy shoes discount ed hardy shoes down coats men UGG 1873 Bailey Button Boots Wholesale MLB Jerseys Ed Hardy Men's clothing down coats men UGG 1873 Bailey Button Boots Wholesale MLB Jerseys Ed Hardy Men's clothing down coats women UGG 1647 Tasmina Sandals authentic jerseys wholesale Cheap Ed Hardy clothing 广告服务 - 法律条款 - 注册指南 - 关于我们 - 企业客户
Copyright © 1999-2008 3see.com All Rights Reserved
北京信通四方企业顾问有限公司 版权所有 京ICP证080069号
TEL:86-10-85863259  客服:service@3see.com 
投稿:contribute@3see.com