您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 项目/工程管理 > 埃森哲-数据挖掘模型DM的分类及说明
0子目录模型的分类与适用范围模型的评价标准与方法案例1预测性模型描述性模型数据挖掘我们的客户是什么样子的?他们需要什么?如何选取最好的针对性客户交互方式,以保证利润最大化?揭示蕴含于历史数据中的规律无指导的学习数据挖掘模型按照功能划分主要分为描述性模型和预测性模型两类无指导性分群关联规则(购物篮)逻辑回归线性回归非线性回归决策树神经网络对未来事件的预测有指导的学习指导性分群技术相关:技术相关:2电信行业中最常用的两种数据挖掘模型是客户分群和预测模型1282282903605809821039285070901101452637%-8%6%-7%5%-6%4%-5%3%-4%2%-3%1%-2%0%-1%客户分群模型•指导性分群•无指导分群预测模型模型•回归•决策树•神经元3电信业数据挖掘模型主要适用范围向上销售客户挽留账单催收管理主动新客户获取客户分群模型预测模型交叉销售客户信用管理交易行为生命周期价值响应倾向流失倾向交易价值信用风险4无指导性分群定义群1群2群4群3无指导性分群是将客户划分到具有相同行为、价值和社会属性等的不同组别的分析性工具5指导性分群定义群1群2群4群3指导性分群是在一定的目标变量(或称指导性变量)将客户划分到具有相同行为、价值和社会属性等的不同组别的分析性工具6指导性分群和无指导分群的主要区别——问题客户性别城市A女性纽约B男性台北C男性纽约您会怎样将这三个客户进行客户分群呢?7指导性分群100.20.40.60.8100.20.40.60.81CityGender性别城市编码后的性别编码后的城市A女性纽约0.450.70B男性台北0.550.30C男性纽约0.550.70性别目标变量=1女性45%男性55%城市目标变量=1(订阅过《纽约客》)纽约70%台北30%目标变量(分群指导变量):是否订阅了《纽约客》杂志群1:纽约群2:台北12ACB编码8指导性分群200.20.40.60.8100.20.40.60.81CityGender性别城市编码后的性别编码后的城市A女性纽约0.900.55B男性台北0.100.45C男性纽约0.100.55性别目标变量=1女性90%男性10%城市目标变量=1(订阅过《化妆师》)纽约55%台北45%12ABC编码目标变量(分群指导变量):是否订阅了《化妆师》杂志群1:女性群2:男性9无指导性分群0101CityGender性别城市编码后的性别编码后的城市A女性纽约00B男性台北11C男性纽约10性别随意编码女性0男性1城市随意编码纽约0台北1群1:?群2:?BCA编码10客户分群常见维度确定分群维度制约性活动/行为场合公司组织/人员需要客户价值人口统计感觉认知地理因素态度/意向分群维度财务制约竞争对手本地,地区,国家和国际地点竞争者的地点和客户服务产业(SIC)公司大小什么时间什么地点如何购买关键购买因素一般购买态度购买心理因素产品与服务的效果认可品牌的认知MOU使用年限安装时间持有产品的种类趋势最常见的客户分群维度年龄性别职业收入生活方式家庭状况ARPU盈利能力与收入相配比的服务成本制约性活动/行为场合公司组织/人员需要客户价值人口统计感觉认知地理因素态度/意向分群维度财务制约竞争对手本地,地区,国家和国际地点竞争者的地点和客户服务产业(SIC)公司大小什么时间什么地点如何购买关键购买因素一般购买态度购买心理因素产品与服务的效果认可品牌的认知MOU使用年限安装时间持有产品的种类趋势最常见的客户分群维度年龄性别职业收入生活方式家庭状况ARPU盈利能力与收入相配比的服务成本人口统计最常见的战略分群维度11行为和价值是最能反映客户态度和需求的两个维度客户关系需求/态度行为$价值$满意品牌体验品牌效应品牌依附度基于产品种类的参与态度决定行为行为决定价值关系体验决定满意度交易关系、客户待遇及产品满意度决定态度客户态度驱动了客户价值12预测模型定义预测模型是通过对过去数据学习来判断未来某种行为或计量的数学模型,模型目标可以是逻辑型或连续性变量,模型可以简单的用数学公式Y=F(X)来描述预测模型(X是n元向量)。每个客户都将通过模型计算获得一个预测值作为业务决策依据之一。电信行业中最为广泛使用的预测模型通常是二元逻辑变量预测模型,如客户离网挽留模型、营销活动相应模型等黄色格子为过去表现出目标行为的客户;白色格子为过去没有目标行为的客户寻找已经有目标行为的客户的共同特征运用已经有目标行为的客户的共同特征,按照相似程度,给其他客户打分得到模型计分,选出相似性高的客户(红色格子)0501001502002503003504000255075100编号电话号码姓名住址185486643AXX街XX号297645756BXX街XX号359801486CXX街XX号421957216DXX街XX号559114637EXX街XX号696272059FXX街XX号760095245GXX街XX号857252087HXX街XX号954408928IXX街XX号1051565770JXX街XX号1148722611KXX街XX号1245879453LXX街XX号1343036294MXX街XX号1440193136NXX街XX号1537349977OXX街XX号1634506819PXX街XX号1731663661QXX街XX号目标客户列表Y=F(X)13模型建立6月5月4月3月2月1月客户数据离网数据应用1-4月份客户数据和6月份离网数据建立离网预测模型模型验证7月6月5月4月3月2月应用2-5月份客户数据和7月份离网数据进行离网预测模型检验模型应用8月7月6月5月4月3月基于离网模型,应用3-6月份客户数据预测9月离网客户挽留行动预测模型的建立方法14子目录模型的分类与适用范围模型的评价标准与方法案例15分群模型评估标准互斥性和穷尽性原则(Mutuallyexclusive&Collectivelyexhaustive)所有的客户都应该包含在分群模型当中单个的客户和客户群必须一一对应可管理性客户群个数要适中,便于从业务上加以管理。一般的规则是在5~9个群之间选择具有业务可操作性客户群应该能够从业务上得到合理的解释客户群特征应明晰,便于从业务的角度制定客户战略和相应的营销计划群大小合理群大小分布合理非指导性分群的群大小之间差异不能太大指导性分群的目标比重应差异比较明显16分群有效性示例——群大小和群目标密度分布模型A模型B示例群大小群中目标客户占比群13%30%群25%20%群310%15%群412%12%群515%10%群615%5%群720%2%群820%2%群大小群中目标客户占比群110%15%群210%15%群310%15%群411%12%群512%10%群612%9%群715%8%群820%7%以下是两个指导性分群结果。从群大小和群目标密度分布来看,我们认为模型A是相对较好的模型17模型中客户群选择示例——没有最好,只有最适合HighIDD(19%)HighOff-peak(27%)HighWeekdayOff-peak(22%)HighWeekendOff-peak(9%)Incomer(11%)HighARPU(32%)HighSMS(11%)HighSMS(9%)HighARPU(31%)Incomer(9%)HighIDD(20%)HighIDDtoChina;HighIR(13%)HighIDDtoUS,UK,AustraliaandCanada(11%)HighWeekdayOff-peak(21%)HighSMS(11%)Incomer(7%)HighWeekendOff-peak(10%)HighARPU(27%)HighIDDtoChina;HighIR(15%)HighIDDtoChina;HighIR(15%)HighIDDtoChina;HighIR(14%)HighIDDtoUS,UK,AustraliaandCanada(13%)HighIDDtoUS,UK,AustraliaandCanada(14%)HighIDDtoUS,UK,AustraliaandCanada(12%)HighWeekdayOff-peak(19%)Before1am(15%)Before1am(16%)HighWeekendOff-peak(8%)HighWeekendOff-peak(7%)HighWeekendOff-peak(8%)Incomer(7%)Incomer(7%)Incomer(7%)HighARPU;High-rangePlan(22%)HighARPU;High-rangePlan(19%)HighARPU;High-rangePlan(18%)HighARPU;Low-rangePlan(6%)HighARPU;Low-rangePlan(6%)HighARPU;Low-rangePlan(5%)HighSMS(10%)HighSMS(11%)Avg.tenure~2yr(4%)Avg.tenure~2.5yr(8%)After1am(6%)After1am(8%)示例18预测模型评估标准模型信息可解释性模型信息丰富度。丰富度越高,模型越好模型主要变量从业务上解释与目标变量的相关性,相关性越高,模型越好模型预测准确性对客户用模型预测出的概率进行排序,前xx%(根据实际需求确定,通常为10%)的客户中实际预测准确的客户数越多,模型越好模型应用强壮性将模型应用到有相同结构的数据集得到的预测结果越接近,模型的应用强壮性越好,模型就越好19预测模型核心评估图01020304050607080901000102030405060708090100模型曲线随机验证曲线客户得分排序百分比(%)抓到预离客户百分比(%)ABC模型信息可解释性=(B+C)/(A+B+C)模型应用强壮性=B/(B+C)模型前10%提升值=42%/10%=4.210%,找到预离客户:42%理想曲线示例20模型可解释性示例流失模型一关键变量•IP长途mou•IP长途mou占总mou百分比•传统长途mou•传统长途占总mou百分比•省内漫游mou•省内漫游mou占总mou百分比•国内漫游MOU•国内漫游mou占总mou百分比•港澳台漫游mou•港澳台漫游mou占总mou百分比•国际漫游(包全部,包港澳台)•国际漫游(包全部,包港澳台)占总mou百分比•漫游(省内+国内+国际)呼出次数•漫游呼出占总呼出次数的百分比•漫游(省内+国内+国际)呼入次数•漫游呼入占总呼入次数的百分比•移动运营商的平均mou(网内+联通)•……流失模型二关键变量•电话号码•客户生日•IP长途mou•IP长途mou占总mou百分比•传统长途mou•传统长途占总mou百分比•省内漫游mou•省内漫游mou占总mou百分比•国内漫游MOU•国内漫游mou占总mou百分比•港澳台漫游mou•港澳台漫游mou占总mou百分比•国际漫游(包全部,包港澳台)•国际漫游(包全部,包港澳台)占总mou百分比•漫游(省内+国内+国际)呼出次数•漫游呼出占总呼出次数的百分比•漫游(省内+国内+国际)呼入次数•漫游呼入占总呼入次数的百分比•移动运营商的平均mou(网内+联通)•……示例21模型可解释性示例0.5-0.5MOU呈上升趋势MOU呈下降趋势对目标变量的影响模型中关键变量“MOU变化趋势”对客户流失的影响说明:正数代表变量为该数值时,客户越倾向于离网;负数则相反示例22模型预测准确性示例0102030405060708090100010203040506070809010020%,找到预离客户61%10%,找到预离客户:42%客户得分排序百分比(%)抓到预离客户百分比(%)0102030405060708090100010203040506070809010020%,找到预离客户5
本文标题:埃森哲-数据挖掘模型DM的分类及说明
链接地址:https://www.777doc.com/doc-1781623 .html