您好,欢迎访问三七文档
当前位置:首页 > 办公文档 > 总结/报告 > 谁说菜鸟不会数据分析
谁说菜鸟不会数据分析主要内容1.分析那些事儿2.方法结构为王成长之路3.数据搜集导入4.处理清洗加工5.分析方法工具6.呈现制表画图菜鸟第一章、数据分析那些事一、数据分析是什么?(1)数据分析为何物?简述:收集数据-适当方法-提炼信息-描述现象发现规律预测未来,帮助判断、决策。(2)数据分析的作用?简述:现状分析、原因分析、预测分析。二、数据分析六部曲?•先决条件•提供方向明确目的•数据库•其他媒介数据收集•清洗、转化、提取、计算数据处理•统计分析•数据挖掘数据分析•图表→表格→文字数据展现•框架清晰•明确结论•提出建议报告撰写一般数据分析用Excel可以完成,若高级数据分析,则需要使用数据分析工具,如SPSSStatistics、SAS等。第一章、数据分析那些事三、数据分析的三大误区?(1)分析目的不明确,为了分析而分析(结果:自己玩!)故:分析一定要结合业务实际问题,有目的的展开。(2)缺乏业务知识,分析结果偏离实际(结果:遭鄙视!)故:弄清业务逻辑,懂点营销和管理等理论。(3)一味追求高级方法,热衷研究模型(结果:削脚适履!)故:能简单处理的,不选复杂方法;不管是白猫还是黑猫,只要能抓老鼠就是好猫”四、数据分析师的职业发展?(1)前景如何?展望未来:1.数据矿山越积越多;2.社会越发达,人们对数据越依赖;3.数据分析越发受管理层重视。管理大师彼得.德鲁克:“如果不能衡量,就无法管理”(2)职业要求?五“懂”:业务+管理+分析+工具+设计(3)基本素质?态度严谨负责,好奇心强烈,逻辑思维清晰,擅长模仿,勇于创新!,1.分析那些事儿2.方法结构为王成长之路3.数据搜集导入4.处理清洗加工5.分析方法工具6.呈现制表画图第二章、结构为王—思路方法第二章、结构为王—思路方法一、数据分析的方法论是什么?(1)数据分析的方法论?简述:论述分析的思路,指导数据分析者进行一次完整的数据分析。例如:我应该从哪几个方面展开分析?各方面包含什么内容和指标?(2)数据分析方法论与数据分析方法的区别?举例说明:一个是整体思路(类似宏观作战方案);一个是工具性解决办法(类似刺刀、冲锋枪、坦克、轰炸机等)。二、常用的方法论?(1)5W2H分析法(用户行为分析、业务专题分析)5W2H分析法是从回答中发现解决问题的线索的方法,即何因(why)、何事(what)、何人(who)、何时(when)、何地(where)、如何做(how)、何价(howmuch),这就构成了5W2H的总框架。该方法简单方便,容易理解,广泛应用于企业营销管理活动等方面。Why何因How如何做Where何地When何时Who何人What何事5W2H分析法Where何地第二章、结构为王—思路方法优点:1.简单易理解2.具有启发性3.弥补思考疏漏4.指导建立框架8(2)逻辑树分析法(业务问题专题分析)逻辑树分析法是将一个已知问题当成树干,然后考虑这个问题和哪些问题有关。每想到一点,就给这个问题所在的树干加一个树枝,并标明树枝代表什么问题。逻辑树方法又称问题树、演绎树或分解树。第二章、结构为王—思路方法要素化:把相同问题归纳总结成要素框架化:将各个要素组成框架,遵守不重不漏的原则关联化:框架内的各元素保持必要的相互关系,简单不孤立逻辑树适用遵循的原则缺点:涉及相关问题可能会有遗漏。例:利润分析利润增长缓慢收入成本其他客户少?质量变差?对手竞争?材料成本?人工成本?广告成本?············避免办法:头脑风暴/专家座谈等。(3)PEST分析法(主要用于行业分析)PEST是指对政治(Political)、经济(Economic)、技术(Technological)和社会(Social)这四类影响企业的主要外部环境因素进行分析。一般用于对宏观环境的分析,由于行业和企业自身的特点和经营方式,分析的具体内容可能会稍有差异。经济环境政治环境社会环境技术环境包括一个国家的社会制度,执政党的性质、方针政策等。宏观指国家国民收入、国民生产总值及变化情况。微观指行业所在地区消费者的收入水平、消费偏好等。包括一个国家的或地区的居民受教育程度和文化水平、信仰风俗、价值观念等。技术环境除了要考察与企业所处领域直接相关的技术手段的发展变化外,还应了解:国家对科技开发的投资和支持重点、技术转移和技术商品化速度、专利及其保护情况、该领域发展动态和研究费用总额等。行业、企业第二章、结构为王—思路方法(4)4P营销理论(公司整体经营状况)4P营销理论产生于20世纪60年代的美国,它随着营销组合理论的提出而出现。它将营销要素概括为四类:产品(product)、价格(price)、渠道(place)、促销(promotion)。如果需要了解公司的整体运营情况,就可以采用4P营销理论进行分析指导。第二章、结构为王—思路方法投入多少促销资源?效果如何?投放多少宣传广告?效果如何?例4P营销公司业务分析产品价格渠道促销公司销售收入怎样?增长还是减少?用户接受的合理价格是多少?用户购买支付方式怎样?公司在各地区有多少销售渠道?用户通过何种渠道购买?公司渠道政策是否具有吸引力?公司提供什么产品和服务?哪个销量好?与用户需求是否一致?购买产品的用户都是何人?(5)用户行为理论用户使用行为是指用户为获取、使用物品或服务所采用的各种行动,一般按照以下过程:对产品有一个认知、熟悉的过程,然后试用,再决定是否继续消费使用,最后成为忠实用户。第二章、结构为王—思路方法1.分析那些事儿2.方法结构为王成长之路3.数据搜集导入4.处理清洗加工5.分析方法工具6.呈现制表画图第三章、数据收集导入第三章、数据收集导入一、数据类型(设置单元格格式)二、数据表类型(一维表和二维表)一维表特征:一条记录就看到完整的信息;一边有字段指标。二维表特征:需要纵横两个纬度看,才能得到完整的信息;两边有字段指标。(1)二维表变一维表?-----数据透视向导(演示,见视频)(2)一维表变二维表?----数据透视表(演示,见视频)第三章、数据搜集导入三、数据搜集导入(1)文本导入:满意度调查(演示)(2)网络:股票数据(演示)(3)调查数据:满意度调查问卷表设计(演示)1.分析那些事儿2.方法结构为王成长之路3.数据搜集导入4.处理清洗加工5.分析方法工具6.呈现制表画图第四章、数据处理一、为啥要数据处理?(1)数据有多余、重复的、空白的(2)数据出错(不同于异常数据)(3)数据的组织格式或字段的再加工,得到适用于分析的内容格式。菜鸟总结:第四章、数据处理二、重复数据处理•发现重复数据(1)使用COUNTIF函数(演示)重复次数COUNTIF(A:A,A2)第几次出现COUNTIF(A$2:A2,A2)(2)用菜单操作来筛选(演示)“数据”→“排序与筛选”→高级(3)使用条件格式(演示)“开始”→“条件格式”→“突出显示单元格规格”→“重复值”(4)数据透视表(后边讲解)•删除重复的数据(1)菜单----删除重复项(2)在发现的基础上,删除。第四章、数据处理三、缺失值处理(1)如何定位缺失值?•编辑-查询和选择-定位条件•Ctrl+G快捷键----定位条件•Ctrl+F快捷键----查找•Ctrl+H快捷键----替换(2)缺失值处理?•模拟值(平均值、回归、插值、历史等)•部分排除•整条删除等。•Ctrl+Enter快捷键(小白举例)第四章、数据处理四、逻辑检查----逻辑函数逻辑函数第四章、数据处理五、加工数据•1.字段分列(1)菜单法(演示)(2)函数法第四章、数据处理五、加工数据•2.字段合并(1)“&”连接符举例:10kg=10&kg(2)Concatenate(,)函数第四章、数据处理五、加工数据•3.字段匹配举例:目的站,城市比对第四章、数据处理五、加工数据•4.字段运算(1)简单运算符“+”“-”“*”“/”()(2)常用函数Sum()、Average()、count()Today()、now()、datedif()DATEIF(start-date,end-date,unit)Unit有Y/M/D/MD/YM/YD六种格式MD:为start-date,end-date日期中天数的差,忽略日期中的月和年YM:为start-date,end-date日期中月数的差,忽略日期中的日和年YD:为start-date,end-date日期中天数的差,忽略日期中的年第四章、数据处理入职日期2000-10-1现在日期2011-11-7工龄(年)4年=DATEIF(B1,B2,“Y”)&“年”工龄(年月)4年1月=DATEIF(B1,B2,“Y”)&“年”&DATEIF(B1,B2,“YM”)&“月”)算工龄?五、加工数据•5.数据分组&数据表行列互换(1)数据分组举例:地区工资分组(2)行列互换选择性粘贴第四章、数据处理第四章、数据处理错误值含义解决办法####输入到单元格中的数据太长或单元格公式所产生的结果太大,使结果在单元格中显示不下。或是日期和时间格式的单元格做减法,出现了负值增加列的宽度,使结果能够完全显示。如果是由日期或时间相减产生了负值引起的,可以改变单元格的格式,比如改为文本格式,结果为负的时间量。#DIV/0!试图除以0。这个错误的产生通常有下面几种情况:除数为0、在公式中除数使用了空单元格或是包含零值单元格的单元格引用。修改单元格引用,或者在用作除数的单元格中输入不为零的值。#VALUE!输入引用文本项的数学公式。如果使用了不正确的参数或运算符,或者当执行自动更正公式功能时不能更正公式,都将产生错误信息#VALUE!。这时应确认公式或函数所需的运算符或参数正确,并且公式引用的单元格中包含有效的数值。例如,单元格C4中有一个数字或逻辑值,而单元格D4包含文本,则在计算公式=C4+D4时,系统不能将文本转换为正确的数据类型,因而返回错误值#VALUE!#N/A无信息可用于所要执行的计算。在建立模型时,用户可以在单元格中输入#N/A,以表明正在等待数据。任何引用含有#N/A值的单元格都将返回#N/A。在等待数据的单元格内填充上数据。#NAME?在公式中使用了Excel所不能识别的文本,比如可能是输错了名称,或是输入了一个已删除的名称,如果没有将文字串括在双引号中,也会产生此错误值如果是使用了不存在的名称而产生这类错误,应确认使用的名称确实存在;如果是名称,函数名拼写错误应就改正过来;将文字串括在双引号中;确认公式中使用的所有区域引用都使用了冒号(:)#NUM!提供了无效的参数给工作表函数,或是公式的结果太大或太小而无法在工作表中表示。确认函数中使用的参数类型正确。#NULL!在公式中的两个范围之间插入一个空格以表示交叉点,但这两个范围没有公共单元格。比如输入:“=SUM(A1:A10C1:C10)”,就会产生这种情况取消两个范围之间的空格。上式可改为“=SUM(A1:A10,C1:C10)”数据处理中,常出现的报错符号(补充部分)1.分析那些事儿2.方法结构为王成长之路3.数据搜集导入4.处理清洗加工5.分析方法工具6.呈现制表画图第五章、数据分析方法工具方法说明举例对比分析法对比(目标与实际、不同时期对比、部门、单位、地区等)见P分组分析法分类标准(相似的归为一类,再对不同类别研究)地区收入水平结构分析法百分比市场占有率平均分析法算数平均、调和平均、几何平均、众数与中位数(平均水平)平均工资交叉分析法常见的二维交叉表(便于观察对比)二维表综合评价分析法加强求和(涵盖信息全面,但意义模糊)上证指数杜邦分析法指标关系架构图(揭示盈利指标关系)见P漏斗分析法各环节转化概率网站转换率矩阵关联分析法两个关键纬度的指标度量方法见P高级分析方法方便以后检索学习见P第五章、数据分析方法工具菜鸟内容提纲一、对比分析法(1)定义对比分析法是将两个或两个以上的数据进行比较,分析其中的差异,从而揭示这些事物所代表的发展变化情况和规律性。(2)特点非常直观的看出事物某方面的变化或差距,而且可以准确、量化的表示出变化的差距是多少。(3)分类静态在同一时间下
本文标题:谁说菜鸟不会数据分析
链接地址:https://www.777doc.com/doc-5512374 .html