您好,欢迎访问三七文档
如何做好数据分析内部培训2015.04目录A、数据分析哪些事儿B、数据处理C、数据分析D、数据展现E、报告撰写A、数据分析哪些事儿数据分析是“神马”数据分析六部曲常用指标或术语数据分析是“神马”数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总、理解并消化,以求最大化地开发数据的功能,发挥数据的作用。A、数据分析哪些事儿·数据分析是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。菜鸟与数据分析师的区别菜鸟会想分析师会想这张曲线图真好看,怎么做的?数据变化的背后真相是什么?这些数据可以做什么样的分析?从哪些角度分析数据才系统?高级分析的方法在这儿能用吗?用什么分析方法最有效?要做多少张图表?图表是否表达出有效的观点?除了为数据添加文字说明还需说什么?数据分析的目的达到了吗?数据分析报告要写多少页?数据分析报告有说服力吗?…………A、数据分析哪些事儿他们主要的区别就在于目的是否明确数据分析师的基本素质态度严谨负责好奇心强烈逻辑思维清晰擅长模仿勇于创新不论说话还是写文章,都要有条理,有目的,不可眉毛胡子一把抓,不分主次。模仿主要是参考他人优秀的分析思路和方法。但不能:一直在模仿,从未超越过。A、数据分析哪些事儿数据分析六步曲一般数据分析用Excel可以完成,若高级数据分析,则需要使用数据分析工具,如SPSSStatistics等。A、数据分析哪些事儿倍数一般是表示数量的增长或上升幅度,而不适用平均数绝对数与相对数百分比与百分点频数与频率比例与比率倍数与番数同比与环比A、数据分析哪些事儿常用指标或术语B、数据处理初识EXCEL&数据准备数据处理方式和技巧数据处理原则数据清洗常用数据处理公式初识EXCELB、数据处理做数据分析讲究的是原则、思考方法和解决方案,任何软件都只是一种工具,我们只要掌握并精通一种工具不足够了。这比什么软件都只懂但都只是略懂皮毛要好很多。本培训所涉及内容,均以Excel2010为例。数据准备:对数据表的要求B、数据处理序号要求1数据表由标明行和数据部分组成2第一行是表的列标题(字段名),列标题不能重复3第二行起是数据部分,数据部分的每一行数据称为一个记录,并且数据部分不允许出现空白行和空白列4数据表中不能有合并单元桥存在5数据表与其他数据之间应该留出至少一个空白行和一个空白列6数据表需要以一维的形式存储,但是在实际操作中接触的数据往往是以二维表格的形式存在的,此时应将二维表转化为一维表的形式储存数据。7数据部分每一列的数据项,内容、格式统一。函数函数是指定的数据按照一定的规则转化为需要的结果,规则也就是我们所用到的公式。图表图表的主要目的是为了表现数据、传递信息。宏宏是一个指令集,用来告诉Excel完成用户指定的动作。宏类似于计算机程序,但它是完全运行于Excel中的。B、数据处理—数据准备数据处理方式和技巧数据处理方式和技巧F2编辑单元格填充柄Ctrl+D‘+007,变成007的有效输入。快速设置单元格格式:Ctrl+11/3的输入,0+空格+1/3B、数据处理数据错误识别错误符号错误原因#DIV/0!除数为0#N/A函数或公式中没有可用的数值#NAME?在公式中使用了不能识别的文本#NULL!使用了不正确的区域运算符或引用的单元格区域的交集为空#NUM!公式或函数中某些数字有问题#REF!单元格引用无效#VALUE!在公式中使用了错误的数据类型B、数据处理数据处理方式和技巧数据处理原则B、数据处理“三心二意”处理数据信心什么是信心?信心是指未看见任何未来时,你依然怀抱希望,坚持下去。细心1%的错误=100%的失败平常心诚意合老板意第一,老板永远是对的;第二,如果老板错了,请参考第一条。数据清洗•冻结窗格•自动筛选•快速隐藏•Ctrl+箭头键•F4的妙用,绝对引用和相对引用•重复数据处理重复数据处理1、使用COUNTIF函数重复次数COUNTIF(A:A,A2)第几次出现COUNTIF(A$2:A2,A2)数据重复次数第几次出现A41B31C21D11E11A42A43A44B32B33C22B、数据处理2、用菜单操作来筛选“数据”→“排序与筛选”→高级3、使用条件格式“开始”→“条件格式”→“突出显示单元格规格”→“重复值”B、数据处理常用数据处理公式或技巧•查找和替换•通配符*?•IF函数•AND和OR•数据统计B、数据处理•数据抽取•抽取函数•字段合并•字段匹配•数据计算•求和,平均值•最大最小值B、数据处理常用数据处理公式或技巧常用数据处理公式或技巧日期的相关处理1、快速录入当前日期TODAY()NOW()2、单纯日数加减简单情况如A1中录入“2011-1-1”,B1中录入“A1+5”,结果:“2011-1-6”复杂情况A2“2011-1-1”,DATE(YEAR(A2)+3,MONTH(A2)+1,DAY(A2)+5)结果:2014-2-6B、数据处理常用数据处理公式或技巧3、利用函数DATEIF计算工龄DATEIF(start-date,end-date,unit)Unit有Y/M/D/MD/YM/YD六种格式MD:为start-date,end-date日期中天数的差,忽略日期中的月和年YM:为start-date,end-date日期中月数的差,忽略日期中的日和年YD:为start-date,end-date日期中天数的差,忽略日期中的年入职日期2007-10-1现在日期2011-11-7工龄(年)4年=DATEIF(B1,B2,“Y”)&“年”工龄(年月)4年1月=DATEIF(B1,B2,“Y”)&“年”&DATEIF(B1,B2,“YM”)&“月”)B、数据处理C、数据分析数据分析方法论数据分析方法数据分析工具C、数据分析C、数据分析数据分析方法论主要用来指导数据分析师进行一个完整的数据分析,它更多的是指数据分析思路。方法论说明使用范围PESTPolitical,Economic,Social,Technological行业分析,统称外部环境4PProduct,Price,Place(渠道),Promotion公司整体经营情况分析逻辑树将问题分层罗列,逐步向下展开业务问题专题分析用户使用行为认知→熟悉→试用→使用→忠诚用户行为研究5W2HWhy,What,Who,When,WhereHow,Howmuch用途广泛•数据分析方法论数据分析方法5W2H分析法在职场中,有很多人逻辑思路很清晰,但是也有些人说话老是抓不住重点,费口舌讲了半天,大家还是听不懂他在说什么,这种人就是缺乏逻辑训练。在所有逻辑思考方法中,5W2H分析法可以说是最容易学习操作的方法之一。用户购买行为分析Why用户购买的目的是什么?产品在哪方面吸引用户?What公司提供什么产品或服务?与用户需求是否一致?Who谁是我们的用户?用户有何特点?When何时购买?多久再次购买?Where用户在哪购买?用户在各个地区构成怎样?How用户购买支付方式是怎样?Howmuch用户购买花费时间、交通等成本各是多少?C、数据分析逻辑树分析法把一个已知问题当成树干,然后考虑这个问题和哪些问题有关。每想到一点,就给这个问题所在的树干加一个“树枝”,并标明这个“树枝”代表什么问题。C、数据分析问题陈述问题一用户购买的目的是什么?产品在哪方面吸引用户?问题二公司提供什么产品或服务?与用户需求是否一致?问题三谁是我们的用户?用户有何特点?问题四何时购买?多久再次购买?数据分析简单方法方法说明对比分析法与目标对比;不同时期对比;同级部门、单位、地区对比;行业内对比;活动前后效果对比分组分析法分组的目的在于便于对比,分组法必须与对比法结合起来结构分析法某部分数值占总体的比率,如市场占有率平均分析法算数平均、调和平均、几何平均、众数与中位数交叉分析法常见的二维交叉表C、数据分析数据分析综合方法•综合评价分析法数据标准化标准值=(原始值-min)/(max-min)权重确定方法目标优化矩阵纵向指标比横向重要时,输入1,否则为0人才评价人品动手能力创新意识教育背景合计排序人品01122动手能力11131创新意识00113教育背景00004C、数据分析杜邦分析法又称杜邦财务分析体系,可对财务状况进行综合分析评价,也可用于其他分析。C、数据分析漏斗分析法100%40%30%20%17%浏览商品40%放入购物车75%生成订单67%支付订单85%完成交易C、数据分析高级数据分析法根据分析三大误区1、分析目的不明确,为分析而分析2、缺乏业务知识,分析结果偏离实际3、一味追求使用高级分析方法,热衷研究模型C、数据分析数据分析工具数据透视表C、数据分析D、数据展现图表常用图表类型与作用图表制作五步法常用表格&图表展示数据展现—图表原则:让老板在30秒种内读懂你的数据D、数据展现图表的作用表达形象化突出重点体现专业化你这是要我在蚂蚁里面挑芝麻吗?常用图表类型与作用要表达的数据和信息饼图柱形图条形图拆线图气泡图其它成分(整体的一部分)排序(数据的比较)时间序列(走势、趋势)频率分布(数据频次)相关性(数据的关系)多重数据比较D、数据展现图表制作五步法D、数据展现确定所要表达的主题或目的确定哪种图表最适合你的目的选择数据制作图表检查是否真实有效地展示数据检查是否表达了你的观点1543215432常用表格&图表展示让图表“五脏俱全”V.S2010年XX公司产品销售情况(单位:百万元)*第三季度品牌A的产品包装发现有毒物质*资料来源:XX调研公司注脚:便于读者理解资料来源:增强数据可信度D、数据展现数据条&图标集D、数据展现迷你图D、数据展现饼图制作原则一些简单的原则:1.尽量不要用3D效果,如果要用尽量薄一些2.饼图的结构中,最多包含5种数据3.标注写在图中,不要标记在一边4.边界线使用白色,突出边缘感5.让数据从12点钟的位置开始排列,最重要的成分紧靠12点钟的位置V.SD、数据展现复合饼图Q4签约店面61%未签约店面10%店面死亡(FY11)26%建店完成1%建设中0%申请通过1%审图通过1%审图修改0%新建店面3%全国整体店面分类Q4签约店面,1256未签约店面,197店面死亡(FY11),533建店完成,21建设中,3申请通过,24审图通过,26审图修改,5新建店面79全国整体店面分类复合饼图可以将分类数据中所占比例较小的分类合并成“其他”项,使图表反映的数据更能突出重点。D、数据展现柱形图—数据对比分析时经常用到一些简单的原则:1.同一数据序列使用相同的颜色;2.不要使用倾斜的标签,别让读者歪着脑袋看3.纵坐标轴一般刻度从0开始020406080100120湖南广东江西晋蒙京津冀安徽陕西广西福建FY11建设完成情况FY11完成数量6710156699252553451湖南广东江西晋蒙京津冀安徽陕西广西福建FY11店面建设完成数量V.SD、数据展现修剪超大值为了便于看到其它分类的情况,而针对某一超大值进行修改。D、数据展现73446505101520253035404550建店完成建设中申请通过审图通过审图修改FY11Q4店面建设状态734465建店完成建设中申请通过审图通过审图修改FY11Q4店面建设状态V.S条形图----横坐标轴的标签文字过长时,可以采用条形图来代替柱型图D、数据展现一些简单的原则:1.同一数据序列使用相同的颜色;2.尽量让数据从大到小排序,方便阅读3.不要使用倾斜的标签4.最好添加数据标签置050100150FY11店面建设完成数量FY11完成数量3451525556676992101广西福建安徽陕西江西湖南晋蒙京津冀广东FY11店面建设完成数量V.S拆线图D、数据展现一些简单的原则:1.拆线选用的线形要相对粗些,最好比网格线、坐标轴等要突出;2.线条一般不超过5条;3.不要使用倾斜的标签4.纵坐标轴一般刻度从0开始020406080100120广西福建安徽陕西江西湖南晋蒙京津冀广东FY11完成数量FY11完成数量345152555667699210102040
本文标题:数据分析怎么做
链接地址:https://www.777doc.com/doc-3871060 .html