您好,欢迎访问三七文档
当前位置:首页 > 医学/心理学 > 药学 > 统计分析和数据挖掘在税务管理部门的主要应用-吴昊
统计分析和数据挖掘在税务管理统计分析和数据挖掘在税务管理部门的主要应用部门的主要应用北京瑞斯泰得数据技术开发有限公司北京瑞斯泰得数据技术开发有限公司吴昊吴昊统计分析和数据挖掘的应用统计分析和数据挖掘的应用•金融机构•电信公司•零售企业•医药卫生•网络挖掘•税务管理统计分析和数据挖掘的应用基础统计分析和数据挖掘的应用基础•统计理论和数据挖掘的知识框架•行业内基础数据来源•各类问题的分析和解决思路•完善的指标评价体系税务管理中的部分应用领域税务管理中的部分应用领域•税收收入的变化分析•税源管理分类分析•综合的专题分析纳税评估稽查选案信誉评级实践应用中的几类问题实践应用中的几类问题•连续变量的预测问题•分类变量的预测问题•群体特征问题•相关变量关系分析•聚类问题•数据降维问题基础数据基础数据税务机关内部信息•纳税人属性信息纳税人基本信息纳税人项目登记信息纳税人征管鉴定信息•纳税人行为信息纳税人申报信息纳税人纳税信息纳税人财务信息发票购领信息违章信息•税务机关行为信息稽查信息相关管理机构的信息•国家统计局部分数据•国家信息中心部分数据•国家工商部门部分数据税收收入的变化税收收入的变化•税收收入变化因素的描述性分析统计量的选择问题:检查补税、税户移动、宏观政策、纳税人内部自然增长等•税收收入预测回归分析:各产业的GDP值、各行业发展的增长指标,行业内重点税源的加权增长额问题:方法的选择,模型的选择,操作过程的控制时间序列:按照时间变化的趋势去预测(数据的使用范围的限制、不同地区的误差情况不同)新的思路的提出:单一行业的序列预测,可以考虑引进新的预测变量(房地产业)利用数据挖掘做纳税评估利用数据挖掘做纳税评估•如何定义纳税评估中发现各类的非正常纳税人;•非正常的纳税人在征管和稽查的过程中所具有的定性的特征;•上述特征中如何取得量化的数据信息;•如何利用数据挖掘模型将不同类型的纳税人分类;•如何利用现有的分类对同等特征的纳税人未来的纳税行为进行预测;数据挖掘的处理过程数据挖掘的处理过程•对明细数据中各种变量的描述和可视化处理•从业务流程数据和稽查数据中产生新的变量(某些连续变量离散化)•分类数据挖掘模型:CART\K-Means\Kohonen,主要的分类评估办法•预测的挖掘模型:C5.0\Neuralnet\logisticRegression,主要的预测方法实践中数据挖掘工作的问题实践中数据挖掘工作的问题•数据问题数据源问题数据质量问题1、系统错误2、采集错误3、管理错误•挖掘主题理解统计问题统计问题•统计量问题标准差问题:稽查选案过程中,业务部门的一条重要规则:同行业同规模纳税人的异常状况我们曾经计算过同行业相同注册资本的纳税人的标准差,找到大于或小于2SD的纳税人原因:纳税人缴纳的税款不符合正态分布统计问题统计问题•数据降维问题在纳税评估过程中,需要计算纳税人税款波动信息对总体税款波动情况的影响,其中涉及的波动值字段有15个,如果再考虑相对值就有30个,如果加上年限……因此在这里考虑的问题就是利用一些数据降维的方法,比如说因子分析、主成分分析挖掘模型组合使用的问题挖掘模型组合使用的问题•模型库—应用的简捷性•组合模型—有效性•模型的发布模型评估系统模型评估系统•模型的准确率•不同模型结果的ROI•在与实际业务结合时模型的可应用性
本文标题:统计分析和数据挖掘在税务管理部门的主要应用-吴昊
链接地址:https://www.777doc.com/doc-7084099 .html