您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 3.多源数据比对校核结果-蔡玥
多源数据比对校核结果国家卫生计生委统计信息中心蔡玥主要内容•部委间数据校核结果–基准校核–多元校核•人口死亡登记数据与全员人口数据比对–方法–结果•全国数据结果•605监测点数据结果部委间数据校核结果国家人口基础信息库介绍•国家人口基础信息库是国家政务信息化建设规划中重点建设的五个国家基础信息库之一。•共建单位包括:公安部、教育部、民政部、人保部、国家卫生计生委等五部委。•国家卫生计生委负责向国库推送人口出生、死亡、新农合及全员人口等信息。基于国库的数据校核数据镜像(基于OracleGoldenGate)应用设计死亡信息人口死亡信息登记管理系统出生信息人口出生信息登记管理系统新农合信息新农合信息系统(海南、河南)前置区镜像同步子系统(前置端)镜像同步配置管理镜像同步异常处理镜像同步日志记录镜像同步过程监控数据提取数据传输管理数据导入数据核对服务代理报文接收任务队列管理线程池管理并发任务调度任务优先级管理日志管理线程池队列监测数据源管理子系统通用接口异构数据导入异构数据导出数据同步子系统数据接收数据反馈前置系统数据加载反馈系统维护校核数据管理维护数据抽取应用校核反馈数据抽取应用校核反馈数据入库文件交换数据推送初始化信息检索信息比对信息推送数据整合数据审核评估数据整合处理原始数据追溯数据采集数据采集数据审核数据转换数据加载数据清洗批量数据管理批量数据请求批量反馈数据抽取批量反馈数据入库文件交换综合应用管理及数据质量控制综合查询模块改造统计分析模块改造数据质量检测与评估系统设计全员人口信息全员人口信息系统(亦庄机房)国家卫生计生委应用设计总体架构部委间数据校核•校核过程:–国库前置端基准校核:•1)ID长度不等于15或18;2)ID最后一位是字母但不为x;3)ID倒数第二位与性别不匹配。–公安部基准校核:•1)ID不存在;2)ID匹配成功但姓名不符–国库多元校核:•国家卫生计生委人口死亡信息登记库及全员人口库、公安部户籍注销库、民政部火化库、人社部居民保险库比对。•参与校核数据:–各系统2014、2015年全年数据。部委间数据校核•国库前置端基准校核结果:2014年省上报数前置端审核错误率报送国库比例省上报数前置端审核错误率报送国库比例北京803832.9397.07湖北28216021.6078.40天津740228.8191.19湖南34235156.6743.33河北22914748.9051.10广东25432713.4286.58山西12571935.0164.99广西17974829.2170.79内蒙古10704940.1859.82海南2780732.8467.16辽宁2634147.9892.02重庆22274428.0371.97吉林12975416.4683.54四川50929422.5077.50黑龙江24700226.7473.26贵州7482933.2466.76上海6680111.7188.29云南22310133.0466.96江苏49510313.5986.41西藏308833.5566.45浙江977704.3195.69陕西12149720.0080.00安徽22421533.7366.27甘肃10029327.7572.25福建8453026.8273.18青海2511436.8563.15江西14843133.6066.40宁夏3190835.4064.60山东66793016.9083.10新疆4204222.0777.93河南45686734.0265.98全国596209425.7874.38部委间数据校核•国库基准校核结果:2014年省国库审核错误率入库率省国库审核错误率入库率北京1.1895.93湖北6.7973.07天津1.6889.65湖南8.9939.43河北9.0946.45广东2.8784.10山西9.4458.86广西5.3367.01内蒙古6.2856.06海南10.1560.34辽宁2.6089.63重庆4.1369.00吉林4.1080.12四川7.1971.93黑龙江5.1169.52贵州11.1059.35上海1.9186.60云南8.1761.49江苏2.9683.85西藏17.5454.79浙江4.7591.15陕西10.5371.58安徽7.8661.06甘肃9.9765.05福建5.8768.88青海8.7757.61江西8.9660.45宁夏6.2760.55山东5.2878.71新疆18.4163.58河南11.0758.67全国6.1669.80部委间数据校核•国库前置端基准校核结果:2015年省上报数前置端审核错误率报送国库比例省上报数前置端审核错误率报送国库比例北京708351.3398.67湖北3152809.7990.21天津749993.9896.02湖南38067422.4577.55河北27115023.4876.52广东3173346.1393.87山西12549018.7181.29广西19105917.1682.84内蒙古11185527.7372.27海南2753820.2779.73辽宁2832914.2495.76重庆22745613.5686.44吉林1310299.3090.70四川52024011.9788.03黑龙江24145312.2287.78贵州7886820.5179.49上海585477.5092.50云南21814414.7485.26江苏5299195.9394.07西藏276612.9487.06浙江100816.4783.53陕西16376812.0887.92安徽25152716.5483.46甘肃10232913.8486.16福建11785411.2188.79青海2246922.0377.97江西16476519.4180.59宁夏3082417.0083.00山东6812699.1390.87新疆5170411.8288.18河南48491719.6180.39全国625036113.1586.85部委间数据校核•国库基准校核结果:2015年省国库审核错误率入库率省国库审核错误率入库率北京3.6095.12湖北18.6273.41天津3.8492.33湖南23.6959.18河北23.7658.34广东6.1888.07山西22.3363.14广西11.9572.94内蒙古16.2660.52海南15.9067.05辽宁8.0388.07重庆13.4074.86吉林12.6579.23四川17.9172.27黑龙江14.5974.97贵州19.1964.24上海5.8387.11云南22.4166.15江苏8.5786.00西藏36.3055.46浙江11.6473.81陕西21.9568.62安徽18.7567.81甘肃28.2361.84福建11.4878.59青海22.9660.06江西26.6159.14宁夏17.5168.46山东14.7877.44新疆44.7748.70河南30.5655.82全国16.8372.23部委间数据校核•国库前置端基准校核结果:2015年省14年入库率15年入库率15-14省14年入库率15年入库率15-14北京95.9395.12-0.80湖北73.0773.410.34天津89.6592.332.67湖南39.4359.1819.74河北46.4558.3411.89广东84.1088.073.97山西58.8663.144.28广西67.0172.945.92内蒙古56.0660.524.45海南60.3467.056.71辽宁89.6388.07-1.57重庆69.0074.865.85吉林80.1279.23-0.88四川71.9372.270.34黑龙江69.5274.975.45贵州59.3564.244.89上海86.6087.110.50云南61.4966.154.66江苏83.8586.002.15西藏54.7955.460.67浙江91.1573.81-17.34陕西71.5868.62-2.97安徽61.0667.816.75甘肃65.0561.84-3.20福建68.8878.599.72青海57.6160.062.45江西60.4559.14-1.31宁夏60.5568.467.91山东78.7177.44-1.27新疆63.5848.70-14.88河南58.6755.82-2.85全国69.8072.232.43部委间数据校核•国库多元校核结果:其它系统补充2013年2014年国家卫生计生委全员人口库38808342328232公安部户籍注销库1396909551193民政部火化库137204204261人社部居民保险库144*以上为2013及2014年国库中其它系统上报,死亡登记系统未上报个案数。部委间数据校核•通过国库多元校核后,其他系统补充进死亡登记系统结果(2013年):*以上为2013年国库中其它系统上报,死亡登记系统未上报个案数。部委间数据校核•通过国库多元校核后,其他系统补充进死亡登记系统结果(2014年):*以上为2014年国库中其它系统上报,死亡登记系统未上报个案数,参加校核数据为2014年12月28日前上报的2014年死亡个案。人口死亡登记数据与全员人口数据比对死亡库与全员人口库比对•全员人口库–为提高人口服务与管理水平,原人口计生委自2009年起利用其覆盖全部街道和乡村的计生专干队伍,建立了覆盖中国每一个人的个案信息库。–全员人口信息主要收集三类数据,分别是人口基本情况、死亡信息和妇女生育史信息。死亡库与全员人口库比对•以人口死亡信息登记管理系统和全员人口系统为基础,对人口死亡信息进行比对。–电脑自动匹配两系统登记的死者身份证号和姓名相同的个案。–电脑自动匹配两系统登记的死者常住地址属同一县区,死亡日期相差3天以内,年龄相同,姓相同,性别一致的个案后,人工判断是否为相同个案。死亡库与全员人口库比对•捕获再捕获方法估算人口总死亡水平。–假设人口死亡总数为N,人口死亡信息登记管理系统报告数为M,全员人口库报告数为n,两系统共同登记人数为m,依照chapman等提出的无偏估计公式估计研究地区死亡总数•N=[(M+1)(n+1)/(m+1)]-1;•方差为:Var(N)=(M+1)(n+1)(M-m)(n-m)/(m+1)2(m+2);•漏报率等于估计的群体总数和上报人数的差值与估计的群体总数的百分比:(N-M)/N*100%;•两来源样本合并后的漏报率为:[N-(n+M-m)]/N*100%。全国数据结果死亡库与全员人口库比对地区死亡率(‰)漏报率(%)人口死亡信息登记系统全员人口系统两系统共同登记合计6.9(6.8,7.0)44.5(43.0,45.9)42.2(41.0,43.4)12.6(10.8,14.4)城市6.4(6.3,6.5)40.7(39.5,41.9)49.2(48.1,50.3)20.2(18.3,22.1)农村7.3(7.2,7.4)46.4(44.8,48.0)37.2(35.9,38.5)7.7(6.2,9.2)东部6.6(6.4,6.8)40.3(39.3,41.3)55.9(54.4,57.4)20.4(18.3,22.5)中部7.0(6.9,7.1)43.7(42.3,45.1)38.3(37.2,39.4)8.3(6.6,10.0)西部7.2(7.1,7.3)49.2(47.6,50.8)28.9(28.0,29.8)7.5(6.1,8.8)2013年人群真实死亡率及各系统漏报情况:两系统数据比对结果显示,2013年人口总死亡率为6.9‰,人口死亡信息登记系统漏报率农村明显高于城市,全员人口系统漏报则呈现城市高于农村,两系统捕获人群互补。死亡库与全员人口库比对地区死亡率(‰)漏报率(%)人口死亡信息登记系统全员人口系统两系统共同登记合计6.9(6.8,7.0)38.0(36.8,39.2)41.7(40.6,42.8)11.1(9.4,12,8
本文标题:3.多源数据比对校核结果-蔡玥
链接地址:https://www.777doc.com/doc-7453484 .html