您好,欢迎访问三七文档
当前位置:首页 > 办公文档 > 工作范文 > stata-期末论文
周恩来政府管理学院2014——2015学年第一学期《高级社会统计及软件应用》(论文)专业:人类学学号:_2120141707姓名:于艳华成绩:_________居民受教育水平对个人职业收入的影响---基于cgss2008的实证数据分析摘要:一直以来人们都认为个人受教育水平的高低对其职业收入水平有着重要的影响,本文利用cgss2008的数据,基于stata统计软件,利用OLS模型对cgss2008的数据进行实证分析,得出结论,个人受教育水平对其职业收入有着显著的影响。并且,考虑到性别、省份所属区域、被访者居住的社区类型等是影响个人职业收入的其他因素,本文将cgss2008的数据按性别进行分组后发现,性别对个人职业收入水平有重要影响,一般意义上,女性的职业收入要低于男性的职业收入;控制性别变量后,被调查对象的省份所属区域对个体收入水平也有显著的影响,一般意义上来说,中部和西部的居民职业收入低于东部的居民职业收入;在控制了性别、被调查对象的省份所属区域,被访者居住的社区类型对个体的职业收入有显著影响,一般来说,居住于非城市社区的居民职业收入水平低于居住于城市社区的居民职业收入水平;在加入了调查对象的受教育水平后,并对以上三个基础变量控制之后发现,居民受教育水平对其职业收入有着显著的影响。一、文献回顾(一)研究意义1、理论意义和现实意义随着知识经济时代的来临,教育在个人收入中的作用日益重要。教育对个人收入影响力的大小主要体现在教育收益率的高低上。关于中国教育收益率的研究也相当多,对于居民受教育水平对个人职业收入的影响,国内研究主要集中于对这种现象的描述分析,缺少权威的实证数据分析,本文利用cgss2008的数据,中国综合社会调查(Chinageneralsocialsurvey,缩写为cgss)是中国的一个较具有权威性的综合社会调查项目,该数据具有规模较大,科学性较强等特点,结合cgss2008的数据,利用OLS模型的实证数据分析推测个体职业收入与教育水平及其他因素之间是否有回归关系,或者这种关系是否显著。这对于完善教育对职业收入的影响的理论研究有重要意义。居民收入水平是衡量一个国家的居民生活水平高低的重要标准,关系一个社会整体的良性运行,而教育是影响个人职业收入的重要因素,是一个社会实现纵向流动的重要途径,为了更好地实现教育对于社会发展进步的积极促进作用,研究教育及其他因素对居民职业收入的影响具有重大的现实意义。(二)现有实证研究的缺陷回顾以往的关于教育对于职业收入影响的分析中可以发现,研究者大多数集中于单一变量对个体职业收入的影响,没有结合其他的变量综合分析教育对于职业收入的影响,本文针对这一缺陷,将会综合考虑教育、性别、省份所属区域、被访者居住的社区类型等变量因素对职业收入的影响。首先分析各个变量(教育、性别、省份所属区域、被访者居住的社区类型)对于职业收入的影响;其次在分别对以上变量进行控制后,分析教育对于居民职业收入的影响,以提高分析的可信度。二、研究问题本文致力于研究受教育水平对居民职业收入的影响,受教育水平用研究对象的最高教育程度表示,利用cgss2008的数据,首先对性别进行分组,以区别不同性别的收入情况;其次在性别分组的基础上,对其省份所属区域进行区分,以分析地域不同对居民收入的影响;然后在性别、省份所属区域的基础上,分析被访者居住的社区对职业收入的影响;最后在控制性别、省份所属区域、被访者居住的社区类型变量的基础上,分析研究对象的受教育水平对职业收入的影响。初步的研究假设有:假设一:性别对收入有着显著的影响,一般意义上,女性收入低于男性收入;假设二:控制性别变量后,省份所属区域对收入有显著影响,一般意义上,中部和西部的居民职业收入低于东部的居民职业收入;假设三:控制性别、省份所属区域变量后,被访者居住的社区类型对职业收入有显著影响,一般意义上,居住在非城市社区的居民职业收入低于居住在城市社区的居民的职业收入;假设四:控制性别、省份所属区域、被访者居住的社区类型变量后,一般意义上,居民的受教育水平越高,居民的职业收入越高。三、研究方法本文利用cgss2008的数据展开实证研究,cgss是中国综合社会调查的缩写,是中国第一个综合性大规模的社会调查项目,由中国人民大学社会学系发起,该数据具有覆盖范围全面,调查内容深入细致,数据的科学性和客观性较强等特点,本文所使用的cgss2008的数据总共有6000个调查对象,是对全国125个县(区),500个街道(乡、镇),1000个居(村)委会、10000户家庭中的个人进行调查。通过定期、系统地收集中国人与中国社会各个方面的数据形成的一套覆盖范围广,科学性强的资料。本文主要用到的cgss2008中的自变量有调查对象的性别、省份、被访者居住的社区类型、目前最高的教育程度等,因变量为研究对象的职业收入(即调查对象去年全年的职业收入)。为了提升本次研究的科学性,在使用数据之前首先对数据进行了处理,将所有变量中有缺失值的变量用stata统计软件做drop处理,这样数据中的6000个变量被处理为5032个没有缺失值的变量,整个研究在这5032个变量的基础上展开。性别变量在数据中的原始变量为a1,为分析方便新产生一个二元变量female,在这篇文章的研究对象中female为0的研究对象为男性,female为1的研究对象是女性,被调查对象的男女分布情况图:见图一;图一:被调查者性别分布状况饼状图第二个自变量为研究对象的省份,原始变量为province,为了更好的区分省份和分析方便,产生一个新的变量pro,将省份划分为“东部”、“中部”、“西部”区域,即将“东部”定义为“1”,包括“北京”、“天津”、“河北省”、“上海”“江苏省”、“浙江省”、“福建省”、“山东省”、“广东省”、“辽宁省”;将“中部”定义为2,表示“中部”包括“山西省”、“安徽省”、“江西省”、“河南省”、“湖北省”、“湖南省”、“黑龙江省”、“吉林省”;将“西部”定义为3,代表“西部”包括“广西省”、“内蒙古自治区”、“重庆”、“四川省”、“贵州省”、“云南省”、“陕西省”、“甘肃省”、“宁夏自治区”、“新疆自治区”。被调查者的省份分布区域划分柱形图:见图二。图二:被调查者的省份分布区域划分柱形图第三个自变量为被访者居住的社区类型,根据原始变量v41产生出一个新的变量com,并将回答“其他”的定义为缺失值,其中com为0时,说明被调查者居住的社区类型为城市社区,将被访者居住的社区类型为“集镇社区”、“农村”、“郊区”定义为1,也就是非城市社区,被访者居住的社区类型分布图:见图三;图三:被访者居住的社区类型分布饼状图最后一个自变量为被调查者目前的最高教育程度,原始变量为a3a,包括“没有受过任何教育”、“私塾”“小学”、“初中”、“职业高中”、“普通高中”、“中专”、“技校”、“大学专科(成人高等教育)”、“大学专科(正规高等教育)”、“大学本科(成人高等教育)”、“大学本科(正规高等教育)”、“研究生及以上”、“其他”,将原始变量中回答“其他”定义为缺失值,这样剩下的变量分为13个等级,等级越高表明调查对象的受教育水平越高,为分析方便根据原始变量产生一个新变量edlevel。被调查者最高教育程度分布图:见图四。图四:被调查者最高教育程度分布直方图050010001500Frequency051015edu本文中所使用的因变量为被调查者去年全年的职业收入,原始变量为a21a,我们将这个原始变量进行缺失值的处理,即将“不适用”、“不知道”、“拒绝回答”定义为缺失值,用drop进行处理,为分析方便,将被调查者去年全年的职业收入按单位为千元进行处理,产生新变量inc。新变量inc的描述性统计情况表:见表一。表一:被访者去年全年的职业收入情况统计(单位:千元)incFreq.PercentCum.02785.525.520.120.045.560.15510.025.580.2100.25.780.22510.025.80.2310.025.820.2520.045.860.2810.025.880.3150.36.180.3520.046.220.4180.366.580.4910.026.60.5480.957.550.6220.447.990.6420.048.030.6510.028.050.7180.368.410.7210.028.430.7540.088.510.8380.769.260.8420.049.30.8510.029.320.950.19.4211783.5412.961.0510.0212.981.0810.02131.150.113.11.1210.0213.121.2230.4613.571.2530.0613.631.3100.213.831.4110.2214.051.5771.5315.581.5610.0215.61.5810.0215.621.6130.2615.881.6810.0215.91.7410.0215.921.7510.0215.941.890.1816.121.87210.0216.141.910.0216.161.9220.0416.222314.5920.792.110.0220.812.1610.0220.832.260.1220.952.330.0621.012.4110.2221.222.5310.6221.842.610.0221.862.720.0421.92.830.0621.962.9410.0221.9832344.6526.633.210.0226.653.2510.0226.673.320.0426.713.410.0226.733.5140.2827.013.6170.3427.343.720.0427.383.820.0427.4241312.630.034.110.0230.054.250.130.154.320.0430.194.4810.0230.214.560.1230.334.890.1830.552434.8335.335.110.0235.355.420.0435.395.530.0635.455.5210.0235.475.810.0235.4961683.3438.836.310.0238.856.550.138.956.610.0238.976.7210.0238.996.810.0239.017701.3940.47.2290.5840.987.580.1641.147.610.0241.167.710.0241.187.830.0641.2481713.444.638.1620.0444.678.1810.0244.698.2810.0244.718.310.0244.738.4250.545.238.49710.0245.258.580.1645.418.620.0445.458.710.0245.478.810.0245.499531.0546.549.210.0246.569.520.0446.69.6641.2747.879.710.0247.899.75610.0247.919.79210.0247.939.810.0247.959.80410.0247.979.8430.0648.03104969.8657.8910.0810.0257.9110.3210.0257.9310.6810.0257.9510.8170.3458.2911310.6258.911.410.0258.92122514.9963.9112.0910.0263.9312.210.0263.9512.310.0263.9712.3610.0263.9912.510.0264.0113551.0965.113.2110.2265.3213.430.0665.3813.520.0465.4214370.7466.1614.0410.0266.1814.310.0266.214.4170.3466.5314.810.0266.55151
本文标题:stata-期末论文
链接地址:https://www.777doc.com/doc-1751935 .html