您好,欢迎访问三七文档
统计学教程第一章绪论第二章统计调查与整理第三章综合指标第四章参数估计和假设检验第五章相关与回归第六章时间序列第七章指数结束二、统计学的研究对象和研究方法(一)统计包含三种涵义,两重关系1、统计工作:调查研究。资料收集、整理和分析。2、统计资料:工作成果。包括统计数据和分析报告。3、统计学:研究如何搜集、整理、分析数据资料的一门方法论科学。统计工作统计资料统计学工作与工作成果关系实践与理论关系统计学的性质:是一门适用于自然现象和社会现象的方法论学科。统计学的研究对象:大量现象的数量方面。包括数量特征、数量关系、数量界限等。(二)统计学的研究对象(一、统计学的产生与发展产生原始社会后期:统计萌芽于计数活动;奴隶制国家产生:使统计日显重要;封建社会时期:统计已具规模;资本主义的兴起:统计扩展到社会经济各方面。统计学应运而生,统计学作为一门系统的科学,距今只有300多年的历史。三、统计学的要素和内容1、统计总体和总体单位总体统计研究所确定的客观对象,是具有共同性质的许多单位组成的整体。无限总体:含无限多个单位范围有限总体:含有限个单位。总体单位:组成总体的各个单位(或元素),是各项统计数字的原始承担者。同质性:总体中各个单位具有某种共同的性质。大量性:总体总是包含大量的单位。(一)统计学的要素特点2、标志标志总体单位的属性、特征。品质标志:用文字表示属性分类数量标志:用数字表示特征不变标志:各单位具体表现相同可变标志:各单位具体表现不同指标:综合反映总体数量特征的概念和数值。构成:指标名+指标数值特点:具体性;综合性3、指标和指标体系分类:数量指标;质量指标描述指标;评价指标;预警指标绝对数指标;相对数指标;平均数指标在推断统计中:说明总体的指标也称参数。说明样本的指标称统计量。指标体系:具有内在联系的一系指标构成的整体。标志与指标的联系与区别:联系(1)一些数量标志汇总可以得到指标的数值。区别(1)标志是说明总体单位特征的,而指标是说统统计总体数量特征的;(2)数量标志与指标之间存在变换关系。(2)标志的具体表现,有的用数值有的用文字表示,而指标都是用数值表示的。4、变量和变量值变量可变的数量标志和统计指标。确定性变量分类随机性变量离散性变量连续性变量变量值:即变量的具体数值,包括标志值和指标数值社会经济现象中许多变量,既受确定性因素影响,又受随机性因素影响。要根据具体情况加以认定。5、样本是从总体中随机抽取部分单位所构成的集合体。必须取自所要研究的总体;特点从一个总体中可抽取许多个样本,这些样本的数值是不同的,也即存在着随机的差异;样本必须具有代表性;样本必须具有客观性,也即排除主观因素的影响6、推断:就是以样本信息为依据对总体的某些特征作出预测和估计。7、推断的可靠性:根据随机抽取的样本对总体推断所得出的结果的可靠程度,也称置信度。(二)统计学的内容1、描述统计指搜集、整理、分析并提供统计资料的理论和方法。主要任务:使反映客观事物的统计数据可以一目了然,条理清晰,使用方便,可以说明现象的数量特征和数量关系。2、推断统计是只依据样本资料推断总体特征的技术和方法,包括参数估计和假设检验的方法。描述统计是推断统计的前提,推断统计是描述统计的发展。测定层次特征运算功能举例1、定名测定2、序列测定3、间距测定4、比率测定分类分类;排序分类;排序;有基本测量单位分类;排序;有基本测量单位;有绝对零点计数计数;排序计数;排序;加减计数;排序;加减乘除产业分类企业等级产品质量差异商品销售额第二章统计调查与整理统计调查统计整理统计分析有组织、有计划地搜集资料。要求:准确、完整、及时对调查资料去伪存真、去粗取精、科学分类、浓缩简化描述性分析推断分析、决策分析。要求:定性定量结合统计工作的三个中心阶段统计调查一、调查组织方式案例统计调查二、调查方案设计报表制度普查重点调查典型调查抽样调查方案内容调查表、问卷设计制度化的经常性调查专门组织调查全面调查非全面调查统计整理主要任务资料审核、分组、汇总、制表、制图等。分组频数分布统计表统计图分组分组前分组后25%33%42%1·划分现象类型作用:例:按所有制性质划分,我国现有8种经济类型:国有经济;集体经济;私营经济;个体经济联营经济;股份制经济;外商投资经济;港澳台投资经济2·研究总体结构例:南京市按GDP计算的三次产业结构(%)1980年1990年1996年1997年GDP100100100100第一产业3.24.32.52.3第二产业75.763.854.552.2第三产业21.131.943.045.53·研究现象之间的依存关系例:中国农民家庭按收入分组的恩格尔系数(1984年)按收入分组(元)2003004005006008001000恩格尔系数(%)64.960.256.754.450.549.943.6分组标志的选择与分组形式关键:服从研究任务需要,反映总体本质特征形式按分组标志性质分品质标志分组数量标志分组按分组标志个数分简单分组复合分组分组体系数分布(频分布数列)是一种重要的分组资料,反映总体单位在各组的分布状态。基本形式:分组单位数频率合计………100频数分布频率分布分类品质数列变量数列单项数列组距数列等距数列异距数列例例例例变量数列的编制1·计算极差2·确定形式单项数列:离散型且取值不多。组距数列:离散型且取值多或连续型。3·组距数列:组距;组数;组限4·计算各组频数,频率,累计频数,累计频率等。5·组中值的计算:闭口组;开口组统计表构成总表题横行标题:统计研究的对象。也称主词。纵栏标题:说明主词的指标名。也称宾词。数字资料分类主词简单表分组表复合表宾词平行形式交叉形式例统计图直方图等距数列:(变量,频数)折线图曲线图P26图2-1等距数列:(组中值,频数)单项数列:(变量,频数)向上累计分布:(变量上限,累计频数)向下累计分布:(变量下限,累计频数)变量的组数无限增多时,折线便趋于一条光滑的曲线。P27图2-2P28图2-3图形第四章数据分布特征一、综合指标概述二、总量指标(绝对数指标)三、相对数指标(相对数)四、平均数指标(平均数)五、标志变异指标主要内容案例二、总量指标(绝对数指标)概念总量指标是反映社会经济现象总规模、总水平的总和指标。(1)反映国情、国力和企事业单位人、财、物的状况;(3)是计算相对指标和平均指标的基础。(2)是国民经济宏观管理和企业经济核算的基础性指标,是实行目标管理的工具;作用分类按反映总体的内容分按反映的时间状态分(1)社会总产品,(2)增加值,(3)国内生产总值(GDP)按计量单位分国民经济统计中几个重要的生产总量指标标志总量总体单位总数时期总量时点总量实物量劳动量价值量四、集中趋势的指标平均指标(平均数)概念平均指标反映同类现象的一般水平,是总体内各单位参差不齐的标志值的代表值,也是对变量分布集中趋势的测定。数据集中区变量xx常用的几种平均数概念计算公式特点优点:①容易理,便于计算②灵敏度高③稳定性好④和缺点:①易受极值影响②在偏斜分布和U形分布中,不具有代表性1.算术平均数()标志总量与总体单位总数的比值nxxiiiiffxx简单:加权:0xx最小2xxx常用的几种平均数概念计算公式特点优点:灵敏度高②受极值影响小于和③适宜于各比率之积为总比率的变量求平均缺点:①有“0”或负值时不能计算②偶数项数列只能用正根3.几何平均数()n个变量值连乘积的n次方根简单:加权:GxniGxxififiGxx常用的几种平均数概念计算公式特点4.中位数(Me)标志值由小到大顺序排列中居中间位置的标志值位置平均数上限公式:下限公式:ifSfUMemm12/ifSfLMemm12/优点:①容易理解,②不受极值影响③适宜于开口组资料和些不能用数字测定的事物缺点:①灵敏度和计算功能差②间断数Me常用的几种平均数概念计算公式特点5.众数(Mo)分配数列中出现次数最多的标志值位置平均数上限公式:下限公式:优点:①容易理解,②不受极值影响缺点:①灵敏度和计算功能差②稳定性差③具有不唯一性idddUMo212idddLMo211位置平均数与算术平均数的关系XfXfXfMoMex(对称分布)MoMex正偏态分布(右)MoMex负偏态分布(左)在偏斜不大时)(2MexMoMexMeMo2323MoMex1212xMoMeMeMoxxMeMo应用平均指标的原则1.必须是同质的量方可平均;2.总平均数与组平均数结合分析;3.根据具体条件选择平均方法;4.平均数与典型值和分配数列结合分析;5.集中趋势与离散趋势结合分析五、标志变异指标(Dispession)概念标志变异指标是反映变量分布离散趋势、与平均指标相匹配的指标。(1)反映变量分布的离散趋势;(3)是对事物发展均衡性的量度。(2)是对平均数的代表性程度的量度;作用概念计算特点数列中最大值与最小值之差1.极差(R)R=最大值-最小值优点:容易理解,计算方便缺点:不能反映全部数据分布状况2.平均差(A、D)各标志值与均值离差绝对值的算术平均iiffiXXDAnXXDAi简单:加权:优点:反映全部数据分布状况缺点:取绝对值,数字上不尽合理概念计算特点各标志值与均值离差平方的平均。方差的平方根(取正根)3.方差(σ2)和标准差(σ)优点:反映全部数据分布状况,数字上合理。缺点:受计量单位和平均水平影响,不便于比较4.标准差系数(Vσ)标准差与均值之商,是无量纲的系数简单:加权:优点:适宜不同数据集的比较缺点:对数据结构变化反应不灵敏ffXX22nXXi22XV2方差(σ2)和标准差(σ)是应用最广的标志变异指标•投资者想购买在纽约证券交易所上市的股票A和股票B中的一种。从前几个月两种股票的收盘价可以发现两者的标准差差别很大SA=2.00美元,SB=8.00美元。那只股票更稳定?标准差的应用测定分布的偏度)(3,eoMXSKMXSK或1.偏度系数MoxSK=0MoxSK0MoxSK0MoMoMoxxx(对称分布)正偏态分布(右)负偏态分布(左)K=1,2,3时,有:一阶中心矩二阶中心矩三阶中心矩0/)(11nXXmnXXm/)(22nXXm/)(33所以,m3可以测定偏度。为消除量纲,转变为系数,再除以σ3。33m偏度系数0负偏态=0对称分布0正偏态33m第四章参数估计和假设检验推断统计:利用样本统计量对总体某些性质或数量特征进行推断。随机原则总体参数统计量推断估计参数估计检验假设检验抽样分布案例一、抽样调查中的基本概念•(一)总体与总体参数•在抽样估计中,用来反映总体数量特征的指标称为总体指标,也叫总体参数。•研究目的确定总体也惟一确定总体参数即确定,因此总体参数是客观存在的,但又是未知的(二)样本与统计量•样本:从总体中抽取的部分总体单位所构成的整体,称为该总体的一个样本。•样本容量:样本所包含的总体单位个数称为样本容量•n≥30的样本称为大样本;n<30称为小样本•统计量:样本指标称为统计量,统计量是随机变量(三)抽样误差•实际抽样误差是指某一具体样本的样本估计值与总体参数的真实值之间的离差。由于总体参数的真实值未知,因此,实际抽样误差也无法计算样本估计量是随样本不同而不同的随机变量,所以实际抽样误差也是随机变量抽样平均误差•抽样平均误差是反映抽样误差一般水平的指标,它的实质含义是指抽样平均数(或成数)的标准差。即它反映了抽样指标与总体指标的平均离散程度。抽样平均误差的作用首先表现在它能够说明样本指标代表性的大小。平均误差大,说明样本指标对总体指标的代表性低;抽样极限误差•抽样极限误差的实际意义是希望总体平均数落在抽样平均数的范围内,总体成数落在抽样成数的范围内。•抽样极限误差是指一定概率下抽样误差的可能范围,也称为允许误差二、抽样分布•概念样本统计量是一个随机变量,有若干个取值,样本统
本文标题:统计学
链接地址:https://www.777doc.com/doc-1868704 .html