您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 市场营销 > 2017年经济师经济基础_第四部分_统计
1第四部分统计第二十二章统计与统计数据考点一:统计学的两大分支及各自的内容统计学的两大分支(描述统计和推断统计)类型主要考点描述统计研究数据收集、整理和描述的统计方法。其内容包括:1.如何取得所需要的数据;2.如何用图表或数学方法对数据进行整理和展示;3.如何描述数据的一般特征。推断统计研究如何利用样本数据推断总体特征的统计方法。其内容包括:1.参数估计:利用样本信息推断总体特征;2.假设检验:利用样本信息判断对总体假设是否成立。考点二:变量及数据1.变量:变量是研究对象的属性或特征,它是相对于常数而言的。常数只有一个固定取值,变量可以有两个或更多个可能的取值。分类定量变量(数量变量)变量的取值是数量。如企业销售额、注册员工数。定性变量分类变量变量的取值是类别。如企业所属行业、员工性别。顺序变量变量的取值是类别且有顺序。如员工受教育水平。2.数据:数据是对变量进行测量、观测的结果。数据可以是数值、文字或者图像等形式。定量数据(数值型数据)是对定量变量的观测结果,其取值表现为具体的数值。如企业的销售额是1000万元。分类数据分类变量的观测结果,表现为类别,一般用文字来表述,也可用数字描述。如,用1表示男性,2表示女性。顺序数据顺序变量的观测结果,表现为类别,一般用文字描述,也可用数字描述。如用1表示硕士及以上,2表示本科,3表示大专及以下。考点三:数据的来源分类类别内容按收集方法观测数据通过直接调查或测量而收集的数据。观测数据是在没有对事物施加任何人为控制因素的条件下得到的。几乎所有与社会经济现象有关的统计数据都是观测数据,如GDP、CPI、房价等。实验数据通过在实验中控制实验对象以及其所处的实验环境收集到的数据。如,一种新产品使用寿命的数据,一种新药疗效的数据。自然科学领域的数据大多都是实验数据。按来源一手数据来源于直接的调查和科学实验的数据,对使用者来说这是数据的直接来源。其来源主要有:调查或观察;实验。二手数据来源于别人的调查或实验的数据。对使用者来说这是数据的间接来源。考点四:统计调查1.统计调查的种类种类具体内容按调查对象的范围不同全面调查全面统计报表和普查。非全面调查非全面统计报表、抽样调查、重点调查和典型调查。按调查登记的时间是否连续连续调查如工厂的产品生产、原材料的投入、能源的消耗、人口的出生、死亡等。不连续调查如生产设备拥有量、耕地面积等。2.统计调查方式在我国常用的统计调查方式有统计报表、普查、抽样调查、重点调查和典型调查。调查方式含义主要考点普查为某一特定目的而专门1.普查通常是一次性的组织的一次性全面调查,主要用于收集处于某一时点状态上的社会经济现象的基本全貌。或者周期性的。2.一般需要规定统一的标准调查时间,以避免调查数据的重复或遗漏,保证普查结果的准确性。3.数据一般比较准确。4.使用范围比较窄。抽样调查从调查对象的总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的一种非全面调查。1.经济性(最显著的优点)2.时效性强3.适应面广4.准确性高重点调查从调查对象的总体中选择少数重点单位进行调查。所选择的重点单位就调查的标志值来说在总体中占绝大比重。(1)为了及时了解全国城市零售物价的变动趋势,就可以对全国的35个大中型城市的零售物价的变化进行调查就是重点调查。(2)要及时了解全国工业企业的增加值和资产总额情况,只需对全国大中型工业企业进行重点调查即可。(3)国家统计局的全国5000家工业企业联网直报制度属于重点调查。典型调查选择若干具有典型意义的或有代表性的单位进行的调查。作用:弥补全面调查的不足;在一定条件下可以验证全面调查数据的真实性。第二十三章描述统计考点一:集中趋势的测度集中趋势是指一组数据向某一中心值靠拢的倾向,测度集中趋势也就是寻找数据一般水平的代表值或中心值。测度值计算备注均值数据组中所有数值的总和除以该组数值的个数(1)它是集中趋势中最主要的测度值。(2)均值主要适用于数值型数据,但不适用于分类数据和顺序数据。(3)均值易受极端值的影响。(4)能够充分利用数据的全部信息。中位数一组数据按从小到大或从大到小的顺序进行排列,位置居中的数值。(1)适用于顺序数据,也适用于数值型数据,但不适用于分类数据。(2)不受极端值的影响,抗干扰性强。(3)没有充分利用数据的全部信息,稳定性差于均值,但优于众数。众数一组数据中出现次数最多的变量值。(1)适于描述分类数据和顺序数据。(2)不受极端值的影响。(3)没有充分利用数据的全部信息,缺乏稳定性,而且可能不唯一。(有些情况下可能出现双众数、多众数或者没有众数,难以描述数据的集中趋势)指标适用数据类型是否受极端值影响众数分类数据、顺序数据不受中位数顺序数据、数值型数据不受均值数值型数据受考点二:离散程度的测度值方差数据组中各数值与其均值离差平方的平均数。方差越小,说明数据值与均值的平均距离越小,均值的代表性越好。2标准差方差的平方根。不仅能度量数值与均值的平均距离,还与原始数值具有相同的计量单位。标准差越小,说明数据值与均值的平均距离越小,均值的代表性越好。离散系数(变异系数,标准差系数)标准差与均值的比值。离散系数消除了测度单位和观测值水平不同的影响,因而可以直接用来比较变量的离散程度。考点三:分布形态的测度分布形态的测度指标包括偏态系数和标准分数。一、偏态系数项目主要内容偏态系数测度数据分布偏度的统计量,取决于离差三次方的平均数与标准差三次方的比值。偏态系数的取值等于0数据的分布是对称的。偏态系数0分布为右偏。1.取值在0和0.5之间,轻度右偏2.取值在0.5和1之间,中度右偏3.取值大于1,严重右偏偏态系数0分布为左偏。1.取值在0和-0.5之间,轻度左偏2.取值在-0.5和-1之间,中度左偏3.取值小于-1,严重左偏偏态系数的绝对值越大数据分布的偏斜程度越大。二、标准分数(也称为“Z”分数)项目主要内容适用在统计上,均值和标准差不同时,来自不同分布的变量值不可比,但是每个数值在变量分布中相对于均值的相对位置是可比的,因此可以通过计算标准分数来比较不同变量的取值。标准分数给出了数值距离均值的相对位置。计算(原始分数Xi-平均分数X)÷标准差s实际应用当数据服从对称的钟形分布时,可以运用经验法则来判断与均值的距离在特定倍数标准差之内的数据项所占比例。约有68%的数据与平均数的距离在1个标准差之内,标准分数在【-1,1】范围内;约有95%的数据与平均数的距离在2个标准差之内;标准分数在【-2,2】范围内;约有99%的数据与平均数的距离在3个标准差之内;标准分数在【-3,3】范围内。考点四:变量间的相关分析一、相关关系的类别分类标准类别内含相关的程度完全相关一个变量的取值变化完全由另一个变量的取值变化所确定。称这两个变量完全相关。不完全相关大部分相关现象均属于不完全相关。不相关两个变量的取值变化彼此互不影响。相关的方向正相关一个变量的取值由小变大,另一个变量的取值也相应的由小变大。(两个变量同方向变化)。负相关一个变量的取值由小变大,另一个变量的取值由大变小(两个变量反方向变化)。相关的形式线性相关pearson相关系数只适用线性相关关系。非线性相关两个相关变量之间的关系近似于某种曲线方程的关系。【注】两变量之间的关系可以用散点图来展示。二、相关系数的取值相关系数是度量两个变量之间相关关系的统计量。最常用的相关系数是pearson(皮尔逊)相关系数。相关系数的取值范围在【-1,1】之间。r的取值两变量之间的关系0r≦+1正线性相关-1≦r0负线性相关r=1完全正线性相关r=-1完全负线性相关r=0不存在线性相关关系,但并不能说明两变量之间没有任何关系,它们之间可能存在非线性相关关系。|r|的取值两变量之间的相关程度|r|≧0.8高度相关0.5≦|r|0.8中度相关0.3≦|r|0.5低度相关|r|0.3相关程度极弱,可视为无线性相关关系第二十四章抽样调查考点一:抽样调查的基本概念【例】在研究某城市居民的家庭消费支出时,在全部50万户家庭中随机抽取3000户进行入户调查,这项抽样调查中的样本单位是指该城市中()。A.抽取出来的3000户家庭B.50万户家庭C.每一户家庭D.抽取出来的每一户家庭【答案】D概念含义本题中总体调查对象的全体50万户家庭总体单元组成总体的各个个体每一户家庭样本总体的一部分,由从总体中按一定原则或程序抽出的部分个体所组成。样本也是一个集合。抽取出来的3000户家庭样本单位每个被抽中进入样本的单位称为入样单位。抽取出来的每一户家庭样本量样本中包含的入样单位的个数称为样本量。3000户抽样框供抽样所用的所有抽样单元的名单,是抽样总体的具体表现。常见的抽样框有名录框,如企业名录、电话簿、人员名册。全部50万户家庭消费信息的载体总体参数即总体指标值,它是未知的常数,是根据总体中所有单位的数值计算的,是通过调查想要了解的,不受样本的抽选结果影响。常用的总体参数有总体总量、总体均值、总体比例、总体方差。50万户家庭的平均消费支出样本统计量(估计量)是根据样本中各单位的数值计算的,是对总体参数的估计,也称估计量。它是一个随机变量,取决于样本设计和正好被选入样本的单元特定组合。常用的样本统计量有样本均值、样本比例、样本方差。抽取出来的3000户家庭的平均消费支出考点二:概率抽样与非概率抽样抽样方法特点具体方式3概率抽样1.按一定概率以随机原则抽取样本。2.总体中每个单元被抽中的概率是已知的或者是可以计算出来。3.当采用样本对总体参数进行估计时,要考虑到每个样本单元被抽中的概率。若每个单位被抽中的概率相等,则称为等概率抽样;否则称为非等概率抽样。1.简单随机抽样2.分层抽样3.系统抽样4.整群抽样5.多阶段抽样非概率抽样抽取样本时并不是依据随机原则。调查者根据自己的方便或主观判断抽取样本。1.判断抽样2.方便抽样3.自愿样本4.配额抽样考点三:抽样调查的一般步骤1.确定调查问题2.调查方案设计3.实施调查过程4.数据处理分析5.撰写调查报告考点四:抽样调查中的误差误差形成原因抽样误差由抽样的随机性造成的,用样本统计量估计总体参数时出现的误差。非抽样误差除抽样误差外,由其他原因引起的样本统计量与总体真值之间的差异。(1)抽样框误差:样本框不完善造成的(2)无回答误差:调查人员没能够从被调查者那里得到所需要的数据。无回答分为:①由于随机因素造成的。如被调查者恰巧不在家。②由于非随机因素造成的:如被调查者不愿告诉实情而拒绝回答。(3)计量误差:由于调查所获得的数据与其真值之间不一致造成的误差。这种误差可能是由调查人员、问卷设计、受访者等原因造成的。考点五:几种基本概率抽样方法的判定方法关注的知识点简单随机抽样1.最基本的随机抽样方法,每个单位的入样概率相同。【例】某校高三年级学生共l000人参加考试,将1000份试卷编好号码后,从中随机抽取30份计算平均成绩,此种抽样方法为(A)。A.简单随机抽样B.系统抽样C.分层抽样D.整群抽样2.不放回简单随机抽样每个单位最多只能被抽中一次,比放回抽样有更低的抽样误差。3.适用条件:(1)抽样框中没有更多可以利用的辅助信息(2)调查对象分布的范围不广阔(3)个体之间的差异不是很大。分层抽样1.理解概念:先按照某种规则把总体分为不同的层,然后在不同的层内独立、随机的抽取样本。【例】在调查某部门平均工资时,先将该部门员工分为经理和普通职员两类,再采用随机原则分别在经理和普通职员中抽取样本,这种抽样方法属于(C)。A.简单随机抽样B.整群抽样C.分层抽样D.等距抽样2.适用条件:抽样框中有足够的辅助信息,能够将总体单位按某种标准划分到各层之中,实现在同一层内,各单位之间的差异尽可能小,不同层之间各单位的差异尽可能大。系统抽样1.理解概念:将总体中的所有单元按一定顺序排列,在规定范围内随机抽取一个初始单元,然后按事先规定的规则抽取其他样本单元。【例】调查一个居委会4000户家庭人均收入,编号1-4000,要抽取40户,在1-100号中随机确定15号,抽取的样本为15;1
本文标题:2017年经济师经济基础_第四部分_统计
链接地址:https://www.777doc.com/doc-2952762 .html