您好,欢迎访问三七文档
当前位置:首页 > 建筑/环境 > 综合/其它 > 初级统计师考试实务复习重点
1、统计是用来处理数据的,它是关于数据的一门学问。统计学是用以收集数据,分析数据和由数据得出结论的一组概念、原则和方法。统计分析数据的方法分为:描述统计、推断统计。描述统计是研究数据搜集、处理和描述的统计学方法。推断统计是研究如何利用样本数据来推断总体特征的统计学方法,内容包括参数估计和假设检验。2、数据类型:①定性数据与定量数据②根据获取数据的方法分为观测数据与实验数据。3、分类变量没有数值特征,所以不能对其数据进行数学运算。分类数据只能用来区分事物,而不能用来表明事物之间的大小、优劣关系。顺序数据之间可以比较大小、高低、优劣。却无法计算相互之间大小、高低或优劣的距离。顺序数据的数据仍然是用来表示事物在性质上的差异,而不能用来反映事物在数量上的差异。因此,从本质上说,顺序数据仍然是定性数据中的一种。数值型数据的计量功能远大于分类数据和顺序数据。有些数值型数据只可以计算绝对差,而有些不仅可以计算绝对差还可以计算相对差。在统计学研究中对数值型数据的研究是定量分析的主要内容。4、观测数据是对客观现象进行实地观测所取得的数据,在数据取得的过程中一般没有人为的控制和条件约束。实验数据一般是在科学实验环境下取得的数据。5、数据的直接来源——原始数据:统计调查或进行实验。通过统计调查得到的数据,一般称为观测数据。通过实验法得到的数据是实验数据。运用实验法首先要注意的是实验组和对照组的产生式随机的。数据的间接来源——次级数据:《中国统计年鉴》、专业调查咨询机构发布的调查结果数据、各企业的经营报表数据等。次级数据(第二手数据)是指由其他人搜集和整理得到的统计数据。6、搜集数据的方法:普查、抽样调查、统计报表、重点调查、典型调查。普查是专门组织的一次性的全面调查,用来调查属于一定时点上或一定时期内的社会现象总量。它适于搜集某些不能或不适宜于定期的全面统计报表搜集的统计资料。普查可以摸清一个国家的国情、国力,特别是可以了解与掌握人力、财力、物资资源状况及其利用状况,为国家制定长远规划与政策提供可靠的依据。普查的特点:是一种全面调查,具有资料包括范围全面、详尽、系统的优点;是一次性的专门调查,因为工作量大,耗资也多,时间周期较长,一般不宜经常举行。抽样调查是一种非全面调查。所有调查单位都有一定的概率被抽取。特点:第一,样本单位按随机原则抽取,排除了主观因素对选取样本单位的影响。第二,能够根据部分调查的实际资料对调查对象的总体的数量特征进行推断,从而达到对调查总体的认识。第三,在抽样调查中会存在抽样误差,但是这个误差可以事先计算并加以控制。在实际调查中,抽样方法主要有概率抽样和非概率抽样。常用的概率抽样形式:简单随机抽样、分层抽样、整群抽样、系统抽样。分层抽样是首先将总体分成不同的层或组,然后在每一层内进行抽样。系统抽样又称等距抽样,是在总体的名录单中每隔一定距离抽选一个被调查者。统计报表是自下而上逐步提供统计资料的调查方法。按照报送范围分为全面报表和非全面报表。内容包括:表式、填表说明。重点调查是在调查对象中选择一部分重点单位进行的一种非全面调查。这些重点单位虽然数目不多,但它们具有所研究对象的总量在总体总量中占据绝大部分的特点。当调查的任务只要求掌握事物的基本状况与基本的发展趋势,而不要求掌握全面的准确资料,而且在总体中确实存在着重点单位时,进行重点调查是比较适宜的。典型调查是一种非全面的专门调查,它是根据调查的目的与要求,在对被调查对象进行全面分析的基础上,有意识地选择若干具有典型意义的或有代表性的单位进行的调查。作用:①补充全面调查的不足②在一定的条件下可以验证全面调查数据的真实性。优点:灵活机动,通过少数典型即可取得深入、详实的统计资料。缺点:由于受“有意识地选出若干有代表性”的限制,在很大程度上受人们主观认识上的影响,因此,必须同其他调查结合起来使用,才能避免出现片面性。7、定性数据包括分类数据和顺序数据,它们的图表展示方法基本相同。即用频数分布表和图形(饼图、条形图、环形图)描述。频数分布表中落在某一特定类别的数据个数称为频数。饼图是利用圆形及圆内扇形面积来表示数值大小的图形。主要用于总体中各组成部分所占比重的研究。条形图是用宽度相同的条形的高度或长度来表述数据多少的图形。如果想比较不同变量之间的结构差异,可以通过环形图来实现。定性数据的图示表述方法都适用于定量数据,反之不然。8、生成定量数据的频数分布表时,首先是将数据进行分组。(分组个数5~15)其次,确定组距。(上限-下限)最后,统计出各组的频数及频数分布表。确定组距时①要考虑各组的划分是否能区分总体内部各个组成部分的性质差别②要能准确清晰地反映总体单位的分布特征③在研究的现象变动比较均匀的情况下,可以采用等距分组④当研究的现象变动很不均匀时,一般采用不等距分组⑤在统计各组频数时,采取上限不在内的原则,即将频数计算在与下限相同的组内。常用来表述定量数据统计图形有:直方图、折线图和散点图。此外还有茎叶图、箱线图。直方图的横坐标代表变量分组,纵坐标代表各变量值出现的频数。折线图是利用线段的升降来说明现象的变动。折线图和散点图都可以用来反映两个变量之间的关系。9、统计表一般由表头、行标题、列标题、数字资料和表外附加组成。10、数据的分布特征:①集中趋势,即数据的数值向其中心值的靠拢程度。②离散程度,反映数据的各数值远离其中心值的趋势和程度。11、反映定性数据集中趋势:百分比、中位数(由小到大排列后中间的数或中间两数的平均数)、众数(出现次数最多)。反映定量数据集中趋势:平均数、中位数、众数和分位数等。反映定量数据离散程度:极差、四分位差、标准差和方差。平均数、中位数和众数:平均数易被多数人理解和接受,实际中用的也较多,但主要缺点是更容易受少数极端数值的影响。中位数和众数提供的信息不像平均数那么多,但不受极端值的影响,具有统计上的稳健性,当数据为偏态分布,特别是偏斜程度较大时,可以考虑选择中位数和众数。极差又称全距,为最大值与最小值之差。它非常容易受极端值的影响,不能准确描述数据的分散程度。标准差是方差的平方根,它比方差更具量纲性。在一个统计样本中,其标准差越大,说明它的各个观测值分布的越分散,它的趋中程度就越差。12、离散系数是将一组数据的标准差除以其均值。13、标准分数是变量值与其平均数的离差除以标准差后的值,用以测定有一个数据在该组数据中的相对位置。14、我们所关心的参数有:总体平均数、总体方差、总体比例。15、统计量是样本的函数。构成统计量的函数中不能包含未知因素。我们关心的统计量通常有样本均值、样本方差、样本比例。16、统计量的概率分布提供了该统计量长远而稳定的信息,它构成了推断总体参数的理论基础。17、样本均值的均值是总体均值。在重置抽样时,样本均值的标准差为总体标准差的1/n。在不重置抽样时,样本均值的标准差为221xNnnN18、当总体服从正态分布时,样本均值一定服从正态分布,即有22(,)(,)XNxNn时,。若总体为未知的非正态分布时,只要样本容量n足够大(通常要求n≥30),样本均值x仍会接近正态分布,其分布的期望值为总体均值,方差为总体方差的1/n。如果总体不是正态分布,当n为小样本时(通常要求n<30),样本均值的分布则不服从正态分布。19、当样本容量比较大时(当np≥5且n(1-p)≥5时),样本比率P近似服从正态分布,且有P的数学期望就是总体比率。P的方差:在重置抽样时,(1)(,)pNn,在不重置抽样时,(1)(,)1NnpNnN20、标准误差用于衡量样本统计量的离散程度,在参数估计中,它是用于衡量样本统计量与总体参数之间差距的一个重要尺度。样本均值的标准误差(SE或x)xn。当总体标准差未知时,可用样本标准差s代替计算。样本比例的标准误差为(1)pn。当总体比例的方差(1)未知时,可用样本比例p(1-p)代替。21、参数估计是用样本统计量去估计总体的参数。由样本统计量来估计总体参数的方法:点估计和区间估计。常用的点估计:样本均值x估计总体均值,样本比例p估计总体比例,样本方差2s估计总体方差2。22、区间估计包括样本统计量在内(有时是以统计量为中心)的一个区间,该区间通常是由样本统计量加减估计标准误差得到的。23、标准正态分布:均值为0,标准差为1。分布标准化公式:xZ样本均值标准化公式:/xznxzn总体参数置信区间:24、评估估计量的标准:无偏性、有效性、一致性。无偏性指估计量的期望值等于被估计的总体参数。x、p、2s分别是、、2的无偏估计量。估计量与参数的接近程度是用估计量的方差(或标准误差)来度量的。对同一个总体参数的两个无偏估计量,有更小方差的估计量更有效。x是的一致估计量。25、在对总体均值进行区间估计时,需要考虑总体是否为正态分布、总体方差是否已知、用于估计的样本是大样本(n≥30)还是小样本等情况。26、总体均值的区间估计:①大样本,/2/21-,)xxnn总体均值在水平下的置信区间为:(-zz②当总体方差未知时,用2s代替2。③小样本,总体方差已知,/2/21-,)xxnn总体均值在水平下的置信区间为:(-zz④当总体方差未知时,/2/2s,sxxtnn总体均值的置信区间为:(-t)。27、总体比例的区间估计:①大样本,5,(1)5,npnp若则二项分布可用正态分布近似,既:(1)~(,)pNn标准化后服从正态分布:~(0,1)(1)pzNn同总体均值的置信区间构造方法同理,可得在1-的置信水平下的置信区间为:/2/2(1)(1)nn(p-z,p+z)但一般总体比率未知,需用样本率p代替,即/2/2(1)(1)ppppnn(p-z,p+z)。28、估计总体均值时样本量的确定:22/22()zEn=,E代表允许的估计误差,/2z表示置信水平。估计总体比例时样本量的确定:2/22()(1)znE。如果总体比例未知,可用样本比例p代替,或取=0.5,使得(1)达到最大。29、时间序列指反映社会、经济、自然现象的数据按时间先后顺序记录形成的数列。时间序列的构成要素:现象所属的时间、对应不同时间的统计指标数值。编制时间序列的原则:①时期长短应该相等②指标经济内容应该一致③总体范围相同④指标的计算方法、计算价格和计量单位一致⑤数列中的各个指标值具有可比性。30、增长量分析指标:发展水平、增长量(=报告期水平-基期水平)、平均增长量。增长量分为:逐期增长量(报告期水平与前一期水平之差)、累计增长量(报告期水平与某一固定时期水平之差)。逐期增长量之和等于相应时期的累计增长量。平均增长量是某种社会经济现象在一定时期内平均每期增长(或减少)的绝对数量。一般用累计增长量除以增长的时期数目计算。31、反映时间序列增长率的指标主要有:发展速度、增长速度、平均发展速度和平均增长速度。100%报告期水平发展速度=基期水平。发展速度分为环比发展速度和定基发展速度。环比发展速度是报告期水平与前一期水平之比,反映了现象逐期发展变化速度;定基发展速度是报告期水平同某一固定时期水平之比,表明现象在较长时期内总的发展变化速度,又称总速度。环比发展速度与定基发展速度的关系:环比发展速度的连乘积等于对应的定基发展速度(由此,平均发展速度0nnnyxRy)。相邻时期的两个定基发展速度相除的商等于相应的环比发展速度。呈直线趋势的时间数列,其各期环比发展速度大致相同。增长量增长速度=基期发展水平1增长速度发展速度定基增长速度是累计增长量与某一固定时期发展水平对比的结果,表示现象在较长时期内总的增长速度。平均增长速度是环比增长速度的几何平均数。平均增长速度=平均发展速度-1。平均发展速度以环比发展速度的个数为变量值个数计算的几何平均数。32、时间序列影响因素:长期趋势、季节变动、循环变动、不规则变动。若要观察现象在一段时期内变动的基本
本文标题:初级统计师考试实务复习重点
链接地址:https://www.777doc.com/doc-1328276 .html