您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 《统计学》PPT完整-袁卫-贾俊平
统计学第一章统计和统计数据的收集第二章统计数据的整理和展示第三章数据的描述性分析第四章概率基础第五章区间估计和假设检验第六章相关与回归分析第七章非参数统计第八章时间数列分析第九章指数结束一、什么是统计?(一)统计包含三种涵义,两重关系1.统计工作:对统计数据进行搜集、整理和分析的过程。2.统计数据:统计工作所产生的成果,用以描述我们所研究现象的属性和特征。如统计图表,统计分析报告等。3.统计学:一门研究总体数量特征的方法论科学。统计工作统计资料统计学工作与工作成果关系实践与理论关系(二)四个重要的术语所研究的具有某些相同性质的全部单位或事件的整体。总体无限总体:含无限多个单位。范围有限总体:含有限个单位。样本:亦可称为抽样总体,是从总体中抽取部分单位所组成的整体,用以分析总体。参数:亦可称为总体指标,是综合测量的整个总体的某个数量特征。统计量:亦可称为样本指标,是根据样本数据计算的综合测量值,可用以反映或估计、推断总体的某个数量特征。(三)统计学的内容1.描述统计关于搜集、展示一批数据,并反映这批数据特征的各种方法,其目的是为了正确地反映总体的数量特点。2.推断统计根据样本统计量估计和推断总体参数的技术和方法。描述统计是推断统计的前提,推断统计是描述统计的发展。二、数据(一)为何需要数据?统计学要研究各种随机变量,通过对这些随机变量的观察所获取的数据包含了我们所需的信息,这些信息能有助于我们在许多场合中做出更为正确的决策。例如:•市场研究者需要对产品的特性进行评估,以区分不同的产品。•药品制造厂商需要判别一种新药是否比现在正使用着的药更有效。•审计人员想通过查看某家公司的财务报表,以确认这家公司是否是依据了通行的会计准则做报表。•财务金融分析人员想判断在未来的五年中,哪些行业中的哪些公司最具有成长性。•经济学家想估计我国国内生产总值今年的增长速度。•生产部门的经理按惯例要检查生产过程,以检验其生产的产品质量是否符合公司的标准。(二)数据分类的原则互斥原则:每一个数据只能划归到某一类型中,而不能既是这一类,又是那一类。穷尽原则:所有被观察的数据都可被归属到适当的类型中,没有一个数据无从归属。(三)数据的类型1.定性数据和定量数据定性数据:用文字描述的。如在本章的“统计引例”中消费者对永美所提供服务的总体评价等都属于文字描述的定性数据。定量数据:用数字描述的。如企业的净资产额、净利润额等。2.离散型数据和连续型数据变量若我们所研究现象的属性和特征的具体表现在不同时间、不同空间或不同单位之间可取不同的数值,则可称这种数据为变量。类型离散型变量:数据只能取整数。如一家公司的职工人数。连续型变量的数据可以取介于两个数值之间的任意数值。如销售额、经济增长率等。3.数据的四个等级定类数据例如,对人口按性别划分为男性和女性两类。也称定名数据,这种数据只对事物的某种属性和类别进行具体的定性描述。能够进行的唯一运算是计数,即计算每一个类型的频数或频率(即比重)。定类数据例如,对企业按经营管理的水平和取得的效益划分为一级企业、二级企业等。定序数据,也称序列数据,是对事物所具有的属性顺序进行描述。定距数据如10℃、20℃等。它不仅有明确的高低之分,而且可以计算差距,如20℃比10℃高10℃,比5℃高15℃等。也称间距数据,是比定序数据的描述功能更好一些的定量数据。定距测定的量可以进行加或减的运算,但却不能进行乘或除的运算。定比数据如产量、产值、固定资产投资额、居民货币收入和支出、银行存款余额等。也称比率数据,是比定距数据更高一级的定量数据。它不仅可以进行加减运算,而且还可以作乘除运算。测定层次特征运算功能举例1.定类测定2.定序测定3.定距测定4.定比测定分类分类;排序分类;排序;有基本测量单位分类;排序;有基本测量单位;有绝对零点计数计数;排序计数;排序;加减计数;排序;加减乘除产业分类企业等级温度商品销售额统计数据四个层次的概括4.截面数据和时间序列数据截面数据:所搜集的不同单位在同一时间的数据。例如,所有上市公司公布的2004年年度的净利润。时间序列数据:所搜集的同一总体或单位在不同时间的数据。某公司公布的1993年到2004年的年度净利润就是时间序列数据。5.原始数据和次级数据原始数据:指直接从各个调查单位搜集的、尚未经过整理的统计数据资料,也称一手数据。次级数据:指那些已经加工整理过的,往往是公开发表的数据,也称二手数据。如从报纸杂志、统计年鉴、会计报表上取得的数据。(四)数据的来源1.从政府机构、各种行业组织、公司和企业所公布的数据中获取。就是把政府机构、各种组织和公司所公布的数据作为来源,这种数据往往是次级数据。2.设计一次试验以获取必要的数据。例如,在检验洗衣机洗净程度的研究中,研究人员通过实际洗涤脏衣服,来研究哪种牌子的洗衣机效果最佳。3.从观察研究中获取。研究人员通常是在自然状态下,进行直接的观察。例如,观察路口的交通流量、观察顾客在商场的购买行为和观察流水线上的产品质量等。4.进行一次调查。它对所调查人们的行为不进行任何控制,仅提出诸如出生年月、爱好、消费习惯、对某一事件的看法和其他特征方面的问题,然后对他们回答的结果进行整理、编码、列表和分析。调查方案的主要内容确定调查目的确定调查对象和调查单位拟订调查提纲确定调查时间编制调查的组织计划三、数据搜集的组织方式(一)普查、抽样、统计报表制度和重点调查1.普查特点:工作量大,时间性强,需要大量人力和财力。任务:搜集重要的国情国力和资源状况的全面资料,为政府制定规划、方针政策提供依据。方式:建立专门机构,配备专门人员调查。利用基层单位原始记录和核算资料进行调查。原则:规定统一的标准时点。规定统一的普查期限。规定统一的调查的项目和指标。2.抽样调查特点:1.按随机原则从总体中抽取样本;2.以样本指标(统计量)为依据推断总体参数或检验总体的某种假设;3.抽样误差可以事先计算并加以控制。3.统计报表制度是按一定的表式和要求,自上而下统一布置,自下而上提供统计资料的一种统计调查方法。这种搜集统计数据方法是伴随着计划经济而产生的,并曾在我国占主导地位。现在,在社会主义市场经济条件下,仍是我国搜集统计数据的组织方式之一。4.重点调查特点:在总体中选择个别或部分重点单位进行调查。任务:及时了解总体基本情况,为主管部门指导工作服务。方式:重点单位指在总体中有举足轻重地位的单位,其标志值在总体标志总量中占有绝大比重。经常性调查;同报表制度结合,用统计报表调查。例如,要了解全国钢铁生产的基本情况,只要调查鞍钢、宝钢、首钢、武钢、包钢等十几家特大型的钢铁企业就可以掌握全国钢铁企业生产的基本情况。(二)抽样的优点1.适用的范围广。对于有限总体,从理论上讲,既可以进行普查也可以进行抽样;对于无限总体,就只能进行抽样。若理论上可以而实际上很难采用全面普查的情况,也只能采用抽样。如产品质量的破坏性检验、居民住户调查等。2.与全面普查相比,抽样最大的优点是节省人、财、物力和时间。3.随机抽样可以比普查更为精确。(三)抽样的类型非随机抽样随机抽样判断抽样定额抽样方便抽样简单随机抽样抽样类型系统抽样分层抽样整群抽样非随机抽样又称为非概率抽样,是不按照随机原则来抽取样本中的单位或个体。特点具有方便、快速和低成本精确性差,结论缺乏普遍性判断抽样又称为典型调查,是从事有关工作的专家按照一定的标准有意识地在总体中选择若干有代表性的单位组成样本进行调查,代表单位的选取标准应根据统计研究的目的而定。定额抽样是根据已定的单位数抽取样本,往往是对总体了解甚少的时采用。如想获取某地区化妆品的销售情况,对该地区的5家商厦进行调查。方便抽样是为了取样方便,随意地抽取样本单位。街头偶遇式调查就是一种最为常见的方便抽样。随机抽样是根据随机原则来抽取样本单位.简单随机抽样方法:在抽样框中的每个单位都具有相同的被抽中的机会,每个容量相同的样本被抽中的机会也是相同的。亦称为纯随机抽样抽取样本的方法:有放回抽样和无放回抽样。适合:总体内部差异不是很大,规模也不大的情况。系统抽样方法:抽样框中的N个单位被分成k个系统,k等于抽样框的容量N除以所需的样本容量n,在抽样框中前面的k个个体或单位中随机抽出第一个样本单位,然后,可在其后的每隔k个单位抽取样本中其余的部分。亦可称为等距抽样编号有两种方法:············一种是利用原有的顺序或编号。如学生的注册名单,或者是从生产流水线上下来的、有编号的产品等。对所研究的总体已有所了解,则可用已知的相关变量对抽样框中的单位进行编号。分层抽样亦可称为类型抽样方法:将总体全部单位分类,形成若干个类型组,后从各类型中分别抽取样本单位,合成样本。总体N样本n等额等比例最优kiiknnnnn121nNNni12NkN1N1n2nkn······nNNniiii221整群抽样方法:首先把总体中的N个单位划分成为若干个群,并要求每个群对整个总体都具有代表性,然后对群进行简单随机抽样,并对抽中群内的所有单位进行调查研究。总体群数R=16样本群数r=4样本容量ABCDEFGHIJKLMNOPLHPDhlpdnnnnn适合:比简单随机抽样的方法能节约更多的成本,特别当总体的分布地域非常辽阔时。四、有关数据调查的几个问题调查的目的判断调查误差的大小调查误差登记性误差:代表性误差系统性的代表性误差登记、汇总、过录时产生的误差,以及无回答误差和测量误差等偶然性的代表性误差即为抽样误差调查中的道德性问题1.调查者别有用意地、有意识地选择导向性的问题,使回答者出现有倾向性的回答。2.询问者有意识地通过语气、语调引导被询问者出现有倾向性的回答。3.回答者不重视或不愿意回答调查的内容,就很可能提供错误的信息。第二章统计数据的整理和展示统计数据的整理目录统计数据的展示排序统计分组频数分布编制统计表统计图一、统计数据的整理排序统计搜集到的大量资料是分散的,不系统的,只能说明各个单位的特征和属性,必须按照科学的原则加以整理,使之条理化和系统化,成为便于储存和传递的、反映总体特征的数据。就是把定量数据按从大到小或从小到大的顺序排列,把定性数据按习惯的文字顺序排列,便于我们研究其条理。统计分组对于定性数据就是依据属性的不同将数据划分成若干组,对于定量数据就是依据属性数值的不同将数据划分成若干组。组内同质性,组间差异性。频数分布编制分组的关键变量的选择,选择与研究的问题有关的变量。组限的确定。应遵循穷尽和互斥原则。定性数列编制:组限的确定一般比较简单。如人口按性别分组、企业按所有制分组等定量变量编制:分为单项数列和组距数列两种形式。单项数列:即变量的一个取值为一组,适用于离散型变量,并且变量的取值较少。组距数列:即每一组有一个上限值和一个下限值所形成的区间,适用于连续性变量,或离散型变量且变量的取值较多的情况。注意以下三个方面的问题1.确定组数2.确定组距:组距为上限与下限之差。等距数列-数据分布均匀。异距数列-数据分布不均匀。3.确定组限应能把现象的不同类型划分出来。要考虑到数据是连续性变量还是离散型变量。无法确定实际数据的取值范围,或者数据中存在极端数值,可采用开口组的形式。4.确定组中值:(上限+下限)/2,开口组二、统计数据的展示当统计数据比较多时,就应该制作表格或者图形进行来展示,使数据的重要特性能从表格或者图形中直观地反映出来,这样可提高分析数据和解释数据的效率。统计表是把统计数据用表格的形式展示出来。类型:按作用分调查表按数据所属的时间分截面数据表时间序列表汇总整理表计算分析表按分组变量的多少分单变量分组表多变量分组表有平行形式交叉形式统计图统计图形通常可比统计表格更生动地描述数据。类型:饼图是以整个圆的360度代表全部数据的总和,按照各类组所占的百分比(频率),把一个“饼”切割为各个扇形。适用于定性数据。40%28%32%ABC50家门店按区域分组的饼图条形图中,每一分类组表示成一个条,条的长度代表了这个组中所含数据的频数或频率。适用于定性数据。50家门店数按区域分组的条形图051
本文标题:《统计学》PPT完整-袁卫-贾俊平
链接地址:https://www.777doc.com/doc-4005060 .html