您好,欢迎访问三七文档
当前位置:首页 > 医学/心理学 > 基础医学 > 概率论和统计学基础知识
第2章概率论和统计学基础知识•若要利用Excel进行统计分析,需要以一定的概率论和统计学的基础知识为基础,便于完成更高层次的统计分析任务,本章将从概率基本理论开始,介绍各种随机变量的概率分布、各种统计量及其分布等知识,并介绍统计数据的来源和整理得相关内容。2.1概率论基本知识•概率论起源于16世纪与赌博有关的问题,发展至今主要研究事件发生的可能性,概率论的基础知识是理解统计知识的桥梁,要利用Excel进行统计分析,对概率论的掌握,在很大程度上决定了对统计知识的理解,因此,本书用一个小节专门介绍概率论最为基本的知识。2.1.1概率基本理论2.1.2离散型随机变量概率分布•下面就介绍几种常见的离散型随机变量的分布。•1.两点分布•2.二项分布•3.泊松分布•4.几何分布2.1.3连续型随机变量概率分布2.2统计学中的基本概念•在本小节中,会承接上节介绍统计学的基本知识,从而明确统计学的任务,理解统计学中的基本概念,了解统计中最基本的统计量及其计算方法,并对统计学中的基本分布函数进行阐述。掌握这些基本知识,便于对今后的统计任务进行理解和操作。2.2.1统计的概念及基本任务•统计学是一门研究客观事物数量方面的方法论科学,其研究对象是大量现象的数量方面。包括数量特征、数量关系、数量界限等。统计学的基本任务是通过收集、整理、分析观测大量随机现象所得的实验数据,来研究如何进行观测以及如何根据观测得到的统计资料,对被研究的随机现象的一般概念特征做出科学的推断。2.2.2总体与样本•分析一个事物的特征,往往需要了解描述事物不同性质的数据,要完全地了解这个事物,就需要对所有的数据进行了解,也就是了解事物性质的总体。但是,现实中并不是所有情况下都能够了解所有总体的,在这时,就可以通过分析总体的一部分性质来推断总体的性质,这一部分就是样本。关于样本和总体的定义,下面将一一介绍。•1.总体•总体统计研究所确定的客观对象,是具有共同性质的许多单位组成的整体,总体既可以指客观事物本身,也可以是反映该事物某重要数量特征的一组数据的集合。该集合中的每个元素就是总体单位,即个体。根据个体的数邢薷龅ノ弧Mü•同质性:总体中各个单位具有某种共同的性质。•大量性:总体总是包含大量的单位。•2.样本•样本是从总体中随机抽取部分单位所构成的集合体,必须取自所要研究的总体。从一个总体中可抽取许多个样本,这些样本的数值是不同的,也即存在着随机的差异。尽管如此,样本的选取仍要满足两个基本要求,即代表性和客观性。样本中包含的个体的个数称为样本容量。2.2.3常用统计量及其计算方法2.3常用的统计分布•在基础的统计任务中,统计量的计算只是一部分,还要明确各个统计量的统计规律及性质,在这方面运用最多的有分布、t分布和F3个比较重要的分布函数,用来对样本的统计量进行估计、检验等,本小节会逐个介绍这3个分布。2.3.1χ2分布(卡方分布)2.3.2t分布2.3.3F分布•1.分位数•2.正态分布总体的抽样分布介绍2.4统计数据•有了统计学的基础知识作为统计工具,还需要统计数据作为统计工具实现其价值的前提。本节会介绍统计数据的来源和统计数据的大体分类,对统计数据进行大体了解,并介绍Excel中数据类型的表达情况。2.4.1数据的来源•统计数据的获取,首先要通过一定的测定方式产生原始信息,还要通过一定的统计调查方式,才能后将这些信息组合成为统计数据。统计调查就是使用明确的概念、方法和程序,以有组织、有条理的方式,从一个总体的部分或所有单元中收集感兴趣的指标信息,并将这些信息综合编辑成有用的简要形式的所有活动。统计调查可以科学地反映客观情况,为解决问题、制定政策或策略提供依据。可以说,调查是认识客观世界的一种手段,通过调查获取信息,对于了解现状,进行管理决策和探索未来发展均具有要意义。调查的组成形式一般有以下5种:•统计报表:是按照国家统一规定的表格形式、统一规定的指标内容,统一规定的报送程序和报送时间,由填报单位自下而上逐级提供统计资料的一种统计调查方式。我国各种的统计年鉴就属于统计报表的范畴。•普查:普查是指一个国家或一个地区为详细地了解某项重要的国情、国力而专门组织的一次性、大规模的全面调查,其主要用来收集某些不能够或不适宜用定期的全面调查报表收集的信息资料,以搞清重要的国情、国力。人口普查是比较常见的普查。•重点调查:重点调查是一种非全面调查,它是在调查对象中,选择一部分重点单位作为样本进行调查。重点调查的主要作用在于反映调查总体的主要情况或基本趋势。重点调查投入少、调查速度快、所反映的主要情况或基本趋势比较准确。•典型调查:也是一种非全面调查,它是从众多的调查研究对象中,有意识地选择若干个具有代表性的典型单位进行深入、周密、系统地调查研究。可以在特定的条件下用于对数据的质量检查,了解与数字相关的生动具体情况。•抽样调查:抽样调查是一种非全面调查,它是从全部调查研究对象中,抽选一部分单位进行调查,并据以对全部调查研究对象做出估计和推断的一种调查方法。抽样调查,要按随机原则抽选样本,总体中每一个单位都有一定的概率被抽中,还可以用一定的概率来保证将误差控制在规定的范围之内。可以分为简单随机抽样、分层抽样、整体抽样、多阶段抽样等几种类型,其中简单随机抽样也称为单纯随机抽样,是指从总体N个单位中任意抽取n个单位作为样本,使每个可能的样本被抽中的概率相等的一种抽样方式,应用范围最广。2.4.2数据的整理•统计整理:就是对搜集得到的初始数据进行审核、分组、汇总,使之条理化、系统化,变成能反映总体特征的综合数据的工作过程,而且,对已整理过的资料(包括历史资料)进行再加工也属于统计整理。统计整理是整个统计工作和研究过程的中间环节,起着承前启后的作用,同时也是统计调查的继续,又是统计分析的基础,还是积累历史资料的必要手段。•本着目的性、联系性、简明性三大原则,统计整理可以分为3类,分别是定期统计报表数据的整理、专题性统计数据的整理和历史统计数据的整理。•数据整理的一般过程有以下5部组成:•(1)对搜集到的资料进行全面审核,以确保统计资料符合统计研究目的的要求,资料准确无误,这是数据整理的起点、也是数据分析的重要环节。•(2)根据研究目和统计分析的需要,选择整理的标志,并进行划类分组,这部分将在下一小节有所介绍。•(3)在分组的基础上,将各项资料进行汇总,得出反映各组和总体数量特征的各种指标。•(4)统计资料的显示:即通过编制统计表和绘制统计图,将整理出的资料简捷明了、系统有序地显示出来。•(5)对统计数据分门别类地系统积累。•整理完毕的数据即可进行预处理工作及后续的分析。2.4.3数据的分组•根据社会经济现象的特点和统计研究的目的要求,按照某个重要标志(或几个标志)把总体划分为若干不同性质的组,称为统计分组。进行统计分组可以划分社会现象的不同类型、揭示社会现象的内部结构、分析社会现象之间的依存关系。分组时也要做到将所有数据全部分入各个组中,并且每个组中没有重复的数据。•分组要有一定的分组标志,分组标志要符合统计研究的目的和要求,要选择最能说明事物本质特征的标志,还要考虑到现象所处的具体历史条件,在Excel中,数据的分组往往是根据行或列为分组标志进行区分的。•分组的方法一般根据分组标志的性质分为属性分组和变量分组两种方法:•属性分组的方法:是针对事物进行属性分组的方法,其组数的多少首先取决于事物本身的特点。对于有些事物构成比较复杂,组数可多可少的情况,就需要考虑统计研究任务的具体要求。人口统计时,性别比例的统计就属于属性分组方法。•变量分组的方法:是按数量标志分组的方法,分组时各组数量界限的确定必须能反映事物质的差别,而且,应根据被研究的现象总体的数量特征,采用适当的分组形式,确定相宜的组距、组限。人口统计中的年龄结构计算应属于变量分组方法的应用范畴。2.5本章小结•本章介绍了概率论和数理统计的一般知识,明确了统计任务中经常会遇到的如数学期望、方差等统计量,还有统计中重要的3个抽样分布。这些基础的知识,需要深入理解,熟练掌握,才能轻松胜任后面的各种统计操作。•此外,对统计数据的介绍,目的在于了解分析对象的来源和基本特点,以便更准确地选取统计工具进行统计分析,并且在统计分析遇到异常值或可疑值等问题时,可以回到统计数据的调查和整理阶段来寻求解决途径。•至此,利用Excel进行统计分析的工作平台和理论知识都已介绍清楚,对Excel统计功能的初步了解是进行统计分析的真正开始,下一章将做出具体介绍。
本文标题:概率论和统计学基础知识
链接地址:https://www.777doc.com/doc-3422050 .html