您好,欢迎访问三七文档
社会保障班32009052133张梦玉1《爱上统计学》--读书笔记合上这本书,手里拿着很久,已经有点舍不得放下了。这的确是一本好书!特别谢谢老师给我们推介了这本书,让我对统计学有了更深刻的认识,有种相见恨晚的感觉。在我读这本书之前,我脑海中就会浮现一大堆枯燥的数字,还有一连串复杂的计算公式。曾经的我觉得统计学是那么单调的一门学科。然而通过对这本书的学习,我对统计学有了全新的认识。通俗易懂,结构清晰,语言幽默,这本书的确做到了这些。定义、定理、公理、推论、公式,这是以往那些数学书所共有的特征。而爱上统计学,它甚至可以告诉你,字母不是绝对的。下面就是我整理过后的读书笔记以及一些我得到的启示和引发出的问题。就一般意义而言,统计学是描述一系列可以用于描述、整理和解释资料或数据的统计工具和技术。这些数据可能是特定数学课程的学生考试得分、解决问题的速度、吃某种药感到不适的病人人数等。本书的描述性统计部分让我学会收集、整理和汇总数据。而在了解了推论性统计的用途之后就可以学会解释数据了。学习统计学,不能零散的学习,而是应该系统的,比较的角度来学习。比如当我学到抽样的平均误差、抽样的极限误差、置信区间的计算式,我需要比较不同的抽样方法,不同的抽样组织及方式计算他们之间的异同点。同样在学习假设实验时,也要对单个总体、两个总体和多总体的情况机型比较,对均值、方差、成数的各种前提条件进行比较。多总结,这样会更容易记忆。弄明白公式之间的关系,把多个公式化简,减轻记忆负担。2.计算和理解平均数:平均值:是能够最好的表达一组数据的数值的数值,一般有三种形式:均值,中位数和众数。均值:是计算平均数最常用的形式。(注):1.均值有时也用字母M表示。2.n表示样本的规模,N表示总体规模。3.均值对极值很敏感。4.均值指算术平均数。中位数:中位数也是平均数,被定义为一系列数据的中点。百分位数:用于定义数据集或数据分布中等于或小于一个特定数值的个体百分数引发的问题:为什么使用中位数而不是均值?答:中位数对极值不敏感而均值不是。如果你的数据集中有一个或多个极值,中社会保障班32009052133张梦玉2位数相对其他集中趋势量数来说能更好地代表数据集的中心值。(注):1.均值是一系列数值的中间点,而中位数是一系列个体的中间点。众数:出现次数最多的数值引发的问题:何时用什么?答:1.如果数据属性是分类的,而且数值只属于一种类型,就属于众数。在这种情况下各个之间是互斥的。2.如果数据中包含极值而且你不想扭曲平均数就使用中位数。3.数据不包括极值也不是分类数据就是用均值。3.理解性变异变异性:可被看做是对不同数值之间的差异性的测量。包含三种量数:极差、标准差、方差。引发的问题:为什么变异性是有用的描述工具?答:变异性反映的是不同数值和一个值的差异性。和平均数两者都是重要的描述统计值。这两个值可共同用与描述数据的特征,并说明数据之间的差异。极差:是对变异性最笼统的测量。R=H-L其中R是极差H是数据集中的最大值L是数据集中的最小值极差有两种类型:包含极差和不包含极差,上面叙述的是不包含极差,包含极差最后再加一个1.标准差:表示一个数据组中变异性的平均数量。实际的含义是与均值的平均距离。引发的问题:标准差的含义是什么?答:作为一个变异性的量数,标准差可以告诉我们数据组的每一个数值与均值的偏差平均数。注:1.标准差是作为偏离均值的平均距离计算的。2.标准差越大,数值分布越广,则数值之间的相互差异越大。3.和均值一样,标准差对极值很敏感。方差:就是标准差的平方。5.计算相关系数相关系数:是反映两个变量之间关系的量化指标。这个描述统计值的值域范围是-1到1.两个变量的相关有时也叫做二元相关。正相关:如果变量变化的方向相同,相关是直接相关或正相关。负相关:如果变量变化的方向相反,相关是间接相关或负相关。注:1.相关系数的值域范围是[-1,1]。2.相关系数的绝对值反映相关的强度。3.相关总是反应每个个体至少有两个数据点的状况。引发的问题:如何理解相关系数?社会保障班32009052133张梦玉3答:最容易解释相关系数值的方式是看看相关系数的大小并使用表:相关系数的大小一般解释0.8——1.0非常强的相关0.6——0.8强相关0.4——0.6中度相关0.2——0.4弱相关0.0——0.2弱相关或无关决定系数:是一个变量的方差可以被另一个变量的方差解释的百分比决定系数就是相关系数的平方其他重要的相关系数:(如下表)变量X变量Y相关类型要计算的相关定类的(选举偏好,如共或党或民主党)定类的(性别,如男性或女性)卡方系数选举偏好和性别之间的相关定类的(社会阶层,如上层,中层或下层)定序的(高中毕业班的排序)等级二列相关系数社会阶级和在高中学校排序之间的相关定类的(家庭结构,如双亲家庭或单亲家庭)定距的(平均成绩)点二列相关系数家庭结构和平均成绩之间的相关定序的(转化为排序的身高)定序的(转化为排序的体重)斯皮尔曼等级相关系数身高和体重之间的相关定距的(解决的问题的数量)定距的(以年计的年龄)皮尔逊相关系数解决的问题数量和以年计的年龄之间的相关6.理解信度和效度测量尺度:依据一定的规则给观察结果分配一定的数值。定类测量水平:是以观察结果的属性特征定义,也就是观察结果只适合一个而且唯一的一个分类或层级。定序测量水平:被测量的事物按照他们的属性特征排序。定距测量水平:是指测验或评估工具是基于某种连续体。信度:新都就是一个测试或者你是用的其他任何测量工具对事物的测量可以保持一致性。引发的问题:信度的不同类型,何时使用,何时计算以及它们的意义?答:信度的类型何时使用如何计算举例说明所得结果的含义再测信度你想知道一个测试在不同时间是计算时期1和时期2相同测试的两次不同时期的青少年认同的形式的社会保障班32009052133张梦玉4否可信值之间的相关系数邦佐测试是可信的。复本信度你想知道一个测试的几个复本是否可信或者是否是等价的计算一个复本测试的值与相同内容的另一个复本的测试的测试值之间的相关系数人格测试的两个复本是等价的,而且表现出复本信度。内在一致性信度你想知道一个测试的项目是否评价一个而且只评价一个维度每一个项目的得分与总得分之间的相关系数SMART创造性测试的所有项目评价相同结构。评分者信度你想知道对一个观察结果的评价是否具有一致性检验不同评分者一致结论的百分比最佳着装足球运动员评价的不同评分者信度是0,91表示不同裁判的一致程度很高再测信度:用于检验一个测试在不同时期是否可信。复本信度:用于检验相同测试吗的不同复本的等价性和相似性。内在一致性信度:用于测试确定测试项目是否彼此一致,都只表示一个维度、一个结构或一个关注的领域。评分者信度:是两个评分这对观察结果判断的一致程度的测量。效度:简单地说就是表示工具能够测量要测量的内容的性质。引发的问题:效度的不同类型,何时使用,何时计算以及他们的意义?答:效度的类型何时使用何时计算举例说明所得结果的含义内容效度你想知道一个特定主题的项目样本是否能够反映项目总体请教专家,让专家判断测试的项目是否反映将要测量的主题的项目总体我的统计学课程的每周测试可以评价每章的内容准则效度你想知道测试成绩是否和其他标准系统相关,这个标准表明被测试者具备某个领域的能力计算测量成绩和其他有效的测量之间的相关系数,并评价相同的一组能力。研究显示烹调技能的EAT测试与结果烹饪学习后两年内成为主厨相关建构效度你想知道测试是否测量一些基本的心理结构计算测试成绩和反应测试设计的结构的理论结果之间的相关系数参与身体接触和危险性动作的男性的侵略性TEST测试的得分较高社会保障班32009052133张梦玉5内容效度:就是测试项目能力代表设计测试要测量的总体项目的性质。准则效度:是评价测试是否反映现在和未来的一组能力建构维度:是最有趣也是最难建立的效度,因为建构效度是基于测试或测量工具背后的基本的结构或概念的。7.检验你的问题因为这本书是给小白看的,而假设检验有事统计学的难点,因此书中并没有用到多少笔墨,不过相应的小结却很值的记录下来:小结:人恶化科学研究的中心要素是假设,而不同的假设类型(零假设和研究假设)有助于行程计划来回答我们的研究所提出的问题,零假设作为研究起点和比较基础的特点使得我们可以使用零假设作为评价研究假设可接受的比较基准。8.概率和概率的重要性正态曲线:是具备三个特征的数据分布的形象表示。注:我们处理大样本数据集(超过30个数据),并且重复的从总体中抽出样本时,曲线的数值就接近正态曲线的形状。标准值:以标准差为单位进行标准化的值。用字母z表示。引发的问题:z表示什么?答:z值表示一个原始数值,也表示数据的分布在x轴上的特定位置。而且z值越大,距离均值越远引发的问题:如何通过z值,找到覆盖面积?答:1.计算原始数值x对应的z值。2.使用附录B的B1表,找到均值和z值之间的面积。引发的问题:研究z值的意义?答:我们预期z值多大,就可以断定一个结果的出现不是由于随机因素,而是由于一些其他因素?如果查阅附录B的正态曲线你就会知道值得临界点1.65包含了曲线覆盖面积的45%,如果与曲线另一侧覆盖面积的50%加起来,就得到全部面积的95%。也就是在x轴的这一点之上留下了5%。任何表示z值1.65或这个值以上的数值就在很小的区域内——或者至少是分布在出现的概率小于其他数值的区域内。社会保障班32009052133张梦玉6第9章到第14章都可总结为下面这个表格:你是检验变量之间的关系还是检验两个群体在一个或多个变量上的差异我检验变量我检验两个群体在一个之间的关系或多个变量上的差异相同的参与者接受多次测试?是不是分析几分析几个群体分析几个群体个变量?两个变量两个以上两个群体两个以上两个群体两个以上相关系数的显回归,因素分非独立样本配对测量独立样本简单方著性的t检验析或典型分析的t检验方差分析的t检验差分析以上就是我在读这本书时记录下来的简单的读书笔记。书中的第四部分我没有做笔记。但是却对我有着很大的意义,他教会了我该如何学习统计,如何面对统计学,让我真的有点爱上统计学了。总之在读过这本书以后,对以前很多模糊不清或者理解不透彻的概念有了新的认识。统计学不同与数学,统计学更贴近实际。我在学习中必须紧密联系到他的现实意义,做完了数据分析,我必须要理解分析出来的数据所具有的世纪经济意义,这样的分析才有意义。统计学是我们生活中密不可少的工具!社会保障班32009052133张梦玉7
本文标题:爱上统计学
链接地址:https://www.777doc.com/doc-4995598 .html