您好,欢迎访问三七文档
从零开始学统计学全海军频数分布表和直方图第一章151154158162154152151167160161155159160160155153163160165146156153165156158155154160156163148151154160169151160159158157154164146151162158166156156150161166162155143159157157156157162161156156162168149159169162162156150153159156162154164161从一组数据能得到什么?80位女大学生身高(cm)数据身高各不相同,数据参考不齐——分布随机变化的——不确定性在一定的区间范围内——分布的特性分组组值频数相对频数累计频数141~14514310.01251146~15014860.0757151~155153190.237526156~160158300.37556161~165163180.22574166~17016860.07580数据转换—频数分布表数据特征:1、身高不是均匀分布的,在某一区域数据集中2、数据分布以某轴左右对称3、数据量变少了,损失了部分数据的细节、但是数据的“要点”清晰了特征更明显,三根柱高,两侧底近似左右对称分布基本符合正态分布不再是原始数据,而是数据的特征图形化表示—直方图161930186010203040143148153158163168频数组值原始数据虽然是现实本身,但只观察它的话什么也不明白数据统计变换的方法,有制作成“图”和求“统计量”两种频数分布表将数据分为5~8组。根据频数分布表可以认清数据特性(集中的地方和对称性等)由频数分布表制成的柱状图是直方图。可以更直观的捕捉数据的特征。频数分布表和直方图小结一、看图思考数据特征,得到的印象因人而异,难以用以交换意见,达到顺利的沟通二、需要大量的统计和报告篇幅频数分布表和直方图的难点平均值第二章计算两个数X和Y的平均值算术平均数=(X+Y)/2几何平均数=(xy)1/2均方根值=𝒙𝟐+𝒚𝟐𝟐调和平均数=𝟐𝟏𝒙+𝟏𝒚用一个数字来概括数据的特征1、某企业某年的销售额增长了50%,次年减少了4%,那么这两年企业的复合增长率是多少?1.5×0.96=1.22、去程以时速x千米移动,返程以时速y千米移动,求平均时速是多少千米?假设单程为1km,则去程花费时间为1/x,返程为1/y,平均时速为2/(1/𝑥+1/𝑦)应用想在合计的意义上保持其本质——算术平均数对待成长率等情况,想在乘法的意义上保持其本质,应该使用几何平均数对待“速度”应该使用调和平均数小结方差和标准差第三章你会选择乘坐哪一辆?公交A:到达时刻是等概率迟到2分钟和提前2分钟公交B:到达时刻是等概率迟到10分钟和提前10分钟选择题例:到达时间为7点30分的公交车5天内到达时刻数据分别为:32、27、29、34、33解读过程:1.平均值为312.5天的时间减去平均值得到的数据为:方差和标准差+1-4-2+3+2偏差3、将偏差进行平米再取算术平均。(+1)2+(−4)2+(−2)𝑥2+(+2)25=6.84、将方差取根号6.8=2.615、结论:公交车平均比时刻表推迟1分钟到达,但实际到达时刻分散在2.6分钟前后方差标准差平均值是从数据的分布中取出的代表的数。数据以平均值为基点,在其左右扩散。评价这种扩散、分散的标准是标准差。标准差将数据平均值的离散方式进行平均化。可以避免相互抵消的平均。小结
本文标题:从零开始学统计学
链接地址:https://www.777doc.com/doc-3418079 .html