您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 四分位数与数据统计基本概念
分佈域、四分位數間距与數據的統計考慮以下兩組數據:單靠平均值不足以判斷數據的分散程度,我們需要一些離差的量度。數據組A:1,3,5,5,7,9數據組B:4,5,5,5,5,6A的平均數=B的平均數=5,A的中位數=B的中位數=5,A的眾數=B的眾數=51.分佈域2.四分位數間距3.標準差分佈域=最大值–最小值分佈域=最高組界–最低組界對於不分組數據數據組中最大值與最小值的差是一個量度數據離差的簡單方法。對於分組數據分佈域對於一組由小至大順序排列的不分組數據…一組由小至大順排列的數據數據的下半部分(50%的數據)數據的上半部分(50%的數據)中位數25%的數據25%的數據25%的數據25%的數據中位數Q2下四分位數Q1上四分位數Q3四分位數間距=Q3–Q1四分位數間距對於分組數據,下四分位數和上四分位數可從累積頻數多邊形(或曲線)讀出。它們分別對應數據組的第25個百分位數和第75個百分位數。下列所示為某商店的8款球鞋的售價。$250,$270,$275,$350,$380,$395,$420,$480∴四分位數間距=$(407.5–272.5)=$135最大數據=$480,最小數據=$250,5.272$2275270$1Q5.407$2420395$3QQ1Q3Q2∴分佈域=$(480–250)=$230課當研習圖中所示為40名學生身高的累積頻數多邊形。(a)求學生身高的分佈域。(b)求學生身高的四分位數間距。(a)最高組界=180.5cm最低組界=149.5cm分佈域=(180.5–149.5)cm=51cm(b)從圖中可得,Q1Q3四分位數間距=(175–157)cm=18cmQ1=157cmQ3=175cm下四分位數、上四分位數、中位數、最大值和最小值提供了有關一組數據中最重要的資料。我們可以透過框線圖把這些資料一併展示出來。框線圖框包含了50%的數據,而兩旁的線則各包含了25%的數據。由於Q1和Q3代表了數據的第25個和第75個百分位數,因此Q1以下有25%的數據而Q3以上有25%的數據。最小值最大值下四分位數中位數上四分位數數值2835612345678910從下面的框線圖我們可得到數據的甚麼資料呢?一众数、中位数、平均数的概念中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.平均数:一组数据的算术平均数,即)(121nxxxnX问题1:众数、中位数、平均数这三个数一般都会来自于同一个总体或样本,它们能表明总体或样本的什么性质?平均数:反映所有数据的平均水平众数:反映的往往是局部较集中的数据信息中位数:是位置型数,反映处于中间部位的数据信息极差:一组数据的最大值与最小值的差极差越大,数据越分散,越不稳定极差越小,数据越集中,越稳定极差体现了数据的离散程度离散程度设一组样本数据,其平均数为,则x称s2为这个样本的方差,称为这个样本的标准差,分别称为样本方差、样本标准差它的算术平方根222121[()()()]nsxxxxxxn2222121[()()()]nsxxxxxxnx1,x2,…,xn•样本中各数据与样本平均数的差的平方和的平均数叫做样本方差;样本方差的算术平方根叫做样本标准差。样本方差和样本标准差都是衡量一个样本波动大小的量,样本方差或样本标准差越大,样本数据的波动就越大。12,,,nxxxx2s12,,,nxbxbxbxb2s12,,,naxaxaxax22as12,,,naxbaxbaxbaxb22as如果数据的平均数为,方差为(1)新数据的平均数为,方差仍为.(2)新数据的平均数为,方差为.(3)新数据的平均数为,方差为.,则方差的运算性质:
本文标题:四分位数与数据统计基本概念
链接地址:https://www.777doc.com/doc-5329551 .html