您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 各种抽样方法之选择、步骤及优劣比较
1各種抽樣方法之選擇、步驟及優劣比較一、簡介調查之目的即在蒐集資料,由資料中獲得訊息,以對未知狀況或現象,加以瞭解,提供決策參據。調查方式可採普查或抽樣調查。普查:即對欲研究對象(母體)中每一份子均加以調查。抽樣調查:由所欲研究對象(母體)中抽取一部分份子(樣本),加以調查蒐集資料。普查之優缺點與必要性:1.普查優點:(1)包羅母體中每一份子,最能陳示母體狀況。(2)可做各細分特性之統計分析。(3)不致產生抽樣誤差。2.普查缺點:(1)耗費大量人力,物力,財力。(2)整理時間過長,統計結果常有過期之憾。(3)調查問卷不易深入。(4)易導致非抽樣誤差。3.普查必要性:(1)基本國勢之陳示。(2)各種抽樣調查之母體。(3)細分特性之陳示。(4)各種抽樣調查估計之權數。第四章各種抽樣方法之選擇、步驟及優劣比較2抽樣調查:抽樣調查係自調查對象之母體中抽取一部份個體,加以觀察,然後再推估母體之現象。抽樣調查成為科學的調查方法,乃是由於推測統計理論的發展,加上近年來統計的重要性倍增,依據調查資料與現存事實進行之交叉分析結果頗獲各方關心,主要原因須歸功於統計在經濟發展中所發揮的功能,所以統計學中的抽樣調查不僅是一門學問,業已成為研究社會問題與經濟現象的主要工具之一。1.抽樣之基本觀念(1)抽樣不過是一個方法、手段、其最終目標仍在推論。(2)對於各種抽樣方法,建立直覺的瞭解,以及探求其優點及限制。(3)注意各種抽樣方法之觀念及使用時機。(4)不要見樹而不見林。(注意樣本之代表性)2.抽樣之基本原則(1)所抽樣本能以代表母體。(代表性)(2)以樣本訊息估計母體之特性,要儘可能精確,並且可測度其可信度(精確性)。(3)取樣成本要儘量少。(成本低)(4)配合不同之母體狀況及行政限制下,採取適宜方法(即考量實務問題)。亦即如何達到快速、準確、具代表性而又能配合實務。(可行性)33.抽樣的步驟建立母體→分析母體決定抽樣方法→選定估計量→估計量的變異數→信賴區間決定樣本大小→樣本抽出方式→樣本與母體差異分析4.抽樣調查優點(1)抽樣調查可節省人力與財力。(2)抽查可縮短調查與整理時間。(3)抽查所抽出之樣本可做更詳細之調查。(4)抽查可迅速獲得調查結果。(5)可配合研究特性與機動性之行政措施。本章的概述最主要目的是作為導讀之用,期望讀者在念完本章節後對抽樣調查有些許初步的認識與興趣,並在往後各章內容中均有非常詳細的介紹。現在,就讓我們一同進入抽樣調查的世界裡,一探抽調的神奇之美。二、抽樣方法之分類抽樣方法分類:可粗分為非機率抽樣與機率抽樣。(一)非機率抽樣:亦即樣本不按照其機率予以抽出,而是由抽樣者之主觀抽出或自願樣本。優點:在某些調查時,有其必要性。缺點:(1)難以評斷樣本之代表性。(2)無法估計精確度。第四章各種抽樣方法之選擇、步驟及優劣比較4(3)樣本偏差往往較大。非機率抽樣之種類:1.便利樣本(偶然樣本)事先不預定樣本,碰到即問或自動回答者。如街頭訪問或主動打電話回答問題者。缺點:注意樣本之偏激性及兩極化。2.立意樣本(判斷樣本)由抽樣者立意抽取之樣本。如民間代表、意見領袖、學者、專家或代表性之樣本。3.滾式樣本(輻射樣本)利用樣本尋找樣本,亦即利用樣本之滾雪球方式或輻射力抽取樣本。如都市中之原住民抽樣。使用時機:可用於當樣本不易取得時,或針對特殊族群之調查。4.配額樣本:按母體某些特性予以配置樣本,但取樣時卻由調查員任意抽取。非機率抽樣有時雖然可予使用,惟在其結果之引用上,要特別注意,亦即其結果之參考性大於其實際之代表性。(二)機率抽樣:抽取之樣本是按照樣本之機率隨機抽出。優點:1.樣本較具代表性。2.可計算估計之精確度。3.可隨不同之抽樣設計採取不同之抽樣方法。4.隨之不同之抽樣方法,採取相互配合之估計方法。機率抽樣之種類:1.簡單隨機抽樣不對母體加以任何修飾或分割,而使每一樣本均有相同之被抽中機率。52.分層隨機抽樣將母體按照某些特性,分成數個不重疊的組群,這些組群即稱為層,而再由各層分別抽取樣本。3.系統抽樣將母體之元素按順序編號後,有系統的每隔一定間隔抽取一個樣本之方法。4.集體抽樣將母體中相鄰近之個體排成為一集體,而以集體為抽樣單位,即每一抽樣單位為一集體之抽樣單位。5.兩段集體抽樣首先抽出一些樣本集體,再由樣本集體內抽出部分基本個體。6.分層集體抽樣將母體內之集體予以分層後,再由各層抽取樣本。三、各種抽樣方法之適用時機、步驟及估計量(一)影響抽樣調查結果準確度的因素為使抽樣估計值能達到估計全事物的目的,需考慮影響其準確的各種因素:原始資料的變異程度樣本數的大小抽樣方法分層抽樣法抽樣的不同(二)估計值準確度構成的條件不偏性(unbiasedness)第四章各種抽樣方法之選擇、步驟及優劣比較6有效性(efficiency)充分性(sufficiency)一致性(consistency)1.不偏性(unbiasedness)定義E(),其中E表示期望值。本定義即說明,統計量的期望值等於參數,這種性質叫做不偏性。舉例來說,假設某母體大小為N,且母體平均為,今從母體內抽取出一組樣本n,求得平均為Y,若EY(),則Y稱為的不偏估計值。2.有效性(efficiency)定義2122()();此定義的意思是說,若同時有二個統計量(1及2),其中一個統計量的變異數較另一個統計量的變異數為小,則變異數小的那個統計量便具有「有效性」。舉例來說,假設母體平均值為,而估計的統計量有中位數(median)及算術平均數(arithmeticmean),但因為前者的變異數大於後者的變異數,則算術平均數具「有效性」。3.充分性(sufficiency)定義(,,,)(,)(,,)YYhgYYnn11;此定義的意思是說,假設母體參數為,但若樣本統計量可直接由樣本觀測值去估計,而與無關,則叫具有充份性。4.一致性(consistency)定義limn;此定義的意思是說,當樣本大小n趨近於無窮大()時,統計量即等於參數,這種性質叫做符合一致性。例如,當n增大為N時,則所求得的Y趨近於,亦即limnY,故可知Y7具有一致性。(三)估計的方法在某些情況下,如所需的原始資料不易得到,或得到的資料所要花費的金錢、時間較多時,可用輔助變數(auxiliaryvariableorconcomitantvariable)yi,此類變數值的取得代價較低。舉例來說,目測值花費時間、金錢較評估估計值所費均少,估計得較準確的估計值X,每個抽樣單位有兩個變數值(,)xyii,xi與yi之間有相關(correlation)存在,母體總合Y必須已知。另外,估計值估計的方法有下列二種:(1)比率估計法(ratioestimation),和(2)迴歸估計法(regressionestimation)。(四)母體與參數及樣本與統計量1.母體與參數同類個體的全部記錄集合一起,使組合成一個全體(aggregate),這個全體稱為母體(population),母體種類很多,表示其特徵的方法有「圖表法」、「常數法」等。利用常數法研究母體即由母體中計算出若干穩定常數,此等常數有介紹母體特性的作用稱為參數(parameters)包括有四類:(1)測定母體趨中性:主要有算術平均、型量、中位數等。(2)測定分散度:主要有變異數、均方、標準偏差。標準偏差()愈大,則母體中所有個體間的變異愈大。(3)測定偏歪度:主要有Fisher氏的1係數,E.S.Pearson氏的b1係數。(4)測定頻度分布的曲線峰度:常用有Fisher氏的2係數,及Geary氏的Wn係數。第四章各種抽樣方法之選擇、步驟及優劣比較82.樣本與統計量母體涵蓋範圍很大,資料經統計分析後,所得結論的適當範圍必很大;所須顧慮者,乃在於母體範圍過大時,蒐集、計數、度量及統計工作隨著浩大,所費時間、金錢往往無法許可,故只好由樣本資料來推斷母體的特性。來自同樣個體的全部N個個體中只抽出n個單位進行計數,度量而得n個單位的記錄(Nn)集結此n個單位記錄在一起,便構成一個樣本(sample),再由樣本資料求得某一統計值來估計參數,此估計值稱為統計量(statistic)。因樣本有抽樣變異,故統計量亦有抽樣變異,如把母體中可能發生的樣本全部取出,然後求得各樣本的某種統計量,再求統計量的總平均值,此總平均值稱為某統計量的期望值,若某統計量的估計方法適當,則該統計量即母體參數。抽樣方法的不同,及抽樣單位的不同會改變統計量的大小,改變對該母體的代表程度。(五)各種抽樣方法之適用時機、步驟及估計量1.簡單隨機抽樣法(simplerandomsampling)簡單隨機抽樣是一種最基礎且最簡便的抽樣方法。它的優點是(i)當母體底冊完整時,直接由母體中抽出樣本,方法簡單;和(ii)每一單位被抽中的機率均相等,參數的估計較簡單。而它的限制是(i)母體底冊不易取得,或取得很費時,費力且費錢;(ii)母體內樣本單位太多時,作業不方便;(iii)樣本分配較分散,行政作業較不易;和(iv)樣本代表性恐有不足(尤其當樣本點差異大時或重要性不同時)。因此,使用簡單隨機抽樣的最佳時機,便是當(i)母體內樣本單位不多,且有完備名冊,可茲編號時;(ii)母體內樣本單位間的差異不大時(對研究的目的而言);和(iii)對母體資訊9無法充份獲得時。簡單隨機抽樣法的準確度會受下列二因素的影響,即(i)母體本身的變異,和(ii)樣本的大小。以下以算術平均值為例來分別說明。﹝例子﹞(1)母體本身的變異:分別對原始母體當變異數較小和變異數較大時,計算簡單隨機抽樣法的所有可能的樣本組合,結果列在表4-1及表4-2內。表4-1簡單隨機抽樣法的所有可能的樣本組合(原始母體變異數較小)樣本順序樣本個體樣本總計樣本平均母體1234567891011121314151617abcdeabcdfabcdgabcefabcegabcfgabdefabdegabdfgabfegacdefacdegacdgfacefgadefgacdefbcdeg38.438.739.138.939.339.639.339.740.040.239.640.040.340.540.940.140.57.687.747.827.787.867.927.867.948.008.047.928.008.068.108.188.028.10a=6.9b=7.4c=7.7d=8.1e=8.3f=8.6g=9.0N=7n=5T=56=8.0第四章各種抽樣方法之選擇、步驟及優劣比較1018192021bcdfgbcefgbdefgcdefg40.841.041.441.78.168.208.288.34總計840.0平均40.0表4-2簡單隨機抽樣法的所有可能的樣本組合(原始母體變異數較大)樣本順序樣本個體樣本總計樣本平均母體1234567891011121314151617abcdeabcdfabcdgabcefabcegabcfgabdefabdegabdfgabfegacdefacdegacdgfacefgadefgacdefbcdeg26272934363736383946384041485039415.25.45.86.87.27.47.27.67.89.27.68.08.29.610.07.88.2a=1b=2c=4d=6e=13f=14g=16N=7n=5T=56=8.01118192021bcdfgbcefgbdefgcdefg424951538.49.810.210.6總計840.0平均40.0比較表4-1及表4-2,可看出同樣的抽樣方法、同樣大小的母體及樣本,在表4-1中由於原始母體的變異小,樣本平均的變異也隨著變小,而大多能代表母體平均,也就是說有較大的準確度。而在表4-2中,因為母體變數由1到16的間,大小相差甚多,結果可能的樣本組合平均值由5.2變化到10.6,故其準確度較小。(2)樣本的大小:同樣
本文标题:各种抽样方法之选择、步骤及优劣比较
链接地址:https://www.777doc.com/doc-417885 .html