您好,欢迎访问三七文档
研究方法假設檢定與T檢定指導教授:王天津報告人:吳佩霖1104346121商奕杰1105346121何謂統計學統計學屬資料蒐集的傳統方法與基礎統計學主要分為統計理論及推論統計統計學的內容多屬於應用數學透過蒐集、整理、陳示、分析、解釋將龐大的資料轉換為有價值的資訊DataInformationDataMining2/123何謂推論統計(1/2)研究如何根據樣本數據去推斷總體數量特徵的方法在以對樣本數據進行描述的基礎上對統計總體的未知數量及特徵做出以概率形式的推斷在一段有限時間內對一目標對象通過對一個隨機過程或是以目的性設計的觀察來進行推斷其目標的性質與特徵3/123何謂推論統計(2/2)案例:想知道全台灣八十萬小學生的近視比例因時間及經濟等考量而無法對整體進行普查而最簡便的方法就是以隨機抽樣的方式抽取一部份作為調查如抽取兩千名來檢查是否有近視八十萬小學生為母體(population)抽取的兩千名小學生為樣本(sample)從母體抽取樣本稱為抽樣(sampling)如此根據樣本資料推估母群性質,即是推論統計4/123假設檢定(HypothesisTesting)(1/3)分為「研究假設」和「統計假設」研究假設是在進行研究前所預設的理論研究者根據經驗、事實與理論,有邏輯的對所研究的問題作出猜測換句話說,就是針對研究所提出的暫時性或是試驗性的答案5/123假設檢定(HypothesisTesting)(2/3)統計假設把研究假設,用數量或統計學用詞等的陳述句加以表達並對未知的母體的性質做有關的陳述一種對於母體參數、特性或分配的「主張」一般在統計檢定的過程中,會先建立6/123假設檢定(HypothesisTesting)(3/3)虛無假設(nullhypothesis)H0研究者欲推翻的假設凡所定的假設而欲予以否定者,以H0來表示對立假設(alternativehypothesis)H1研究者所要證實的假設相對於虛無假設,以H1表示其大多為實驗研究者內心所想要加以支持的假設H0和H1是互斥的兩個假設7/123虛無假設與對立假設(1/4)案例1:若要證明一個人沒有罵過人,則必須檢視他從小到大的所有言論還必須證明其是否為真實及時間是否連續無中斷,實屬不可能實現但若是要證明一個人有沒有罵過人,就只要找到一次就行了也就是說,企圖肯定什麼事物很難,但要否定卻相對的容易假設檢定背後的哲學意涵-反面論證8/123虛無假設與對立假設(2/4)在假設檢定中,一般要先設立一個原假設如剛剛的「從來沒罵過人」就是原假設如果否定不了,表示證據不足,無法否定原假設但也不代表原假設是正確的9/123虛無假設與對立假設(3/4)虛無假設與對立假設的建立原則一般而言,研究假設常被設定會對立假設如果拒絕H0,就是支持研究假設,故研究假設應被設定為對立假設虛無假設H0→研究者欲推翻的假設對立假設H1→研究者所要證實的假設不是H0為真;就是Ha為真,不可能兩者同時為真10/123虛無假設與對立假設(4/4)案例2:某款汽車的平均耗油是每加侖24哩現有一新型引擎「號稱」能增加每加侖的行駛哩程如果樣本結果顯示不能拒絕H0,則就不能認定新引擎可以增加哩程如果結果顯示能拒絕H0,則可以推論μ24,也就是H1為真H0:μ≦24H1:μ2411/123事實H0為真H1為真拒絕H0TypeIError型I錯誤正確決策不拒絕(接受)H0正確決策TypeIIError型II錯誤假說檢定基本概念(1/4)虛無與對立假設是描述母體的兩個互相對立的描述實際上卻無法保證一直獲得理想的結果因為假設檢定是以樣本資料為基礎所以必須容許有錯誤的可能性12/123兩種錯誤型一錯誤(typeIerror)也為第一類型錯誤。當虛無假設為真時,而研究者卻加以拒絕時所犯下的錯誤。其發生之機率以α表示。H0為真之下,錯誤地拒絕H0型二錯誤(typeIIerror)也為第二類型錯誤。當虛無假設為假時,而研究者卻加以接受時所犯下的錯誤。其發生之機率以β表示。H1為真之下,錯誤地不拒絕13假說檢定基本概念(2/4)/123假說檢定基本概念(3/4)顯著水準(significantlevel)為發生型I錯誤的最大機率,以α來表示。一般會設顯著水準為α=0.05、α=0.01或α=0.001,以此鎖住並控制型I錯誤發生的可能性,使其不超過檢定者所能忍受之範圍。自由度(degreeoffreedom)任何變數之中可以自由變動之數值的數目用df來表示14/123假說檢定基本概念(4/4)在利用一定樣本大小的一次實驗觀察之後不可再增加樣本之大小絕不可為了達成拒絕虛無假設的結果而在實驗之後更改α與N15/123淺談顯著水準(significantlevel)實務上由執行假設檢定的人選訂顯著水準(α)一旦在實驗觀察前決定好,就不可再變動選定了α,也就是選定了犯型I錯誤的機率如果犯型I錯誤必須付出極高的成本,則偏好較小的α值只控制α的假設檢定稱為顯著性檢定(significancetests)大部分的假設檢定皆為此種類型16/123淺談自由度(degreeoffreedom)(1/5)自由度指在推論統計中可以從多少個樣本來去推估個母數的意思當有愈多的樣本推估去母數,母數就會愈清楚一般在推論統計中如T、F檢定,自由度愈大,推估的誤差會變少類似概念X+Y+Z=100當已知X=50Y=30時則勢必Z=20Z在此關係中就無自由度17/123淺談自由度(degreeoffreedom)(2/5)比如有5個數可以去推估母數這5個數的自由度就是5代表你可以隨機從母群中抽出5個自由的變數來推估如果規定5個樣本其中一定要有數字10出現那麼自由度變少了一個,變成418/123淺談自由度(degreeoffreedom)(3/5)案例1:當走在路上肚子餓了,口袋有100元而面前有四個可以吃東西的地方7-11、一般便當店、王品牛排、西堤牛排這時自由度只有2,因為100只可能吃的起7-11或一般便當店可若口袋有3000元時,自由度就是4了19/123淺談自由度(degreeoffreedom)(4/5)案例2:想知道暗戀的對象週六都喜歡做些什麼事,於是偷偷觀察她5週但發現有兩週她必須要上班,所以觀察她的自由度由5就變成3人的行為也是如此,當你行為的自由度愈大時,就愈有意義→清潔工和你隨手撿起垃圾,誰比較有意義?20/123淺談自由度(degreeoffreedom)(5/5)樣本可自由變動的個數21/123期望值(μ)之假說檢定母體常態母體變異數σ2已知母體變異數σ2未知採Z檢定母體非常態,σ2未知(需要大樣本)採T檢定採Z檢定22/123T檢定適用的條件23當自變項是類別變項,依變項是等距時使用僅用於自變項只有兩類的變項,例如性別只有兩種屬性自變項若是超過兩類,則需要使用其他的資料分析方法,如ANOVA。/123相依變項的本質必須是連續數,而且是隨機樣本也就是是從母群體中隨機抽樣而來的如果不是連續數,則必須採用無母體分析相依變項的母群體必須是常態分佈若檢測結果不是常態分佈,須改為無母體分析前提假設(1/2)24/123樣本的量測都為獨立事件,也就是獨立變項只有一組或兩組,而且第一組的樣本不會影響第二組的樣本。例如性別:如果樣本是男性者一定不會影響樣本是女性者的量測。如果不是獨立事件,則應該採用配對T檢定。兩組樣本的變異數要為常態分佈,並且為定值。如果不是,其統計值t必須調整。前提假設(2/2)25/123連續變數次數分配:歸類整理描述統計:集中趨勢量數(平均數、中數、眾數)離散量數(全距、四分差、標準差、變異數)抽樣分配特性研究者無法真的知道抽樣過程是不是具有偏差而違反常態分配的基本要求,因此,連續變數的檢驗必須特別考慮抽樣分配的特性,選取適當的檢驗方式。基本概念(1/2)26/123單母群的平均數檢定一個連續變數的得分可以計算出一個平均數,例如薪資的平均數或學業成績的平均數,如果研究者僅對單一變數的平均數加以檢驗,不考慮其他變數的影響,稱為單母群的平均數檢驗。多母群的平均數檢定同時考慮不同情況之下的平均數是不是有差異,例如男生與女生的平均數比較,這時即牽涉到多個平均數的檢驗;不同平均數,代表背後具有多個母群存在,因此稱為多母群的平均數檢驗。基本概念(2/2)母體多寡27/123單尾與雙尾檢定(1/4)平均數檢定會因為研究假設的方向性,分為單尾或雙尾檢定。平均數檢定目的在於比較不同平均數的大小差距,所提出的兩個平均數大於、小於或不等於等不同形式的研究假設28/123單尾與雙尾檢定(2/4)單尾或是雙尾的T檢定,是取決於是全部放在一邊或是平均分配在兩邊單尾T檢定是用在只關心特定方向的結果而雙尾T檢定則是結果的兩個方向都關心單尾或是雙尾T檢定之選擇,考量各種不同的假設檢定情況29/123單側/單尾檢定(one-tailedtest)使用於考驗單一方向性的問題適用於含有「大於」、「多於」、「短於」、「少於」等問題單尾與雙尾檢定(3/4)30/123單側/單尾檢定(one-tailedtest)使用於考驗單一方向性的問題適用於含有「大於」、「多於」、「短於」、「少於」等問題雙側/雙尾檢定(two-tailedtest)只強調有無差異,而不強調方向性。單尾與雙尾檢定(4/4)31/123單尾檢定(1/4)單尾檢定(one-tailedtest)只關心單一方向的比較關係平均數的檢驗僅有一個拒絕區虛無假設H0:1≤2對立假設H1:1232/123單尾檢定(2/4)在單側檢定中,把集中在一個區域當H1:12時,表示1-2是正值把集中在右端;當H1:12時,表示1-2是負值,集中在左端。所佔的區域稱為臨界區或拒絕區是因為假設檢定所計算出的檢定值落入這區域便要拒絕H0。33/123單尾檢定(3/4)H0:1≤2H1:1234/123例如:自由度為10(df=10)定為0.05t10,0.05=1.812,其抽樣分配模式可以圖示如下:單尾檢定(4/4)35/123雙尾檢定(1/3)雙尾檢定(two-tailedtest)無特定方向的假設假設在兩個極端的情況都有可能發生,而必須設定兩個拒絕區虛無假設H0:1=2(1-2=0)對立假設H1:12(1-20)36/123雙尾檢定(2/3)在雙側檢定中,α分為兩個區域(如圖)左右端各有一個,離平均數的距離比單側檢定時遠當α相等時,使用雙側檢定者較難達到顯著水準,不容易拒絕H037/123雙尾檢定(3/3)雙尾T檢定是將值平均分配在兩端虛無假設的臨界值有二:一為正,一為負,t值則是以正負號表示(±)例如:自由度為10(df=10),而定為0.05,則t10,.05=±2.228,其抽樣分配模式可以圖示如下:38/123比較單尾與雙尾檢定單尾檢定由於只需考慮單方向的差異性,因此在同樣的顯著水準下,可以比雙尾檢定容易得到顯著的結果,即其統計檢定力(poweroftest)大於雙尾檢定。採用單尾檢定必須提出支持證據,除非理論文獻支持單尾檢定的概念,或是變項間的關係具有明顯的線索顯示須使用單尾檢定,否則以採雙尾檢定來檢驗平均數的特性。39/123獨立樣本與相依樣本(1/2)在多母數的平均數檢驗中,不同的平均數進行相互比較,然而不同的平均數可能計算自不同的樣本,也有可能計算自同一個樣本的同一群人,或是具有配對關係的不同樣本。根據機率原理,當不同的平均數來自不同的獨立樣本,兩個樣本的抽樣機率亦相互獨立。40/123獨立樣本與相依樣本(2/2)重複量數設計不同的平均數來自於同一樣本的同一群人例:國企所學生的四學期平均成績配對樣本設計配對關係的不同樣本例:夫妻兩人的薪資多寡、同組的成績41/123單一母體之假說檢定單一母體期望值(μ)之假說檢定變異數(S2)之假說檢定比例(p)之假說檢定42/123母體常態母體變異數σ2已知母體變異數σ2未知採Z檢定母體非常態,σ2未知(需要大樣本)採T檢定採Z檢定43期望值(μ)之假說檢定(1/4)/123期望值(μ)之假說檢定(
本文标题:假设检定与T检定
链接地址:https://www.777doc.com/doc-4633906 .html