6Sigma基础统计概念

1基礎統計概念6Sigma企劃部3/13/20012機率的世界V.S.確定的世界百分之百確定的事？例子…..量子的世界─機率決定一切統計學家從不說100％確定。那麼有多確定…？95%確定；99%確定；99.99966%確定？3機率V.S.統計母體(分配)樣本(抽樣)機率統計Q1：隨機變數X為常態分配N(μ,σ2)，請問的平均數、變異數、變異係數？Q2：自某一母體Y隨機抽樣50個樣本，得到樣本平均數為50,樣本標準差為5,請問此母體平均數是否為45(在95%顯著水準下)？x4統計學的種類敘述統計(DescriptiveStatistics)樣本平均數、中位數、四分位數、變異數、標準差……推論統計(DeductiveStatistics)信賴區間估計(ConfidenceInterval)、假設檢定(HypothesisTest)實驗設計回歸分析(Regression)、變異數分析(ANOVA，ANalysisOfVAriance)5敘述統計介紹─平均數、標準差(1)A說：昨天晚上我和3個平均年齡只有24歲的小姐約會。B說：哇！！茂死啊！茂死啊！A說：一點也不，年齡差距太大，一點也不起勁。B說：還好吧，你也才28歲而已！60歲6歲6歲只衡量數值集中的程度還不夠，還要衡量離散的程度！6敘述統計介紹─平均數、標準差(2)離散的程度：全距(Range)、標準差(StandardDeviation)全距＝最大值-最小值樣本變異數Variance＝,i=1,2,…..n其中樣本標準差s＝三個樣本值分別為6,6,60→平均＝24；全距=54，標準差s＝＝31.17712)(nxxinxxi13224)-(60224)-(6224)-(6樣本變異數7敘述統計介紹─中位數、四分位數中位數：一群數值從小到大排列後，位於正中間的數。（若為偶數個數值，則取最中間兩數的平均）四分位數：在此數值之下，有1/4或3/4的數值分佈。例子1：10個樣本值，由小到大排列，如下：3,4,5,5,6,7,8,9,10,11求中位數？上四分位數(Q1)？下四分位數(Q3)？Ans:中位數(median)＝6.5FirstQuartile(Q1)＝5ThirdQuartile(Q3)＝8.75→EXCEL、MINITAB都可以算出來；但Q1、Q3答案(公式)不一樣8311敘述統計介紹─箱型圖(BoxPlot)作法：把最小值，Q1，中位數(=Q2)，Q3,最大值畫出來。功用：可看出一群數值大致的分佈。接前例56.58.75最小值Q1中位數Q3最大值9常見機率分配─常態分配(NormalDistribution)(1)μ2)(2121)(xexfσ常態分配特性：1.期望值E(x)=μ….又稱mean2.變異數V(x)=σ23.為左右對稱的分配,-∞x∞常記為X~N(μ,σ2)10常見機率分配─常態分配(NormalDistribution)(2)常態分配的機率分佈：μ±σ…………68.27%μ±1.645σ…………90%μ±1.96σ…………95%μ±2σ…………95.44%μ±3σ…………99.73%μ±6σ…………(1-3.4PPM)?μ2σ95.44%2σμ6σ6σ1.5σ3.4ppm1-0.002PPM11常見機率分配─常態分配(NormalDistribution)(3)若隨機變數X~N(μ,σ2)，則1.若Y=ΣXi，i=1,2..,n；則Y~N(nμ,nσ2)2.若3.若；則Z~N(0,1)同理Z稱為標準常態分配！！nixx；則~N(μ,)xn2xz)1,0(~xNn12常見機率分配─卡方(Chi-square)分配(1)設(X1,….,Xn)為抽自N(μ,σ2)之一組隨機樣本，1.若Y=則Y為具有自由度n之卡方分配，記為Y~2.若母數μ未知，以統計量代之，則得2)x(1inix2)1(2221is)1()xx(nnin2)(n用來檢定母體變異數σ2自由度：n-113常見機率分配─卡方(Chi-square)分配(2)卡方分配特性：1.期望值E()=自由度2.變異數V()=2倍自由度3.為右偏的分配22)(2vα)P()(22v14常見機率分配─t分配(1)設Z與W為獨立的隨機變數，且Z~N(0,1)，W~，又令：則稱隨機變數T的機率分配，是自由度為v的t分配，記為T~t(v)2)(vvWZT15常見機率分配─t分配(2)0t分配特性：1.期望值E(T)=02.變異數V(T)=v/(v-2)，v23.為左右對稱的分配4.當v→∞，t分配近似於標準常態分配N(0,1)t(v)tα(v)α16常見機率分配─t分配(3)設(X1,….,Xn)為抽自常態母體N(μ,σ2)之一組隨機樣本，則：Proof:1)-(nt~/S-xn)1,0(~/xzNn2)1(22s)1(nn1)1(/WZT22nSnnXv用來檢定母體平均數μ17常見機率分配─F分配(1)設與為獨立隨機變數，且又令：則隨機變數F的機率分配是自由度v1與v2的F分配，記為F~F(v1,v2)222121Fvv2122)1(2~21v)2(2~22v18設(X1,….,Xn1)與(Y1,….,Yn2)為分別由常態母體N(μ1,σ12)與N(μ2,σ22)抽出的兩組獨立的隨機樣本，則：常見機率分配─F分配(2))1,1(F~2122222121nnSS用來檢定兩母體標準差是否相等(σ1=σ2)19設(X1,….,Xn)為由常態母體N(μ,σ2)抽出的一組獨立的隨機樣本。母體mean之信賴區間估計─Z分配(1))1,0(~NnxZ95.0)96.196.1(nxPRecall:Page1020母體mean之信賴區間估計─Z分配(2)95.0)96.196.1(nxnxP表示：有95%信心，母體的mean(μ)將在底下區間之內)96.1,96.1(nxnx如果要有99%信心的話呢？21母體mean之信賴區間估計─Z分配(3)定義：對於一常態分配母體的mean(μ)，若已知其標準差為σ，則其100(1-α)%的信賴區間為：),(22nzxnzxExample:99%,Zα/2=2.575(查表可得，統計軟體會內建)0Zα/2(1-α)-Zα/2現實問題是：σ不知道。22母體mean之信賴區間估計─t分配(1)對於一常態分配母體的mean(μ)，若其母體標準差未知，求其100(1-α)%的信賴區間→t分配Recall:1)-(nt~/S-xnT12)(nxxSi其中，i=1,2,…n23母體mean之信賴區間估計─t分配(2)1)()1,2()1,2(nntTtP0t(α/2,n-1)(1-α)-t(α/2,n-1)1)()1,2()1,2(nntnSXtP24母體mean之信賴區間估計─t分配(3)1)()1,2()1,2(nStXnStXPnn定義：對於一常態分配母體的mean(μ)，若與S為其樣本平均值及樣本標準差，則其100(1-α)%的信賴區間為：x)()1,2()1,2(nStXnStXnn，查表得到或軟體內建25母體mean之信賴區間估計─t分配(4))()110,025.0()110,025.0(nStXnStX，例子：10,13,17,14,20,15,21,18,13,20為自一常態母體抽出的一組樣本。試求母體mean的95%信賴區間：,1.16x67.31102)(xxSi)1067.3*262.21.161067.3*262.21.16(，Ans:所以母體mean的95%信賴區間：)725.18475.13(，26假設檢定(HypothesisTest)─概論(1)動機：經由統計方法，拒絕一原始的假設。原始假設：虛無假設(NullHypothesis):希望被否定的統計假設，以H0表示之。另外假設：對立假設(AlternativeHypothesis):由於否定虛無假設而被認為對的統計假設，以H1或Ha表示之。H0:新藥不具療效H1:新藥具有療效→利用數據及統計方法去拒絕H0（接受H1）27假設檢定(HypothesisTest)─概論(2)檢定程序：1.決定檢定統計量2.決定拒絕域(rejectionregion)：與顯著水準α有關當檢定統計量落入拒絕域，則拒絕H00Zα(1-α)αH1Z0Zα則拒絕H028假設檢定(HypothesisTest)─概論(3)另一種表示檢定結果的方法：P-Value1.以標準常態分配為例，P-Value=P(Z檢定統計量Z0)2.當P-Valueα，則拒絕H00Zα(1-α)Z0P29假設檢定(HypothesisTest)─概論(4)兩種檢定錯誤：1.typeIerror：當虛無假設H0為真時，但檢定結果卻拒絕H0(其機率值為下圖的α)2.typeIIerror：當虛無假設H0為假時，但檢定結果卻接受H0(其機率值為下圖的β)μ1Zαβμ2αH0H130假設檢定(HypothesisTest)─概論(5)檢定能力：Power=P(rejectH0|whenH1istrue)=1-βμ1Zαβμ2αH0H131假設檢定(HypothesesTest)─母體平均數mean(1)檢定母體的mean：H0：μ＝μ0檢定統計量：Ha：拒絕域μμ0μμ0μ≠μ0或nSxt/-0)1,(ntt)1,(ntt)1,2(ntt)1,2(ntt右尾雙尾檢定左尾32假設檢定(HypothesesTest)─母體平均數mean(2)H0：μ＝12Ha：μ≠12Ans：因為所以拒絕H0，表示母體均數μ≠12比較Page25之μ的信賴區間,1.16x67.3s262.254.310/67.321-6.11)110,025.0(tt例子：10,13,17,14,20,15,21,18,13,20為自一常態母體抽出的一組樣本。試檢定(顯著水準α=0.05)：33假設檢定(HypothesesTest)─母體變異數(1)H0：檢定統計量Ha：拒絕域或檢定母體的變異數：2022022s)1(n202202202)1(22n)1(212n)1(222n)1(2212n)1(2nα)1(21n34例子：10,13,17,14,20,15,21,18,13,20為自一常態母體抽出的一組樣本。試檢定(顯著水準α=0.05)：H0：σ2≦9Ha：σ2＞9Ans：因為所以接受H0，表示母體變異數可能小於或等於9,1.16x43.132s假設檢定(HypothesesTest)─母體變異數(2)92.16)110(943.31)110(205.0235到目前為止：，t，F分配，其母體都是常態分配。如何確保樣本統計量為常態分配？母體常態性檢定：NormalProbabilityPlot、K-S檢定….中央極限定理：當樣本數n30，不管母體分配為何，趨近常態實用經驗：若樣本本身的分佈是鐘型曲線(Bell-shape)，則樣本數n只要等於4或5，不管母體分配為何，趨近常態最後的問題─如何確保樣本統計量為常態分配？2xx36謝謝各位！恭喜各位已經學到統計的入門，請繼續加油！！

6Sigma基础统计概念

免费阅读已结束，点击付费阅读剩下 ... 页

阅读已结束，您可以下载文档离线阅读

房屋建筑和市政基础设施工程施工分包管理办法

河南省十二五干线工程建设管理与监督办法

Gartner研究引入第二家网络供应商以节约资金并优化运营

第9章项目管理

工程部技术员绩效评价要素表(公司)

四大会计事务所财务培训_2

计量经济学7经典计量经济学应用模型

035S图例集

企业内部管理规章制度

XX金融服务集团业务介绍

相关文档

相关搜索

6Sigma基础统计概念

免费阅读已结束，点击付费阅读剩下 ... 页

阅读已结束，您可以下载文档离线阅读

房屋建筑和市政基础设施工程施工分包管理办法

河南省十二五干线工程建设管理与监督办法

Gartner研究 引入第二家网络供应商以节约资金并优化运营

第9章项目管理

工程部技术员绩效评价要素表(公司)

四大会计事务所财务培训_2

计量经济学7经典计量经济学应用模型

035S图例集

企业内部管理规章制度

XX金融服务集团业务介绍

相关文档

相关搜索

Gartner研究引入第二家网络供应商以节约资金并优化运营