做統計推論之假說檢定(hypothesis testing)時,是下一個「是or否」之決定:
即接受虛擬假說(null hypothesis, Ho) or 拒絕虛擬假說(而接受對立假說,alternative hypethesis, Ha)。
因此在使用某檢定方法(例如:變方分析且估算出F值後,無論F值大或小)後,決定拒絕或接受Ho。
但由於母群真值之不確定使我們有可能造成Type I或Type II的錯誤。
Type I Error是在
條件一:當Ho為真 |
→ 此二條件同時存在時發生 |
條件二:我們拒絕Ho |
Type I Error發生的機率(probability)為:α
此值之大小則完全由研究者自設的顯著水平(significance level)來控制。
換言之,若我們的試驗設計較擔心犯此Type I Error時,我們可將α= 0.05改設為α= 0.01,如此就不容易拒絕Ho因而也不易犯第一型的錯誤。
但是,如果太在意Type I Error,又有增加Type II Error的風險。
Type II Error是在
條件一:當Ha為真 (即Ho為偽) |
→此二條件同時發生時出現的 |
條件二:我們沒有拒絕Ho
|
此型錯誤不易自試驗數據中看出,出現此錯誤之機率:β(beta)
此機率是由一次次重複試驗誤差出現的頻率所形成。
相對的,下正確決定(即Ha為真而我們拒絕Ho)的機率我們稱為檢定力(Power),所以:
Power= 1 – (type II error)
= 1–β
當減少Type II Error時,即可增加Power。
控制Type II Error (β)的方法可設法增大檢定的F值,較大的F值可使我們有較多的機會拒絕Ho,因而避免犯Type II Error。
增大F值可藉下列方法達成:
1.增加處理的數目(或取樣數目)-使SSerror/dferror值減小,進而減小F值估算時的分母(MSerror),因而可增大F值。
2.增強處理效果-可增大F值估算時的分子(MStreat)而增大F值。
3.減小試驗誤差量-經由周詳計畫減少非處理之誤差,或儘量使用均質之對象試驗,而減低SSerror增大F值。
4.利用較敏感的試驗設計-增大處理間差異,提高F值。
由上述知道假說檢驗中,研究者即使下了正確的決定(接受或拒絕Ho),他仍冒有對母群退論錯誤的機會。
下表為研究者「下決定」與「母群本質」間的關係:
Table.試驗者的決定與母群本質特性關係
基於統計分析我們所下的決定 |
母群本質 |
|
Ho為真 (所有μi均相等) |
Ho為偽 (非所有μi均相等) |
|
拒絕Ho |
Type I Error (機率=α) |
正確決定 (機率=1–β) |
接受Ho |
正確決定 (機率=1–α) |
Type II Error (機率=β) |
圖片來源:stackexchange
假說檢定結果不是接受就是拒絕Ho,因此邏輯上若我們下了決定,則只會犯一種錯誤,換言之若我們拒絕Ho,我們只有可能犯Type I Error。
我們對試驗下結論時:
可以說試驗結果支持(support)或確定(confirm)某理論
但絕不能說某理論被我們的試驗結果所證明(be proved)
因為利用假說檢驗中,Type I或Type II Error不是這個錯就是那個錯,我們總有可能犯上某一型錯誤!
統計上α、β與樣本數(n)三者間的關係如下:
□ 固定α值之下,增加n會減低β。
□ 固定n值,降低α會增加β。
□ 要想降低α與β值,可多取樣增加n。
p值:
為數據中求得某統計量(如:t, F值)後,依照該機率分布所查得(或算出)之機率值
而α(譬如是0.05)是p值的臨界,小於此臨界則我們有信心(95%)可拒絕假說Ho而認為差異是統計上顯著的。
圖片來源:mropengate
因此,α值是我們事前所設定犯Type I error之機率,p值則由數據估算而得,α為p值的臨界,小於設定的α則為統計上「顯著」。
參考資料:是誰將數字變得有意義了?:談生物統計-張念台 編著