閱讀本篇,你會學到以下內容:
- 單一樣本 t 檢定的使用時機
- 單一樣本 t 檢定的實作步驟
而還不熟悉假設檢定方法或是 t 檢定的小夥伴,可以參考以下兩篇文章:
以下情境將會貫穿整篇文章,協助大家理解單一樣本 t 檢定的實作:
Statea Cup 咖啡廳的老闆想要確認他們的咖啡杯平均重量是否等於標準值 360 g。
STEP 1:建立虛無假設和研究假設

這是個雙尾檢定的例子,虛無假設為未知母體平均數(咖啡杯重量)等於標準值 360 g,而研究假設則成數未知母體平均值不等於標準值。
STEP 2:設立顯著水準
我們這邊設定顯著水準為 0.05。
STEP 3:決定統計檢定方法
我們須根據資料的型態、變數的尺度和數量、研究的目標和對象來找到合適的檢定方法。在這個例子中,因為店內的咖啡杯很多,老闆僅想抽取其中幾個杯子當作樣本測量重量,因此使用「單一樣本 t 檢定」作為統計檢定方法。以下整理單一樣本 t 檢定使用時機:
- 一個母體
- 想知道母體平均值是否等於特定值
- 母體呈現常態分佈
STEP 4:計算檢定統計量
檢定統計量可看作是模型可解釋的變異對模型無法解釋的變異的比率,依照這個概念,我們將單一樣本 t 檢定的公式列出:

這個公式的分子部分 (x̄ — μ) 代表的是樣本平均值和特定值(假定的母體平均數)的差異。如果這個差異越大,分子的數值就越大。
分母部分 (s / √n) 則反映了樣本的變異性,也就是模型無法解釋的變異(僅能由隨機性解釋的變異)。s 代表樣本的標準差,這表示樣本中個別數據點相對於平均值的偏離程度。√n 表示樣本的大小的平方根,它反映了我們從整體母體中取樣的數量。
如果這個 t 值越大,表示樣本平均值和假設的母體平均值之間的差異相對於樣本的變異性越大,這可能是一個統計上的顯著差異,而不僅僅是因為隨機變動所致。
讓我們將咖啡杯的例子套入這個公式吧!抽取 10 個樣本測重後,我們計算出樣本平均數跟標準差,並依照公式求出對應的 t 值,整理成以下表格:


STEP 5:制定並執行決策規則
在計算出檢定統計量後,下一步則是將檢定統計量和顯著水準進行比較,來制定並執行決策規則,而決策規則總共有兩種,我們將分配套入咖啡杯例子來進行解釋。
1. 將檢定統計量轉換成 p 值進行比較
當 t 值為 0.602,自由度為 9(df = n — 1 = 9)時,查詢 t 分佈表或使用統計軟體,可以找到對應的 p 值。根據統計軟體的計算,t 值為 0.602 所對應到的 p 值大約為 0.279。由於顯著水準為 0.05,而計算得到的 p 值 (0.279)大於顯著水準的一半(0.025,雙尾檢定),我們無法拒絕虛無假設。這表示在統計上,這個樣本的平均數與特定值 360 並無顯著差異。
2. 計算臨界值與檢定統計量進行比較
當顯著水準為 0.05 且自由度為 9 時,雙尾 t 分佈的臨界值是分佈的兩個尾端各 0.025 的值,我們可以使用 t 分佈表或統計軟體來找到這些臨界 t 值。

先來講講這張 t 分布表該如何使用吧!欄位名是 α 表示顯著水準,而列名 df 則是自由度,依照自己樣本所設定的顯著水準及計算出來的自由度做對照,即可找到對應 t 值。這邊須注意,在雙尾檢定中,因為顯著水準需要在分佈的兩個尾端均分,因此在查找 t 分布表時,必須將原本的顯著水準除以 2,以確保在兩個尾端找到正確的臨界值。
查表可知,上下尾臨界 t 值分別是 2.262 和 -2.262,表示若計算得到的 t 值小於 -2.262 或大於 2.262,我們就有足夠的證據來拒絕虛無假設,但我們所求 t 值(0.602)沒有滿足上述條件,因此我們無法拒絕虛無假設,而推論出樣本的平均數與特定值 360 並無顯著差異。
得出結論後,我們通常會用特定方式來表示:

其中,t 表示使用的檢定方法,(9) 表示自由度,0.602 是統計檢定量(t 值),而 p > 0.05 則代表檢定結果無顯著性(不能拒絕虛無假設),也可以寫成 p = n.s.。
STEP 6:解釋結果 & 檢測效應量
由於這個例子的最終結果是不具顯著性,因此不須計算效應量來得出顯著性的規模。
完成上述步驟後,由於檢定結果是不能拒絕虛無假設,因此 Statea Cup 咖啡廳的老闆可得出以下結論:
在顯著水準等於 0.05 的情況下,咖啡杯的平均重量跟標準值 360 g 並無統計上的差異。
結論
本文深入探討了單一樣本 t 檢定的特點和適用情境。單一樣本 t 檢定是一個強大的工具,能夠從小樣本中提取有關母體的重要信息,透過計算 t 值與臨界值的比較,我們可以評估樣本平均值跟特定值的差異是否具有統計顯著性。不過,若是想知道兩個母體或者相依兩群體的平均值是否存在顯著差異,則需要透過其他的 t 檢定來完成,讓我們好好期待接下來的學習吧!
沒有留言:
發佈留言