統計学入門:母平均と母標準偏差の区間推定|Excelでの求め方をわかりやすく解説
今回は、 母平均と母標準偏差の区間推定 について、具体例を用いてわかりやすく整理する。
課題として与えられているのは、 ある大学の女性教員の身長 を対象に、母平均と母標準偏差を推定したいという設定である。標本サイズは 51、 標本平均は 160、 標本標準偏差は 10 である。
ここでは、 99%信頼係数 のもとで、母平均と母標準偏差をどのように区間推定するのかを、Excelの関数とともに確認していく。
課題の条件
まず、与えられている条件を整理すると次の通りである。
標本サイズ:n = 51
標本平均:m = 160
標本標準偏差:s = 10
信頼係数:99%
このデータを用いて、母平均 μ と母標準偏差 σ の区間推定を行う。
母平均の区間推定の考え方
まず母平均の区間推定を考える。標本サイズが十分にあり、標本平均と標本標準偏差が与えられている場合、母平均の信頼区間は 標本平均 ± 臨界値 × 標準誤差 という形で求めることができる。
標準誤差は、 s / √n で表される。今回の数値を代入すると、
10 / √51 ≒ 1.40028
となる。99%信頼区間では、両側0.5%ずつを除いた範囲を考えるため、Excelでは正規分布関数を使って上下限を求めることができる。
Excelで母平均の99%信頼区間を求める方法
Excelで母平均の99%信頼区間を求める場合、次のような式を用いることができる。
=NORM.INV((1-99/100)/2,160,10/SQRT(51))
から
=NORM.INV(1-(1-99/100)/2,160,10/SQRT(51))
これを計算すると、母平均 μ の99%信頼区間は次のようになる。
156.3931175 ≦ μ ≦ 163.6068825
したがって、この標本から判断すると、ある大学の女性教員の身長の母平均は、99%信頼係数のもとで 約156.39cmから163.61cmの範囲 にあると推定できる。
母平均の結果の読み取り方
この結果は、「母平均が必ずこの範囲にある」と断定するものではない。正確には、 同じ方法で標本抽出と区間推定を何度も繰り返したとき、そのうち99%程度の区間が真の母平均を含む という意味である。
つまり、今回得られた区間 156.39~163.61 は、99%信頼水準で真の母平均を含むとみなせる範囲だということである。
母標準偏差の区間推定の考え方
次に、母標準偏差の区間推定を考える。母標準偏差については、母平均の場合のように正規分布関数ではなく、 カイ二乗分布 を用いる。
母分散 σ2 の99%信頼区間は、自由度 n-1 = 50 を用いて、
(n-1)s2 / χ2(0.995) ≦ σ2 ≦ (n-1)s2 / χ2(0.005)
という形で求めることができる。今回の値を代入すると、
(50 × 102) / χ2(0.995) ≦ σ2 ≦ (50 × 102) / χ2(0.005)
となる。
Excelで母標準偏差の99%信頼区間を求める方法
Excelでは、カイ二乗分布の逆関数を用いて母分散、さらに母標準偏差の区間を求めることができる。まず、母分散の上下限を求める式は次のようになる。
下限:
=(50*10^2)/CHISQ.INV.RT(0.005,50)
上限:
=(50*10^2)/CHISQ.INV.RT(0.995,50)
母標準偏差は母分散の平方根であるから、最終的には次のように平方根を取ればよい。
下限:
=SQRT((50*10^2)/CHISQ.INV.RT(0.005,50))
上限:
=SQRT((50*10^2)/CHISQ.INV.RT(0.995,50))
これを計算すると、母標準偏差 σ の99%信頼区間は次のようになる。
7.9310158 ≦ σ ≦ 13.3652702
したがって、母標準偏差は99%信頼係数のもとで 約7.93から13.37の範囲 にあると推定できる。
結果をまとめるとどうなるか
以上より、この標本データに基づく99%信頼区間は次の通りである。
母平均:
156.3931175 ≦ μ ≦ 163.6068825
母標準偏差:
7.9310158 ≦ σ ≦ 13.3652702
このことから、ある大学の女性教員の身長について、真の平均値はおよそ 156.39cmから163.61cm の間にあり、真のばらつきの大きさを表す母標準偏差はおよそ 7.93から13.37 の間にあると推定される。
まとめ
統計学入門において、母平均と母標準偏差の区間推定は、標本から母集団の特徴を推測する基本的な方法である。
母平均の区間推定では、 標本平均と標準誤差 を用い、Excelでは NORM.INV 関数で求めることができる。一方、母標準偏差の区間推定では、 カイ二乗分布 を用い、Excelでは CHISQ.INV.RT 関数を使って計算する。
今回のデータでは、99%信頼係数のもとで、母平均は 156.3931175~163.6068825 、母標準偏差は 7.9310158~13.3652702 と推定された。
区間推定は、単に一つの値を当てるのではなく、 どの範囲に真の値があると考えられるか を示す点に大きな意味がある。統計学を学ぶうえでは、この考え方をしっかり押さえておくことが重要である。

