統計的仮説検定について|帰無仮説・対立仮説・p値をわかりやすく解説
今回は、 統計的仮説検定 について、基本からわかりやすく整理します。
統計学を学び始めると、 帰無仮説、 対立仮説、 p値、 有意水準 といった用語が登場します。しかし、言葉だけを覚えても、実際に何をしているのかが分かりにくいと感じる人は少なくありません。
仮説検定とは、簡単にいえば、 得られた標本データをもとに、ある仮説を棄却できるかどうかを判断する方法 です。以下では、仮説検定の考え方と手順を順番に解説します。
統計的仮説検定とは何か
統計的仮説検定とは、母集団についてある仮説を立て、その仮説が標本データと整合的かどうかを確率的に判断する方法です。
たとえば、「この新しい教材は従来の教材より効果があるのか」「この薬は本当に効いているのか」「平均値に差があるのか」といった問題を考えるとき、単に標本平均を比較するだけでは十分ではありません。なぜなら、標本には偶然によるばらつきが含まれているからです。
そこで仮説検定では、 もし差がないとしたら、今のようなデータはどれくらい起こりにくいのか を考えることで、統計的な判断を行います。
帰無仮説とは何か
仮説検定で最初に立てる仮説のうち、一般に研究者が 当初否定したい仮説 に置かれることが多いものが、 帰無仮説 です。
帰無仮説とは、たとえば「差がない」「効果がない」「平均は等しい」といった、基準となる状態を表す仮説です。具体的には、抽出した標本のデータが、母平均や既知の基準値と等しいとみなす仮説がこれに当たります。
たとえば、ある平均値が50であるかを検討したい場合には、 H?: μ = 50 のように帰無仮説を立てます。
対立仮説とは何か
帰無仮説に対して、その反対の立場に置かれる仮説が 対立仮説 です。
これは研究者が最終的に主張したい内容に対応することが多く、「差がある」「効果がある」「平均は等しくない」といった形で表されます。
たとえば先ほどの例であれば、 H?: μ ≠ 50 のように表すことができます。あるいは、「平均は50より大きい」「平均は50より小さい」といった片側検定の形をとることもあります。
仮説検定では、 帰無仮説を棄却できたときに、対立仮説を支持する という流れで判断を行います。
「帰無仮説を棄却しない」と「受容する」は違います
仮説検定を学ぶうえで特に注意したいのは、 「帰無仮説を棄却しない」ことと「帰無仮説を受容する」ことは同じではない という点です。
仮説検定は、帰無仮説が正しいと仮定したうえで、観測されたデータがどれほど起こりにくいかを調べる方法です。そのため、棄却できなかったとしても、それは「帰無仮説が正しいと証明された」という意味にはなりません。
単に、 今回のデータだけでは帰無仮説を否定するだけの十分な証拠が得られなかった という意味にとどまります。この点は非常に重要です。
仮説検定の基本手順① 仮説を立てる
仮説検定の第一段階では、 帰無仮説と対立仮説の二つを立てます 。
このとき一般には、研究者が主張したい内容を対立仮説に置きます。たとえば「新しい方法のほうが成績を上げる」と主張したいなら、「差がない」を帰無仮説にし、「新しい方法のほうが良い」を対立仮説に置くことになります。
この段階で重要なのは、 何を比較したいのか、どの方向の差を見たいのかを明確にすること です。
仮説検定の基本手順② p値を求める
次に、帰無仮説が正しいと仮定したときに、 今得られた観測データ、またはそれよりさらに極端なデータが得られる確率 を求めます。これが p値 です。
p値は小さいほど、「帰無仮説が正しいとすると、こんなデータは起こりにくい」ということを意味します。逆にp値が大きい場合は、観測データが帰無仮説のもとでもそれほど珍しくないことになります。
したがって、p値は仮説検定における判断材料として非常に重要です。
仮説検定の基本手順③ 有意水準と比較する
最後に、手順②で求めたp値を、 有意水準 と比較します。
有意水準とは、「これより小さければ十分に珍しいとみなす」という判断基準のことで、一般には 5% や 1% が用いられます。
もし p値が有意水準以下 であれば、帰無仮説のもとでは今回のデータは起こりにくいと判断し、 帰無仮説を棄却 します。その結果、対立仮説が支持されることになります。
一方、p値が有意水準より大きい場合は、帰無仮説を棄却できません。この場合、仮説検定は有意な結果を得られなかったことになります。
仮説検定の流れをまとめると
仮説検定の流れを簡潔に整理すると、次のようになります。
まず、 帰無仮説と対立仮説を立てる 。 次に、 帰無仮説が正しいとした場合のp値を求める 。 そして最後に、 p値を有意水準と比較して棄却するかどうかを判断する 。
この三段階を通して、研究者は標本データから母集団に関する仮説を検討することができます。
仮説検定で大切な考え方
仮説検定では、単に計算結果だけを見るのではなく、 何を帰無仮説に置いたのか、 p値が何を意味しているのか、 棄却できないことが何を意味するのか を正しく理解することが重要です。
特に初心者が誤解しやすいのは、p値が小さいと「対立仮説が正しい確率が高い」と考えてしまう点です。しかし実際には、p値は 帰無仮説が正しいと仮定した場合に、そのデータがどれほど珍しいか を表しているのであって、仮説そのものの真偽の確率を直接示しているわけではありません。
まとめ
統計的仮説検定とは、標本データをもとに、母集団について立てた仮説を確率的に検討する方法です。
まず、 帰無仮説 と 対立仮説 を立てます。次に、帰無仮説が正しいと仮定したときに、観測データまたはそれより極端なデータが得られる確率である p値 を求めます。そして、そのp値が有意水準以下であれば帰無仮説を棄却し、対立仮説を支持します。
ただし、 帰無仮説を棄却しないことは、帰無仮説を正しいと認めることではない ので、この点には十分注意が必要です。
仮説検定は統計学の中心的な考え方の一つであり、研究、調査、実験の結果を客観的に判断するための重要な道具であるといえます。

