母比率の検定についてわかりやすく解説|例題を使って徹底理解!

統計学基礎

母比率の検定とは?

母比率とは?

母比率とは、母集団において、特定の特徴を持つ要素の割合のことを指します。

例えば、日本全体の左利きの人の割合(母比率)を調べたいとしましょう。

しかし、日本全国の全員を調査するのは現実的ではありません。

そこで、一部のサンプルを調査し、その結果から母比率を推測することになります。

このとき、サンプルから得られた比率を 標本比率と呼び、それを基に母比率を検定します。

一般的に母比率が\(p\)で表されるのに対し、標本比率は\(\hat{p}\)で表されます。

母比率の検定とは?

母比率の検定は、データから「ある割合が本当に特定の値と異なるか?」を判断するための方法です。

例えば、

  • スポーツチームの勝率が昨年より上がったか?
  • ある町の喫煙率が全国平均より高いか?
  • 新しいワクチンの有効率は既存のものより優れているか?

こうした疑問を統計的に検証し、「偶然のばらつきによる違いか、それとも本当に違うのか?」を判断するのが母比率の検定です。

数式を使って計算し、統計的に意味のある違いなのかを明らかにするのがポイントです。


母比率の検定の手順

1. 仮説の設定

母比率の検定では、次のような仮説を設定します。

  • 帰無仮説H0:「母比率 \(p\) はある特定の値と等しい」
  • 対立仮説H1:「母比率 \(p\) は特定の値と異なる(大きい・小さい)」

例えば、「ある学校の生徒の中でスマートフォンを持っている割合が全国平均50%と異なるか?」を調べる場合、次のような仮説を立てます。

$$H_0:p=0.5$$

$$H_1:p\ne0.5$$

2. 検定統計量の計算

標本比率 を用いて、以下の検定統計量(Z値)を計算します。

$$Z = \frac{\hat{p} – p_0}{\sqrt{\frac{p_0(1 – p_0)}{n}}}$$

ここで、

  • \(\hat{p}\)は標本比率(調査で得た比率)
  • \(p_0\)は仮説で設定した母比率
  • \(n\)はサンプルサイズ

この値を基に、標準正規分布を用いて帰無仮説を棄却するかどうかを判断します。

3. 有意水準と臨界値の設定

通常、有意水準\(\alpha\)は 5%(0.05)または 1%(0.01)に設定します。

  • 両側検定では、 Zの値が ±1.96(有意水準5%の場合)または ±2.58(有意水準1%の場合)を超えれば帰無仮説を棄却。
  • 片側検定では、1.645(5%)や 2.33(1%)を基準とします。

これらの臨界値は、正規分布表から確認します。

4. 判定

計算した Z 値と臨界値を比較し、帰無仮説を棄却するかどうかを判断します。

  • Zの値が臨界値より外側にある → 帰無仮説を棄却(統計的に有意)
  • Zの値が臨界値を超えない → 帰無仮説を採択(統計的に有意な差なし)

母比率の検定に関する例題

例題:ワクチンの有効率

新ワクチンを1000人に接種し、920人に効果があったとする。

従来のワクチンの有効率90%と異なるかを有意水準1%で検定する。

  • 帰無仮説\(H_0\):\(p=0.9\)
  • 対立仮説\(H_1\):\(p>0.9\)
  • サンプル比率:\(\hat{p}=\frac{920}{1000}=0.92\)

$$Z = \frac{\hat{p} – p_0}{\sqrt{\frac{p_0(1 – p_0)}{n}}}\frac{0.92 – 0.9}{0.0095} = \frac{0.02}{0.0095} \approx 2.11$$

有意水準1%での片側検定では臨界値は2.33。 2.11<2.33なので帰無仮説は棄却されない。

よって、新ワクチンの有効率は統計的には従来と有意な差がない。

まとめ

今回は、母比率の検定について基本的な概念から具体的な計算方法を解説しました。

母比率の検定は非常に実用的な検定方法であり、学んでおくと統計学と現実における問題が紐づきます。

このようなトピックで現実とリンクさせ、モチベーションを高めながら勉強を頑張りましょう!