検定統計量とは？具体的な求め方や統計検定量との違いも解説

検定統計量とは？

検定統計量（Test Statistic）とは、統計的仮説検定において、仮説の真偽を判断するために計算される数値です。この数値をもとに、データが偶然の産物なのか、それとも意味のある結果なのかを評価します。

例えば、ある新しい薬が本当に効果があるかどうかを知りたいとします。このとき、

という形で仮説を設定します。そして、実験で得られたデータをもとに検定統計量を算出し、その値を基準にして帰無仮説を棄却するかどうかを決めます。

代表的な検定統計量には以下のようなものがあります。

検定統計量は、データを数値化して「どのくらい極端な結果か」を測るものです。

例えば、

検定統計量を求めたら、それを基準に「これは偶然の範囲内か、それとも意味のある差なのか？」を判断します。

要するに、検定統計量とは、データの背後にある「偶然か必然か」を見極めるための数値なのです。

統計的仮説検定では、まず帰無仮説（H₀）と対立仮説（H₁）を設定します。

実験や観察から得られたデータを用いて、適切な方法で検定統計量を計算します。例えば、t検定であれば以下の式を使います。

$$t = \frac{\bar{x} – \mu}{s / \sqrt{n}}$$

ここで、

通常、5%（0.05）や1%（0.01）といった有意水準を設定し、検定統計量の値がこの範囲を超えたら帰無仮説を棄却します。

計算した検定統計量と統計表に載っている臨界値を比較し、帰無仮説を棄却するかどうかを決めます。

統計学の問題では、さらに多くの検定統計量が使われます。以下に代表的なものを紹介します。

マン・ホイットニーU検定は、2つの独立した群の中央値が異なるかどうかを検定する方法です。U統計量は次の式で求められます。

$$U = n_1 n_2 + \frac{n_1(n_1 + 1)}{2} – R_1$$

ここで、

クラスカル・ウォリス検定は、3つ以上の独立した群の中央値が等しいかどうかを調べる方法です。H統計量は以下の式で計算されます。

$$H = \frac{12}{N(N+1)} \sum \frac{R_i^2}{n_i} – 3(N+1)$$

ここで、

これらの検定統計量は、データの特性や分析の目的に応じて適切に選択することが重要です。

検定統計量はややこしい日本語であり、統計検定量という言葉と交ざりがちです。

しかし、統計検定量という言葉は一般的には使われません。

検定を行うために変換した統計量であることが重要です。

今回は検定統計量とは何か、その使い方や統計検定量との違いについて解説しました。

統計検定量について学んでいるあなたは、統計学について本腰を入れて学んでいると言えるでしょう。

引き続き、自信を持って統計学の勉強を進めましょう！