統計学の標本に関する文章を読んでいるとき、「独立に同じ分布に従うため〜」「独立同分布に従い〜」という表現が登場することがあります。
これらの仮定はよく見過ごされてしまいがちですが、非常に重要な意味を持っています。
今回は独立同分布とは何か、図解や具体例を交えてわかりやすく解説していきます!
読者の皆さんが独立同分布について正しく理解し、統計学の勉強や実際のデータ分析に自信を持って取り組むための第一歩となれば幸いです。
独立同分布(i.i.d.)とは?
独立同分布(independent and identically distributed)とは、独立かつ同一の分布に従う確率分布です。
つまり、各データが互いに独立であり、かつ全てが同じ確率分布から生成されることを意味します。

独立とは、各データや確率変数が互いに影響し合わないという性質を指します。
例えば、あるサイコロを振る場合、前回の結果が次回の結果に影響を与えません。
つまり、一回ごとの試行が互いに無関係であり、これは独立です。
同一分布とは、各データが全く同じ確率分布に従っている状態を意味します。
先ほどの例で言うと、サイコロを一回振った時に出る目の試行は、必ず1~6の出目それぞれが1/6の一様分布に従っています。
これら二つの性質が同時に成立する場合、試行ごとに発生する確率変数は独立同分布(iid)となります。
iidの仮定は、特に母集団からのサンプル抽出など、基本的な統計手法の理論的根拠となっています。
独立同一分布とは?
「独立同一分布」と表記されているサイトも散見されますが、「独立同分布」と同様の意味で使用されているようです。
一般的に、独立かつ同分布に従う場合は独立同分布と表現することが多いです。
「独立同分布に従う」とどうなる?
独立同分布に従うとき、その試行や各データの統計量は真の母数になります。
例えば確率変数\(X_1,X_2,…,X_n\)が独立同分布に従うとき、任意のデータについて
$$E[X_i]=\mu$$
となります。
また、同様に分散も
$$V[X_i]=\sigma^2$$
となります。この時、各データ同士は独立であるため、共分散は0になります。
この前提によって、標本分散の期待値を算出することができています。詳しくは以下の記事で解説しています。
独立同分布に従わない例
逆に、「独立同分布に従わない」とはどのような時なのでしょうか。
以下のトランプの例を見てみましょう。
引いたカードを戻さない場合:
1枚目のカードを引く時、52枚すべてのカードが均等な確率で引かれるため、各カードの出現確率は \(\frac{1}{52}\)です。しかし、1枚カードを引いた後、そのカードを山札に戻さないとすると、次に引かれるカードは残りの51枚の中から選ばれます。この時、各引きが前の結果に依存するため、独立性が失われ、分布も毎回変化するため独立同分布に従うとは言えません。
十分なシャッフルをせず、カードに偏りがある場合:
十分にシャッフルされていない山札を用いると、特定のカードが次に引かれる確率が高くなると言えます。この場合も引かれるカードは同じ分布に従わなくなり、独立同分布の仮定が崩れてしまいます。
まとめ
統計学やデータサイエンスでは、iidの前提が多くの理論や実践的な手法の基礎となっているため、この概念の正確な理解は非常に重要です。
この記事が、今後の統計学やデータサイエンスの学習における一助となれば幸いです。