本記事では同時分布の基本的な概念から、同時確率分布、同時確率密度関数、周辺分布について具体例や数式を用いて解説します!
読者の皆さんが同時分布について正しく理解し、統計学の勉強や実際のデータ分析に自信を持って取り組むための第一歩となれば幸いです。
同時分布とは?
同時分布(joint distribution)とは、複数の確率変数がどのように同時に発生するかを表す分布です。
また、同時確率分布とは二つ以上の確率変数が特定の値をとる確率を記述する確率分布です。
たとえば、2つの離散型確率変数 \(X\) と \(Y\) の場合、\(P(X=x, Y=y)\) という形で表されます。
これは2つの確率変数 \(X\) , \(Y\) がそれぞれx,yになるときの確率です。
具体例として、サイコロ2個を振ったときの出目の組み合わせは、それぞれの組み合わせに対して\(P(X=x,\, Y=y)=\frac{1}{36}\)となります。ここで、すべての組み合わせの確率の和が1になる必要があります。
同時確率密度関数とは?
連続型の確率変数の場合、同時分布は同時確率密度関数(joint probability density function, pdf)として表されます。
同時確率密度関数とは、連続型の確率変数 \(X\) と \(Y\) に対して、確率がどのように変化するかを示す確率分布です。
連続確率変数 \(X\) と \(Y\) に対して、同時確率密度関数 \(f(x,y)\) は次の性質を持ちます。
$$ \int_{-\infty}^{\infty}\int_{-\infty}^{\infty} f(x,y)\,dx\,dy = 1 $$
また、同時確率関数\(f(x,y)\) について、2つの確率変数\(X\) , \(Y\) が互いに独立である時、
$$f(x,y)=f_x(x)f_y(y)$$
が成り立ちます。
周辺分布とは?
周辺分布とは、複数の確率変数の同時分布から特定の変数だけに注目した分布です。
特定の変数だけに注目するために、特定の確率変数の要素を除去する操作を周辺化と呼びます。
以下は同時確率分布から、\(X\)のみに注目するときの周辺化です。
$$P(X=x) = \sum_y P(X=x,\, Y=y)$$
連続型の場合も同様に、
$$f_X(x) = \int_{-\infty}^{\infty} f(x,y)\,dy$$
となります。
同時分布の具体例
具体例として、以下の2変数の同時確率密度関数を考えます。
\[ f(x,y)= \begin{cases} 2, & 0 \leq x \leq y \leq 1,\\[1ex] 0, & \text{その他} \end{cases} \]
このとき、\(X\) の周辺分布は \(y\) に関して積分して求めます。
\[ f_X(x)=\int_x^1 2\,dy = 2(1-x) \quad (0\leq x\leq 1) \]
この計算により、\(X\) のみの分布がどのようになるかが明確になります。
まとめ
今回は統計学の入門として「同時分布」について解説しました。
同時分布の概念、離散型と連続型の違い、同時確率密度関数、さらに周辺分布の求め方について理解できたでしょうか。
統計学の中では細かい部分ですが、今後の学習においてもこのような基礎を固めた上で進めていくことが重要です。
この記事が、今後の統計学やデータサイエンスの学習における一助となれば幸いです。