ポアソン過程とは?
ポアソン過程は、「ランダムに発生する事象の発生回数」をモデル化するための数学的な仕組みです。例えば、
- 電車の遅延発生回数 → 1時間あたりの遅延の発生頻度をモデル化。
- 顧客の来店数 → 1日あたりに何人の顧客が来るかを予測。
- 通信エラーの発生頻度 → 1分間に発生するエラーの数。
ポアソン過程を使うと、これらの事象がランダムにどのように発生するかを確率的に分析できます。
つまりポアソン分布とは、事象の発生回数がポアソン分布に従う過程のことを言います。
ポアソン分布とは以下の確率で表現される確率分布のことです。
ここで、
は単位時間あたりの平均発生回数(発生率)。 は観測時間。 は観測時間内の発生回数。
この式は「t時間内にちょうどk回の事象が発生する確率」を表しています。
ポアソン過程に関する例題
例題:コールセンターの電話応答回数
あるコールセンターでは、1時間あたり平均10件の電話がかかってくるとします。では、2時間以内に電話がちょうど15回かかってくる確率は?
解答:
(1時間あたりの平均) (観測時間) (求めたい回数)
ポアソン分布の公式に代入すると、
この値を計算すると、約0.051(5.1%)の確率になります。
【発展】複合ポアソン過程とは?
通常のポアソン過程では「発生回数」に注目しますが、実際の応用では「発生する事象の大きさ」も考慮することが重要です。例えば、
- 保険会社の損害額 → 事故の発生回数だけでなく、事故ごとの損害額も考慮。
- 金融市場の注文フロー → 取引回数だけでなく、各取引の金額も影響を与える。
これをモデル化するのが 複合ポアソン過程(Compound Poisson Process) です。
複合ポアソン過程の定義
複合ポアソン過程では、各発生回数に対して独立な大きさ(ジャンプサイズ)が付与されます。数学的には、
ここで、
はポアソン過程に従う発生回数。 は各発生におけるランダムな大きさ。
まとめ
今回は、ポアソン過程について勉強していきました。
ポアソン過程は統計学で勉強するポアソン分布の具体的なシチュエーションとして考えることができます。
統計学の勉強が現実の問題と紐づく面白い例として、さまざまなシチュエーションを探してみましょう!
データサイエンス.jpでは、データサイエンスや統計学をわかりやすく学べるようなプラットフォームを提供しています。機械学習やデータ分析など、実用的でトピックも扱っていますので、ぜひ他の記事もご覧ください!