層化抽出法とは?図解と例でわかりやすく解説

統計学基礎

統計的な結論を導くとき、母集団からサンプルを取り、母集団の傾向・性質を推測する必要があります。母集団からサンプルを取る時に、ケースごとに複数の標本抽出法が用いられます。

層化抽出法はその標本抽出法のうちの一つです。

層化抽出法とは?図解と例でわかりやすく解説

層化抽出法(層別抽出法、stratified sampling)は、調査対象の母集団をいくつかの「層」に分け、それぞれの層から無作為にサンプルを抽出する手法です。
例えば、全体の学生を「学年」や「性別」などで分け、各グループから均等に、または割合に応じた数を抽出するイメージです。

完全にランダムに抽出する単純無作為抽出法(ランダムサンプリング)が理想的ですが、現実の調査では偏りが生じてしまう可能性があるため、このような標本抽出法が用いられます。

この時、グループに応じた割合ごとに抽出する方法を特に比例配分法と呼びます。

他の標本抽出法との違いは?

層化抽出法と多段抽出法の違い

多段抽出法は、第一段階で大きなグループを無作為に選び、その後も段階的にグループ分けしたグループから無作為に選んで抽出していく方法です。

単純な層化抽出法では、このように複数の段階のグループ分けは意味としては含みません。

多段抽出法の具体例

  • 第一段階:都道府県を無作為に10県選出(例:全47都道府県の中からランダムに10県を選ぶ)
  • 第二段階:各選出県から、さらに無作為に各県内の市区町村を5市区町村ずつ選定
  • 第三段階:選定された市区町村内の公立小中学校リストから各市区町村ごとに無作為に3校ずつ選び、調査対象とする

ただし、層化多段抽出法と呼ばれる標本抽出法も存在します。

層化多段抽出法の具体例

層化:学校を「公立」と「私立」に層分け

多段抽出

  1. 第一段階(層内抽出):各層ごとに、地域(例:東北、関東、近畿、九州など)別に無作為に県を選定
  2. 第二段階:選定された県内から、無作為に高等学校をそれぞれ5校ずつ選ぶ
  3. 第三段階:各学校から、学年ごとに無作為に生徒50名ずつ抽出し、調査対象とする

このように、公立の私立の2層で、各層ごとに地域、学校、生徒と段階的にサンプルを決定するといった場合もあります。

多段抽出の各段階で、層化抽出法を用いているというイメージです。

層化抽出法と集落抽出法との違い

集落抽出法(Cluster Sampling)は、地理的または自然な集団単位(集落、クラスター)を定め、その中からさらにサンプルを選ぶ方法です。一方、層化抽出法は、統計的な基準であらかじめ均質なグループに分割してから抽出を行います。

集落抽出法の具体例

全国にある学校を1つの集落(クラスター)として定め、その中からランダムで100校を抽出し、選ばれた学校の生徒は全員調査対象とする。

層化抽出法の例

理解を深めるために、色々な層化抽出法の例を見てみましょう。

  • ある大学には全学生5,000名が在籍しており、1年生1,200名、2年生1,300名、3年生1,200名、4年生1,300名で構成されている。全学生の学習環境に関するアンケートを実施するため、各学年から均等にサンプルを抽出することにした。
  • ある製品の満足度を調べるために、全国の消費者を地域別(都市部、郊外、農村)に分けることにした。調査対象となる消費者数は、都市部2,000名、郊外1,500名、農村1,000名である。全体で300名のサンプルを取るために、都市部134名、郊外100名、農村66名のサンプルを抽出した。
  • ある企業では全従業員300名が在籍しており、部署ごとの構成は、営業部80名、技術部100名、事務部70名、管理部50名である。各部署の実態を反映するため、層化抽出法により部署別にサンプルを抽出することとした。

層化抽出法のメリット・デメリット

層化抽出法のメリット

推定精度が高くなる

現実の調査では、単純無作為抽出を行ってしまうと特定の層からの抽出を行ってしまい、偏りが生じてしまうことが多いです。層化抽出法では層別に抽出するため、偏りが生じる可能性が低くなります。

各層の性質が反映される

層別にサンプルを抽出することで、少ない層からの情報も把握することができます。また、層ごとの特徴を比較・分析することも可能です。

層化抽出法のデメリット

層の設定によっては推定精度が低くなる

層の設定が不適切だった場合、同じ属性を持つ個体が複数の層にまたがったり、本来分けるべき層を分けないことで、逆に偏りが生じてしまう可能性があります。

コストが増加する

層ごとの詳細な情報収集が必要なため、単純無作為抽出法に比べてかかるコストが増加する場合があります。

まとめ

層化抽出法について、イメージしていただけたでしょうか。

偏りを減らそうとする、統計的な考えが強く反映されている標本抽出法だと言えます。

ぜひ皆さんも、世の中の調査方法がどのような手法で行われているのかにも注目してみてください!