今回は統計検定2級受験の練習として最適な、オリジナル練習問題を用意しました!
形式を統計検定の過去問(最新のCBT形式)に合わせているため、問題のイメージを掴んでいただけると思います。
「統計検定ってどんな感じの問題が出るんだろう?」と気になっている方や、「試験直前の最終チェックをしたい」という方におすすめですのでぜひご活用ください!
問題(問題数:7問、試験時間:18分)
問1
全国の中学校における生徒の生活習慣に関する調査を実施するため、以下のような抽出手法が取られた。
Ⅰ. ある中学校の生徒名簿において、最初に無作為に1名を選び、その後、名簿の順番に沿って一定の間隔(例えば毎5人ごと)で抽出を行った。
Ⅱ. 全国をいくつかの地域に区分し、各地域から無作為に選ばれた1校ずつの中学校に在籍する全生徒を調査対象とした。
Ⅲ. 全国の中学校を、都市部と地方部という2つのグループに分け、各グループ内から無作為に一定数の中学校を選び、その学校に在籍する生徒からさらに一定数を抽出して調査を実施した。
I〜Ⅲにおける抽出方法の組み合わせとして、次の①〜⑤のうちから適切なものを一つ選べ。[1]
①Ⅰ.系統抽出法
②Ⅰ.系統抽出法
③Ⅰ.層化抽出法
④Ⅰ.層化抽出法
⑤Ⅰ.集落抽出法
Ⅱ.層化抽出法
Ⅱ.集落抽出法
Ⅱ.系統抽出法
Ⅱ.集落抽出法
Ⅱ.系統抽出法
Ⅲ.集落抽出法
Ⅲ.層化抽出法
Ⅲ.集落抽出法
Ⅲ.系統抽出法
Ⅲ.層化抽出法
問2
ある母集団は平均 \(\mu = 20\)、母分散 \(\sigma^2 = 16\) の正規分布に従うとする。
この母集団から標本サイズ \(n=25 \)の標本を抽出したとき、標本平均が 18 から 22 の間にある確率 \(P(18 \leq \bar{X} \leq 22)\) として、次の①〜⑤のうちから適切なものを一つ選べ。[2]
①0.9125
②0.9500
③0.9750
④0.9876
⑤0.9938
問3
ある製品の2種類の品質検査における測定値を表す確率変数 \(X\) と \(Y\) について、期待値、分散は以下のようになっている。
\(E[X]=8.0\), \(V[X]=4.0\), \(E[Y]=12.0\), \(V[Y]=9.0\)
さらに、 \(X\) と \(Y\) の共分散は
\(Cov[X,Y]=3.0\)
である時、以下の問いに答えよ。
(1) \(X\) に対して線形変換 \(Z=2X-3\) を行った。この時の \(Z\) の期待値 \(E[Z]\) と分散 \(V[Z]\) の組み合わせとして、次の①〜⑤のうちから適切なものを一つ選べ。 [3]
① \(E[Z]\) :12 , \(V[Z]\):15
② \(E[Z]\) :12 , \(V[Z]\):16
③ \(E[Z]\) :13 , \(V[Z]\):15
④ \(E[Z]\) :13 , \(V[Z]\):16
⑤ \(E[Z]\) :14 , \(V[Z]\):16
(2) \(X\) と \(Y\)の和 \(W=X+Y\) が近似的に正規分布に従うと仮定する。この時の区間 \(10<W<25\) における確率 \(P(10<W<25)\) として、次の①〜⑤のうちから適切なものを一つ選べ。 [4]
①0.8520
②0.8640
③0.8760
④0.8860
⑤0.9025
(3) \(X\) と \(Y\) の線形結合
$$U = 3X + 2Y$$
を考える。\(X\) と \(U\) の共分散 \(\operatorname{Cov}[X, U]\) と相関係数 \(r[X, U]\) の組み合わせとして、次の①〜⑤のうちから適切なものを一つ選べ。[5]
① \(\operatorname{Cov}[X, U]\) :16 , \(r[X, U]\):0.8460
② \(\operatorname{Cov}[X, U]\) :16 , \(r[X, U]\):0.8660
③ \(\operatorname{Cov}[X, U]\) :17 , \(r[X, U]\):0.8460
④ \(\operatorname{Cov}[X, U]\) :17 , \(r[X, U]\):0.8660
⑤ \(\operatorname{Cov}[X, U]\) :18 , \(r[X, U]\):0.8660
問4
ある企業は従業員のパフォーマンス向上を目的として、コーヒーブレイクの長さが業務効率に与える影響を検証する実験を実施した。被験者は、休憩時間ごとに5分、10分、20分の3つの条件に無作為に割り当てられ、各条件に10名ずつ参加した。次の表は一元配置分散分析を行った結果得られた分散分析表である。
平方和 | 自由度 | 平均平方 | F値 | \({P_f}{(>F)}\) | |
要因 | 320 | (A) | (C) | (E) | 3.35 |
残差 | 486 | (B) | (D) | ||
全体 | 806 | ? |
(1) 実験に参加した30名のスコアにおける標本分散(不偏分散)はいくらか。次の①〜⑤のうちから適切なものを一つ選べ。[6]
①27.0
②27.4
③27.8
④28.2
⑤28.6
(2) (A)~(E)に当てはまる数値の組み合わせとして、次の①〜⑤のうちから適切なものを一つ選べ。[7]
① (A)2
② (A)2
③ (A)2
④ (A)27
⑤ (A)27
(B)27
(B)27
(B)27
(B)2
(B)2
(C)160
(C)160
(C)18
(C)18
(C)18
(D)18
(D)18
(D)160
(D)160
(D)160
(E)8.89
(E)2.89
(E)2.89
(E)8.89
(E)2.89
解答
[1]② [2]④ [3]④ [4]② [5]⑤ [6]③ [7]①
解説
問1
[1]
Ⅰ.系統抽出法とは、母集団のリストからランダムな開始点を決定し、一定の間隔で標本を抽出する方法です。今回の文章1では、ある中学校の生徒名簿から最初に無作為に1名を選び、その後、名簿順に沿って毎5人ごとに抽出しているため、系統抽出法に該当します。
Ⅱ.集落抽出法とは、調査対象を地理的または組織的なまとまり(クラスター)に分け、そのまとまり単位で標本を抽出する方法です。文章2では、全国を複数の地域に分け、各地域から無作為に選ばれた1校の全生徒を対象としているため、集落抽出法に該当します。
Ⅲ.層化抽出法とは、母集団をあらかじめ意味のある基準(例えば地域、性別、年齢など)で層に分け、各層から無作為に標本を抽出する方法です。文章3では、中学校を都市部と地方部という2つの層に分け、各層から無作為に学校や生徒を選んで調査を実施しているため、層化抽出法に該当します。
問2
[2]
標本平均 \(\bar{X}\) を標準正規変数 \(Z\) に変換するため、以下の変換式を用いる。
$$ Z = \frac{\bar{X} – \mu}{\sqrt{\frac{\sigma^2}{n}}} = \frac{\bar{X} – 20}{0.8} $$
上限と下限について \(Z\) の値を算出する。
$$Z_{\text{下限}} = \frac{18 – 20}{0.8} = -2.5, \quad Z_{\text{上限}} = \frac{22 – 20}{0.8} = 2.5$$
標準正規変数 \(Z\) は標準正規分布 \(N(0, 1)\) に従うから、正規分布表より \(Z\) が区間内にある確率は
$$P(Z \leq 2.5) = 1-0.0062=0.9938 \quad \text{および} \quad P(Z \leq -2.5) = 0.0062$$
よって、
$$P(-2.5 \leq Z \leq 2.5) \approx 0.9938 – 0.0062 = 0.9876$$
問3
[3]
線形変換の性質より、
$$E(Z) = E(2X – 3) = 2E(X)\,-\,3 = 2 \times 8\,-\,3 = 13$$
また、定数項の分散は0になるので、
$$\operatorname{V}(Z) = \operatorname{V}(2X – 3) = 2^2 \operatorname{V}(X) = 4 \times 4 = 16$$
[4]
まず、\(W\)の期待値は、
$$E(W) = E(X) + E(Y) = 8 + 12 = 20$$
次に、\(W\)の分散は、
$$\operatorname{V}(W) = \operatorname{V}(X) + \operatorname{V}(Y) + 2\,\operatorname{Cov}(X, Y) = 4 + 9 + 2 \times 3 = 19$$
\( W \) が \( N(20, 19) \) に近似できるとすると、標準化変数 \( Z \) は
$$Z = \frac{W – 20}{\sqrt{19}}$$
$$\text{下限:} \quad \frac{10 – 20}{\sqrt{19}} = \frac{-10}{\sqrt{19}} \approx \frac{-10}{4.36} \approx -2.29$$
$$\text{上限:} \quad \frac{25 – 20}{\sqrt{19}} = \frac{5}{\sqrt{19}} \approx \frac{5}{4.36} \approx 1.15$$
標準正規分布表より、 上限を下回る確率と下限を上回る確率はそれぞれ、
$$P(Z < 1.15) \approx 0.8749 \quad \text{および} \quad P(Z < -2.29) \approx 0.0109$$
したがって、
$$P(10 < W < 25) = P(-2.29 < Z < 1.15) = 0.8749 – 0.0109 \approx 0.8640$$
[5]
線形性より、任意の定数 \(a, b, c, d\) に対して、
$$\operatorname{Cov}(aX + b, \, cY + d) = ac\,\operatorname{Cov}(X, Y)$$
が成り立つから、
$$\operatorname{Cov}(X, U) = \operatorname{Cov}(X, 3X + 2Y) = 3\,\operatorname{Cov}(X, X) + 2\,\operatorname{Cov}(X, Y)$$
ここで、\(\operatorname{Cov}(X, X) = \operatorname{V}(X) = 4\) および \(\operatorname{Cov}(X, Y) = 3\) であるため、
$$\operatorname{Cov}(X, U) = 3 \times 4 + 2 \times 3 = 18$$
\( X \) と \( U \) の相関係数は、
$$r[X, U] = \frac{\operatorname{Cov}(X, U)}{\sqrt{\operatorname{Var}(X)} \sqrt{\operatorname{Var}(U)}} = \frac{18}{\sqrt{4}\sqrt{108}}= \frac{1.5}{\sqrt{3}}\approx 0.8660$$
問4
[6]
標本分散を\(S^2 \)とすると、
総平方和(\(SST)\):806
自由度\(N-1\):30 – 1
より
$$ S^2 = \frac{SST}{N-1} = \frac{806}{30-1} {\risingdotseq 27.8} $$
この問題では、シンプルに30名のスコアだけを見て標本分散を求めます。
総平方和(SST)は、各データが全体のサンプル平均からどれだけ離れているかの合計を示しています。サンプル全体で独立に変動できる情報の数は、データ全体の個数から1つ分減ったもの\(N − 1\)となります。
[7]
(A) 要因の数から1を引いた数になります。
\( 3 – 1 {= 2}\)
(B) \( 30 – 3 {= 27}\)
(C) 平均平方を、自由度で割った値になります。
\( \frac{320}{2} {=160}\)
(D) \(\frac{486}{27}{=18}\)
(E) \( F=\frac{MSB}{MSE}\)より、
\(F=\frac{MSB}{MSE} = \frac{160}{18}{=8.89}\)
まとめ
お疲れ様でした!今回は統計検定2級の練習問題にチャレンジしていきました。
統計の問題を解く際には、公式を使うだけではなくそれぞれの値が意味する内容まで理解できていることが理想です。
ぜひそれぞれの変数や式の意味を考えながら勉強を進めていってください!