統計検定2級問題解説 ~2019年11月実施~ (その1)

過去問題

過去問題は統計検定公式問題集が問題と解答例を公開しています。こちらを参照してください。


問1 解答

(箱ひげ図)

[1]

$\boxed{ \ \mathsf{1}\ }$

東京の箱ひげ図を見ると、$16$~$18$℃の範囲に外れ値が$2$つあり、その次に大きい値が$12$~$14$℃の範囲に含まれている。このことから、
・$14$℃以上$16$℃未満の度数$=0$
・$16$℃以上$18$℃未満の度数$=2$
・$18$℃以上$20$℃未満の度数$=0$
となるので、度数分布は$\mathrm{(A)}$となる。
なお、ほかの都市の箱ひげ図は外れ値がないので、ひげの最大値最小値がどこの範囲に含まれているかを見れば、
 名古屋$=\mathrm{(E)}$、大阪$=\mathrm{(D)}$、広島$=\mathrm{(B)}$、福岡$=\mathrm{(C)}$
であることがわかる。

[2]

$\boxed{ \ \mathsf{2}\ }$

範囲$=$最大値$-$最小値、四分位範囲$=$第3四分位数$-$第1四分位数で、箱ひげ図では箱の高さが四分位範囲、範囲は外れ値を含んで最大値と最小値の間の高さ、箱の中の線が中央値になるので、
・範囲が最も大きいのは福岡
・四分位範囲が最も小さいのは東京
・第1四分位数が最も大きいのは福岡
・中央値が最も小さいのは名古屋
・最大値が最も小さいのは名古屋
となる。


問2 解答

(散布図、相関係数、ヒストグラム)

[1]

$\boxed{ \ \mathsf{3}\ }$

・$1990$年の散布図から、 女性の$50$歳時未婚率が$8\%$を超えている件数は$1$件あり、男性の$50$歳時未婚率が$10\%$を超えている件数は$2$件あるので、①と②は誤り。
・男性の$50$歳時未婚率は$1990$年の最大値($12\%$程度)より$2015$年の最小値($18\%$程度)が上回っているので、③は誤り。
・$2015$年の散布図から、 女性の$50$歳時未婚率が最も低い都道府県は、男性の$50$歳時未婚率は下から$3$番目であるので、⑤は誤り。
・$2015$年の散布図から、すべての都道府県は女性の$50$歳時未婚率$=$男性の$50$歳時未婚率となる直線(散布図左上の$(18,18)$の点から右上方に$45^{\circ}$に引いた直線)より下側にあることから、 女性の$50$歳時未婚率は男性の$50$歳時未婚率よりも低くなっている。④は正しい。

[2]

$\boxed{ \ \mathsf{4}\ }$

$1990$年の散布図と$2015$年の散布図を比較すると、どちらも正の相関で、$1990$年のほうが相関が強く(より直線状に分布している)なっているので、相関係数は$r_{1990}\gt r_{2015}$となる。よって、該当するのは①か④となるが、$1990$年の相関の強さを表しているのは④のほうである。

[3]

$\boxed{ \ \mathsf{5}\ }$

$2015$年の散布図から、$(10\%$~$12\%$の件数$)\gt 5$であることがわかるので、この条件を満たすヒストグラムは③のみである。


問3 解答

(変化率,指数化,幾何平均)

[1]

$\boxed{ \ \mathsf{6}\ }$

$($平成$31$年$1$月の賃金指数$)\div($平成$30$年$1$月の賃金指数$)=1+(-0.97\%)$
 $\Rightarrow ($平成$31$年$1$月の賃金指数$)=102.6\times(1-0.0097)$
$\therefore ($平成$31$年$1$月の賃金指数の平成$30$年$12$月からの変化率$)$
 $\displaystyle=\left\{\frac{102.6\times(1-0.0097)}{104.1}-1\right\}\times 100$

※)値$a$から値$b$への変化率$\displaystyle=\frac{b-a}{a}=\frac{b}{a}-1$

[2]

$\boxed{ \ \mathsf{7}\ }$

$1$か月あたりの平均変化率を$r$とすると、【条件】から
$($平成$30$年$1$月の賃金指数$)\times (1+r/100)^3=($平成$30$年$4$月の賃金指数$)$
 $\displaystyle\Rightarrow (1+r/100)^3=\frac{105.6}{102.6}$
 $\displaystyle\Rightarrow r=\left\{\left(\frac{105.6}{102.6}\right)^{1/3}-1\right\}\times100$


問4 解答

(時系列データ)

$\boxed{ \ \mathsf{8}\ }$

・傾向変動は長期にわたる動きを表す変動ではあるが、必ずしも直線で表される変動となるとは限らない。(例えば、複数年にわたる循環変動とか)。
・季節変動は1年を周期として循環を繰り返す変動を指す。
・不規則変動は傾向変動と季節変動以外の変動で、規則性のない変動を指し、これには偶然変動も含まれる。
よって、Ⅱのみ正しい。


問5 解答

(コレログラム)

$\boxed{ \ \mathsf{9}\ }$

グラフは、$12$か月周期のグラフになっているので、自己相関係数はラグ$12,24$で強い正の相関となる。また、ピークの$6$か月後付近は小さい値で変動していることから、自己相関係数はラグ$6,18$前後では負の相関となる。

以上のことから、横軸にラグ、縦軸に自己相関係数をとったグラフであるコレログラムは、②となる。
①、⑤はラグ$12$で負の値となっており、③、④はラグ$6$で負の相関になっていない。


問6 解答

(標本抽出法)

$\boxed{ \ \mathsf{10}\ }$

Ⅰは母集団から無作為に抽出しているので単純無作為抽出法。
Ⅱは母集団をグループに分け、それぞれのグループから無作為に抽出しているので層化抽出法。
Ⅲは母集団を便単位に分け(クラスター)、いくつかの便を選択し、その便において全数調査しているから集落抽出法。

標本調査の抽出方法

単純無作為抽出法・・・母集団の中から無作為に標本を抽出する方法。
層化抽出法・・・母集団をあらかじめいくつかの層(グループ)に分けておき、各層の中から必要な数の調査対象を無作為に抽出する方法。
(通常,層の大きさに比例させて調査対象を抽出する大きさを決める。(比例配分法))
集落(クラスター)抽出法・・・母集団を小集団であるクラスター(集落)に分け,その中からいくつかのクラスターを無作為に抽出し,それぞれのクラスターにおいて全数調査を行う。
二段抽出法・・・母集団をいくつかのグループに分け,その中からいくつかのグループを無作為に抽出し(第1段抽出),さらにそこから標本を無作為に抽出(第2段抽出)する。
系統抽出法・・・通し番号をつけた名簿を作成し,1番目の調査対象を無作為に選び、2番目以降の調査対象を一定の間隔で抽出する方法。


問7 解答

(標本誤差)

$\boxed{ \ \mathsf{11}\ }$

標本平均の分散は、$$V(\bar X)=V\left(\frac{X_1+X_2+\cdots+X_n}n\right)=\frac{V(X_1+X_2+\cdots+X_n)}{n^2}=\frac{n\sigma^2}{n^2}=\frac{\sigma^2}{n}$$
標準誤差は推定量の標準偏差であり、標本平均の標準偏差は、$$SE=\sqrt{\frac{\sigma^2}{n}}=\frac{\sigma}{\sqrt{n}}$$
ここで、標本平均の場合、母分散$\sigma^2$の推定量である不偏分散$\hat\sigma^2$に置き換えて$$SE=\sqrt{\frac{\hat\sigma^2}{n}}=\sqrt{\frac{16}{100}}=0.40$$


問8 解答

(確率の乗法定理、ベイズの定理)

[1]

$\boxed{ \ \mathsf{12}\ }$

対策講座を受講したという事象を$A$、検定試験に合格したという事象を$B$とすると、
$$P(A)=20\%=0.2,\ P(B|A)=70\%=0.7$$
対策講座を受講した合格者を選ぶ確率$P(A\cap B)$は乗法定理より、
$$P(A\cap B)=P(A)\cdot P(B|A)=0.2\times0.7=0.14$$

[2]

$\boxed{ \ \mathsf{13}\ }$

無作為に選んだ人が合格者だった場合にその人が対策講座を受講した確率$P(A|B)$はベイズの定理より
$$P(A|B)=\frac{P(A)P(B|A)}{P(B)}=\frac{P(A)P(B|A)}{P(A)P(B|A)+P(A^C)P(B|A^C)}$$
ここで、[1]より$P(A)P(B|A)=0.14$
また、$P(B|A^C)=30\%=0.3,\ P(A^C)=1-P(A)=1-20\%=80\%=0.8$
$$\therefore\ P(A|B)=\frac{0.14}{0.14+0.8\times0.3}=\frac{0.14}{0.38}\fallingdotseq0.37$$


問9 解答

(連続型確率変数)

[1]

$\boxed{ \ \mathsf{14}\ }$

確率の公理より、確率密度関数$f(x)$は、$\displaystyle\int_{-\infty}^\infty f(x)dx=1$を満たさなければならない。よって、
$$\begin{align}
\int_{-\infty}^\infty f(x)dx&=\int_{-\infty}^0 f(x)dx+\int_0^{20} f(x)dx+\int_{20}^\infty f(x)dx\\
&=0+\int_0^{20} a\left(1-\frac{x}{20}\right)dx+0\\
&=a\left[x-\frac{x^2}{2\times20}\right]_0^{20}\\
&=a\left(20-\frac{20^2}{2\times20}\right)=10a=1\\
\therefore\ a&=\frac{1}{10}
\end{align}$$

[2]

$\boxed{ \ \mathsf{15}\ }$

1か月の水道使用量の期待値は
$$\begin{align}
E(X)&=\int_0^{20} xf(x)dx\\
&=\int_0^{20} \frac{x}{10}\left(1-\frac{x}{20}\right)dx\\
&=\frac{1}{10}\left[\frac{x^2}{2}-\frac{x^3}{3\times20}\right]_0^{20}\\
&=\frac{1}{10}\left(\frac{20^2}{2}-\frac{20^3}{3\times20}\right)\\
&=\frac{20}{3}
\end{align}$$

[3]

$\boxed{ \ \mathsf{16}\ }$

1か月の水道使用料金の期待値は水道使用量の確率に単価をかけて求める。
$$\begin{align}
&1000\times\int_0^{10}\frac{1}{10}\left(1-\frac{x}{20}\right)dx+1120\times\int_{10}^{15}\frac{1}{10}\left(1-\frac{x}{20}\right)dx+1280\times\int_{15}^{20}\frac{1}{10}\left(1-\frac{x}{20}\right)dx\\
=&\frac{1000}{10}\left[x-\frac{x^2}{2\times20}\right]_0^{10}+\frac{1120}{10}\left[x-\frac{x^2}{2\times20}\right]_{10}^{15}+\frac{1280}{10}\left[x-\frac{x^2}{2\times20}\right]_{15}^{20}\\
=&100\times\left(10-\frac{10^2}{40}\right)+112\times\left(15-\frac{15^2}{40}-10+\frac{10^2}{40}\right)+128\times\left(20-\frac{20^2}{40}-15+\frac{15^2}{40}\right)\\
=&750+210+80=1040
\end{align}$$

※水道料金のパターンが$1000$円、$1120$円、$1280$円となっているので、水道使用量の確率から考えて、期待値は$1000$~$1280$の範囲に収まることがわかる。さらに、水道使用量が$0\le x\lt10$となる確率は$$\int_0^{10}\frac{1}{10}\left(1-\frac{x}{20}\right)dx=\frac{1}{10}\times\left(10-\frac{10^2}{40}\right)=\frac{3}{4}$$となることから、期待値は$1000$円に近いほうと考えられる。このことから②が正解だとわかる。


問10 解答

(分布関数、期待値)

[1]

$\boxed{ \ \mathsf{17}\ }$

$Z$は正値確率変数確率で、分布関数$F_Z$は単調増加の関数なので、$F_Z(0)=0$
また、$F_Z(100)=P(Z\le100)=0.96$から、$P(Z\gt100)=1-0.96=0.04$
一方、確率変数$X$の定義から$X$の取りうる範囲は$0\le x\le100$
ここで、$F_X(0)=P(X=0)=P(Z=0)+P(Z\gt100)=0.04$となり、$0\lt x\lt100$の場合は$$\begin{align}
F_X(x)&=P(X\le x)\\
&=P(X=0)+P(0\lt X\le x)\\
&=0.04+P(0\lt Z\le x)\\
&=0.04+F_Z(x)
\end{align}$$

[2]

$\boxed{ \ \mathsf{18}\ }$

$X$の下側$95\%$点を$a$とすると、
$$\begin{align}
P(X\le a)=F_X(a)&=0.95\\
F_Z(a)+0.04&=0.95\\
F_Z(a)&=0.91
\end{align}$$
よって、$a=5$となる。

[3]

$\boxed{ \ \mathsf{19}\ }$

確率変数が連続型である場合、分布関数は確率密度関数を積分することで求められる。したがって、分布関数が連続ならば分布関数を微分することで確率密度関数を求めることができる。
確率変数$X$の確率密度関数を$f_X(x)$とすると、$F_X(x)$は$0\lt x\lt100$では連続関数なので、
$$f_X(x)=\frac{d}{dx}F_X(x)=\frac{d}{dx}(F_Z(x)+0.04)=\frac{d}{dx}F_Z(x)=f_Z(x)$$
また$x\ge100$では、$X$の定義から$f_X(x)=0$
以上より確率変数$X$の期待値は、
$$E(X)=\int_0^\infty xf_X(x)dx=\int_0^{100} xf_X(x)dx+\int_{100}^\infty xf_X(x)dx==$$