統計検定2級問題解説 ~2016年11月実施~ (その1)

過去問題

過去問題は統計検定公式問題集が問題と解答例を公開しています。こちらを参照してください。


問1 解答

(幹葉図)

[1]

$\boxed{ \ \mathsf{1}\ }$ ③

すべて,幹葉図から,

① 期末試験の最高得点は$90$点である。誤り。
② 期末試験の最低得点は$40$点である。誤り。
③ 期末試験の得点が$60$点未満の学生は$7$名である。正しい。
④ 期末試験の得点が上から$5$番目の学生の成績は$78$点である。誤り。
⑤ 期末試験の得点の最頻値(モード)は$58$点($5$名)である。誤り。

[2]

$\boxed{ \ \mathsf{2}\ }$ ⑤

学生数が$25$名なので,中央値は下から(上から)$13$番目の得点である$68$点である。


問2 解答

(度数分布表・ヒストグラム)

まず,度数分布表の(ア)~(カ)を求める。
$50+$(ア)$+$(イ)$+134+173+110+20=730$
$\ \rightarrow\ $(ア)$+$(イ)$=730-50-134-173-110-20=243$
(ア)と(イ)のいずれかが$144$なので,もう一方は$243-144=99$
(カ)$+35=112\ \rightarrow\ $(カ)$=112-35=77$
$50+$(オ)$+$(カ)$+35=302\ \rightarrow\ $(オ)$=302-50-35-77=140$
これにより,(ア)$=$(ウ)$+$(オ)$=$(ウ)$+140$,(イ)$=$(エ)$+$(カ)$=$(エ)$+77$なので
(ア)$=144$,(イ)$=99$
よって,(ウ)$=$(ア)$-$(オ)$=144-140=4$,(エ)$=$(イ)$-$(カ)$=99-77=22$

階級度数(期間全体)度数(夏季)度数(冬季)
0℃を超えて 5℃以下50050
5℃を超えて10℃以下1444140
10℃を超えて15℃以下992277
15℃を超えて20℃以下1349935
20℃を超えて25℃以下1731730
25℃を超えて30℃以下1101100
30℃を超えて35℃以下20200

[1]

$\boxed{ \ \mathsf{3}\ }$ ①

期間全体の最大頻度は「20℃を超えて25℃以下」(下から5番目の階級)の$173$,「5℃を超えて10℃以下」(下から2番目の階級)の$144$となるので,ヒストグラムは①

[2]

$\boxed{ \ \mathsf{4}\ }$ ③

① [1]のヒストグラムから峰が2つある形状をしている。正しい。
② 度数分布表から$50+144=194$日以上$194+99=293$以下である。正しい。
③ 度数分布表から$(99+134+173)/730=0.56$。誤り。
④ 度数の一番高い階級の代表値は$(20+25)/2=22.5$℃である。正しい。
⑤ 度数が最大の階級と2番目に大きい階級を足した度数は全体の$(173+144)/730=0.43$。正しい。


問3 解答

(ヒストグラム,分布の形状)

ヒストグラムから度数分布表を作る。

階級相対度数(%)累積相対度数(%)
~100万円未満6.76.7
100万円以上~200万円未満13.920.6
200万円以上~300万円未満14.334.9
300万円以上~400万円未満13.448.3
400万円以上~500万円未満10.158.4
500万円以上~600万円未満8.466.8
600万円以上~700万円未満6.973.7
700万円以上~800万円未満6.480.1
800万円以上~900万円未満5.085.1
900万円以上~1000万円未満3.888.9
1000万円以上~1100万円未満2.891.7
1100万円以上~1200万円未満2.293.9
1200万円以上~1500万円未満3.297.1
1500万円以上~2000万円未満1.798.8
2000万円以上~1.2100.0

[1]

$\boxed{ \ \mathsf{5}\ }$ ②

右に裾の長い分布では最頻値<中央値<平均という関係が成り立つ。
累積相対度数が$50\%$となる階級は「400万円以上~500万円未満」なので,(ア)は中央値。
となると,(イ)は平均。
※左に裾の長い分布では,平均<中央値<最頻値

[2]

$\boxed{ \ \mathsf{6}\ }$ ④

Ⅰ.累積度数を見ると,第1四分位数(累積度数25%)が含まれる階級は「200万円以上~300万円未満」。誤り。
Ⅱ.第3四分位数(累積度数75%)が含まれる階級は「700万円以上~800万円未満」。よって四分位範囲は$700-300=400$万円以上$800-200=600$万円以上となる。正しい。
Ⅲ.その通り。正しい。


問4 解答

(散布図,相関係数)

[1]

$\boxed{ \ \mathsf{7}\ }$ ⑤

プロットされたデータが左下から右上に分布し、直線状に分布しているので、散布図は正の相関が強くみられる。

[2]

$\boxed{ \ \mathsf{8}\ }$ ④

すべて,散布図から
Ⅰ.得点が一番大きいチームは失点が一番小さい。正しい。
Ⅱ.得点と勝点は強い正の相関,失点と勝点は強い負の相関がみられ,得点と失点は負の相関がみられるが強さは他の2つよりも小さくみられる。正しい。
Ⅲ.得点の範囲はおよそ$20\sim80$の間,失点の範囲はおよそ$30\sim70$の間である。誤り。


問5 解答

(標本抽出法)

[1]

$\boxed{ \ \mathsf{9}\ }$ ⑤

Ⅰ.特定の場所で調査票を行うと,そこの場所に行かない人の回答が収集できない。誤り。
Ⅱ.回答を特定の方向に誘導する質問になりうるので,公平な評価が得られない。誤り。
Ⅲ.難しく厳密な用語は調査対象者に伝わらず,無回答や誤解を与える可能性が高い。誤り。
(上記3つとも調査でやってはいけないことあるある)

[2]

$\boxed{ \ \mathsf{10}\ }$ ②

① 各層内を母集団の構成に合わせる必要はない。誤り。
② 各層を散らばりが小さい同質な構成にして,そこから標本を抽出することにより調査精度を上げることができる。正しい。
③ 各層の構成が等質なグループになっていない。誤り。
④⑤ 各層のサイズの大小は等質性とは直接的に関係がない。誤り。


問6 解答

(フィッシャーの三原則)

$\boxed{ \ \mathsf{11}\ }$ ③

フィッシャーの3原則:無作為化,繰り返し,局所管理
無作為化(ランダム化):対象の抽出,処理の順番など,均一にできない条件については無作為に割り付ける。
繰り返し:ばらつきや個体差の影響を見積もるために実験を繰り返しを行う。
局所管理:処理効果以外のばらつきを小さくするため,条件が均一になるようブロック化する。


問7 解答

(ベイズの定理)

[1]

$\boxed{ \ \mathsf{12}\ }$ ②

無作為に選んだ人に$40\%$の確率でA型かと聞いてあたる確率は$40\%\times0.4=0.16$
同様にO型は$30\%\times0.3=0.09$,B型は$20\%\times0.2=0.04$,AB型は$10\%\times0.1=0.01$
これらは排反なので,求める確率は
$$0.16+0.09+0.04+0.01=0.30=30\%$$

[2]

$\boxed{ \ \mathsf{13}\ }$ ③

Eさんがある人をA型であるという事象を$E$,血液型がA型である事象を$A$とする。
$$P(A)=0.4,\ P(E|A)=2/3,\ P(E^c|A^c)=2/3$$
これから
$$
\begin{align}
P(A^c)=&1-P(A)=1-0.4=0.6,\\
P(E|A^c)=&1-P(E^c|A^c)=1-2/3=1/3\\
P(E)=&P(E|A)\times P(A)+P(E|A^c)\times P(A^c)\\
=&2/3\times0.4+1/3\times0.6\\
\therefore\ P(A|E)=&\frac{P(E|A)P(A)}{P(E)}\\
=&\frac{2/3\times0.4}{2/3\times0.4+1/3\times0.6}=\frac{0.8}{0.8+0.6}=0.57
\end{align}
$$


問8 解答

(確率変数の共分散,相関係数)

[1]

$\boxed{ \ \mathsf{14}\ }$ ④

$X_1$,$X_2$,$X_3$が互いに無相関なので,
$Cov[X_1,X_2]=0, Cov[X_1,X_3]=0, Cov[X_2,X_3]=0$
$$\begin{align}
Cov[X_1,Y]=&Cov\left[X_1, \frac{X_1+X_2+X_3}{3}\right]\\
=&\frac13Cov[X_1,X_1]+\frac13Cov[X_1,X_2]+\frac13Cov[X_1,X_3]\\
=&\frac13V[X_1]=\frac13\\
V[Y]=&V\left[\frac{X_1+X_2+X_3}{3}\right]\\
=&\frac19(V[X_1]+V[X_2]+V[X_3]\\
&+2Cov[X_1,X_2]+2Cov[X_1,X_3]+2Cov[X_2,X_3])\\
=&\frac{1+1+1}{9}=\frac13\\
\therefore\ \rho=&\frac{Cov[X_1,Y]}{\sqrt{V[X_1]}\sqrt{V[Y]}}\\
=&\frac{1/3}{\sqrt{1\times1/3}}=\frac{\sqrt{3}}{3}=0.577
\end{align}$$

[2]

$\boxed{ \ \mathsf{15}\ }$ ③

問題文より
$$\begin{align}
\frac{Cov[X_1,X_2]}{\sqrt{V[X_1]}\sqrt{V[X_2]}}=\frac{Cov[X_2,X_3]}{\sqrt{V[X_2]}\sqrt{V[X_3]}}=\frac{Cov[X_3,X_1]}{\sqrt{V[X_3]}\sqrt{V[X_1]}}=0.5\\
\Rightarrow\ Cov[X_1,X_2]=Cov[X_2,X_3]=Cov[X_3,X_1]=0.5
\end{align}$$
よって
$$\begin{align}
Cov[X_1,Y]=&Cov\left[X_1, \frac{X_1+X_2+X_3}{3}\right]\\
=&\frac13Cov[X_1,X_1]+\frac13Cov[X_1,X_2]+\frac13Cov[X_1,X_3]\\
=&\frac13+\frac13\times0.5+\frac13\times0.5=\frac23\\
V[Y]=&V\left[\frac{X_1+X_2+X_3}{3}\right]\\
=&\frac19(V[X_1]+V[X_2]+V[X_3]\\
&+2Cov[X_1,X_2]+2Cov[X_1,X_3]+2Cov[X_2,X_3])\\
=&\frac{1+1+1+2\times0.5+2\times0.5+2\times0.5}{9}=\frac23\\
\therefore\ \rho=&\frac{Cov[X_1,Y]}{\sqrt{V[X_1]}\sqrt{V[Y]}}\\
=&\frac{2/3}{\sqrt{1\times2/3}}=\frac{\sqrt{2}}{\sqrt{3}}=0.816
\end{align}$$