統計検定3級問題解説 ~2018年11月実施~ (問1~問10)

過去問題

過去問題は統計検定公式問題集が問題と解答例を公開しています。こちらを参照してください。


問1 解答

(量的変数、質的変数)

$\boxed{ \ \mathsf{1}\ }$ ②

$A$~$C$のすべては数字だけで構成される変数ですが、$A$は台風の個数、$C$は台風の中心気圧で、個数を数えたり、平均を求めたりなどの計算をすることができるので、量的変数といえます。一方、$B$は台風の識別をするための記号としてつけられているものなので、質的変数になります。


問2 解答

(確率、条件付き確率)

$\boxed{ \ \mathsf{2}\ }$ ⑤

$A$さんが赤色のボールを取り出す確率は$7/10$、このボールを戻さずに$B$さんが赤色のボールを取り出す確率は$6/9$なので、$A$さんと$B$さんが赤色のボールを取り出す確率は、$7/10\times6/9=7/15$となります。
一方、$A$さんが白色のボールを取り出す確率は$3/10$、このボールを戻さずに$B$さんが白色のボールを取り出す確率は$2/9$なので、$A$さんと$B$さんが白色のボールを取り出す確率は、$3/10\times2/9=1/15$となります。
以上より、$A$さんと$B$さんが同じ色のボールを取り出す確率は、
 $7/15+1/15=8/15$
となります。


問3 解答

(確率、反復試行)

$\boxed{ \ \mathsf{3}\ }$ ④

$5$回中、$3$回$6$の目が出て、残り$2$回$6$以外($=1$~$5$)の目が出る確率は、
 $\displaystyle \left(\frac16\right)^3\times\left(\frac56\right)^2=\frac{25}{6^5}$
となります。$5$回のうち、何回目に$6$の目が出るかの組み合わせは、${}_5 \mathrm{ C }_3$となりますので、求める確率は、
 $\displaystyle {}_5 \mathrm{ C }_3\times\frac{25}{6^5}=\frac{5\times4\times3}{3\times2\times1}\times\frac{25}{6^5}\fallingdotseq0.0032$
となります。
※)$5$回のうち、何回目に$6$の目が出るかの組み合わせは、$1$から$5$までの数字から$3$つの数字を引く組み合わせ(引く順番は考慮しない)と考えればよいので、${}_5 \mathrm{ C }_3$となります。


問4 解答

(1変数グラフ)

$\boxed{ \ \mathsf{4}\ }$ ③

Ⅰ.$A$のグラフは。ネットショッピングの利用世帯の割合の推移を示したものなので、実際の店舗を利用した人数を読み取ることはできません。
Ⅱ.$B$のグラフは、ネットショッピング支出額に占める主な項目の割合を示したものなので、世帯の割合を読み取ることはできません。
Ⅲ.$C$のグラフは、地方別に見たエアコンへの支出金額を示したもので、ここから北海道の支出金額が丹生地方より少ないことが読み取れます。


問5 解答

(ヒストグラム、相対度数)

[1]

$\boxed{ \ \mathsf{5}\ }$ ④

さいたま市の平均年齢は$59.9$歳なので、これを含む階級は$59$歳以上$60$歳未満になります。階級値はこの階級の中間地になるので$(59+60)/2=59.5$となります。また、この階級の度数が$12$と読み取れるので、相対度数は$12/47\fallingdotseq0.255$となります。

[2]

$\boxed{ \ \mathsf{6}\ }$ ③

第1四分位数は、下から$1/4$の位置にあるデータの値です。市数=都道府県数が$47$人の場合、第1四分位数は下から$12$番目と$13$番目の中間の値になります。
ここで、$57$歳未満の市数は$6$市、$58$歳未満の市数は$6+7=13$市なので、下から$12$番目と$13$番目は、$57$歳以上の$58$歳未満の階級に含まれています。
中央値は、下から$24$番目の値になります。$59$歳未満の市数は$13+10=23$市なので、下から$24$番目は、$59$歳以上の$60$歳未満の階級に含まれています。

[3]

$\boxed{ \ \mathsf{7}\ }$ ①

Ⅰ.$60$歳未満の市数は$23+12=35$市なので、全体に占める割合は$35\div47\times100\fallingdotseq74.5\%$となります。
Ⅱ.首都圏の一都三県の世帯主の平均年齢は、都県庁所在市の世帯主の平均年齢だけではわかりません。(例えば、都県庁所在市以外の市町村の平均年齢と各市町村の世帯数がわからないと求められません。)
Ⅲ.グラフからは平均年齢の分布のみがわかるだけで、世帯主の総数までは読み取ることができません。


問6 解答

(散らばりのグラフ表現)

$\boxed{ \ \mathsf{8}\ }$ ③

はずれ値を検出するためには、データの散らばり具合を見る必要があります。問題の3つのグラフのうち、箱ひげ図とヒストグラムは散らばりを表現できるグラフですが、円グラフは割合を表すグラフとして用いるものです。


問7 解答

(はずれ値)

[1]

$\boxed{ \ \mathsf{9}\ }$ ②

Ⅰ.はずれ値であったとしても、これが測定誤差や計測ミスによるものなのか、たまたまそのような値になったものがあったのかは、別途調査しないとわからないことなので、必ず取り除く必要があるとは言い切れません。
Ⅱ.はずれ値はデータ全体からみると極端に大きいか極端に小さい値となるので、平均値の値には大きな影響を与えてしまうことになりますが、中央値には大きな影響を与えないものと考えられるので、2つの値の差が大きくなることがあり得ます。
Ⅲ.範囲は最大値と最小値の差なので、はずれ値の影響を受けますが、四分位範囲は第1四分位数と第3四分位数の差なので、はずれ値の影響を受けにくいものと考えられます。したがって、データの散らばりは四分位範囲を用いて評価すべきです。

[2]

$\boxed{ \ \mathsf{10}\ }$ ②

はずれ値を取り除くと平均値が減少しているため、はずれ値は極端に大きい値であることがわかります。はずれ値を取り除く前はデータの個数が$21$個なので、中央値は下から$11$番目の値になりますが、はずれ値を取り除くと、中央値は下から$10$番目と$11$番目の値の中間値となるので、中央値は減少します。また、はずれ値を取り除くとデータの散らばりが小さくなるので、分散は減少するようになります。


問8 解答

(変動係数)

[1]

$\boxed{ \ \mathsf{11}\ }$ ⑤

単位が異なるデータや平均値が大きく異なるデータの散らばりの程度を相対的に比較したいとき、標準偏差を平均値で割って標準化したものである変動係数を用いることがあります。

[2]

$\boxed{ \ \mathsf{12}\ }$ ④

Ⅰ.男$11$歳の体重の変動係数は$8.35\div38.2\fallingdotseq0.219$、男$17$歳の体重の変動係数は$10.38\div62.6\fallingdotseq0.166$となるので、変動係数は$17$歳のほうが小さくなります。
Ⅱ.男女とも、年齢が上がるほど、平均値が大きくなり、標準偏差が小さいか同じ値となっているので、変動係数は定義から年齢が上がるほど小さくなることになります。
Ⅲ.男女のどの年齢においても、標準偏差は体重のほうが大きく、平均値は体重のほうが小さいので、変動係数は定義から体重のほうが大きくなることになります。


問9 解答

(散布図)

[1]

$\boxed{ \ \mathsf{13}\ }$ ⑤

散布図から読み取ると、滋賀県の未婚率は、
 女性の未婚率が男性の未婚率よりも小さくなっています。
 男女どちらの未婚率も$50\%$を下回っています。
 男女どちらの未婚率も平均を下回っています。
 男性の未婚率と女性の未婚率の差は$10\%$より大きくなっています。

[2]

$\boxed{ \ \mathsf{14}\ }$ ①

Ⅰ.散布図から、すべての都道府県において、女性の未婚率は男性の未婚率より低くなっています。
Ⅱ.この散布図は男女の未婚率の関係を示しているだけで、人口と未婚率の関係は示されていません。
Ⅲ.散布図から、男性の未婚率が$50\%$より大きい都道府県は、約$15$都道府県と読み取れるので、半数ではありません。


問10 解答

(散布図、折れ線グラフ)

[1]

$\boxed{ \ \mathsf{15}\ }$ ①

Ⅰ.散布図の点は、おおよそ左下から右上に分布しているので、打率が高い年は防御率も高くなっている傾向にあることがわかります。
Ⅱ.この散布図だけでは、打率と防御率がどの年のものかはわかりません。
Ⅲ.打率が一番高い点は、防御率が一番高くなっていません。

[2]

$\boxed{ \ \mathsf{16}\ }$ ⑤

Ⅰ.防御率のグラフから一番低い年は$2012$年ですが、勝率のグラフでは一番高い年は$2017$年となっています。
Ⅱ.勝率のグラフから一番高い年は$2017$年ですが、打率のグラフでは一番高い年は$2004$年となっています。
Ⅲ.例えば、$2009$年や$2015$年をみると、防御率は前年より低くなっていますが、勝率も前年より低くなっています。