統計検定3級問題解説 ~2021年6月実施~ (その1)

過去問題

過去問題は統計検定公式問題集が問題と解答例を公開しています。こちらを参照してください。


問1 解答

(量的変数)

$\boxed{ \ \mathsf{1}\ }$ ③

量的変数は数量で示される変数です。Ⅰ~Ⅳの中では金額を示しているⅢ、ポイントを示しているⅣは量的変数です。
量的変数は、一般的に合計や平均といった集計対象となる変数です。質的変数は、量的変数を分類したりや集計条件として使うための変数です。集計する変数なのかそうでないかで考えるのが、量的か質的を判断する基準になります。
※Ⅰの日付は数字で表されていますが質的変数として扱うのが一般的です。一方で、日数などの期間を表す値は量的変数として取り扱うことが多いです。


問2 解答

(1変数グラフ)

$\boxed{ \ \mathsf{1}\ }$ ②

Ⅰは、比率や割合がわかるグラフが望ましいので、円グラフや帯グラフが使われます。
Ⅱは、推移がわかるグラフが望ましいので、折れ線グラフや棒グラフが使われます。
Ⅲは、ばらつきの比較ができるブラフが望ましいので、箱ひげ図やヒストグラムが使われます。
※ローソク足は一定期間内の始値・高値・安値・終値を表示するグラフで、主に株価の推移などで使われます。散布図は2つの変数の(相関)関係を表示するためのグラフです。


問3 解答

(幹葉図、最頻値、中央値)

問題の幹葉図をデータ列に展開すると次のようになります。

46 46 47 48 49 49 53 53 54 54 55 59 59 59 60 62 63 63 66 68

[1]

$\boxed{ \ \mathsf{3}\ }$ ⑤

最頻値は、最も多く観測されているデータとなります。問題のデータを見ると、$59$が$3$回観測されているので、最頻値は$59$となります。

[2]

$\boxed{ \ \mathsf{4}\ }$ ①

中央値は、データを小さい順に並べたときにちょうど中央に来るデータの値です。問題の場合は、データの件数が$20$件なので、小さいほうから$10$番目の値$54$と、$11$番目の値$55$の平均$=(54+55)\div2=54.5$が中央値となります。


問4 解答

(最頻値、中央値、平均値、四分位範囲)

問題の発生件数を小さい順に並べると次のようになります。

0 1 1 1 1 2 2 3 3 5 5 6

$\boxed{ \ \mathsf{5}\ }$ ④

Ⅰ.発生件数の範囲(最大値$-$最小値)は$6-0=6$で、四分位範囲(第$3$四分位数$-$第$1$四分位数)はそれより小さくなります。
※第$1$四分位数$=(1+1)\div2=1$、第$3$四分位数$=(3+5)\div2=4$なので、四分位範囲は$4-1=3$
Ⅱ.小さいほうから$6$番目の値が$2$、$7$番目の値が$2$なので、中央値は$2$となります。また、平均値は$$(0+1+1+1+1+2+2+3+3+5+5+6)\div12=30\div12=2.5$$となります。
Ⅲ.最頻値は、最も多く観測されているデータとなりますので、$4$回観測されている$1$が最頻値となります。


問5 解答

(頻度表、最頻値、中央値、平均値)

[1]

$\boxed{ \ \mathsf{6}\ }$ ③

Ⅰ.中央値は、データを小さい順に並べたときにちょうど中央に来るデータの値です。力士数の半数は$38/div2=19$人で、勝ち数が$6$以下の人数が$5+5+1+1=12$人、$7$以下の人数が$12+9=21$人なので、中央値は$7$になります。
Ⅱ.$0$勝の力士および$1$勝の力士は$0$人で、$2$勝の力士が$1$人いるので、勝ち数の最小値は$2$となります。
Ⅲ.頻度(人数)が最も大きい勝ち数は、人数が$9$人になっている勝ち数$7$になります。

[2]

$\boxed{ \ \mathsf{7}\ }$ ⑤

問題の頻度表からの勝ち数の平均値の求め方は、勝ち数$\times$人数の合計を総人数で割って計算します。$$\begin{eqnarray}(14&\times&1+13\times1+11\times4+10\times3+9\times3+8\times5\\&+&7\times9+6\times5+5\times5+4\times1+2\times1)\div38=292\div38\fallingdotseq7.7\end{eqnarray}$$


問6 解答

(箱ひげ図、ヒストグラム)

[1]

$\boxed{ \ \mathsf{8}\ }$ ⑤

Ⅰ.四分位範囲は箱ひげ図の箱の部分の大きさ(高さ)で表されます。$2012$年度、$2017$年度ともに箱ひげ図の箱の高さは、グラフの一目盛の高さ$=30$(千円)よりも大きくなっているので、四分位範囲はともに$30$(千円)以上になります。
Ⅱ.中央値は箱内の線で表されます。$2012$年度と$2017$年度を比較すると、$2017$年度の中央値のほうが大きくなっているので、$2012$年度の中央値の$1$倍より大きくなります。
Ⅲ.第$3$四分位数は箱の上辺で表されます。$2017$年度の中央値は、$2012$年度の箱の上辺より上にあるので、$2012$年度の第$3$四分位数より大きくなります。

[2]

$\boxed{ \ \mathsf{9}\ }$ ③

箱ひげ図から、$2012$年度の最小値は$260\sim270$(千円)、最大値は$380\sim390$(千円)と読み取れます。また同じく、$2017$年度の最小値は$310\sim320$(千円)、最大値は$440\sim450$(千円)と読み取れます。このことから、該当するヒストグラムは$2012$年度が$a$、$2017$年度が$c$となります。


問7 解答

(時系列データ、指数、変化率)

[1]

$\boxed{ \ \mathsf{10}\ }$ ④

折れ線グラフから$2016$年における指数は$2008$年より大きく、$2015$年の指数は$100$となっています。また、$2012$年以降のグラフを見ると、$2015$年から$2016$年にかけては指数が減少(下降)していることがわかります。

[2]

$\boxed{ \ \mathsf{11}\ }$ ④

折れ線グラフから値を読み取ると、$2016$年の値は$99.9$、$2014$年の値は$99.2$と読み取れます。これを問題の式に代入すると、$$\frac{99.9-99.2}{99.2}\times100\fallingdotseq0.7$$となります。

[3]

$\boxed{ \ \mathsf{12}\ }$ ①

[1]で検討した通り、$2015$年から$2016$年にかけては指数が減少していますので、前年比の計算式から、前年比はマイナスの値になります。したがって該当するグラフは①か②となります。また、$2014$年の前年比を求めると、$$\frac{99.2-96.6}{96.6}\times100\fallingdotseq2.7$$となりますので、該当するグラフは①になります。


問8 解答

(相関関係、相関係数)

[1]

$\boxed{ \ \mathsf{13}\ }$ ③

散布図から、年平均気温が上がれば年間雪日数が減少する傾向にあります。これは年平均気温は年間雪日数と負の相関関係にあるといえます。
なお、相関図だけからは、年平均気温が上昇傾向にあることも、相関関係に地球温暖化の影響があることもわかりません。さらに、この相関図では降雪量に関する情報は読み取れません。

[2]

$\boxed{ \ \mathsf{14}\ }$ ①

相関図における沖縄県の値から、沖縄県の値を除外した場合、年平均気温と年間雪日数の相関関係は強くなる(より直線的な関係になる)といえます。相関関係は負の相関であり、相関係数は負の値をとるので、相関が強くなった場合は相関係数は小さくなります。

[3]

$\boxed{ \ \mathsf{15}\ }$ ③

2つのヒストグラムはそれぞれ年平均気温と年間雪日数のどちらか一方の情報しかもっていません。したがって、これらのヒストグラムを見比べても、$2$つの変数間の因果関係や共分散の符号、相関係数の絶対値の大きさや符号はわかりません。また、年平均気温のヒストグラムからは年間雪日数を予測することはできませんし、年間雪日数のヒストグラムからは年平均気温を予測することはできません。


問9 解答

(帯グラフ)

$\boxed{ \ \mathsf{16}\ }$ ①

Ⅰ.帯グラフより、新聞閲読者の政治・選挙への関心ありの割合は$69.1\%$で、新聞非閲読者の政治・選挙への関心ありの割合$38.5\%$よりも大きくなっています。
Ⅱ.新聞非閲読者の政治・選挙への関心なしの人数は、新聞非閲読者数$794$人の$58.6\%$である$794\times58.6\div100\fallingdotseq465$人となります。
Ⅲ.新聞閲読者の政治・選挙への関心なしの人数は、新聞閲読者数$2,989$人の$29.2\%$である$2989\times29.2\div100\fallingdotseq873$人となり、新聞非閲読者の政治・選挙への関心なしの人数より大きくなってます。
※帯グラフはこのような比率(構成比)の表現に用いるのがよくある使い方です。数量(人数)を表現するには、棒グラフが望ましいです。


問10 解答

(外れ値)

$\boxed{ \ \mathsf{17}\ }$ ②

Ⅰ.外れ値は、他のデータに比べて、極端に大きい値や小さい値を指すので、必ずしも常に平均値より大きいとは限りません。
Ⅱ.箱ひげ図からは、ひげの長さが極端に長いことで外れ値の存在を検出することができます。
Ⅲ.外れ値が存在した場合は、その理由を探ることは重要です。それにより、外れ値の特殊性やデータ異常を把握することができ、外れ値が分析に与える影響や分析から除外できるかを判断することができるからです。