統計検定3級問題解説 ~2019年6月実施~ (その1)

過去問題

過去問題は統計検定公式問題集が問題と解答例を公開しています。こちらを参照してください。


問1 解答

(量的変数)

$\boxed{ \ \mathsf{1}\ }$ ② or ④

量的変数は計算できる数量を扱う変数です。問題では、Ⅱ.特急料金は明らかに量的変数です。
一方、すべてが数字で構成されている変数であっても、「郵便番号」や「商品コード」のような計算できない変数は、量的変数ではなく質的変数になります。
ただし、問題のⅠ.発車時刻のような「日付・時刻」は、月別や時間帯別といったデータの分類に用いることが多いので、質的変数とすることが一般的ですが、例えば、日数や時間間隔などを求めるために用いるなど、数量として取り扱う場面が想定される場合は、量的変数と見ることがあります。
当初、この問題の正解は「②Ⅱのみ」でしたが、そういった理由から「④ⅠとⅡのみ」も正解となりました。


問2 解答

(ヒストグラム)

[1]

$\boxed{ \ \mathsf{2}\ }$ ②

問題の頻度表から、
・最も度数が大きい階級は$81$以上$90$以下。
・$0$以上$30$以下の階級だけ、他の階級と階級幅が違う。
ということがわかります。ヒストグラムでは、各階級の棒の大きさは、面積が度数に比例するよう描かなければなりませんので、他の階級の約$3$倍の階級幅となっている$0$以上$30$以下の階級の棒の高さは、$6\div3=2$となり、棒の幅は他の階級の3倍になります。

[2]

$\boxed{ \ \mathsf{3}\ }$ ①

Ⅰ.中央値は、データを小さい順に並べたときにちょうど中央に来るデータの値です。問題の場合、人数が$100$人ですので、中央値は下から$50$番目と$51$番目の中間の値になります。
ここで、$60$以下の人数は、$6+10+14+16=46$人、$70$以下の人数は、$6+10+14+16+15=61$人なので、下から$50$番目と$51$番目は、$61$以上の$70$以下の階級に含まれています。
Ⅱ.第3四分位数は、下から$3/4$の位置にあるデータの値です。人数が$100$人の場合、第3四分位数は下から$75$番目と$76$番目の中間の値、すなわち、上から$25$番目と$26$番目の中間の値になります。
ここで、$91$以上の人数は、$11$人、$81$以上の人数は、$11+18=29$人なので、上から$25$番目と$26$番目は、$81$以上の$90$以下の階級に含まれています。
Ⅲ.第1四分位数は、下から$1/4$の位置にあるデータの値です。人数が$100$人の場合、第1四分位数は下から$25$番目と$26$番目の中間の値になります。度数分布表から、第1四分位数は$41$以上の$50$以下の階級に含まれています。四分位範囲は、(第3四分位数)$-$(第1四分位数)で求められますので、四分位範囲は最小で、第3四分位数の下端から第1四分位数の上端を差し引いた$81-50=31$となります。


問3 解答

(幹葉図)

幹葉図は左端の値を10の位以上、右にある数字を1の位としてデータを表したものです。例えば2列目の
 $1|1\ 1\ 1\ 2\ 3\ 3\ 4\ 4\ 5\ 6\ 6\ 7\ 8\ 8\ 8\ 9$

 $11\ 11\ 11\ 12\ 13\ 13\ 14\ 14\ 15\ 16\ 16\ 17\ 18\ 18\ 18\ 19$
というデータ列を表しています。このような幹葉図で表すと、10の位ごとの度数の分布の形がぱっと見で分かるようになっていることに加え、データの詳細も把握することができます。

[1]

$\boxed{ \ \mathsf{4}\ }$ ③

中央値は、データを小さい順に並べたときにちょうど中央に来るデータの値なので、データ数が$47$件の場合は、中央値は下から$24$番目の値になります。幹葉図から、$0$~$9$の階級が$4$件、$10$~$19$の階級が$16$件あることがわかるので、下から$24$番目は、$20$~$29$の階級の$4$番目になる$22$ということになります。

[2]

$\boxed{ \ \mathsf{5}\ }$ ③

平均は、データの合計をデータの件数で割ったものになるので、まずデータの合計を求めます。(計算のやり方は、他にもいろいろありますが、ここでは1例を挙げておきます。)
$$\begin{eqnarray}5&+&7+7+8=27\\
11&+&11+11+12+13+13+14+14+15+16+16+17+18+18+18+19=236\\
21&+&22+22+22+22+22+24+25+25+26+29+29=289\\
30&+&31+32+33+37+37+38+39=277\\
43&+&43+44+54+63+85+95=427\\
27&+&236+289+277+427=1256\end{eqnarray}$$よって、平均は、
 $1256\div47=26.7$
となります。


問4 解答

(データの分布、最頻値、中央値、平均値)

$\boxed{ \ \mathsf{6}\ }$ ④

Ⅰ.このデータでヒストグラムを作ると、グラフは右側にピークがあり、左側に分布が伸びている形状になり、左に裾が長い分布になります。
Ⅱ.最頻値は最もデータの件数が多い$9$、中央値は下から$7$番目の値である$9$で、両者は等しくなります。
Ⅲ.データから平均値は$9$より小さい値になります。このデータに$9$を追加すると、平均値は$9$に近づくので値は変化します。一方、中央値は下から$7$番目の値と$8$番目の値の中間値で$9$になります。よって中央値は変化しません。


問5 解答

(度数分布表からの中央値、箱ひげ図)

[1]

$\boxed{ \ \mathsf{7}\ }$ ②

人数が$30$人ですので、中央値は下から$15$番目と$16$番目の中間の値になります。
ここで、$50$点以下の人数は、$1+6+6=13$人、$60$点以下の人数は、$1+6+6+5=18$人なので、下から$15$番目と$16$番目は、$51$点以上の$60$点以下の階級に含まれています。

[2]

$\boxed{ \ \mathsf{8}\ }$ ⑤

箱ひげ図をみると、最小値が$A$では$31$点以上の$40$点以下の階級に、$B$では$21$点以上の$30$点以下の階級にあります。これを踏まえて度数分布表をみると、$A$は$3$回目、$B$は$1$回目のグラフであることがわかります。

[3]

$\boxed{ \ \mathsf{9}\ }$ ②

Ⅰ.2つの箱ひげ図から中央値(箱の中の線)を読み取ると、間隔が$30$点以下となっています。
Ⅱ.$B$の四分位範囲は$40$点以上$70$以下の範囲に入っています。また四分位範囲に入るデータは、下から$8$番目から$23$番目のデータなので、$16$人含まれていることになります。
Ⅲ.$A$のグラフでは、中央値がほぼ$80$点付近にあることから全体の半数である$15$以上が$80$点以上を取っていることがわかります。一方、$B$のグラフでは、第3四分位数の位置が$70$点以下となっていることから、$80$点以上を取っている人数は全体の$1/4$の$8$人以下となっていることがわかります。


問6 解答

(標準偏差、偏差値)

[1]

$\boxed{ \ \mathsf{10}\ }$ ④

平均を$\bar x$、標準偏差を$s$とすると、得点$x_i$の偏差値は、
 $\displaystyle 50+10\times\frac{x_i-\bar x}{s}$
で求められます。よって、$A$さんの理科の偏差値は、
 $\displaystyle 50+10\times\frac{78-66.0}{16}=57.5$
となります。

[2]

$\boxed{ \ \mathsf{11}\ }$ ②

数学の標準偏差を$s$とすると、理科と数学の偏差値が同じなので、
 $\displaystyle 50+10\times\frac{69-60}{s}=57.5$
 $\displaystyle \therefore s=\frac{10\times(69-60)}{57.5-50}=12.0$

[3]

$\boxed{ \ \mathsf{12}\ }$ ④

元のデータを$1.1$倍すると、中央値、平均及び標準偏差も$1.1$倍になります。その結果、偏差値は
 $\displaystyle 50+10\times\frac{1.1\times x_i-1.1\times\bar x}{1.1\times s}=50+10\times\frac{x_i-\bar x}{s}$
となりますので、変更前と変更後の点数で偏差値は変わりません。


問7 解答

(はずれ値)

[1]

$\boxed{ \ \mathsf{13}\ }$ ①

問題のような場合、はずれ値が発生する原因としては、製品そのものに異常があるほかに、測定誤差やデータの記載ミスなども考えられます。また、計測結果にはずれ値が含まれる数は決まっていません。なので、はずれ値が含まれない場合もあります。

[2]

$\boxed{ \ \mathsf{14}\ }$ ⑤

はずれ値は、必ずしも大きい値ではずれるとは限りませんので、はずれ値が存在すると平均値や中央値が大きくなるとは限りません。また、はずれ値は他のデータに比べ極端にはずれている値なので、データのばらつきが大きくなり、分散が大きくなります。


問8 解答

(5数要約、はずれ値を含む箱ひげ図)

[1]

$\boxed{ \ \mathsf{15}\ }$ ④

範囲及び四分位範囲は、以下の式で求められます。
 (範囲)$=$(最大値)$-$(最小値)$=100-22=78$
 (四分位範囲)$=$(第3四分位数)$-$(第1四分位数)$=86-68=18$

[2]

$\boxed{ \ \mathsf{16}\ }$ ②

(第1四分位数)$-$(四分位範囲)$\times1.5=68-18\times1.5=41$
(第3四分位数)$+$(四分位範囲)$\times1.5=86+18\times1.5=113$
となりますので、はずれ値は$22$となります。この結果、ひげの範囲は$44$から$100$になります。