統計検定3級問題解説 ~2018年11月実施~ (問11~問18)

過去問題

過去問題は統計検定公式問題集が問題と解答例を公開しています。こちらを参照してください。


問11 解答

(クロス集計表)

$\boxed{ \ \mathsf{17}\ }$ ④

各所得階層ごとに「している」と回答した人の割合を計算すると、以下のとおりとなります。
$200$万円未満 $91/164\fallingdotseq0.555$、$200$万~$400$万円 $236/386\fallingdotseq0.611$、$400$万~$600$万円 $279/370\fallingdotseq0.754$、$600$万~$800$万円 $204/266\fallingdotseq0.767$、$800$万~$1,000$万円 $96/123\fallingdotseq0.780$、$1,000$万円以上 $78/100\fallingdotseq0.780$
Ⅰ.すべての所得層において、「している」と回答した人の割合は$50\%$以上となっています。
Ⅱ.所得の増加にともない、「している」と回答した人の割合は増加する傾向となっています。(ただし、$1,000$万円以上の割合は一つ下の階層よりは若干小さくなっています。)
Ⅲ.この集計表は、「スマートフォンでメールを見たり送ったりする」ことを集計しているので、他の利用を含むスマートフォンの利用そのものを調査しているものではありません。


問12 解答

(クロス集計表)

$\boxed{ \ \mathsf{18}\ }$ ⑤

Ⅰ.「そう思わない」と答えた割合が最も大きいのは、$27.4\%$で家事専業の人となっています。
Ⅱ.「そう思う」と答えた人数が「そう思わない」と答えた人数の何倍かを求めると、被雇用者(パート含む)では$1,658/535\fallingdotseq3.10$となり、雇用主・自営業では$354/80\fallingdotseq4.43$となっています。このことから雇用主・自営業のほうが「そう思う」傾向が強いと考えられます。
Ⅲ.生徒・学生でこのアンケートに回答した人数が$85$人で、すべての$20$歳以上の日本在住者の生徒・学生の人数と比較しても少ない人数ですので、このアンケートの結果だけから、$20$歳以上の日本在住者全体でも生徒・学生が「そう思う」と回答する割合一番大きくなると判断するとは、言い切れません。(統計的検定などを用いて検証する必要があります。)


問13 解答

(相関係数)

[1]

$\boxed{ \ \mathsf{19}\ }$ ④

$x$と$y$の相関係数は$x$と$y$の共分散を$x$と$y$の分散で割ることで求められます。
$x$の平均 $\bar x=(0+0+1+1+2+2)/6=1$
$x$の分散 $\begin{eqnarray}s_x^2&=&\{(0-1)^2+(0-1)^2+(1-1)^2\\&&+(1-1)^2+(2-1)^2+(2-1)^2\}/6=2/3\end{eqnarray}$
$y$の平均 $\bar y=(3+6+1+4+2+5)/6=7/2$
$y$の分散 $\begin{eqnarray}s_y^2&=&\{(3-7/2)^2+(6-7/2)^2+(1-7/2)^2\\&&+(4-7/2)^2+(2-7/2)^2+(5-7/2)^2\}/6=35/12\end{eqnarray}$
$x$と$y$の共分散 $\begin{eqnarray}s_{xy}&=&\{(0-1)\times(3-7/2)+(0-1)\times(6-7/2)+(1-1)\times(1-7/2)\\&&+(1-1)\times(4-7/2)+(2-1)\times(2-7/2)+(2-1)\times(5-7/2)\}/6\\&=&-1/3\end{eqnarray}$
よって、$x$と$y$の相関係数 $\displaystyle r=\frac{s_{xy}}{s_{x}s_{y}}=\frac{-1/3}{\sqrt{2/3}\times\sqrt{35/12}}\fallingdotseq-0.239$

[2]

$\boxed{ \ \mathsf{20}\ }$ ①

Ⅰ.$x$の値で$0, 1, 2$の頻度はいずれも$2$なので、同じ頻度で出現しています。
Ⅱ.$y$の値は$1, 2, 3, 4, 5, 6$の頻度がいずれも$1$なので、同じ頻度で出現しています。
Ⅲ.$x$が$1$のとき、$y$は$1$と$4$が出現しています。


問14 解答

(相関係数)

$\boxed{ \ \mathsf{21}\ }$ ③

元の値を$2$倍すると、平均は$2$倍、分散は$4$倍、共分散は$4$倍になるので、相関係数は$1$倍になります。


問15 解答

(散布図)

$\boxed{ \ \mathsf{22}\ }$ ①

中央値は、データを小さい順に並べたときにちょうど中央に来るデータの値です。問題の場合、$11$人分なので、中央値は下から$6$番目の値になります。よって、中間値は数学が$80$点、理科が$80$点となります。
範囲は、データの最大値と最小値の差です。よって、数学、理科ともには$96-54=42$点となります。
平均値は、数学が$(54+56+58+60+62+80+82+83+84+88+96)/11=73$点、理科が$(54+62+68+76+78+80+82+86+92+93+96)/11=78.8$点となります。
散布図の点の配置を見ると、概ね左下から右上に配置されているので、両科目の得点間には正の相関がみられます。


問16 解答

(箱ひげ図、散布図)

[1]

$\boxed{ \ \mathsf{23}\ }$ ④

選択肢の箱ひげ図を見ると、それぞれ金沢と静岡の最大値、最小値が違うので、表から最大値、最小値を読みとると、最小値は金沢が$52.0$、静岡が$48.5$、最大値は金沢が$526.5$、静岡が$563.5$となります。これを満たすのは④の箱ひげ図になります。

[2]

$\boxed{ \ \mathsf{24}\ }$ ①

気温に注目して散布図をみると、②は$10$月と$11$月の気温、③は$6$月と$7$月の気温、④は$11$月の気温が違っています。(③、④は他にも違っている月があります。)

[3]

$\boxed{ \ \mathsf{25}\ }$ ④

Ⅰ.散布図の点の配置は直線状に分布していないので、強い相関があるとはいえません。
Ⅱ.散布図の点の配置は左下から右上に直線状に分布しているので、強い正の相関があります。
Ⅲ.金沢の気温と静岡の気温は強い正の相関がありますが、金沢の気温が上がることが静岡の気温を上げる原因になっているとはいいきれません。


問17 解答

(平均値、標準偏差)

$\boxed{ \ \mathsf{26}\ }$ ②

身長を$x$、標準体重を$y$とおくと、両者の関係は$$y=0.6x-40$$となります。このことから、
$y$の平均は$$\bar{y}=\frac1n\sum_{i=1}^ny_i=\frac1n\sum_{i=1}^n(0.6x_i-40)=\frac1n\left(0.6\sum_{i=1}^nx_i-40n\right)=0.6\bar{x}-40$$
$y$の分散は$$\begin{eqnarray}s_y^2=\frac1n\sum_{i=1}^n(y_i-\bar{y})^2=\frac1n\sum_{i=1}^n(0.6x_i-40-0.6\bar{x}+40)^2&=&\frac1n\sum_{i=1}^n0.6^2(x_i-\bar{x})^2\\&=&0.6^2x_s^2\end{eqnarray}$$
$y$の標準偏差は$s_y=0.6s_x$
$y$の中央値は$y_m=0.6x_m-40$ ($x_m$は$x$の中央値)
となります。


問18 解答

(時系列)

[1]

$\boxed{ \ \mathsf{27}\ }$ ⑤

Ⅰ.携帯電話全体とスマートフォンの出荷台数の挙動が似ているのは、スマートフォンの出荷台数が携帯電話全体の出荷台数の内数となっていて、スマートフォンの割合が比較的大きいからといえます。
Ⅱ.スマートフォンの出荷台数が携帯電話全体の出荷台数の内数となっているので、スマートフォンの折れ線が携帯電話全体の折れ線より上にあることは絶対ありません。
Ⅲ.グラフから$2013$年以降、$4$月の値は$3$月の値より下がっています。

[2]

$\boxed{ \ \mathsf{28}\ }$ ①

Ⅰ.グラフから、$2017$年$1$月以降の値はすべて$0.5$を上回っています。
Ⅱ.スマートフォンの占める割合が上がっている原因は、このグラフから読み取ることはできません。原因を知るには別途調査が必要です。
Ⅲ.グラフから$2014$年、$2015$年で$0.4$を下回っている月が何回かあります。


問19 解答

(調査手法、標本抽出)

[1]

$\boxed{ \ \mathsf{29}\ }$ ③

Ⅰ.この高校の生徒の成績と家庭学習時間の関係性を検討するためであれば、必ずしも全員を調査する必要はありません。
Ⅱ.学習時間の長短でグループ分けをして調査を行う必然性はありません。
Ⅲ.既に終わっているテストの成績と家庭学習時間の関係性を検討するものなので、そのどちらにも介入できませんので、実験研究ではありません。実験研究は、観察対象に対して観測者の意図した条件を介入できる調査になります。

[2]

$\boxed{ \ \mathsf{30}\ }$ ⑤

Ⅰ.調査協力希望者のみを対象にするのは、調査対象に偏りができるので好ましくありません。
Ⅱ.2年生以外の状況が反映されないので、標本に偏りが生じるため好ましくありません。
Ⅲ.学校全体からの単純無作為抽出なので、必ずしも各学年から同数の対象が選ばれるとは限りません。