統計検定2級問題解説 ~2016年6月実施~ (その1)

過去問題

過去問題は統計検定公式問題集が問題と解答例を公開しています。こちらを参照してください。


問1 解答

(箱ひげ図,ヒストグラム,散布図)

[1]

$\boxed{ \ \mathsf{1}\ }$ ②

Ⅰ. 箱ひげ図からは標準偏差は読み取れない。誤り。
Ⅱ. 箱ひげ図から今年の中央値が $8^\circ\mathrm{C}$ 強,昨年の中央値が $6^\circ\mathrm{C}$ 強で,今年の方が約 $2^\circ\mathrm{C}$ 高い。正しい。
Ⅲ. 箱ひげ図から今年の方が昨年よりも範囲が大きい。誤り。

[2]

$\boxed{ \ \mathsf{2}\ }$ ③

箱ひげ図の最大値の値から,最大値の階級は$12\sim14^\circ\mathrm{C}$なので,③か⑤
箱ひげ図の中央値から左右の幅を見ると右に裾が長い分布とみられるので③が正解。

[3]

$\boxed{ \ \mathsf{3}\ }$ ④

Ⅰ. 右上の散布図から日平均気温と日最高気温の間には正の相関がみられる。正しい。
Ⅱ. 左下の散布図から日最低気温の範囲は約 $11^\circ\mathrm{C}$ で, 日最高気温の範囲は約 $19^\circ\mathrm{C}$ となっている。正しい。
Ⅲ. 左上の散布図から日平均気温と日最低気温の間には正の相関がみられる。誤り。


問2 解答

(平均値)

[1]

$\boxed{ \ \mathsf{4}\ }$ ⑤

試験Aで $100$ 点をとっていない生徒の人数は $6$ 人なので,$100$ 点をとった人数は $20-6=14$ 人

[2]

$\boxed{ \ \mathsf{5}\ }$ ③

クラス全員の試験Bの得点の合計は平均値から $79.5\times20=1590$ 点
これから試験Aで $100$ 点を取っていない $6$ 人の生徒の試験Bの得点を差し引いて,残り $14$ 人で平均をとると
$$(1590-20-30-60-70-80-90)/14=1240/14\fallingdotseq88.6$$


問3 解答

(2元クロス表,相関係数)

[1]

$\boxed{ \ \mathsf{6}\ }$ ④

「いいえ」と答えた人の割合は $100$ 人中 $80$ 人,$(0.8)$。属性Bの人数は $60$ 人なので,属性Bで「いいえ」と答えた人数は $60\times0.8=48$ 人

[2]

$\boxed{ \ \mathsf{7}\ }$ ①

属性の平均 $\bar x$,回答の平均 $\bar y$,属性の分散 $\sigma^2_x$,回答の分散 $\sigma^2_y$,属性と回答の共分散を $\sigma^2_{xy}$とすると,相関係数は$$r=\frac{\sigma_{xy}}{\sigma_x\sigma_y}=\frac{\frac1n\sum_i(x_i-\bar x)(y_i-\bar y)}{\sqrt{\frac1n\sum_i(x_i-\bar x)^2}\sqrt{\frac1n\sum_i(y_i-\bar y)^2}}=\frac{\sum_i(x_i-\bar x)(y_i-\bar y)}{\sqrt{\sum_i(x_i-\bar x)^2}\sqrt{\sum_i(y_i-\bar y)^2}}$$

となる。ここで,$$\begin{align}
\bar x=&(0\times50+1\times50)/100=1/2\\
\bar y=&(0\times50+1\times50)/100=1/2\\
\sum_i(x_i-\bar x)^2=&(0-1/2)^2\times50+(1-1/2)^2\times50=25\\
\sum_i(y_i-\bar y)^2=&(0-1/2)^2\times50+(1-1/2)^2\times50=25\\
\sum_i(x_i-\bar x)(y_i-\bar y)=&(0-1/2)\times(0-1/2)\times40+(0-1/2)\times(1-1/2)\times10\\
&+(1-1/2)\times(0-1/2)\times10+(1-1/2)\times(1-1/2)\times40\\
=&15\\
\therefore r_1=&\frac{15}{\sqrt{25}\sqrt{25}}=\frac35=0.6
\end{align}$$

[3]

$\boxed{ \ \mathsf{8}\ }$ ①

属性について$x^*=ax+b$と変数変換を考えると, $$\begin{align}\bar x^*=&\frac1n\sum_{i=1}^nx^*_i=\frac1n\sum_{i=1}^n(ax_i+b)=a\bar x+b\\
\sum_{i=1}^n(x^*_i-\bar x^*)^2=&\sum_{i=1}^n{(ax_i+b)-(a\bar x+b)}^2=a^2\sum_{i=1}^n(x_i-\bar x)^2\\
\sum_{i=1}^n(x^*_i-\bar x^*)(y_i-\bar y)=&\sum_{i=1}^n{(ax_i+b)-(a\bar x+b)}(y_i-\bar y)\\
=&a\sum_{i=1}^n(x_i-\bar x)(y_i-\bar y)\\
\therefore r^*=&\frac{\sum_{i=1}^n(x^*_i-\bar x^*)(y_i-\bar y)}{\sqrt{{\sum_{i=1}^n(ax_i+b)-(a\bar x+b)}^2}\sqrt{\sum_{i=1}^n(y_i-\bar y)^2}}\\
=&\frac{a\sum_{i=1}^n(x_i-\bar x)(y_i-\bar y)}{\sqrt{a^2\sum_{i=1}^n(x_i-\bar x)^2}\sqrt{\sum_{i=1}^n(y_i-\bar y)^2}}
=\frac{a}{|a|}r
\end{align}
$$

$r_2$の属性は$r_1$の場合から$\displaystyle x^*=\frac12x$と変数変換すれば,$\displaystyle r_2=\frac{1/2}{|1/2|}r_1=r_1$
$r_3$の属性は$r_1$の場合から$x^*=-x+1$と変数変換すれば,$\displaystyle r_3=\frac{-1}{|-1|}r_1=-r_1$

【別解】

$r_2$の場合$$\begin{align}
\bar x=&(0\times50+(1/2)\times50)/100=1/4\\
\sum_{i=1}^n(x_i-\bar x)^2=&(0-1/4)^2\times50+(1/2-1/4)^2\times50=25/4\\
\sum_{i=1}^n(x_i-\bar x)(y_i-\bar y)=&(0-1/4)\times(0-1/2)\times40+(0-1/4)\times(1-1/2)\times10\\
&+(1/2-1/4)\times(0-1/2)\times10+(1/2-1/4)\times(1-1/2)\times40\\
=&15/2\\
\therefore r_2=&\frac{15/2}{\sqrt{25/4}\sqrt{25}}=\frac35=0.6
\end{align}$$
$r_3$の場合$$\begin{align}
\bar x=&(1\times50+0\times50)/100=1/2\\
\sum_{i=1}^n(x_i-\bar x)^2=&(1-1/2)^2\times50+(0-1/2)^2\times50=25\\
\sum_{i=1}^n(x_i-\bar x)(y_i-\bar y)=&(1-1/2)\times(0-1/2)\times40+(1-1/2)\times(1-1/2)\times10\\
&+(0-1/2)\times(0-1/2)\times10+(0-1/2)\times(1-1/2)\times40\\
=&-15\\
\therefore r_3=&\frac{-15}{\sqrt{25}\sqrt{25}}=-\frac35=-0.6
\end{align}$$よって,$r_1=r_2=-r_3$


問4 解答

(成長率,指数化)

[1]

$\boxed{ \ \mathsf{9}\ }$ ②

当年の物価指数=前年の物価指数×物価上昇率なので,
$$103.2\times(1+1.0\%)\times(1+1.8\%)=103.2\times1.010\times1.018=106.1$$

[2]

$\boxed{ \ \mathsf{10}\ }$ ③

Ⅰ.月次消費者物価指数を平均したものが年平均の消費者物価指数になるので,前年と年平均の消費者物価指数が同じだからと言って,月次消費者物価指数がすべて同じ値であるとは言えない。誤り。
Ⅱ.指数の値が前年より減少している年があるので,上昇を続けているとは言えない。誤り。
Ⅲ.各年の物価上昇率は前年と当年の物価の比率なので,指数の基準年を変更したとしても,物価上昇率は変化しない。正しい。


問5 解答

(単回帰モデル)

[1]

$\boxed{ \ \mathsf{11}\ }$ ①

原系列は全体的に増加傾向にあるので,階差系列は正の値が多くなるので,①か④。
一方,2009年付近で大きく値が落ち込んでいるので,この時期の階差系列は大きく負の値となるので,①が正解。

[2]

$\boxed{ \ \mathsf{12}\ }$ ①

$t$ 値=回帰係数÷標準誤差なので,
$21.86=0.937/$(ア) $\Rightarrow$ (ア)$=0.937/21.86=0.0429$

[3]

$\boxed{ \ \mathsf{13}\ }$ ④

2015年7-9月期なので,この単回帰モデル式に $t=87$ を代入して予測する
$$0.937\times87+452.011=533.530$$


問6 解答

(標本抽出法)

[1]

$\boxed{ \ \mathsf{14}\ }$ ②

① 全数調査の方が標本調査よりも調査するサンプル数が多いので費用がかかる場合が多い。正しい。
② 無作為抽出に伴う誤差は標準誤差として評価することができる。誤り。
③ 無作為抽出の標本誤差の値は調査員の品質に関連しない。正しい。
④ 標本調査の方が調査対象が少ないので速く調査を終えることができる。正しい。
⑤ どの調査を行うにしても,事前に母集団の状態を正確に把握できる方が望ましい。正しい。

[2]

$\boxed{ \ \mathsf{15}\ }$ ④

① 二段抽出法
母集団をいくつかのグループ(第1段抽出)に分け,そこから無作為抽出でいくつかグループを選び,さらにその中から標本を無作為に抽出(第2段抽出)する。
② 二相抽出法(標本層別抽出法)
母集団からまず多数の標本を抽出しておき、この標本について層別に必要な事項を調査して、その予備統計処理の結果に基づいて層別した上で標本抽出を行う。
③ 単純無作為抽出法
全部で$N$個の個体からなる母集団から$n$個の標本を得るとき,各個体が選択される確率は等しく$N/n$,どの個体の組も選択される確率が等しく${}_NC_n$となるように標本を抽出する。
④ 集落(クラスター)抽出法
母集団を小集団であるクラスター(集落)に分け,その中からいくつかのクラスターを無作為に抽出し,それぞれのクラスターにおいて全数調査を行う。
⑤ 層別抽出法
母集団をあらかじめいくつかの層(グループ)に分けておき、各層の中から必要な数の調査対象を無作為に抽出する方法
 (通常,層の大きさに比例させて調査対象を抽出する大きさを決める。(比例配分法))


問7 解答

(条件付き確率)

[1]

$\boxed{ \ \mathsf{16}\ }$ ⑤

Aが勝つ確率は $\displaystyle\frac12$,Cが勝つ確率は $\displaystyle\frac12$,Aが負けた後に優勝する確率は $r$ なので,求める確率は$$\frac12\times\frac12\times r=\frac14r$$

[2]

$\boxed{ \ \mathsf{17}\ }$ ③

最初からAが2連勝する場合の確率は,$$\frac12\times\frac12=\frac14$$最初Bに負け,その後Aが優勝する場合の確率は,$$\frac12\times r=\frac12r$$よって,Aが優勝する確率は,$$P_A=\frac14r+\frac14+\frac12r=\frac14+\frac34r$$

[3]

$\boxed{ \ \mathsf{18}\ }$ ②

最初にAとBが戦うので,Bが優勝する確率 $P_B$ はAが優勝する確率 $P_A$ と等しい。
Cが優勝するのは「Cが2連勝する」場合と「CがAorBに勝った後にCが負け,その後Cが優勝する」場合の2つがある。それぞれの確率は,$\displaystyle\frac12\times\frac12=\frac14$,$\displaystyle\frac12\times\frac12\times r=\frac14r$であるので,Cが優勝する確率は
$$P_C=\frac14+\frac14r<P_A$$