統計検定2級問題解説 ~2017年6月実施~ (問1~問8)

過去問題

過去問題は統計検定公式問題集が問題と解答例を公開しています。こちらを参照してください。


問1 解答

(箱ひげ図,ヒストグラム)

[1]

$\boxed{ \ \mathsf{1}\ }$ ④

すべて,箱ひげ図から,
Ⅰ.TV保有率の最小値(○の値)$\gt$PC保有率最大値(ひげの最上部の値)なので,正しい。
Ⅱ.$47/4=11.75$なので,PC保有率の最大値~第$3$四分位数の人数は$10$人以上。PC保有率の第3四分位数$\gt$DVD/BD保有率の最大値なので,正しい。
Ⅲ.SP保有率の最小値$\lt$MP保有率の最大値なので,誤り。

[2]

$\boxed{ \ \mathsf{2}\ }$ ③

各ヒストグラムの最大値の階級がすべて違っており,小さい方から$e\lt b \lt a\lt c\lt d$。
一方,箱ひげ図から保有率の最大値は,小さい方からDVD/BD$\lt$MP$\lt$SP$\lt$PC$\lt$TV。
よって,MPが$b$,SPが$a$。
(箱ひげ図の最大値,最小値,中央値,四分位数からヒストグラムの形状がわかるようにする。)


問2 解答

(度数分布表,相対度数)

[1]

$\boxed{ \ \mathsf{3}\ }$ ③

茨城県の総度数の半分は$57681\div2=28840.5$。
茨城県の階級(C)までの累積度数は$371+8375+17131=25877$,階級(D)までの累積度数は$25877+10644=36521$なので,中央値は階級(D)に含まれる。

[2]

$\boxed{ \ \mathsf{2}\ }$ ②

長野県の総度数の$1/4,3/4$はそれぞれ$57681\times1/4=13306,57681\times3/4=39918$。
長野県の階級別累積度数は下の階級から順に$1851,15909,36305,44022,\cdots$となるので,第1四分位数は階級(B),第3四分位数は階級(D)にそれぞれ含まれる。

[3]

$\boxed{ \ \mathsf{5}\ }$ ⑤

4道県の(A)~(B)の相対度数を求めると,
北海道:$(342+986)/39620=0.034$,秋田県:$(251+3219)/38539=0.090$,
茨城県:$(371+8375)/57681=0.152$,長野県:$(1851+14058)/53224=0.299$
となり,グラフの(A)~(B)の大きさから北海道は(エ),秋田県は(ウ)


問3 解答

(成長率,コレログラム)

[1]

$\boxed{ \ \mathsf{6}\ }$ ③

2015年8月の前年同月比伸び率は$$\frac{1668}{995}-1=0.676=67.6\%$$

[2]

$\boxed{ \ \mathsf{7}\ }$ ②

Ⅰ.季節性のある時系列データのトレンドを把握するためには,季節の影響を排除するために,前年同月比伸び率や移動平均を調べる。誤り。
Ⅱ.左図よりアジア計と北アメリカ計の訪日外客数の差は拡大する傾向にある。正しい。
Ⅲ.前年同月比伸び率の違いには実データの差は関係しない。誤り。

[3]

$\boxed{ \ \mathsf{8}\ }$ ①

多少の増減はあるものの,全体的には増加傾向にあるため①。
②は増減を1カ月毎にくり返す。③は時系列的な傾向がみられない。④は4カ月毎の周期性がある。


問4 解答

解答

(散布図,相関係数,回帰係数の検定)

[1]

$\boxed{ \ \mathsf{9}\ }$ ④

散布図の点は全体的に左上から右下に点が分布していることから,負の相関になる。負の相関係数の2つの選択肢(④,⑤)のうち,⑤の$-0.994$となるのは,散布図の点がほぼ直線状に並んでいる状態である。

[2]

$\boxed{ \ \mathsf{10}\ }$ ②

単回帰モデルの回帰直線は,散布図の点のほぼ中央部分を通る。①③は直線の上側に点が多く直線の位置が下にずれており,④⑤は線の下側に点が多く直線の位置が上にずれている。5つの図のなかでは②があてはまりがよい。

[3]

$\boxed{ \ \mathsf{11}\ }$ ⑤

回帰係数の検定では母分散が未定の時に使われる$t$検定を行うのが標準的である。このとき,傾きが$\beta_0=0$であるという帰無仮説に対する検定の$t$検定統計量は
$$t=\frac{\hat\beta-\beta_0}{\mathrm{se}(\hat\beta)}=\frac{(-0.14510)-0}{0.02316}=-6.27$$
ここで,$\hat\beta$は傾き$\beta$の推定値,$\mathrm{se}(\hat\beta)$は標準誤差である。
自由度は,(データ件数)-(推定される回帰係数(定数項含む))$=25-2=23$である。


問5 解答

(標本抽出法)

$\boxed{ \ \mathsf{12}\ }$ ④

① 多段抽出で段数が多くなるほど,調査対象が特定のグループに絞られるので,平均などの制度は落ちてくる。誤り。
② 層別抽出は,母集団をできるだけ等質な構成要素の層に分割してから抽出するため,各層の散らばり具合は必ずしも均質とはならない。誤り。
③ 街頭インタビューでいかに無作為に抽出したところで,その街全体の人が街頭にいるわけでないので,街全体を無作為抽出したことにならない。誤り。
④ クラスター抽出法では母集団をクラスターを分け,そこからいくつかのクラスターを抽出してそのクラスターの全体調査をするので,コストは低減できるが精度は落ちる。正しい。
⑤ 調査対象者を紹介してもらうと,調査対象が同質となる傾向にあるので,回答率は上がるかもしれないが,精度は向上するとは言えない。誤り。


問6 解答

(確率変数の和と差)

$\boxed{ \ \mathsf{13}\ }$ ③

$b$の推定値は
$$\frac{X-Y}2=\frac{(a+b+\varepsilon_1)-(a-b+\varepsilon_2)}{2}=b+\frac{\varepsilon_1-\varepsilon_2}{2}$$
よって,この推定値の分散は$\varepsilon_1,\varepsilon_2$が互いに独立だから
$$V\left[\frac{\varepsilon_1+\varepsilon_2}{2}\right]=\frac14(V[\varepsilon_1]+V[\varepsilon_2])=\frac14(\sigma^2+\sigma^2)=\frac{\sigma^2}2$$


問7 解答

(ベイズの定理、確率の乗法定理)

抽出された貝が漁港Xから仕入れたという事象を$X$,
抽出された貝が規格外であるという事象を$A$とする。

[1]

$\boxed{ \ \mathsf{14}\ }$ ④

$P(X\cap A)=P(X)\times P(A|X)=0.4\times0.1=0.04$

[2]

$\boxed{ \ \mathsf{15}\ }$ ③

各漁港から仕入れるという事象は互いに排反なので
$P(A)=0.4\times0.1+0.3\times0.05+0.3\times0.02=0.061$

[3]

$\boxed{ \ \mathsf{16}\ }$ ②

抽出した貝が規格外という条件の下で,その貝が漁港Xから仕入れたものという条件付き確率は
$\begin{align}P(X|A)=\frac{P(X\cap A)}{P(A)}=\frac{0.04}{0.061}=0.656\end{align}$

【別解】ベイズの定理を用いて求める
$\begin{align}P(X|A)=\frac{P(A|X)}{P(A)}P(X)=\frac{0.1}{0.061}\times0.4=0.656\end{align}$


問8 解答

(二項分布)

[1]

$\boxed{ \ \mathsf{17}\ }$ ①

「対局が第5局で終了し,名人Aが4勝する」確率は,「第4局までに名人Aが3勝し,第5局目に名人Aが勝つ」確率を求める。
${}_4\mathrm{C}_3\times0.7^3\times0.3\times0.7=4\times0.7^4\times0.3=0.288$

[2]

$\boxed{ \ \mathsf{18}\ }$ ⑤

「対局が第7局で終了する」確率は,「第6局までに名人Aと挑戦者Bがそれぞれ3勝する」確率を求める。
${}_6\mathrm{C}_3\times0.7^3\times0.3^3=20\times0.21^3=0.185$