統計検定3級問題解説 ~2021年6月実施~ (その2)

過去問題

過去問題は統計検定公式問題集が問題と解答例を公開しています。こちらを参照してください。


問11 解答

(クロス集計表)

$\boxed{ \ \mathsf{18}\ }$ ①

Ⅰ.こどもの数は、$2019$年では$785+748=1533$、$2018$年では$795+757=1552$と、$2018$年から減少しています。一方で、こどもの女の数に対する男の数の比は、$2019$年では$785\div748\fallingdotseq1.049$、$2018$年では$795\div757\fallingdotseq1.050$となっており、大きな差はありませんでした。
Ⅱ.このクロス集計表からは$65$歳以上の人口の動向を知ることはできません。
Ⅲ.$2019$年の総人口は男の数のほうが女の数よりも少ないため、女の数に対する男の数の比は$1$より小さくなります。


問12 解答

(相関関係、因果関係、擬相関)

$\boxed{ \ \mathsf{19}\ }$ ②

Ⅰ.相関係数からはやや強い負の相関がありますが、日平均気温の変動と推計人口の変動の間には因果関係が見られないので、気温が上がると人口が減るとは言えません。
Ⅱ.警察官定員と$1$年間の刑法犯認知件数の間には弱い相関があるので、警察官定員が多いからといって、$1$年間の刑法犯認知件数が少ない傾向にあるとは言えません。
Ⅲ.二人以上世帯の$1$世帯当たりのミネラルウォーターに対する支出額と海浜事故に遭った人数の間に強い相関がみられたとしても、支出額と海浜事故の間には直接の因果関係が見られず、どちらも気温と強い相関関係があるため擬相関の可能性が高いと言えます。


問13 解答

(母集団と標本、無作為抽出)

[1]

$\boxed{ \ \mathsf{20}\ }$ ④

母集団は調査の対象になる対象全体の集まり、標本は母集団の中から実際に調査を行うために抽出した対象のことを言います。
問題の場合は、母集団は$A$県のすべての小学校に通う小学生$5$万人で、標本は$A$県のすべての小学校から選ばれた小学生$1,200$人となります。
(回答は小学生の保護者が行いますが、あくまで調査対象となるのは小学生のほうです。)

[2]

$\boxed{ \ \mathsf{21}\ }$ ①

標本の抽出に当たっては、単純無作為抽出するので、母集団全体から全く同じ確率で標本を抽出する必要があります。したがって、学校による偏りがあったり、性別、生年月日や保護者がPTA役員といった調査に直接関係ない事柄で標本の抽出に影響を与えてはいけません。


問14 解答

(実験研究)

$\boxed{ \ \mathsf{22}\ }$ ③

問題の調査は、新開発のシューズと従来のシューズのゴールタイムを比較するものなので、それ以外の事項についてはできるだけ差が出ないようにする必要があります。また、調査対象の抽出に当たっては、新開発のシューズを履くか従来のシューズを履くかは、無作為に割り振る必要があります。
①②は特定の$A$さんと$B$さんだけを対象としているので、二人の能力に結果が左右されてしまうので好ましくありません。
④は自己ベストの早い$10$人に新開発のシューズを、残りの$10$人に従来のシューズを履いてもらうため、シューズの性能以外の要因でタイムが変わる可能性があるので好ましくありません。
⑤はマラソンの中間地点まで新開発のシューズを、残りの距離で従来のシューズを履いてもらうため、コースの前半と後半では走路の条件や体力の変化などの要因でタイムが変わる可能性があるので好ましくありません。


問15 解答

(条件付き確率)

[1]

$\boxed{ \ \mathsf{23}\ }$ ②

$1$回目に赤玉、$2$回目に白玉を取り出したので、$3$回目を引く前の袋の中身は、赤玉$6$個と白玉$3$個になっています。この中から白玉を取り出す確率は$\displaystyle\frac39=\frac13$となります。

[2]

$\boxed{ \ \mathsf{24}\ }$ ⑤

$1$回目に赤玉を取り出す確率は$\displaystyle\frac57$。
$2$回目に白玉を取り出す確率は$\displaystyle\frac28=\frac14$。
したがって、$1$回目に赤玉、$2$回目に白玉、$3$回目に白玉を引く確率は$$\frac57\times\frac14\times\frac13=\frac5{84}$$となります。

[3]

$\boxed{ \ \mathsf{25}\ }$ ①

$1$回目赤玉~$2$回目赤玉~$3$回目白玉を取り出す確率は$$\frac57\times\frac68\times\frac29=\frac{10}{84}$$
$1$回目赤玉~$2$回目白玉~$3$回目白玉を取り出す確率は$$\frac57\times\frac28\times\frac39=\frac{5}{84}$$
$1$回目白玉~$2$回目白玉~$3$回目白玉を取り出す確率は$$\frac27\times\frac38\times\frac49=\frac{4}{84}$$
$1$回目白玉~$2$回目赤玉~$3$回目白玉を取り出す確率は$$\frac27\times\frac58\times\frac39=\frac{5}{84}$$
したがって、$3$回目白玉を取り出す確率は$$\frac{10}{84}+\frac{5}{84}+\frac{4}{84}+\frac{5}{84}=\frac{24}{84}=\frac{2}{7}$$となります。


問16 解答

(回帰直線、予測)

$\boxed{ \ \mathsf{26}\ }$ ④

単回帰分析では身長を$x$、気管チューブの内径を$y$とおいたとき、その間に$$y=\alpha+\beta x$$という関係式が成り立つと考えて、身長$x$から内径$y$を予測することを考えます。そこで、実際の$x,y$の観測結果から、関係式にある$\alpha,\beta$の予測値$\hat\alpha,\hat\beta$を求めて、これを用いて$x$から$y$の予測値$\hat y$を$$\hat y=\hat\alpha+\hat\beta x$$により求めます。この$\hat\alpha,\hat\beta$は、最小二乗法という手法を用いて、$$\hat\beta=\frac{s_{xy}}{s_x^2}=r_{xy}\frac{s_y}{s_x},\quad \hat\alpha=\bar y-\hat\beta\bar x$$により求められます。ここで、$r_{xy}$は$x$と$y$の相関係数、$s_x$は$x$の標準偏差、$s_y$は$y$の標準偏差、$\bar x$は$x$の平均、$\bar y$は$y$の平均です。(ちなみに$s_{xy}$は$x$と$y$の共分散、$s_x^2$は$x$の分散で、$r_{xy}=s_{xy}/({s_x}{s_y})$の関係があります。)
以上を踏まえ、問題文中の値を代入して$\hat\alpha,\hat\beta$を求めます。問題文から、$$\bar x=110,\ s_x=22,\ \bar y=5.5,\ s_y=1.0,\ r_{xy}=0.94$$なので、$$\begin{eqnarray}\hat\beta&=&r_{xy}\frac{s_y}{s_x}=0.94\times\frac{1.0}{22}\fallingdotseq0.043\\\hat\alpha&=&\bar y-\hat\beta\bar x=5.5-0.043\times110=0.77\end{eqnarray}$$となります。これを用いて$x=122$の時の$\hat y$を求めると、$$\hat y=\hat\alpha+\hat\beta x=0.77+0.043\times122\fallingdotseq6.0$$となります。


問17 解答

(標本平均の標本分布)

$\boxed{ \ \mathsf{27}\ }$ ③

母平均$\mu$,母分散$\sigma^2$をもつ母集団から,大きさ$n$の標本として$X_1,X_2,\cdots,X_n$を無作為抽出するとします。この$X_1,X_2,\cdots,X_n$は確率変数なので,それらの平均$\displaystyle\bar X=\sum_{i=1}^nX_i$もまた確率変数となります。この平均を標本平均といいます。
ここで、$n$が十分大きいとき、標本平均$\bar X$は正規分布$N(\mu$,$\sigma^2/n)$に近似的に従うことがわかっています。よって、分布の散らばり具合は母集団の散らばり具合のおよそ$1/\sqrt{n}$倍となることが見込まれます。
問題では、ヒストグラムから母集団の範囲がおおよそ$20000$なので、標本平均の範囲は$20000/\sqrt{100}=2000$程度になると見込まれます。選択肢のグラフから範囲がおよそ$2000$程度になっているのは③になります。


問18 解答

(標本平均)

$\boxed{ \ \mathsf{28}\ }$ ②

標本平均の標本分布の期待値は$$E(\bar X)=E\left(\frac1n\sum_{i=1}^nX_i\right)=\frac1n\sum_{i=1}^nE(X_i)=\frac1n\sum_{i=1}^n\mu=\mu$$となります。標本平均の標本分布の期待値は必ず$\mu$となりますが、標本平均自体は必ずしも$\mu$に近い値とはなりません。
なお、標本平均の標本分布の分散は$$V(\bar X)=V\left(\frac1n\sum_{i=1}^nX_i\right)=\frac1{n^2}\sum_{i=1}^nV(X_i)=\frac1{n^2}\sum_{i=1}^n\sigma^2=\frac{\sigma^2}{n}$$となり、$n$に依存します。
また、$n$が十分大きいときは標本平均の標本分布は正規分布で近似できますが、$n$が小さいときは必ずしも正規分布とはなりません。


問19 解答

(信頼区間)

$\boxed{ \ \mathsf{29}\ }$ ②

母平均$\mu$,母分散$\sigma^2$をもつ母集団から$n$個の確率変数$X_1,X_2,\cdots,X_n$ が互いに独立に無作為抽出された場合,$n$が十分に大きいとき,標本平均$\bar X$は正規分布$N(\mu$,$\sigma^2/n)$に近似的に従うので、$\bar X$を標準化した$\displaystyle Z=\frac{\bar X−\mu}{\sigma/\sqrt{n}}$は標準正規分布$N(0,1)$に近似的に従います。したがって,母平均$\mu$に対する信頼度$100(1-\alpha)\%$の信頼区間は、$$\bar X-z(\alpha/2)\frac{\sigma}{\sqrt{n}}\le\mu\le\bar X+z(\alpha/2)\frac{\sigma}{\sqrt{n}}$$となり、信頼区間の幅は$$2z(\alpha/2)\frac{\sigma}{\sqrt{n}}$$となります。なお、$z(\alpha)$は標準正規分布の$\alpha$点からの上側確率を表します。

Ⅰ.信頼度が大きくなれば、信頼区間の幅は広がります。
※信頼度$95\%$の信頼区間の幅は、標準正規分布の上側確率の表から$z(0.05/2)=z(0.025)=1.96$なので$$2z(0.025)\frac{\sigma}{\sqrt{n}}=2\times1.96\times\frac{2}{\sqrt{10}}\fallingdotseq2.48$$となり、一方、信頼度$99\%$の信頼区間の幅は、標準正規分布の上側確率の表から$z(0.01/2)=z(0.005)=2.575$なので$$2z(0.005)\frac{\sigma}{\sqrt{n}}=2\times2.575\times\frac{2}{\sqrt{10}}\fallingdotseq3.26$$となります。
Ⅱ.標本の数が大きくなれば、信頼区間の幅は狭くなります。
※標本数が$50$の時の信頼区間の幅は$$2z(0.025)\frac{\sigma}{\sqrt{n}}=2\times1.96\times\frac{2}{\sqrt{50}}\fallingdotseq1.11$$となります。
Ⅲ.パンの見た目で、パンの重さの平均の信頼区間は必ずしも狭くなりません。(信頼区間の幅は母分散の標準偏差と標本数で決まります。)


問20 解答

(仮設検定)

$\boxed{ \ \mathsf{30}\ }$ ④

問題の検定では、有意水準$5\%$で、賛成派の人数が$526$以上のとき帰無仮説を棄却することになっています。したがって、賛成派の人数が$534$人だった場合、帰無仮説は棄却されます。帰無仮説($p=0.5$)が棄却されたので、対立仮説($p>0.5$)が採用され、賛成派の比率は$\underline5$割より高くなります。