統計検定2級問題解説 ~2017年11月実施~ (その2)

過去問題

過去問題は統計検定公式問題集が問題と解答例を公開しています。こちらを参照してください。


問9 解答

(標準正規分布,$t$分布,$\chi^2$分布,$F$分布)

[1]

$\boxed{ \ \mathsf{17}\ }$ ⑤

・確率変数 $Z_1,Z_2,\dots,Z_n$ が互いに独立に標準正規分布$N(0,1)$に従うとき$$W=Z_1^2+Z_2^2+\cdots+Z_n^2$$は自由度$n$のカイ二乗分布に従う。
・標準正規分布$N(0,1)$に従う確率変数 $Z$ が $W$ と独立であれば$$\frac Z{\sqrt{W/n}}$$は自由度$n$の$t$分布に従う。
・確率変数 $W_1,W_2$ が互いに独立に自由度 $m_1,m_2$ のカイ二乗分布に従うとき$$\frac{W_1/m_1}{W_2/m_2}$$は自由度 $(m_1,m_2)$の$F$分布に従う。

[2]

$\boxed{ \ \mathsf{18}\ }$ ②

$Y$は自由度$(20,10)$の$F$分布に従う。([1]の定義から)
ここで,$1/Y$は自由度$(10,20)$のF分布に従うから$$P(Y\le a)=P\left(\frac1Y\ge\frac1a\right)=0.05$$となる$1/a$を求めればよい。$F$分布表から$$\frac1a=2.348\ \ \Rightarrow\ \ a=\frac1{2.348}$$


問10 解答

(標準正規分布,標本平均の確率分布)

[1]

$\boxed{ \ \mathsf{19}\ }$ ①

$X_1\sim N(50,10^2)$なので,標準正規分布に従う確率変数を$Z\sim N(0,1)$とするとき$$Z=\frac{X_1-50}{10},\ \ P(X_1\ge60)=P(Z\ge\frac{60-50}{10})=P(Z\ge1)=0.1587$$

[2]

$\boxed{ \ \mathsf{20}\ }$ ④

$1$人が$60$点以上取る確率は[1]で計算した。よって求める確率は$${}_5\mathrm{C}_1\times0.1587^1\times(1-0.1587)^4=0.3975$$

[3]

$\boxed{ \ \mathsf{21}\ }$ ②

$5$人の点数の標本平均$Y=(X_1+\cdots+X_5)/5$は平均$50$,標準偏差$10/\sqrt{5}$の正規分布に従う(中心極限定理)。
よって,$$P(Y\ge52)=P\left(\frac{Y-50}{10/\sqrt{5}}\ge\frac{52-50}{10/\sqrt{5}}\right)=P(Z\ge0.447)\fallingdotseq0.33$$


問11 解答

(ポアソン分析)

ポアソン分布:
 二項分布$B(n,p)$において,期待値$np=\lambda$を固定し,$n\rightarrow\infty,\ p\rightarrow0$ のような極限を取った時の確率分布。試行回数が大きく成功確率が低いことから,まれに起きる現象に対する確率分布として使われる。
 確率密度関数:$\begin{align}f(x)=\frac{\lambda^xe^{-\lambda}}{x!}\ \ (x=0,1,2,\dots)\end{align}$
 期待値:$E[X]=\lambda$ 分散:$V[X]=\lambda$
<証明>$$\begin{align}    E(X)&=\sum_{x=1}^\infty xP(X=x)=\sum_{x=1}^\infty x\frac{\lambda^x}{x!}e^{-\lambda}\\    &=e^{-\lambda}\lambda\sum_{x-1=0}^\infty \frac{\lambda^{x-1}}{(x-1)!}    =e^{-\lambda}\lambda e^{\lambda}=\lambda\\    E(X(X-1))&=\sum_{x=1}^\infty x(x-1)P(X=x)=\sum_{x=1}^\infty x(x-1)\frac{\lambda^x}{x!}e^{-\lambda}\\    &=e^{-\lambda}\lambda^2\sum_{x-2=0}^\infty \frac{\lambda^{x-2}}{(x-2)!}    =e^{-\lambda}\lambda^2 e^{\lambda}=\lambda^2\\    V(X)&=E(X(X-1))+E(X)-E(X)^2=\lambda^2+\lambda-\lambda^2=\lambda\end{align}$$

[1]

$\boxed{ \ \mathsf{22}\ }$ ②

ポワソン分布では分散は期待値(平均)に等しい。

[2]

$\boxed{ \ \mathsf{23}\ }$ ③

ポワソン分布で$x=0$の時の確率を求めればよい。$$P(X=0)=f(0)=\frac{\lambda^0e^{-\lambda}}{0!}=\frac1{e^{518/365}}\fallingdotseq\frac1{4.19}=0.24$$


問12 解答

(重回帰モデル,回帰係数の検定,統計ソフトウェアの活用)

※重回帰モデルの統計ソフトウェアによる出力結果の主な項目
$\mathtt{Estimate}$:回帰係数($\alpha,\beta_1,\beta_2,\beta_3$)の推定値
$\mathtt{Std.Error}$:回帰係数の推定値の標準誤差
$\mathtt{t\ value}$:$t$値,$\mathtt{Pr(\gt|t|)}$:$P_-$値・・・回帰係数の検定で使う
$\mathtt{Rasidual\ standard\ error}$:誤差項の標準偏差の推定値
$\mathtt{degrees\ of\ freedom}$:自由度
$\mathtt{Multiple\ R-squared}$:決定係数($R^2$)
$\mathtt{Adjusted\ R-squared}$:自由度調整済み決定係数($R^{*2}$)
$\mathtt{F-statistic}$:$F$検定統計量,$\mathtt{p-value}$:$P_-$値・・・回帰の有意性の検定で使う

[1]

$\boxed{ \ \mathsf{24}\ }$ ⑤

このモデルの誤差項の標準偏差の自由度は標本のサイズから推定された回帰係数(定数項含む)の数を差し引いたものになる。
出力結果から誤差項の標準偏差の自由度は$199$,回帰係数の数は$2$なので,標本のサイズは$199+2=201$

[2]

$\boxed{ \ \mathsf{25}\ }$ ①

回帰係数の検定では母分散が未定の時に使われる$t$検定を行うのが標準的である。このとき,$t$検定統計量は  $$t=\frac{\hat\beta-\beta_0}{\mathrm{se}(\hat\beta)}=\frac{-4.89615-(-1)}{0.28922}$$ここで,$\hat\beta$は$\beta$の推定値,$\mathrm{se}(\hat\beta)$は標準誤差である。

[3]

$\boxed{ \ \mathsf{26}\ }$ ③

Ⅰ.$\mathrm{log}$(販売価格)の回帰係数が$-4.89615$なので,正しい。
Ⅱ.$\mathrm{log}$(販売価格)の回帰係数が負なので,販売価格が大きくなると,予測値である販売数量は小さくなる。正しい。
Ⅲ.モデル式に値を代入すると$7.92546+(-4.89615)\times(-0.3)=9.394$となる。誤り。


問13 解答

(母比率の区間推定,母比率の差の区間推定・検定)

[1]

$\boxed{ \ \mathsf{27}\ }$ ③

成功確率$p$の試行を$n$回行うときに成功する回数$X$は二項分布$B(n,p)$に従う。
$\therefore\ \ E(X)=np,\ V(X)=np(1-p)$このとき,$n$がある程度大きいときは,中心極限定理によって,$B(n,p)$は正規分布$N(mp,np(1-p))$に近似できる。よって,$X$を標準化すると標準正規分布$N(0,1)$に従う。$$Z=\frac{X-np}{\sqrt{np(1-p)}}=\frac{X/n-p}{\sqrt{\frac{p(1-p)}n}}\sim N(0,1)$$ここで,標本比率 $\hat p=x/n$は$p$の一致推定量なので,$n$が十分大きいとき$p$は$\hat p$に置き換えられる。
したがって,母比率の$100(1-\alpha)\%$信頼区間は,標準正規分布の上側 $100\alpha/2\%$ 点を $z_{\alpha/2}$とすると,$$P\left(\hat p-z_{\alpha/2}\sqrt{\frac{\hat p(1-\hat p)}n}\le p\le\hat p+z_{\alpha/2}\sqrt{\frac{\hat p(1-\hat p)}n}\right)=1-\alpha$$
「非常に関心がある」の母比率の$95\%$信頼区間は,$n=1897$,$\hat p=0.483$,$\alpha=0.05$として$$\hat p\pm z_{\alpha/2}\sqrt{\frac{\hat p(1-\hat p)}n}=0.483\pm1.96\times\sqrt{\frac{0.483\times(1-0.483)}{1897}}=0.483\pm0.022$$

[2]

$\boxed{ \ \mathsf{28}\ }$ ②

2つの母集団からの標本に基づいて,2つの母集団の母比率$p_1,p_2$に差があるかの検定を行う。
帰無仮説を$H_0:p_1=p_2$とする。$n_1,n_2$が十分大きいとき,標本比率$\hat p_1=x_1/n_1, \hat p_2=x_2/n_2$は近似的に正規分布$\hat p_1\sim N(p_1,p_1(1-p_1)/n_1), \hat p_2\sim N(p_2,p_2(1-p_2)/n_2)$に従うので,2つの標本比率の差も正規分布に従う。$$\hat p_1-\hat p_2\sim N\left(p_1-p_2, \frac{p_1(1-p_1)}{n_1}+\frac{p_2(1-p_2)}{n_2}\right)$$$z$を以下のとおりにすると,標準正規分布に従う。ここで,標本比率$\hat p_1,\hat p_2$は母比率の一致推定量なので,分散に含まれている$p_1,p_2$は$n_1,n_2$が十分大きいとき$\hat p_1,\hat p_2$に置き換えることができる。$$z=\frac{(\hat p_1-\hat p_2)-(p_1-p_2)}{\sqrt{\frac{\hat p_1(1-\hat p_1)}{n_1}+\frac{\hat p_2(1-\hat p_2)}{n_2}}}$$これを用いて,$p_1-p_2$の$95\%$信頼区間を求めると$$\begin{align}&(\hat p_1-\hat p_2)\pm z_{0.025}\sqrt{\frac{\hat p_1(1-\hat p_1)}{n_1}+\frac{\hat p_2(1-\hat p_2)}{n_2}}\\=&(0.483-0.416)\pm1.96\sqrt{\frac{0.483\times(1-0.483)}{1897}+\frac{0.416\times(1-0.416)}{1925}}\\=&0.067\pm1.96\sqrt{\frac{0.483\times0.517}{1897}+\frac{0.416(1-0.416)}{1925}}\\=&0.067\pm0.0315\end{align}$$となる。$95\%$信頼区間$[0.036,0.098]$は$0$を含まないので,有意水準$5\%$で母比率の差は$0$でないといえる(帰無仮説は棄却される)。


問14 解答

(仮説検定の理論,検出力,$P_-$値)

真実
帰無仮説が正しい対立仮説が正しい
検定の結果帰無仮説を棄却しない
(対立仮説が正しいとは言えない)
正しい第二種の過誤(β)
帰無仮説を棄却する
(対立仮説が正しい)
第一種の過誤(α)
有意水準
正しい
検出力(1-β)

$\boxed{ \ \mathsf{29}\ }$ ⑤

Ⅰ.検出力は対立仮説が正しいときに帰無仮説を棄却する確率である。誤り。
Ⅱ.$P_-$値は,帰無仮説が正しいときに「検定統計量が実現と同じかそれ以上に極端な値をとる確率」と定義される。$P_-$値が有意水準より小さいときは検定統計値が棄却域にあるので,帰無仮説は棄却される。正しい。
Ⅲ.$P_-$値は確率なので$0$以上$1$以下である。正しい。


問15 解答

(適合度の検定)

適合度の検定は,ある属性$A$の$k$個のカテゴリの値が理論値に適合しているかどうかの検定。
属性$A$のカテゴリ$A_i$の観測度数を$O_{i}$とし,属性$A$のカテゴリ$A_i$の理論的な出現確率を$p_i$とする。<br/>理論値に適合するという帰無仮説を$H_0:P(A_i)=p_i\ (i=1,2,\cdot,k, \sum p_i=1)$とすると,カテゴリ$A_i$の理論的な期待度数は$E_i=np_i$と計算される。
 帰無仮説$H_0$の下で,検定統計量$\chi^2$は度数が大きいときに近似的に$\chi^2$分布に従う。カテゴリ数の合計が固定されていることから自由度は$k$(カテゴリ数)$-1$となる。$$\chi^2=\sum_{i=1}^k\frac{(O_{i}-E_{i})^2}{E_i}\sim\chi^2(k-1)$$有意水準$100\alpha\%$で帰無仮説が棄却されるには,$\chi^2$分布の上側$\alpha$点より上で求めた$\chi^2$統計量が大きくなればよい。

[1]

$\boxed{ \ \mathsf{30}\ }$ ②

自由度は(カテゴリ数)$-1=3-1=2$

[2]

$\boxed{ \ \mathsf{31}\ }$ ⑤

$\chi^2$検定量は$$\chi^2=\frac{(5-0.2\times50)^2}{0.2\times50}+\frac{(12-0.3\times50)^2}{0.3\times50}+\frac{(33-0.5\times50)^2}{0.5\times50}=5.66$$自由度$2$のカイ二乗分布の上側$5\%$点は$\chi^2$分布表から$5.99$
よって,帰無仮説は棄却することができない。


問16 解答

(一元配置分散分析)

帰無仮説$H_o:$「各カテゴリの平均は同じである。」,対立仮説$H_1:$「少なくとも2つのカテゴリの平均は同じでないものがある。」としたときの$F$検定を行う。 
分散分析表(カテゴリ数を$n_i$とする)

変動要因平方和自由度分散$F$値
水準間$S_A=\sum_{j=1}^{n_i}\sum_{i=1}^{n_j}(\bar y_{j\cdot}-\bar y_{\cdot\cdot})^2$
$=\sum_{j=1}^{n_i}n_j(\bar y_{j\cdot}-\bar y_{\cdot\cdot})^2$
$\phi_A=n_i-1$$V_A=S_A/\phi_A$$F=V_A/V_E$
残差$S_E=\sum_{j=1}^{n_i}\sum_{i=1}^{n_j}(y_{ji}-\bar y_{j\cdot})^2$$\phi_E=\sum_{j=1}^{n_i}n_j-n_i$$V_E=S_E/\phi_E$
合計$S_A+S_E$$\phi=\sum_{j=1}^{n_i}n_j-1$


この検定統計量$F$が自由度$(\phi_A,\phi_E)$の$F$分布に従うものとして検定を行う。

[1]

$\boxed{ \ \mathsf{32}\ }$ ②

要約統計量の表にある各地域の平均値を,各地域の観測数で加重平均をとれば,全体の平均が求められる。$$210\times27+89\times13+712\times2+515\times31+192\times7+559\times3)/83=328.1566$$

[2]

$\boxed{ \ \mathsf{33}\ }$ ④

上の分散分析表より,$F_-$値は,$n_i=6,\sum_{j=1}^{n_i}n_j=83$なので,$$F=\frac{S_A/\phi_A}{S_E/\phi_E}=\frac{\sum_{j=1}^6n_j(\bar y_{j\cdot}-\bar y_{\cdot\cdot})^2/5}{\sum_{j=1}^6\sum_{i=1}^{n_j}(y_{ji}-\bar y_{j\cdot})^2/77}$$

[3]

$\boxed{ \ \mathsf{34}\ }$ ①

Ⅰ.統計ソフトウェアの一元配置分散分析の出力結果から,$P_-$値が$1\%$より小さいので,$F_-$値は$F$分布の上側$1\%$点よりも大きい。正しい。
Ⅱ.$P_-$値が$1\%$より小さいので,帰無仮説は棄却され,少なくとも2つの地域間で平均の信頼区間に重なりがない。誤り。
Ⅲ.出力結果から,$P_-$値が$1\%$より小さい。誤り。