統計検定準1級 問題解説 ~2017年6月実施 選択問題及び部分記述問題 問6~

過去問題

過去問題は統計検定公式が問題と解答例を公開しています。こちらを参照してください。

解答

[1] 解答

$\boxed{ \ \mathsf{5}\ }$ : ②

母集団において,イチロー選手が好きと回答する人の割合(母比率)を $p$ とすると,イチロー選手以外が好きと回答する人の割合(母比率)は $1-p$ である.
857人の有効回答を $X_1,X_2,\dots, X_{857}$ とすると,これらはそれぞれが独立に確率 $p$ のベルヌーイ分布 $Ber(p)$ に従うと考えられる.

したがって, $X =\sum_{i=1}^{857}X_i$ は 二項分布 $B(857,p)$ に従う.

$n=857$ は十分大きいとみなして, $B(857,p)$ を正規分布 $N(857p,857p(1-p))$ で近似する.つまり,$X\sim N(857p,857p(1-p))$ とみなす.
標本比率を $\hat{p} = \dfrac{X}{857}$ とすると,$\hat{p}\sim N\left(p,\dfrac{p(1-p)}{857}\right)$ となる.
ここで,$z = \dfrac{\hat{p}-p}{\sqrt{p(1-p)/857}}$ とすると,$z\sim N(0,1)$ であるから,$P(-1.96 \leq z \leq 1.96) = 0.95$ より,$-1.96 \leq z \leq 1.96$ を整理すると,

\[
           \hat{p} -1.96\sqrt{\dfrac{p(1-p)}{857}} \leq p \leq \hat{p} +1.96\sqrt{\dfrac{p(1-p)}{857}}.
\]

ここで,左辺と右辺の$p$ を $\hat{p} = \dfrac{192}{857} = 0.224$ で置き換える.

すると,$0.224 \pm 1.96\sqrt{ \dfrac{0.224\times 0.776}{857} } = 0.224 \pm 0.0279$ であるから,$p$ の95%信頼区間は$(0.1961, 0.2519)$ となる.

[2] 解答

$\boxed{ \ \mathsf{6}\ }$ : ⑤

母集団において,イチロー選手が好きと回答する人の割合(母比率)を $p_1$,錦織圭選手が好きと回答する人の割合(母比率)を$p_2$とすると,その2人以外の人が好きと回答する割合(母比率)は$1-p_1-p_2$である.

また,$X_1$ をイチロー選手が好きと回答する人数,$X_2$ を錦織圭選手が好きと回答する人数,$X_3$ をイチロー選手,錦織圭選手以外が好きと回答する人数とすると,$X=(X_1,X_2,X_3)$ は多項分布 $M(n;p_1,p_2,1-p_1-p_2)$に従う($n=857$).
また,$\hat{p}_1=\dfrac{X_1}{n}=0.224,\hat{p}_2=\dfrac{X_2}{n}=0.169$ はそれぞれ$p_1$,$p_2$の最尤推定量である.

求めるものは差の標準偏差

$$
\begin{align*}
           \sqrt{V[\hat{p}_1-\hat{p}_2]} &= \sqrt{V\left[\dfrac{X_1}{n}-\dfrac{X_2}{n}\right]}\\
                                         &= \dfrac{\sqrt{V\left[X_1-X_2\right]}}{n}\\
                                         &= \dfrac{\sqrt{V[X_1]+V[X_2]-2\mathrm{Cov}[X_1,X_2]}}{n}
\end{align*}
$$

である($X_1$ と $X_2$は独立でないため,$V[X_1-X_2] \neq V[X_1] +V[X_2]$ に注意).
この式に,多項分布における分散と共分散 $V[X_1] = np_1(1-p_1)$, $V[X_2] = np_2(1-p_2)$,$ \mathrm{Cov}[X_1,X_2] = -np_1p_2$を代入すると,

$$
\begin{align*}
           &\dfrac{\sqrt{np_1(1-p_1) + np_2(1-p_2) +2np_1p_2}}{n} \\
           =&\dfrac{\sqrt{p_1(1-p_1) + p_2(1-p_2) +2p_1p_2}}{\sqrt{n}}   
\end{align*}
$$

となる.さらに,$p_1,p_2$ に$\hat{p}_1 = 0.224, \hat{p}_2 = 0.169$ を代入し,$n=857$ とすると,

\[
           \dfrac{\sqrt{0.224 \cdot 0.776 + 0.169 \cdot 0.831 + 2 \cdot 0.224 \cdot 0.169}}{\sqrt{857}} = 0.021331823
\]

となる.

参考

・準$1$級関連まとめ
https://www.hello-statisticians.com/toukeikentei-semi1