8章「母比率の区間推定」の練習問題解答例〜例題で学ぶ初歩からの統計学[第2版]〜

当記事は「白砂, 例題で学ぶ初歩からの統計学 第2版 (日本評論社)」の読解サポートにあたって8章「母比率の区間推定」の練習問題を解説します。
基本的には書籍の購入者向けの解説なので、まだ入手されていない方は下記より入手をご検討ください。また、解説はあくまでサイト運営者が独自に作成したものであり、書籍の公式ページではないことにご注意ください。(そのため著者の意図とは異なる解説となる可能性はあります)

執筆:@kakusan96

演習問題解答例

8-1 母比率の区間推定

二項分布の母集団から無作為に抽出した標本より標本比率$\hat{p}$を求めると$\hat{p}$はnが大きくなるにつれて近似的に正規分布$\mathcal{N}(p, \frac{p(1-p)}{n})$に近似できる。
よって、$\hat{p}$を標準化した値zの分布は標準正規分布$\mathcal{N}(0, 1)$に従う。

$$
z = \frac{\hat{p} – p}{\sqrt{\frac{p(1-p)}{n}}}
$$

ここで標本数nが十分に大きいとき、母比率pは標本比率$\hat{p}$に近似することが可能である。
信頼係数が$\alpha$の時、標準正規分布において上側確率が$\frac{1-\alpha}{2}$になるz値を$z_{\frac{1-\alpha}{2}}$としたとき

$$
\begin{align}
– z_{\frac{1-\alpha}{2}} \leq &\frac{\hat{p} – p}{\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}} \leq + z_{\frac{1-\alpha}{2}} \\
\hat{p} – z_{\frac{1-\alpha}{2}} \times\sqrt{\frac{\hat{p}(1-\hat{p})}{n}} \leq &p \leq \hat{p} + z_{\frac{1-\alpha}{2}} \times\sqrt{\frac{\hat{p}(1-\hat{p})}{n}} 
\end{align}
$$

ちなみによく用いられる信頼係数αはα=90、α=95、α=99であり、その場合のz値はそれぞれ標準正規分布表より以下の通りとなる。

$$
\begin{align}
z_{0.05} &=1.645 \\
z_{0.025} &=1.96 \\
z_{0.005} &=2.576\\
\end{align}
$$

である。よって、それぞれ信頼係数におけるの推定区間は以下のようになる。

信頼区間$90$%

$$
\begin{align}
\hat{p} – z_{0.05} \times\sqrt{\frac{\hat{p}(1-\hat{p})}{n}} \leq &p \leq \hat{p} + z_{0.05} \times\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}  \\
\hat{p} – 1.645 \times\sqrt{\frac{\hat{p}(1-\hat{p})}{n}} \leq &p \leq \hat{p} + 1.645 \times\sqrt{\frac{\hat{p}(1-\hat{p})}{n}} 
\end{align}
$$

信頼区間$95$%

$$
\begin{align}
\hat{p} – z_{0.025} \times\sqrt{\frac{\hat{p}(1-\hat{p})}{n}} \leq &p \leq \hat{p} + z_{0.025} \times\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}  \\
\hat{p} – 1.96 \times\sqrt{\frac{\hat{p}(1-\hat{p})}{n}} \leq &p \leq \hat{p} + 1.96 \times\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}
\end{align}
$$

信頼区間$99$%

$$
\begin{align}
\hat{p} – z_{0.005} \times\sqrt{\frac{\hat{p}(1-\hat{p})}{n}} \leq &p \leq \hat{p} + z_{0.005} \times\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}  \\
\hat{p} – 2.576 \times\sqrt{\frac{\hat{p}(1-\hat{p})}{n}} \leq &p \leq \hat{p} + 2.576 \times\sqrt{\frac{\hat{p}(1-\hat{p})}{n}} 
\end{align}
$$

標本比率$\hat{p}$は $\hat{p} = \frac{578}{850} = 0.68$ であるのでそれぞれの推定区間は以下の通り。

①信頼区間$90$%

$$
\begin{align}
\hat{p} – z_{0.05} \times\sqrt{\frac{\hat{p}(1-\hat{p})}{n}} \leq &p \leq \hat{p} + z_{0.05} \times\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}  \\
0.68 – 1.645 \times\sqrt{\frac{0.68(1-0.68)}{850}} \leq &p \leq 0.68 + 1.645 \times\sqrt{\frac{0.68(1-0.68)}{850}} \\
0.65368\leq &p \leq 0.70632
\end{align}
$$

②信頼区間$95$%

$$
\begin{align}
\hat{p} – z_{0.025} \times\sqrt{\frac{\hat{p}(1-\hat{p})}{n}} \leq &p \leq \hat{p} + z_{0.025} \times\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}  \\
0.68 – 1.96 \times\sqrt{\frac{0.68(1-0.68)}{850}} \leq &p \leq 0.68 + 1.96 \times\sqrt{\frac{0.68(1-0.68)}{850}}  \\
0.64864\leq &p \leq 0.71136
\end{align}
$$

③信頼区間$99$%

$$
\begin{align}
\hat{p} – z_{0.005} \times\sqrt{\frac{\hat{p}(1-\hat{p})}{n}} \leq &p \leq \hat{p} + z_{0.005} \times\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}  \\
0.68 – 2.576 \times\sqrt{\frac{0.68(1-0.68)}{850}} \leq &p \leq 0.68 + 2.576 \times\sqrt{\frac{0.68(1-0.68)}{850}}  \\
0.638784\leq &p \leq 0.721216\\
\end{align}
$$

8-2 母比率の区間推定・標本の大きさの決定[標本比率pの情報あり]

標本比率$\hat{p}$は$\hat{p} = \frac{96}{2400}= 0.04$である。

①区間推定
区間推定値は8-1と同様に計算できる。

(1)信頼区間$90$%

$$
\begin{align}
\hat{p} – z_{0.05} \times\sqrt{\frac{\hat{p}(1-\hat{p})}{n}} \leq &p \leq \hat{p} + z_{0.05} \times\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}  \\
0.04 – 1.645 \times\sqrt{\frac{0.04(1-0.04)}{2400}} \leq &p \leq 0.04 + 1.645 \times\sqrt{\frac{0.04(1-0.04)}{2400}}  \\
0.03342\leq &p \leq 0.04658
\end{align}
$$

(2)信頼区間$95$%は

$$
\begin{align}
\hat{p} – z_{0.025} \times\sqrt{\frac{\hat{p}(1-\hat{p})}{n}} \leq &p \leq \hat{p} + z_{0.025} \times\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}  \\
0.04 – 1.96 \times\sqrt{\frac{0.04(1-0.04)}{2400}} \leq &p \leq 0.04 + 1.96 \times\sqrt{\frac{0.04(1-0.04)}{2400}}  \\
0.03216\leq &p \leq 0.04784
\end{align}
$$

(3)信頼区間$99$%

$$
\begin{align}
\hat{p} – z_{0.005} \times\sqrt{\frac{\hat{p}(1-\hat{p})}{n}} \leq &p \leq \hat{p} + z_{0.005} \times\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}  \\
0.04 – 2.576 \times\sqrt{\frac{0.04(1-0.04)}{2400}} \leq &p \leq 0.04 + 2.576 \times\sqrt{\frac{0.04(1-0.04)}{2400}}  \\
0.029696\leq &p \leq 0.050304\\
\end{align}
$$

②標本の大きさ

母比率を$p$、標本比率を$\hat{p}$、推定の誤差$|\hat{p}-p|$をある値$e$以下のしたいとき、前述の信頼区間を推定する式より

$$
\begin{align}
&- z_{\frac{1-α}{2}} \leq \frac{\hat{p} – p}{\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}} \leq + z_{\frac{1-α}{2}}\\
&|\hat{p} – p| \leq z_{\frac{1-α}{2}} \times \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}
\end{align}
$$

右辺が推定の誤差$e$以下になるようにおくと

$$
\begin{align}
&z_{\frac{1-α}{2}} \times \sqrt{\frac{\hat{p}(1-\hat{p})}{n}} \leq e\\
&\frac{\hat{p}(1-\hat{p})}{n} \leq \left( \frac{e}{z_{\frac{1-α}{2}}} \right)^2 \\
&n \geq \left( \frac{z_\frac{1-α}{2}}{e} \right)^2 \times \hat{p}(1-\hat{p})
\end{align}
$$

よって母比率$p$の区間推定において推定の誤差$|\hat{p}-p|$をある値$e$以下のしたいとき必要な標本の大きさnは信頼区間$90$%において

$$
\begin{align}
&n \geq \left( \frac{z_{0.05}}{e} \right)^2\hat{p}(1-\hat{p})\\
&n \geq \left( \frac{1.645}{e} \right)^2\hat{p}(1-\hat{p})
\end{align}
$$

信頼区間$95$%において

$$
\begin{align}
&n \geq \left( \frac{z_{0.025}}{e} \right)^2\hat{p}(1-\hat{p})\\
&n \geq \left( \frac{1.96}{e} \right)^2\hat{p}(1-\hat{p})
\end{align}
$$

信頼区間$99$%において

$$
\begin{align}
n \geq \left( \frac{z_{0.005}}{e} \right)^2\hat{p}(1-\hat{p})\\
n \geq \left( \frac{2.576}{e} \right)^2\hat{p}(1-\hat{p})\\
\end{align}
$$

となる。

上記より信頼区間$99$%において、推定の誤差が$0.5$%以下になるような標本の大きさは

$$
\begin{align}
&n \geq \left( \frac{2.576}{0.005} \right)^2{0.04}(1-0.04)\\
&n \geq 10192.551936
\end{align}
$$

よって標本の大きさは少なくとも$10,193$以上にする必要がある。

8-3 母比率の区間推定の応用

標本比率$\hat{p}$は$\hat{p} = \frac{20}{100} = 0.2$。
8-1と同様に推定区間を求められる。
①90%信頼区間

$$
\begin{align}
0.2 – 1.645 \times\sqrt{\frac{0.2(1-0.2)}{100}} \leq &p \leq 0.2 + 1.645 \times\sqrt{\frac{0.2(1-0.2)}{100}}  \\
0.1342 \leq &p \leq 0.2658
\end{align}
$$

よって、②タヌキの総数を$n$とおくと

$$
\begin{align}
0.1342 \leq &\frac{300}{n} \leq 0.2658 \\
\frac{300}{0.2658} \leq &n \leq \frac{300}{0.1342}\\
1128.66 \leq &n \leq 2235.46
\end{align}
$$

よってタヌキの総数の$95$%信頼区間は$1128$匹以上$2236$匹以下である。

8-4 母比率の区間推定・標本の大きさの決定[標本比率pの情報あり]

標本比率$\hat{p}$は$\hat{p} = \frac{1470}{2100} = 0.7$

8-1と同様に①信頼区間は以下のようになる

(1)信頼区間90%

$$
\begin{align}
0.7 – 1.645 \times\sqrt{\frac{0.7(1-0.7)}{2100}} \leq &p \leq 0.7 + 1.645 \times\sqrt{\frac{0.7(1-0.7)}{2100}}  \\
0.68355\leq &p \leq 0.71645
\end{align}
$$

(2)信頼区間95%

$$
\begin{align}
0.7 – 1.96 \times\sqrt{\frac{0.7(1-0.7)}{2100}} \leq &p \leq 0.7 + 1.96 \times\sqrt{\frac{0.7(1-0.7)}{2100}}  \\
0.6804\leq &p \leq 0.7196
\end{align}
$$

(3)信頼区間99%

$$
\begin{align}
0.7 – 2.576 \times\sqrt{\frac{0.7(1-0.7)}{2100}} \leq &p \leq 0.7 + 2.576 \times\sqrt{\frac{0.7(1-0.7)}{2100}}  \\
0.67424\leq &p \leq 0.72576\\
\end{align}
$$

②推定の誤差が95%信頼区間において1%以下になる標本の大きさは8-2と同様に

$$
\begin{align}
n &\geq (\frac{1.96}{0.01})^2{0.7}(1-0.7)\\
n &\geq 8067.36
\end{align}
$$

よって標本の大きさは少なくとも8,068以上にする必要がある

8-5 標本の大きさの決定[標本比率$p$の情報なし]

母比率pの区間推定において標本比率$\hat{p}$がわからないとき推定の誤差$|\hat{p}-p|$をある値e以下にしたいとき必要な標本の大きさnは$\hat{p}(1-\hat{p})$の最大値である$\frac{1}{4}$を代用して推定する。

$$
\begin{align}
n &\geq \left( \frac{z_\frac{1-α}{2}}{e} \right)^2 \times \hat{p}(1-\hat{p})\\
n &\geq \left( \frac{z_\frac{1-α}{2}}{e} \right)^2 \times \frac{1}{4}
\end{align}
$$

よって上記の式より

$$
\begin{align}
n &\geq \left( \frac{1.96}{0.04} \right)^2\times\frac{1}{4}\\
n &\geq 600.25
\end{align}
$$

よって必要な標本の大きさは$601$以上である。