7章「母平均の区間推定」の練習問題解答例〜例題で学ぶ初歩からの統計学[第2版]〜

当記事は「白砂, 例題で学ぶ初歩からの統計学 第2版 (日本評論社)」の読解サポートにあたって7章「母平均の区間推定」の練習問題を解説します。
基本的には書籍の購入者向けの解説なので、まだ入手されていない方は下記より入手をご検討ください。また、解説はあくまでサイト運営者が独自に作成したものであり、書籍の公式ページではないことにご注意ください。(そのため著者の意図とは異なる解説となる可能性はあります)

執筆:@kakusan96

演習問題解答例

7.1 母平均の区間推定 [正規母集団で母標準偏差$\sigma$が既知:$n \ge 30$]

母集団が平均$\mu$、$分散\sigma^2$の正規分布の時、標本$\bar{X}$の分布は$平均\mu$、$分散\frac{\sigma^{2}}{n}$の正規分布になる。よって$\bar{X}$を標準化した$z = \frac{\bar{X}-\mu}{\frac{\sigma}{\sqrt{n}}}$は標準正規分布$\mathcal{N}(0, 1)$に従う。信頼係数が$\alpha$の時、標準正規分布において上側確率が$\frac{1-\alpha}{2}$になるz値を$z_{\frac{1-\alpha}{2}}$としたとき

$$
\begin{align}
-z_{\frac{1-\alpha}{2}} \leq &\frac{\bar{X}-\mu}{\frac{\sigma}{\sqrt{n}}} \leq z_{\frac{1-\alpha}{2}}\\
-z_{\frac{1-\alpha}{2}} \times \frac{\sigma}{\sqrt{n}} \leq &\bar{X}-\mu \leq z_{\frac{1-\alpha}{2}} \times \frac{\sigma}{\sqrt{n}}\\
\bar{X} – z_{\frac{1-\alpha}{2}} \times \frac{\sigma}{\sqrt{n}} \leq &\mu \leq \bar{X} + z_{\frac{1-\alpha}{2}} \times \frac{\sigma}{\sqrt{n}}
\end{align}
$$

にて信頼区間を推定することができる。
ちなみによく用いられる信頼係数$\alpha$は$\alpha=90$、$\alpha=95$、$\alpha=99$であり、その場合の$z$値はそれぞれ標準正規分布表より

$$
\begin{align}
&z_{0.05}=1.645\\
&z_{0.025}=1.96\\
&z_{0.005}=2.576
\end{align}
$$

である。よって母標準偏差が既知の場合、信頼区間は以下のようにして求めることができる。

信頼区間$90$%

$$
\begin{align}
\bar{X} – z_{0.05} \times \frac{\sigma}{\sqrt{n}}\leq \mu \leq \bar{X} + z_{0.05} \times \frac{\sigma}{\sqrt{n}}\\
\bar{X} – 1.645 \times \frac{\sigma}{\sqrt{n}}\leq \mu \leq \bar{X} + 1.645 \times \frac{\sigma}{\sqrt{n}}
\end{align}
$$

信頼区間$95$%

$$
\begin{align}
\bar{X} – z_{0.025} \times \frac{\sigma}{\sqrt{n}}\leq \mu \leq \bar{X} + z_{0.025} \times \frac{\sigma}{\sqrt{n}}\\
\bar{X} – 1.96 \times \frac{\sigma}{\sqrt{n}}\leq \mu \leq \bar{X} + 1.96 \times \frac{\sigma}{\sqrt{n}}
\end{align}
$$

信頼区間$99$%

$$
\begin{align}
\bar{X} – z_{0.005} \times \frac{\sigma}{\sqrt{n}}\leq \mu \leq \bar{X} + z_{0.005} \times \frac{\sigma}{\sqrt{n}}\\
\bar{X} – 2.576 \times \frac{\sigma}{\sqrt{n}}\leq \mu \leq \bar{X} + 2.576 \times \frac{\sigma}{\sqrt{n}}
\end{align}
$$

ここで、

$\mu$: 母平均, $\bar{X}$ : 標本平均, $\sigma$ : 母標準偏差, $n$ : 標本の大きさ
である。

上記より、

①信頼区間$90$%

$$
\begin{align}
&14.5 – 1.645 \times \frac{2.1}{\sqrt{49}}\leq \mu \leq 14.5 + 1.645 \times \frac{2.1}{\sqrt{49}}\\
= &14.0065 \leq \mu \leq14.935
\end{align}
$$

②信頼区間$95$%

$$
\begin{align}
&14.5 – 1.96 \times \frac{2.1}{\sqrt{49}}\leq \mu \leq 14.5 + 1.96 \times \frac{2.1}{\sqrt{49}}\\
= &13.912 \leq \mu \leq 15.088
\end{align}
$$

③信頼区間$99$%

$$
\begin{align}
&14.5 – 2.576 \times \frac{2.1}{\sqrt{49}}\leq \mu \leq 14.5 + 2.576 \times \frac{2.1}{\sqrt{49}}\\
= &13.7272 \leq \mu \leq 15.2728
\end{align}
$$

7.2 母平均の区間推定[正規母集団で母標準偏差$\sigma$が既知]

7-1と同様に

①$n=4$

$$
\begin{align}
100.0 – 1.96 \times \frac{8}{\sqrt{4}}\leq &\mu \leq 100.0 + 1.96 \times \frac{8}{\sqrt{4}}\\
= 92.16 \leq &\mu \leq 107.84
\end{align}
$$

②$n=16$

$$
\begin{align}
100.0 – 1.96 \times \frac{8}{\sqrt{16}}\leq &\mu \leq 100.0 + 1.96 \times \frac{8}{\sqrt{16}}\\
= 96.08 \leq &\mu \leq 103.92
\end{align}
$$

③$n=64$

$$
\begin{align}
100.0 – 1.96 \times \frac{8}{\sqrt{64}}\leq &\mu \leq 100.0 + 1.96 \times \frac{8}{\sqrt{64}}\\
= 98.04 \leq &\mu \leq 101.96\\
\end{align}
$$

④$n=256$

$$
\begin{align}
100.0 – 1.96 \times \frac{8}{\sqrt{256}}\leq &\mu \leq 100.0 + 1.96 \times \frac{8}{\sqrt{256}}\\
= 99.02 \leq &\mu \leq 100.98
\end{align}
$$

7.3 母平均の区間推定[母集団分布の形と母標準偏差$\sigma$が未知 : $n \ge 30$]

母標準偏差が未知かつ標本数が十分にある場合は標準化するにあたり母標準偏差の代わりに標本不偏分散の平方根で代用して信頼区間を求める。
標準化した値は自由度n-1のt分布に従うが、標本の大きさnが十分にある場合は標準化した値は標準正規分布に近似することが可能である。
ここでいう十分な標本の大きさというのは解析によって定義は様々であるが、今回の解説においては$n\geq30$の場合を十分な標本の大きさとする。

7-1と同様に

⑴信頼区間$90$%

$$
\begin{align}
76.0 – 1.645 \times \frac{19.8}{\sqrt{121}}\leq &\mu \leq 76.0 + 1.645 \times \frac{19.8}{\sqrt{121}}\\
= 73.039 \leq &\mu \leq 78.961
\end{align}
$$

⑵信頼区間$95$%

$$
\begin{align}
76.0 – 1.96 \times \frac{19.8}{\sqrt{121}}\leq &\mu \leq 76.0 + 1.96 \times \frac{19.8}{\sqrt{121}}\\
= 72.472 \leq &\mu \leq 79.528
\end{align}
$$

⑶信頼区間$99$%

$$
\begin{align}
76.0 – 2.576 \times \frac{19.8}{\sqrt{121}}\leq &\mu \leq 76.0 + 2.576 \times \frac{19.8}{\sqrt{121}}\\
= 71.3632 \leq &\mu \leq 80.6368
\end{align}
$$

②標本平均$\bar{X}$と母平均$\mu$の差$|\bar{X} – \mu|$を$e$としたときに、$e$をある一定の値以下にするための標本の大きさnは以下のように求めることができる。
信頼区間を推定する公式を変形して

$$
\begin{align}
-z_{\frac{1-α}{2}} \leq &\frac{\bar{X}-\mu}{\frac{\sigma}{\sqrt{n}}} \leq z_{\frac{1-α}{2}}\\
-z_{\frac{1-α}{2}} \times \frac{\sigma}{\sqrt{n}} \leq &|\bar{X}-\mu| \leq z_{\frac{1-α}{2}} \times \frac{\sigma}{\sqrt{n}}\\
|\bar{X}-\mu| \leq &z_{\frac{1-α}{2}} \times \frac{\sigma}{\sqrt{n}}
\end{align}
$$

ここで$z_{\frac{1-α}{2}} \times \frac{\sigma}{\sqrt{n}}$を推定の誤差$e$以下になるようにおくと以下のように標本の大きさ$n$について展開できる。

$$
\begin{align}
z_{\frac{1-α}{2}} \times \frac{\sigma}{\sqrt{n}} &\leq e\\
\sqrt{n} &\geq \frac{z_{\frac{1-α}{2}} \times \sigma}{e}\\
n &\geq (\frac{z_{\frac{1-α}{2}} \times \sigma}{e})^2\\
n &\geq \left( \frac{z_{\frac{1-\alpha}{2}} \cdot \sigma}{|\bar{X} – \mu| } \right)^2
\end{align}
$$

$z_{\frac{1 – \alpha}{2}}$について、7−1で示した値を適用することで、信頼係数$90$%、$95$%、$99$%について以下の通り計算できる。

⑴信頼区間$90$%

$$
\begin{align}
n &\geq \left( \frac{1.645 \times 19.8}{2} \right)^{2}\\
&=265.21751025
\end{align}
$$

よって必要な標本数nは$n \geq 266$である。

⑵信頼区間$95$%

$$
\begin{align}
n &\geq \left( \frac{1.96 \times 19.8}{2} \right)^{2}\\
&=376.515216
\end{align}
$$

よって必要な標本数は$n \geq 377$である。

⑶信頼区間$99$%

$$
\begin{align}
n &\geq \left( \frac{2.576 \times 19.8}{2} \right)^{2}\\
&=650.37240576
\end{align}
$$

よって必要な標本数nは$n \geq 651$である。

7.4 母平均の区間推定[正規母集団で母標準偏差$\sigma$が未知 : $n < 30$]

母標準偏差が未知かつ標本数が不十分な場合は標準化するにあたって母標準偏差の代わりに標本不偏分散の平方根で代用して信頼区間を求める。標準化した値は自由度n-1のt分布に従う。よって

$$
\begin{align}
\bar{X} – t_{\frac{1-α}{2}} \times \frac{s}{\sqrt{n}} \leq \mu \leq \bar{X} + t_{\frac{1-α}{2}} \times \frac{s}{\sqrt{n}}
\end{align}
$$

ここで、$t_{\frac{1-α}{2}}$は自由度n-1のt分布における$\frac{1-\alpha}{2}$点である。90%,95%,99%の値は以下の通りである。

  • $ t_{0.05}(20-1) = 1.729$
  • $ t_{0.025}(20-1) = 2.093$
  • $ t_{0.005}(20-1) = 2.861$

これらを利用して、各信頼期間は下記の通り計算できる。

①信頼区間$90$%

$$
\begin{align}
120.3 – t_{0.050} \times \frac{8.6}{\sqrt{20}} \leq &\mu \leq 120.3 + t_{0.050} \times \frac{8.6}{\sqrt{20}}\\
= 120.3 – 1.729 \times \frac{8.6}{\sqrt{20}} \leq &\mu \leq 120.3 + 1.729 \times \frac{8.6}{\sqrt{20}}\\
=116.975 \leq &\mu \leq 123.624\\
\end{align}
$$

②信頼区間$95$%

$$
\begin{align}
120.3 – t_{0.025} \times \frac{8.6}{\sqrt{20}} \leq &\mu \leq 120.3 + t_{0.050} \times \frac{8.6}{\sqrt{20}}\\
=  120.3 – 2.093 \times \frac{8.6}{\sqrt{20}} \leq &\mu \leq 120.3 + 2.093 \times \frac{8.6}{\sqrt{20}}\\
=116.275 \leq &\mu \leq 124.324
\end{align}
$$

③信頼区間$99$%

$$
\begin{align}
120.3 – t_{0.005} \times \frac{8.6}{\sqrt{20}} \leq &\mu \leq 120.3 + t_{0.005} \times \frac{8.6}{\sqrt{20}}\\
= 120.3 – 2.861 \times \frac{8.6}{\sqrt{20}} \leq &\mu \leq 120.3 + 2.861 \times \frac{8.6}{\sqrt{20}}\\
=114.789 \leq &\mu \leq 125.801
\end{align}
$$

7.5 母平均の区間推定[正規母集団で母標準偏差$\sigma$が未知 : $n < 30$]

問の設定から各変数は以下の通りである。

  • $n = 16$
  • $\bar{X} = 105$
  • $s = 12$
  • 自由度は15

7-4と同様に

⑴信頼区間$90$%

$$
\begin{align}
105 – t_{0.050} \times \frac{12}{\sqrt{16}} \leq &\mu \leq 105 + t_{0.050} \times \frac{12}{\sqrt{16}}\\
= 105 – 1.753 \times \frac{12}{\sqrt{16}} \leq &\mu \leq 105 + 1.753 \times \frac{12}{\sqrt{16}}\\
= 99.741 \leq &\mu \leq 110.259
\end{align}
$$

⑵信頼区間$95$%

$$
\begin{align}
105 – t_{0.025} \times \frac{12}{\sqrt{16}} \leq &\mu \leq 105 + t_{0.050} \times \frac{12}{\sqrt{16}}\\
= 105 – 2.131 \times \frac{12}{\sqrt{16}} \leq &\mu \leq 105 + 2.131 \times \frac{12}{\sqrt{16}}\\
=98.607 \leq &\mu \leq 111.393
\end{align}
$$

⑶信頼区間$99$%

$$
\begin{align}
105 – t_{0.005} \times \frac{12}{\sqrt{16}} \leq &\mu \leq 105 + t_{0.005} \times \frac{12}{\sqrt{16}}\\
= 105 – 2.947 \times \frac{12}{\sqrt{16}} \leq &\mu \leq 105 + 2.947 \times \frac{12}{\sqrt{16}}\\
= 96.159 \leq &\mu \leq 113.841
\end{align}
$$