3.4.2 母分散が未知の場合の母平均の推定 〜統計検定2級対応・統計学入門まとめ〜

当まとめでは統計検定$2$級の公式テキストの副教材に用いることができるように、統計学入門に関して取り扱います。当記事では「統計検定$2$級対応 統計学基礎」の$3.4.2$節「母分散が未知の場合の母平均の推定」の内容を元に母分散未知の際の母平均の推定について取りまとめを行いました。
統計検定$2$級のテキストとの対応がわかりやすいように、目次を「統計検定$2$級対応 統計学基礎」と対応させました。学びやすさの観点からあえて目次を対応させましたが、当まとめは「統計の森」オリジナルのコンテンツであり、統計検定の公式とは一切関係ないことにご注意ください。

・統計検定$2$級対応・統計学入門まとめ
https://www.hello-statisticians.com/stat_basic

母分散が未知の場合の母平均の推定の概要

概要

上記で取り扱った「正規分布の母平均の推定」に際して、母分散が未知の場合を当記事では取り扱います。

必要な数学

「区間推定」の結果の導出にあたっては不等号に関する計算がよく出てくるので、抑えておく必要があります。
$$
\large
\begin{align}
-1.96 \frac{\sigma}{\sqrt{n}} \leq \bar{x}-\mu \leq 1.96 \frac{\sigma}{\sqrt{n}}
\end{align}
$$

正規分布の母平均の推定

母分散が未知の場合の母平均の推定

母分散$\sigma^2$が未知の場合は不偏標本分散$s^2$を用います。このとき標本平均$\overline{X}$に関して下記が成立します。
$$
\large
\begin{align}
\frac{\overline{X}-\mu}{s/\sqrt{n}} & \sim t(n-1) \\
\overline{X} &= \frac{1}{n} \sum_{i=1}^{n} X_i \\
s^2 &= \frac{1}{n-1} \sum_{i=1}^{n} (X-\overline{X})^2
\end{align}
$$

上記の$t(n-1)$は自由度$n-1$の$t$分布を表します。ここで標本平均の実現値を$\overline{x}$、不偏標本分散の実現値を$\hat{s}^2$、自由度$n-1$の$t$分布$t(n-1)$の上側$\alpha’$点を$t_{\alpha=\alpha’}(n-1)$のようにおくと、$\displaystyle \frac{\overline{X}-\mu}{s/\sqrt{n}} \sim t(n-1)$より$\mu$の$95$%区間に関して下記が成立します。
$$
\large
\begin{align}
t_{\alpha=0.975}(n-1) \leq \frac{\bar{x}-\mu}{\hat{s}/\sqrt{n}} \leq t_{\alpha=0.025}(n-1) \quad (1)
\end{align}
$$

$t_{\alpha=0.975}(n-1)=-t_{\alpha=0.025}(n-1)$上記の$(1)$式は下記のように変形できます。
$$
\large
\begin{align}
t_{\alpha=0.975}(n-1) \leq & \frac{\bar{x}-\mu}{\hat{s}/\sqrt{n}} \leq t_{\alpha=0.025}(n-1) \quad (1) \\
-t_{\alpha=0.025}(n-1) \leq & \frac{\bar{x}-\mu}{\hat{s}/\sqrt{n}} \leq t_{\alpha=0.025}(n-1) \\
-t_{\alpha=0.025}(n-1) \frac{\hat{s}}{\sqrt{n}} \leq & \bar{x}-\mu \leq t_{\alpha=0.025}(n-1) \frac{\hat{s}}{\sqrt{n}} \\
-t_{\alpha=0.025}(n-1) \frac{\hat{s}}{\sqrt{n}} \leq & \mu-\bar{x} \leq t_{\alpha=0.025}(n-1) \frac{\hat{s}}{\sqrt{n}} \\
\bar{x} – t_{\alpha=0.025}(n-1) \frac{\hat{s}}{\sqrt{n}} \leq & \mu \leq \bar{x} + t_{\alpha=0.025}(n-1) \frac{\hat{s}}{\sqrt{n}}
\end{align}
$$

上記の$\mu$が得られた観測値に基づく母平均$\mu$の$95$%区間であると考えることができます。

$t$分布の上側%点と自由度

下記の値は概ね抑えておくと良いと思います。

自由度 $10$$20$$30$$60$$120$$240$正規分布
$0.5$%点 $3.169$$2.845$$2.750$$2.660$$2.617$$2.596$$2.576$
$2.5$%点 $2.228$$2.086$$2.042$$2.000$$1.980$$1.970$$1.960$
$5.0$%点 $1.812$$1.725$$1.697$$1.671$$1.658$$1.651$$1.645$
「統計検定2級対応 統計学基礎」表$3.1$

発展事項

$t$分布の確率密度関数の導出は下記で詳しく取り扱いました。