3.3.2 区間推定 〜統計検定2級対応・統計学入門まとめ〜

当まとめでは統計検定$2$級の公式テキストの副教材に用いることができるように、統計学入門に関して取り扱います。当記事では「統計検定$2$級対応 統計学基礎」の$3.3.2$節「区間推定」の内容を元に区間推定の基本的な考え方について取りまとめを行いました。
統計検定$2$級のテキストとの対応がわかりやすいように、目次を「統計検定$2$級対応 統計学基礎」と対応させました。学びやすさの観点からあえて目次を対応させましたが、当まとめは「統計の森」オリジナルのコンテンツであり、統計検定の公式とは一切関係ないことにご注意ください。

・統計検定$2$級対応・統計学入門まとめ
https://www.hello-statisticians.com/stat_basic

区間推定の概要

概要

「推測統計」では観測された「標本」から母平均などの「母集団」のパラメータの「推定」を行いますが、$1$点でパラメータを推定する「点推定」に対して「区間推定」は「上限」と「下限」に基づく区間を用いて推定を行います。

たとえば全国模試のクラス平均が$75$点だった際に、全国平均も$75$点と推定するのが「点推定」、概ね$70$点〜$80$点の間であると推定するのが「区間推定」に対応すると大まかに考えておくと良いです。

必要な数学

「区間推定」の結果の導出にあたっては不等号に関する計算がよく出てくるので、抑えておく必要があります。
$$
\large
\begin{align}
– 1.96 \frac{\sigma}{\sqrt{n}} \leq \bar{x}-\mu \leq 1.96 \frac{\sigma}{\sqrt{n}}
\end{align}
$$

上記のような数式を$\mu$に関して解く必要があるので、特に$-x<-y$が$x>y$に対応することは必須です。

区間推定

区間推定の基本的な考え方

区間推定(interval estimation)は「確率変数の関数である統計量が特定の確率分布に従う」ことに基づいて区間の推定を行う考え方です。たとえば標本平均$\overline{X}$に関して中心極限定理より下記が成立します。
$$
\large
\begin{align}
T(X_1, \cdots , X_n) &= \overline{X} \sim \mathcal{N} \left( \mu,\frac{\sigma^2}{n} \right) \\
\overline{X} &= \frac{1}{n} \sum_{i=1}^{n} X_i
\end{align}
$$

ここで標本平均の実現値を$\overline{x}$、母分散を定数$\sigma^2$、標準正規分布$\mathcal{N}(0,1)$の上側$\alpha’$点を$z_{\alpha=\alpha’}$のようにおくと、$\displaystyle \overline{X} \sim \mathcal{N} \left( \mu,\frac{\sigma^2}{n} \right)$より$\mu$の$95$%区間に関して下記が成立します。
$$
\large
\begin{align}
z_{\alpha=0.975} \leq \frac{\bar{x}-\mu}{\sigma/\sqrt{n}} \leq z_{\alpha=0.025} \quad (1)
\end{align}
$$

標準正規分布$\mathcal{N}(0,1)$に関して$z_{\alpha=0.025}=1.96, z_{\alpha=0.975}=-z_{\alpha=0.025}=-1.96$より、$(1)$式は下記のように変形できます。
$$
\large
\begin{align}
z_{\alpha=0.975} \leq & \frac{\bar{x}-\mu}{\sigma/\sqrt{n}} \leq z_{\alpha=0.025} \quad (1) \\
-1.96 \leq & \frac{\bar{x}-\mu}{\sigma/\sqrt{n}} \leq 1.96 \\
-1.96 \frac{\sigma}{\sqrt{n}} \leq & \bar{x}-\mu \leq 1.96 \frac{\sigma}{\sqrt{n}} \\
-1.96 \frac{\sigma}{\sqrt{n}} \leq & \mu-\bar{x} \leq 1.96 \frac{\sigma}{\sqrt{n}} \\
\bar{x}-1.96 \frac{\sigma}{\sqrt{n}} \leq & \mu \leq \bar{x} + 1.96 \frac{\sigma}{\sqrt{n}}
\end{align}
$$

上記の$\mu$が得られた観測値に基づく母平均$\mu$の$95$%区間であると考えることができます。

発展事項

基本的には「統計量は標本の関数である」と定義されますが、標本が「確率変数」を指すのか「観測値」を指すのかは文脈次第であることが多いように思います。見分け方に関しては確率変数の場合は大文字を用いて$X_i$、観測値の場合は小文字を用いて$x_i$と定義されることが多いです。

同様に統計量が$T(X_1, \cdots , X_n)$と表記されれば確率変数です。また、統計量$T(X_1, \cdots , X_n)$を用いて定義する$\hat{\theta}=T(X_1, \cdots , X_n)$を「推定量」、推定量に具体的な観測値を代入した値を「推定値」という場合が多いです。

本文では統計量$T(X_1, \cdots , X_n)$に関し、$T(X_1, \cdots , X_n) = \overline{X} \sim \mathcal{N}(\mu, \sigma^2)$のような表現を用いるにあたって統計量は確率変数の関数であると定義しました。

具体例:光速の測定値

「3.3.2 区間推定 〜統計検定2級対応・統計学入門まとめ〜」への1件の返信

コメントは受け付けていません。