当まとめでは統計検定$2$級の公式テキストの副教材に用いることができるように、統計学入門に関して取り扱います。当記事では「統計検定$2$級対応 統計学基礎」の$3.5.3$節「母分散の比の区間推定」の内容を$F$分布を用いた母分散の比の取り扱いについて取りまとめを行いました。
統計検定$2$級のテキストとの対応がわかりやすいように、目次を「統計検定$2$級対応 統計学基礎」と対応させました。学びやすさの観点からあえて目次を対応させましたが、当まとめは「統計の森」オリジナルのコンテンツであり、統計検定の公式とは一切関係ないことにご注意ください。
・統計検定$2$級対応・統計学入門まとめ
https://www.hello-statisticians.com/stat_basic
Contents
「母分散の比の区間推定」の概要
概要
散らばりの度合いを表す「分散」や「標準偏差」などの指標は常に正の値を取ることから差ではなく比を元に取り扱うのが適切です。当記事では以下$F$分布を元に、$2$つの母集団から得られる標本の母分散の比の区間推定に関して確認を行います。
発展事項
$F$検定に用いる$F$分布の確率密度関数の導出に関しては下記などで詳しく取り扱いました。
必要な数学
「区間推定」の結果の導出にあたっては不等号に関する計算がよく出てくるので、抑えておく必要があります。
$$
\large
\begin{align}
-1.96 \frac{\sigma}{\sqrt{n}} \leq \bar{x}-\mu \leq 1.96 \frac{\sigma}{\sqrt{n}}
\end{align}
$$
上記のような数式を$\mu$に関して解く必要があるので、特に$-x<-y$が$x>y$に対応することは必須です。
母分散の比の区間推定
検定統計量の導出
F分布
$$
\large
\begin{align}
X & \sim \chi^2(m) \\
Y & \sim \chi^2(n)
\end{align}
$$
上記のように$X$と$Y$がそれぞれ自由度$m$と$n$の$\chi^2$分布に従う場合を仮定します。このとき、下記のように$F$を考えることができます。
$$
\large
\begin{align}
F = \frac{X/m}{Y/n} \sim F(m,n)
\end{align}
$$
上記の$F(m,n)$は自由度$(m,m)$の$F$分布(F-distribution)を表します。
母分散の推定・検定
母分散の推定・検定にあたっては、下記のように定める統計量$\chi^2$を用います。
$$
\large
\begin{align}
\chi^2 &= \frac{(n-1)\hat{\sigma}^2}{\sigma^2} \sim \chi^2(n-1) \\
\hat{\sigma}^2 &= \frac{1}{n-1} \sum_{i=1}^{n} (X_i-\overline{X})^2
\end{align}
$$
上記の$\hat{\sigma}^2$は不偏標本分散に対応します。
F統計量
母分散$\sigma_x^2$と$\sigma_y^2$の$2$つの母集団に関して、それぞれ$m$個と$n$個の標本の不偏標本分散$\hat{\sigma}_x^2$と$\hat{\sigma}_y^2$を仮定します。このとき下記が成立します。
$$
\large
\begin{align}
\frac{(m-1)\hat{\sigma}_x^{2}}{\sigma_x^{2}} & \sim \chi^{2}(m-1) \\
\frac{(n-1)\hat{\sigma}_y^{2}}{\sigma_y^{2}} & \sim \chi^{2}(n-1)
\end{align}
$$
上記と「$F$分布」の内容を元に、$2$つの母集団の母分散の比の統計量$F$を下記のように定義することができます。
$$
\large
\begin{align}
F &= \frac{\frac{(m-1)\hat{\sigma}_x^{2}}{\sigma_x^{2} (m-1)}}{\frac{(n-1)\hat{\sigma}_y^{2}}{\sigma_y^{2} (n-1)}} \\
&= \frac{\hat{\sigma}_x^{2}}{\sigma_x^{2}} \cdot \frac{\sigma_y^{2}}{\hat{\sigma}_y^{2}} \sim F(m-1,n-1)
\end{align}
$$
母分散の比の区間推定
前項の内容に基づいて母分散の比$\displaystyle \frac{\sigma_x^{2}}{\sigma_y^{2}}$の$95$%区間は下記のように表すことができます。
$$
\large
\begin{align}
F_{\alpha=0.975}(m-1,n-1) \leq & F \leq F_{\alpha=0.025}(m-1,n-1) \\
\frac{1}{F_{\alpha=0.025}(n-1,m-1)} \leq & \frac{\hat{\sigma}_x^{2}}{\sigma_x^{2}} \cdot \frac{\sigma_y^{2}}{\hat{\sigma}_y^{2}} \leq F_{\alpha=0.025}(m-1,n-1) \\
\frac{1}{F_{\alpha=0.025}(m-1,n-1)} \frac{\hat{\sigma}_x^{2}}{\hat{\sigma}_y^{2}} \leq & \frac{\sigma_x^{2}}{\sigma_y^{2}} \leq F_{\alpha=0.025}(n-1,m-1) \frac{\hat{\sigma}_x^{2}}{\hat{\sigma}_y^{2}}
\end{align}
$$
ここで$16$個の標本に基づいて$\hat{\sigma}_x^2=6$、$11$個の標本に基づいて$\hat{\sigma}_y^2=3$が観測される場合、母分散の比$\displaystyle \frac{\sigma_x^{2}}{\sigma_y^{2}}$の$95$%区間は下記のように計算できます。
$$
\large
\begin{align}
\frac{1}{F_{\alpha=0.025}(m-1,n-1)} \frac{\hat{\sigma}_x^{2}}{\hat{\sigma}_y^{2}} \leq & \frac{\sigma_x^{2}}{\sigma_y^{2}} \leq F_{\alpha=0.025}(n-1,m-1) \frac{\hat{\sigma}_x^{2}}{\hat{\sigma}_y^{2}} \\
\frac{2}{2.845} \leq & \frac{\sigma_x^{2}}{\sigma_y^{2}} \leq 2.544 \times 2 \\
0.703 \leq & \frac{\sigma_x^{2}}{\sigma_y^{2}} \leq 5.088
\end{align}
$$
「統計検定$2$級対応 統計学基礎」では$\displaystyle \frac{\sigma_x^{2}}{\sigma_y^{2}}$ではなく$\displaystyle \frac{\sigma_y^{2}}{\sigma_x^{2}}$が用いられるが、上記の不等号の両辺の逆数を元に不等号を入れ替えると結果が一致します。
[…] 3.5.3 母分散の比の区間推定 〜統計検定2級対応・統計学入門まとめ〜 […]