3.5.1 2つの母平均の差の区間推定 〜統計検定2級対応・統計学入門まとめ〜

当まとめでは統計検定$2$級の公式テキストの副教材に用いることができるように、統計学入門に関して取り扱います。当記事では「統計検定$2$級対応 統計学基礎」の$3.5.1$節「$2$つの母平均の差の区間推定」の内容を元に母平均の差の区間推定について取りまとめを行いました。
統計検定$2$級のテキストとの対応がわかりやすいように、目次を「統計検定$2$級対応 統計学基礎」と対応させました。学びやすさの観点からあえて目次を対応させましたが、当まとめは「統計の森」オリジナルのコンテンツであり、統計検定の公式とは一切関係ないことにご注意ください。

・統計検定$2$級対応・統計学入門まとめ
https://www.hello-statisticians.com/stat_basic

「2つの母平均の差の区間推定」の概要

概要

教材 人数平均標準偏差
標準版教材(A) $32$$62.2$$11.0$
改定版教材(B) $35$$71.4$$10.8$
「統計検定$2$級対応 統計学基礎」 第$3$章 例$10$

上記のように教材$A$、教材$B$の統計量の実現値が得られた場合、母平均に差があるかを調べる場合を考えます。このときの一連の手順が「$2$つの母平均の差の区間推定」であり、次節で「母分散既知の場合」、「母分散未知かつ等しい場合」の$2$つに場合分けし、それぞれについて区間推定の手順を確認します。

必要な数学

「区間推定」の結果の導出にあたっては不等号に関する計算がよく出てくるので、抑えておく必要があります。
$$
\large
\begin{align}
-1.96 \frac{\sigma}{\sqrt{n}} \leq \bar{x}-\mu \leq 1.96 \frac{\sigma}{\sqrt{n}}
\end{align}
$$

上記のような数式を$\mu$に関して解く必要があるので、特に$-x<-y$が$x>y$に対応することは必須です。

2つの母平均の差の区間推定

母分散が既知のとき

教材$A$の標本の実現値$x_1, \cdots , x_m$が$\mathcal{N}(\mu_1,\sigma_1^2)$に基づいて生成され、教材$B$の標本の実現値$y_1, \cdots , y_n$が$\mathcal{N}(\mu_2,\sigma_2^2)$に基づいて生成されると仮定します。

このとき、標本平均$\overline{X}, \overline{Y}$を下記のように定めます。
$$
\large
\begin{align}
\overline{X} &= \frac{1}{m} \sum_{i=1}^{m} X_i \\
\overline{Y} &= \frac{1}{n} \sum_{j=1}^{n} Y_j \\
\overline{X} & \sim \mathcal{N} \left( \mu_1,\frac{\sigma_1^2}{m} \right), \quad \overline{Y} \sim \mathcal{N} \left( \mu_2,\frac{\sigma_2^2}{n} \right)
\end{align}
$$

ここで標本平均の差の$\overline{X}-\overline{Y}$を考えるとき、正規分布のモーメント母関数などを用いることで下記を示すことができます。
$$
\large
\begin{align}
\overline{X}-\overline{Y} \sim \mathcal{N} \left( \mu_1-\mu_2, \frac{\sigma_1^2}{m}+\frac{\sigma_2^2}{n} \right)
\end{align}
$$

ここで$\overline{X}-\overline{Y}$の実現値を$\bar{x}-\bar{y}$とおくと、母平均の差$\mu_1-\mu_2$の$95$%区間に関して下記が成立します。
$$
\large
\begin{align}
z_{\alpha=0.975} \leq \frac{(\bar{x}-\bar{y})-(\mu_1-\mu_2)}{\displaystyle \sqrt{\frac{\sigma_1^2}{m}+\frac{\sigma_2^2}{n}}} \leq z_{\alpha=0.025} \quad (1)
\end{align}
$$

上記の$(1)$式は下記のように変形できます。
$$
\large
\begin{align}
z_{\alpha=0.975} \leq & \frac{(\bar{x}-\bar{y})-(\mu_1-\mu_2)}{\displaystyle \sqrt{\frac{\sigma_1^2}{m}+\frac{\sigma_2^2}{n}}} \leq z_{\alpha=0.025} \quad (1) \\
\bar{x}-\bar{y} – 1.96 \sqrt{\frac{\sigma_1^2}{m}+\frac{\sigma_2^2}{n}} \leq & \mu_1-\mu_2 \leq \bar{x}-\bar{y} + 1.96 \sqrt{\frac{\sigma_1^2}{m}+\frac{\sigma_2^2}{n}}
\end{align}
$$

上記が母平均の差$\mu_1-\mu_2$の$95$%区間を表します。

発展事項

$\displaystyle \overline{X}-\overline{Y} \sim \mathcal{N} \left( \mu_1-\mu_2, \frac{\sigma_1^2}{m}+\frac{\sigma_2^2}{n} \right)$が成立することは正規分布のモーメント母関数を用いることで示すことができます。詳しくは下記で取り扱いました。

上記の導出にはモーメント母関数の理解が必須なので、統計検定$2$級範囲では下記のように$E[\overline{X}-\overline{Y}], V[\overline{X}-\overline{Y}]$の計算で抑えておくでも十分です。
$$
\large
\begin{align}
E[\overline{X}-\overline{Y}] &= E[\overline{X}] – E[\overline{Y}] \\
V[\overline{X}-\overline{Y}] &= V[\overline{X}] + V[-\overline{Y}] \\
&= V[\overline{X}] + (-1)^2V[\overline{Y}] = V[\overline{X}] + V[\overline{Y}]
\end{align}
$$

母分散未知かつ等しい場合

「3.5.1 2つの母平均の差の区間推定 〜統計検定2級対応・統計学入門まとめ〜」への1件の返信

コメントは受け付けていません。