当まとめでは統計検定$2$級の公式テキストの副教材に用いることができるように、統計学入門に関して取り扱います。当記事では「統計検定$2$級対応 統計学基礎」の$4.4.1$節「母平均の差の検定」の内容を元に母分散既知・未知の場合の母平均の差の検定の方法について確認を行います。
統計検定$2$級のテキストとの対応がわかりやすいように、目次を「統計検定$2$級対応 統計学基礎」と対応させました。学びやすさの観点からあえて目次を対応させましたが、当まとめは「統計の森」オリジナルのコンテンツであり、統計検定の公式とは一切関係ないことにご注意ください。
・統計検定$2$級対応・統計学入門まとめ
https://www.hello-statisticians.com/stat_basic
Contents
「母平均の差の検定」の概要
概要
$L$ | $90$ | $76$ | $90$ | $64$ | $86$ | $51$ | $72$ | $90$ | $95$ | $78$ |
$H$ | $73$ | $102$ | $118$ | $104$ | $81$ | $107$ | $100$ | $87$ | $117$ | $111$ |
$C$ | $116$ | $68$ | $32$ | $142$ | $110$ | $56$ | $94$ | $64$ | $92$ | $104$ |
上記のように$L$、$H$、$C$の$3$つのグループに関して観測値が得られたとき、$2$グループを選んでそれぞれのグループの母平均に差があるかを調べる場合を考えます。
このときの一連の手順が「母平均の差の検定」であり、次節で「母分散既知の場合」、「母分散未知かつ等しい場合」、「母分散未知かつ等しくない場合」の$3$つに場合分けし、それぞれについて検定の手順を確認します。
必要な数学
$\sqrt{x}$や$x^2$の取り扱いなど、基本的な計算を抑えておけば十分です。
母平均の検定
母分散既知の場合
$L$からの標本の実現値$x_1, \cdots , x_m$が$\mathcal{N}(\mu_1,\sigma^2)$に基づいて生成され、$H$からの標本の実現値$y_1, \cdots , y_n$が$\mathcal{N}(\mu_2,\sigma^2)$に基づいて生成されると仮定します。
このとき、標本平均$\overline{X}, \overline{Y}$を下記のように定めます。
$$
\large
\begin{align}
\overline{X} &= \frac{1}{m} \sum_{i=1}^{m} X_i \\
\overline{Y} &= \frac{1}{n} \sum_{j=1}^{n} Y_j \\
\overline{X} & \sim \mathcal{N} \left( \mu_1,\frac{\sigma^2}{m} \right), \quad \overline{Y} \sim \mathcal{N} \left( \mu_2,\frac{\sigma^2}{n} \right)
\end{align}
$$
ここで標本平均の差の$\overline{X}-\overline{Y}$を考えるとき、正規分布のモーメント母関数などを用いることで下記を示すことができます。
$$
\large
\begin{align}
\overline{X}-\overline{Y} \sim \mathcal{N} \left( \mu_1-\mu_2, \frac{\sigma^2}{m}+\frac{\sigma^2}{n} \right)
\end{align}
$$
上記より、$\displaystyle \overline{X}-\overline{Y} \sim \mathcal{N} \left( \mu_1-\mu_2, \left(\frac{1}{m}+\frac{1}{n}\right)\sigma^2 \right)$が成立します。よって、検定統計量$Z$を下記のように定義することができます。
$$
\large
\begin{align}
Z &= \frac{(\overline{X}-\overline{Y})-(\mu_1-\mu_2)}{\sqrt{\frac{1}{m}+\frac{1}{n}}\sigma} \\
Z & \sim \mathcal{N}(0,1)
\end{align}
$$
上記に対し$\mu_1-\mu_2$に対して帰無仮説$H_0: \, \mu_1-\mu_2=0$などを仮定し、$z_{\alpha=0.025}=1.96$などを用いることで両側$5$%検定を行うことができます。
発展事項
$\displaystyle \overline{X}-\overline{Y} \sim \mathcal{N} \left( \mu_1-\mu_2, \left(\frac{1}{m}+\frac{1}{n}\right)\sigma^2 \right)$が成立することは正規分布のモーメント母関数を用いることで示すことができます。詳しくは下記で取り扱いました。
上記の導出にはモーメント母関数の理解が必須なので、統計検定$2$級範囲では下記のように$E[\overline{X}-\overline{Y}], V[\overline{X}-\overline{Y}]$の計算で抑えておくでも十分です。
$$
\large
\begin{align}
E[\overline{X}-\overline{Y}] &= E[\overline{X}] – E[\overline{Y}] \\
V[\overline{X}-\overline{Y}] &= V[\overline{X}] + V[-\overline{Y}] \\
&= V[\overline{X}] + (-1)^2V[\overline{Y}] = V[\overline{X}] + V[\overline{Y}]
\end{align}
$$
[…] 4.4.1 母平均の差の検定 〜統計検定2級対応・統計学入門まとめ〜 […]
[…] このときに$d_1$と$d_2$に相関があり「$4.4.1$ 母平均の差の検定」と同様な手法を用いることはできないので、当記事で以下取り扱う「対応ある$2$標本の取り扱い」の流れを抑えておく必要があります。 […]