当まとめでは統計検定$2$級の公式テキストの副教材に用いることができるように、統計学入門に関して取り扱います。当記事では「統計検定$2$級対応 統計学基礎」の$3.5.2$節「対応のある$2$標本の場合」の内容を元に対応のある$2$標本の区間推定について取りまとめを行いました。
統計検定$2$級のテキストとの対応がわかりやすいように、目次を「統計検定$2$級対応 統計学基礎」と対応させました。学びやすさの観点からあえて目次を対応させましたが、当まとめは「統計の森」オリジナルのコンテンツであり、統計検定の公式とは一切関係ないことにご注意ください。
・統計検定$2$級対応・統計学入門まとめ
https://www.hello-statisticians.com/stat_basic
「対応のある2標本の区間推定」の概要
概要
$2$標本に対応がある場合、標本平均の差$\overline{X}-\overline{Y}$の分散$V[\overline{X}-\overline{Y}]$について下記が成立します。
$$
\large
\begin{align}
V[\overline{X}-\overline{Y}] = V[\overline{X}] + V[\overline{Y}] – 2 \mathrm{Cov}[\overline{X}, \overline{Y}]
\end{align}
$$
上記の式は$2$標本に対応がない場合も成立しますが、「$2$標本に対応がない$\implies$ $\mathrm{Cov}[\overline{X}, \overline{Y}]=0$」より、「$3.5.1 \,$ $2$つの母平均の差の区間推定」の式に一致します。
このように「対応のある$2$標本の区間推定」は単に母平均の差の区間推定の考え方を用いることはできないので、当記事では$2$標本に対応がある際の区間推定における取り扱いについて確認します。
必要な数学
「区間推定」の結果の導出にあたっては不等号に関する計算がよく出てくるので、抑えておく必要があります。
$$
\large
\begin{align}
-1.96 \frac{\sigma}{\sqrt{n}} \leq \bar{x}-\mu \leq 1.96 \frac{\sigma}{\sqrt{n}}
\end{align}
$$
上記のような数式を$\mu$に関して解く必要があるので、特に$-x<-y$が$x>y$に対応することは必須です。
対応のある2標本の区間推定
対応のある$2$標本$x_1, \cdots , x_n$と$y_1, \cdots , y_n$の母平均の差の取り扱いにあたってはそれぞれの標本の差を$d_i=x_i-y_i$のように定め、$d_i$の標本平均$\bar{d}$と不偏標本分散$s_d^2$の値を計算し、$t$検定を行えば良いです。
ここで$2$標本の差の母平均を$d$とおくとき、$\displaystyle \frac{\bar{d}-d}{s_d/\sqrt{n}} \sim t(n-1)$が成立します。よって母平均$d$の$95$%区間は下記のように表すことができます。
$$
\large
\begin{align}
t_{\alpha=0.975}(n-1) \leq & \frac{\bar{d}-d}{s_d/\sqrt{n}} \leq t_{\alpha=0.025}(n-1) \\
\bar{d} – t_{\alpha=0.025}(n-1) \frac{s_d}{\sqrt{n}} \leq & d \leq \bar{d} + t_{\alpha=0.025}(n-1) \frac{s_d}{\sqrt{n}}
\end{align}
$$