標本平均の分散に対して有限修正(finite correction)を行う際の修正項の導出

有限母集団を取り扱うにあたって、標本平均の分散に対して有限母集団修正(finite population correction)を行う問題は統計検定の準1級などで取り扱われますが、導出が省略されることが多いので、当記事では修正項の導出を行います。
「人文・社会科学の統計学」の第$3$章の「標本調査法」の$3.2.2$節「母平均と母分散の推定」の内容を参考に作成を行いました。

前提の確認

分散・共分散に関する公式の確認

分散・共分散に関する公式の確認を行う。詳しい導出は下記などで取り扱ったのでここでは省略する。
https://www.hello-statisticians.com/explain-terms-cat/expectation-variance-covariance.html

・$V[X] = E[X^2] – E[X]^2$
上記の両辺に$n$をかけることで下記を導出することもできる。
$$
\large
\begin{align}
V[X] &= E[X^2] – E[X]^2 \\
\frac{1}{n} \sum_{i=1}^{n} (X_i-E[X])^2 &= \frac{1}{n} \sum_{i=1}^{n} X_i^2 – \left( \frac{1}{n} \sum_{i=1}^{n} X_i \right) \\
\sum_{i=1}^{n} (X_i-E[X])^2 &= \sum_{i=1}^{n} X_i^2 – \frac{1}{n} \left( \sum_{i=1}^{n} X_i \right) \quad (1)
\end{align}
$$
$(1)$式は途中計算で出てくるので先に抑えておくとよい。

・$V[aX] = a^2 V[X] \quad (2)$

・$Cov[X,Y] = E[XY] – E[X]E[Y] \quad (3)$

・$\displaystyle V[X+Y] = V[X^2] + V[Y^2] + 2Cov[X,Y] \quad (4)$

・$\displaystyle V \left[ \sum_{i=1}^{n} X_i \right] = \sum_{i=1}^{n} V[X_i] + \sum_{i \neq j} Cov[X_i,X_j]$
上記は下記のように変形することができる。
$$
\large
\begin{align}
V \left[ \sum_{i=1}^{n} X_i \right] &= \sum_{i=1}^{n} V[X_i] + \sum_{i \neq j} Cov[X_i,X_j] \\
&= n V[X_1] + n(n-1) Cov[X_1,X_2] \quad (5)
\end{align}
$$

有限修正項の導出

$E[X_i]=\mu, V[X_i]=\sigma^2$の有限母集団よりサンプリングを行なった結果の標本平均$\displaystyle \bar{X} = \frac{1}{n} \sum_{i=1}^{n} X_i$の分散$V[\bar{X}]$は下記のように考えることができる。
$$
\large
\begin{align}
V[\bar{X}] &= V \left[ \frac{1}{n} \sum_{i=1}^{n} X_i \right] \\
&= \frac{1}{n^2} V \left[ \sum_{i=1}^{n} X_i \right] \\
&= \frac{1}{n^2} (n V[X_1] + n(n-1) Cov[X_1,X_2]) \quad (6)
\end{align}
$$
上記の計算にあたっては$(2)$式と$(5)$式を用いた。

ここで$V[X_1]=\sigma^2$なので、以下では$Cov[X_1,X_2]$に関して計算を行う。
$$
\large
\begin{align}
Cov[X_1,X_2] &= E[X_1X_2] – E[X_1]E[X_2] \\
&= \frac{1}{N(N-1)} \sum_{i \neq j} X_iX_j – \left( \frac{\sum X_i}{N} \right)^2 \\
&= \frac{(\sum X_i)^2-\sum X_i^2}{N(N-1)} – \frac{(\sum X_i)^2}{N^2} \\
&= \frac{N (\sum X_i)^2 – N \sum X_i^2}{N^2(N-1)} – \frac{(N-1)(\sum X_i)^2}{N^2(N-1)} \\
&= \frac{(\sum X_i)^2 – N \sum X_i^2}{N^2(N-1)} \\
&= – \frac{1}{N-1} \left( \frac{1}{N} \sum X_i^2 – \left( \frac{1}{N} \sum X_i \right)^2 \right) \\
&= – \frac{1}{N-1} (E[X_i^2]-E[X_i]^2) \\
&= – \frac{1}{N-1} (V[X_i]) \\
&= – \frac{\sigma^2}{N-1} \quad (7)
\end{align}
$$
上記の計算にあたっては$(1)$式と$(3)$式を用いた。

$(7)$式を$(6)$式に代入することで、$V[\bar{X}]$に関して下記を得ることができる。
$$
\large
\begin{align}
V[\bar{X}] &= \frac{1}{n^2} (n V[X_1] + n(n-1) Cov[X_1,X_2]) \\
&= \frac{1}{n^2} \left( n \sigma^2 – n(n-1) \frac{\sigma^2}{N-1} \right) \\
&= \frac{\sigma^2}{n} \left( 1 – \frac{n-1}{N-1} \right) \\
&= \frac{\sigma^2}{n} \frac{N-1-(n-1)}{N-1} \\
&= \frac{N-n}{N-1} \cdot \frac{\sigma^2}{n}
\end{align}
$$

統計検定準1級で非復元無作為抽出に関してここで用いた計算と同様の計算を行う出題がなされているので、合わせて抑えておくとよい。

参考

・準1級ワークブック 第21章
https://www.hello-statisticians.com/explain-books-cat/stat_workbook/stat_workbook_ch21.html

・人文・社会科学の統計学 第3章
https://www.hello-statisticians.com/explain-books-cat/stat_green/stat_green_ch3.html

「標本平均の分散に対して有限修正(finite correction)を行う際の修正項の導出」への2件のフィードバック

コメントは受け付けていません。