統計検定1級 統計数理 問題解説 ~2018年11月実施 問1~

統計検定1級の2018年11月の「統計数理」の問1の解答例と解説について取り扱いました。他の問題の解答に関しては下記よりご確認ください。
https://www.hello-statisticians.com/stat_certifi_1_math

問題

詳しくは統計検定公式よりご確認ください。

解答

[1]
$$
\large
\begin{align}
s^2 = \frac{1}{n-1} \sum_{i=1}^{n} (X_i – \bar{X})^2
\end{align}
$$
上記で定義した$s^2$が母分散$\sigma^2$の不偏推定量であることを示す。

まず母平均を$\mu$と考え、$\displaystyle \sum_{i=1}^{n} (X_i – \mu)^2$に関して下記のような変形を考える。
$$
\large
\begin{align}
\sum_{i=1}^{n} (X_i – \mu)^2 &= \sum_{i=1}^{n} (X_i – \bar{X} + \bar{X} – \mu)^2 \\
&= \sum_{i=1}^{n} ((X_i – \bar{X}) + (\bar{X} – \mu))^2 \\
&= \sum_{i=1}^{n} ((X_i – \bar{X})^2 + (\bar{X} – \mu)^2 + 2(X_i – \bar{X})(\bar{X} – \mu)) \\
&= \sum_{i=1}^{n} (X_i – \bar{X})^2 + \sum_{i=1}^{n} (\bar{X} – \mu)^2 + 2 (\bar{X} – \mu) \sum_{i=1}^{n} (X_i – \bar{X}) \\
&= \sum_{i=1}^{n} (X_i – \bar{X})^2 + n(\bar{X} – \mu)^2 \quad (1)
\end{align}
$$

$(1)$式の両辺の期待値を取ると、$\displaystyle \bar{X} \sim N \left( \mu,\frac{\sigma^2}{n} \right)$より下記が成立する。
$$
\large
\begin{align}
E \left[ \sum_{i=1}^{n} (X_i – \mu)^2 \right] &= E \left[ \sum_{i=1}^{n} (X_i – \bar{X})^2 + n(\bar{X} – \mu)^2 \right] \\
E \left[ \sum_{i=1}^{n} (X_i – \bar{X})^2 \right] &= E \left[ \sum_{i=1}^{n} (X_i – \mu)^2 \right] – E \left[ n(\bar{X} – \mu)^2 \right] \\
&= \sum_{i=1}^{n} E \left[ (X_i – \mu)^2 \right] – n E \left[ (\bar{X} – \mu)^2 \right] \\
&= \sum_{i=1}^{n} \sigma^2 – n \times \frac{\sigma^2}{n} \\
&= n \sigma^2 – \sigma^2 \\
&= (n-1) \sigma^2
\end{align}
$$

よって、$s^2$に関して下記が成立する。
$$
\large
\begin{align}
E[s^2] &= E \left[ \frac{1}{n-1} \sum_{i=1}^{n} (X_i – \bar{X})^2 \right] \\
&= \frac{1}{n-1} E \left[ \sum_{i=1}^{n} (X_i – \bar{X})^2 \right] \\
&= \frac{1}{n-1} \times (n-1) \sigma^2 \\
&= \sigma^2
\end{align}
$$
上記は$s^2$が母分散$\sigma^2$の不偏推定量であることを意味する。

[2]
・期待値$E[Y]$の計算
期待値$E[Y]$は下記のように計算を行うことができる。
$$
\large
\begin{align}
E[Y] &= \int_{0}^{\infty} y g(y) dy \\
&= \int_{0}^{\infty} y \times \frac{\left( \frac{1}{2} \right)^{\frac{n-1}{2}}}{\Gamma \left( \frac{n-1}{2} \right)} y^{\frac{n-1}{2}-1} e^{-\frac{y}{2}} dy \\
&= \frac{\left( \frac{1}{2} \right)^{\frac{n-1}{2}}}{\Gamma \left( \frac{n-1}{2} \right)} \int_{0}^{\infty} y^{\frac{n+1}{2}-1} e^{-\frac{y}{2}} dy \\
&= \frac{\left( \frac{1}{2} \right)^{\frac{n-1}{2}}}{\Gamma \left( \frac{n-1}{2} \right)} \times \frac{\Gamma \left( \frac{n+1}{2} \right)}{\left( \frac{1}{2} \right)^{\frac{n+1}{2}}} \\
&= 2 \times \frac{\frac{n-1}{2} \cdot \Gamma \left( \frac{n-1}{2} \right)}{\Gamma \left( \frac{n-1}{2} \right)} \\
&= n – 1
\end{align}
$$

・分散$V[Y]$の計算
$V[Y]=E[Y^2]-E[Y]^2$のように導出できるので、$E[Y^2]$の計算を先に行う。
$$
\large
\begin{align}
E[Y^2] &= \int_{0}^{\infty} y^2 g(y) dy \\
&= \int_{0}^{\infty} y^2 \times \frac{\left( \frac{1}{2} \right)^{\frac{n-1}{2}}}{\Gamma \left( \frac{n-1}{2} \right)} y^{\frac{n-1}{2}-1} e^{-\frac{y}{2}} dy \\
&= \frac{\left( \frac{1}{2} \right)^{\frac{n-1}{2}}}{\Gamma \left( \frac{n-1}{2} \right)} \int_{0}^{\infty} y^{\left( \frac{n-1}{2}+2 \right)-1} e^{-\frac{y}{2}} dy \\
&= \frac{\left( \frac{1}{2} \right)^{\frac{n-1}{2}}}{\Gamma \left( \frac{n-1}{2} \right)} \times \frac{\Gamma \left( \frac{n-1}{2}+2 \right)}{\left( \frac{1}{2} \right)^{\frac{n-1}{2}+2}} \\
&= 2^2 \times \frac{\frac{n+1}{2} \cdot \frac{n-1}{2} \cdot \Gamma \left( \frac{n-1}{2} \right)}{\Gamma \left( \frac{n-1}{2} \right)} \\
&= n^2 – 1
\end{align}
$$

よって、$V[Y]$は下記のように示すことができる。
$$
\large
\begin{align}
V[Y] &= E[Y^2]-E[Y]^2 \\
&= n^2 – 1 – (n – 1)^2 \\
&= n^2 – 1 – (n^2 – 2n +1) \\
&= 2n – 2 \\
&= 2(n-1)
\end{align}
$$

・$s^2$の分散$V[s^2]$の計算
$\displaystyle \frac{(n-1)s^2}{\sigma^2} = Y \sim Ga \left( \frac{n-1}{2},2 \right)$のように考えることができるので、これに対して$V[Y]$の導出結果を活用する。
$$
\large
\begin{align}
V \left[ \frac{(n-1)s^2}{\sigma^2} \right] &= V[Y] \\
&= 2(n-1) \\
\left( \frac{(n-1)}{\sigma^2} \right)^2 V[s^2] &= 2(n-1) \\
V[s^2] &= 2(n-1) \times \frac{\sigma^4}{(n-1)^2} \\
&= \frac{2 \sigma^4}{n-1}
\end{align}
$$

下記でも同様の議論を行なった。
https://www.hello-statisticians.com/explain-books-cat/math_stat_practice_ch7.html#71

[3]
$E[\sqrt{Y}]$に関しては、[2]の$E[Y],E[Y^2]$と同様に導出することができる。
$$
\large
\begin{align}
E[\sqrt{Y}] &= \int_{0}^{\infty} \sqrt{y} g(y) dy \\
&= \int_{0}^{\infty} y^{\frac{1}{2}} \times \frac{\left( \frac{1}{2} \right)^{\frac{n-1}{2}}}{\Gamma \left( \frac{n-1}{2} \right)} y^{\frac{n-1}{2}-1} e^{-\frac{y}{2}} dy \\
&= \frac{\left( \frac{1}{2} \right)^{\frac{n-1}{2}}}{\Gamma \left( \frac{n-1}{2} \right)} \int_{0}^{\infty} y^{\frac{n}{2}-1} e^{-\frac{y}{2}} dy \\
&= \frac{\left( \frac{1}{2} \right)^{\frac{n-1}{2}}}{\Gamma \left( \frac{n-1}{2} \right)} \times \frac{\Gamma \left( \frac{n}{2} \right)}{\left( \frac{1}{2} \right)^{\frac{n}{2}}} \\
&= \frac{\sqrt{2} \Gamma \left( \frac{n}{2} \right)}{\Gamma \left( \frac{n-1}{2} \right)}
\end{align}
$$

また、$E[s]$の導出にあたっては、$V[s^2]$の議論における$\displaystyle \frac{(n-1)s^2}{\sigma^2} = Y$より、$\displaystyle s = \sigma \sqrt{\frac{Y}{n-1}}$と変形できることを利用することができる。
$$
\large
\begin{align}
E[s] &= E \left[ \sigma \sqrt{\frac{Y}{n-1}} \right] \\
&= \frac{\sigma}{\sqrt{n-1}} E[\sqrt{Y}] \\
&= \frac{\sigma}{\sqrt{n-1}} \times \frac{\sqrt{2} \Gamma \left( \frac{n}{2} \right)}{\Gamma \left( \frac{n-1}{2} \right)} \\
\end{align}
$$

[4]
偏り$E[s]-\sigma$をデルタ法を用いて求める。
$$
\large
\begin{align}
g(x) \simeq g(\theta) + g'(\theta)(x-\theta) + \frac{1}{2}g^{”}(\theta)(x-\theta)^2
\end{align}
$$

上記の両辺の$x$を確率変数$X$に置き換えて期待値を取る。
$$
\large
\begin{align}
E[g(X)] & \simeq E \left[ g(\theta) + g'(\theta)(X-\theta) + \frac{1}{2}g^{”}(\theta)(X-\theta)^2 \right] \\
&= g(\theta) + g'(\theta)(E[X]-\theta) + \frac{1}{2} g^{”}(\theta) E\left[ (X-\theta)^2 \right] \\
&= g(\theta) + \frac{1}{2} g^{”}(\theta)V[X] \quad (1)
\end{align}
$$

ここで$g(x)=\sqrt{x}$とおくと、$x$に関する$1$階微分、$2$階は下記のように計算できる。
$$
\large
\begin{align}
g'(x) &= \frac{1}{2} x^{-\frac{1}{2}} \\
g^{”}(x) &= \frac{1}{2} \times – \frac{1}{2} x^{-\frac{3}{2}} \\
&= – \frac{1}{4} x^{-\frac{3}{2}}
\end{align}
$$

上記の$g^{”}(x)$に$x=\theta=\sigma^2$を代入することで下記が得られる。
$$
\large
\begin{align}
g^{”}(\theta) &= – \frac{1}{4} x^{-\frac{3}{2}} \\
&= – \frac{1}{4} (\sigma^2)^{-\frac{3}{2}} \\
&= – \frac{1}{4 \sigma^3} \quad (2)
\end{align}
$$

$(2)$式を$(1)$式に代入を行うことで$E[s]$は下記のように近似できる。
$$
\large
\begin{align}
E[s] & \simeq g(\theta) + \frac{1}{2} g^{”}(\theta)V[X] \\
&= \sqrt{\sigma^2} + \frac{1}{2} \times – \frac{1}{4 \sigma^3} \times \frac{2 \sigma^4}{n-1} \\
& \simeq \sigma – \frac{\sigma}{4n}
\end{align}
$$

上記より偏りが$\displaystyle – \frac{\sigma}{4n}$であることが導出できる。

解説

不偏標本分散の推定に関連するオーソドックスな題材の出題と考えて良いと思われるので、推定論に関する演習に用いてもなかなか有意義な内容だと思われました。$E[s^2], V[s^2], E[s]$の導出がメインの流れであると抑えておくと良いと思います。
20点配分なら[1]が5点、[2]が5点、[3]が3点、[4]が7点くらいが妥当な印象でした。全体的に抑えておきたいトピックが多い印象だったので、統計検定に関係なく何度か復習しておくと良さそうでした。

「統計検定1級 統計数理 問題解説 ~2018年11月実施 問1~」への1件の返信

  1. […] また、下記のように「現代数理統計学」の「章末課題」や「統計検定1級」の「統計数理」で類題が出題されているので合わせて抑えておくと良いと思います。https://www.hello-statisticians.com/explain-books-cat/math_stat_practice_ch7.html#71https://www.hello-statisticians.com/explain-books-cat/math_stat_practice_ch7.html#73https://www.hello-statisticians.com/toukei-kentei-1/stat_app/stat_certifi_1_math_18_1.html […]

コメントは受け付けていません。