統計検定1級 統計数理 問題解説 ~2019年11月実施 問3~

統計検定1級の2019年11月の「統計数理」の問3の解答例と解説について取り扱いました。他の問題の解答に関しては下記よりご確認ください。
https://www.hello-statisticians.com/stat_certifi_1_math

問題

詳しくは統計検定公式よりご確認ください。

解答

[1]
一様分布を考えるにあたって指示関数$\mathit{I}_{[x \leq c]}(x)$を下記のように定義する。
$$
\large
\begin{align}
\mathit{I}_{[x \leq c]}(x) &= 1, \quad if \quad x \leq c \\
&= 0 \quad otherwise
\end{align}
$$

上記は$x$に関して$x \leq c$が成立すれば$\mathit{I}_{[x \leq c]}(x)=1$、そうでなければ$\mathit{I}_{[x \leq c]}(x)=0$を表す。

このとき一様分布$U(0,\theta)$に従う確率変数$X_i$の確率密度関数を$f(x_i)$と定義すると、$f(x_i)$は指示関数を用いて下記のように表すことができる。
$$
\large
\begin{align}
f(x_i) = \frac{1}{\theta} \mathit{I}_{[0 \leq x_i \leq \theta]}(x_i)
\end{align}
$$

上記に基づいて、確率変数$X_1,X_2,…,X_n$に関する同時確率密度関数を$f(x_1,x_2,…,x_n)$のように定義すると、$f(x_1,x_2,…,x_n)$は下記のように表せる。
$$
\large
\begin{align}
f(x_1,x_2,…,x_n) &= \prod_{i=1}^{n} \frac{1}{\theta} \mathit{I}_{[0 \leq x_i \leq \theta]}(x_i) \\
&= \frac{1}{\theta^n} \prod_{i=1}^{n} \mathit{I}_{[0 \leq x_i \leq \theta]}(x_i) \\
&= \frac{1}{\theta^n} \mathit{I}_{[0 \leq x_1 \leq \theta, …, 0 \leq x_n \leq \theta]}(x_1,…,x_n) \\
&= \frac{1}{\theta^n} \mathit{I}_{[0 \leq \min x_i]}(x_1,…,x_n) \mathit{I}_{[\max x_i \leq \theta]}(x_1,…,x_n) \\
&= \frac{1}{\theta^n} \mathit{I}_{[0 \leq \min x_i]}(x_1,…,x_n) \mathit{I}_{[y \leq \theta]}(y)
\end{align}
$$

上記より、Fisher-Neymanの分解定理により、$Y$が$\theta$に関する十分統計量であることが確認できる。

[2]
$Y$の累積分布関数を$G(y)$とおくとき、$G(y)$は$0 < y < \theta$の範囲で下記のように表すことができる。
$$
\large
\begin{align}
G(y) &= P(Y \leq y) \\
&= P(X_1,X_2,…,X_n \leq y) \\
&= P(X_1 \leq y)P(X_2 \leq y)…P(X_n \leq y) \\
&= \prod_{i=1}^{n} \frac{y}{\theta} \\
&= \frac{y^n}{\theta^n}
\end{align}
$$

$Y$の確率密度関数の$g(y)$は$G(y)$を$y$で微分することで、$0 < y < \theta$の範囲で下記のように得ることができる。
$$
\large
\begin{align}
g(y) &= \frac{d}{dy} G'(y) \\
&= \frac{d}{dy} \left( \frac{y^n}{\theta^n} \right)’ \\
&= \frac{n}{\theta^n} y^{n-1}
\end{align}
$$

[3]
$Y=y$が与えられた際の$X_1,…,X_n$に関する条件付き同時確率密度関数を$Y$以外の確率変数を$X_1,…,X_{n-1}$とおくことで$f(x_1,…,x_{n-1}|y)$のように定義する。このとき条件付き確率の式より、$f(x_1,…,x_{n-1}|y)$は下記のように表すことができる。
$$
\large
\begin{align}
f(x_1,…,x_{n-1}|y) = \frac{f(x_1,…,x_{n-1},y)}{g(y)}
\end{align}
$$

上記の$g(y)$は[2]で求めた。$f(x_1,…,x_{n-1},y)$は一様分布の1つの地点であり、$Y$の選び方が$n$通りあると考えると下記が成立する。
$$
\large
\begin{align}
f(x_1,…,x_{n-1},y) = \frac{n}{\theta^n}
\end{align}
$$

ここまでの議論により、条件付き確率$f(x_1,…,x_{n-1}|y)$は下記のように導出できる。
$$
\large
\begin{align}
f(x_1,…,x_{n-1}|y) &= \frac{f(x_1,…,x_{n-1},y)}{g(y)} \\
&= \frac{\frac{n}{\theta^n}}{\frac{n}{\theta^n} y^{n-1}} \\
&= \frac{1}{y^{n-1}}
\end{align}
$$

・別解
$Y=X_n$となる確率が$1/n$と考えて解く方法もある。← 公式書籍に記載されているので、そちらを参照ください。

[4]
$Y$の期待値$E[Y]$は下記のように計算することができる。
$$
\large
\begin{align}
E[Y] &= \int_{0}^{\theta} y \cdot g(y) dy \\
&= \int_{0}^{\theta} y \cdot \frac{n}{\theta^n} y^{n-1} dy \\
&= \frac{n}{\theta^n} \int_{0}^{\theta} y^{n} dy \\
&= \frac{n}{\theta^n} \left[ \frac{1}{n+1} y^{n+1} \right]_{0}^{\theta} \\
&= \frac{n}{\theta^n} \times \frac{\theta^{n+1}}{n+1} \\
&= \frac{n}{n+1} \theta
\end{align}
$$

また、上記より、下記が成立する。
$$
\large
\begin{align}
E \left[ \frac{n+1}{n}Y \right] &= \frac{n+1}{n} E[Y] \\
&= \frac{n+1}{n} \times \frac{n}{n+1} \theta \\
&= \theta
\end{align}
$$
上記より$\displaystyle \tilde{\theta} = \frac{n+1}{n} Y$とおけば$E[\tilde{\theta}]=\theta$より、$\tilde{\theta}$が不偏推定量であることがわかる。

[5]
$E[u(Y)]=0$であることより、下記のように考えることができる。
$$
\large
\begin{align}
E[u(Y)] &= \int_{0}^{\theta} u(y) \cdot g(y) dy \\
&= \int_{0}^{\theta} u(y) \cdot \frac{n}{\theta^n} y^{n-1} dy \\
&= \frac{n}{\theta^n} \int_{0}^{\theta} u(y) y^{n-1} dy = 0 \\
\end{align}
$$

上記が全ての$\theta$で成立するには$u(Y)$がなめらかであることより$u(Y) \equiv 0$でなければならない。

[6]
$s(Y)$を$\theta$の別の不偏推定量であると考えると、$E[s(Y)]=\theta$が成立する。ここで$u(Y)=s(Y)-\tilde{\theta}$とおくと、$E[u(Y)]$は下記のように変形できる。
$$
\large
\begin{align}
E[u(Y)] &= E \left[ s(Y)-\tilde{\theta} \right] \\
&= E \left[ s(Y) \right] – E \left[ \frac{n+1}{n}Y \right] \\
&= \theta – \theta \\
&= 0
\end{align}
$$
ここで[5]より$E[u(Y)]=0 \implies u(Y) \equiv 0$が成立し、$u(Y) \equiv 0$より$s(Y) \equiv \tilde{\theta}$も成立する。よって、[4]で計算を行なった$\tilde{\theta}$が唯一の不偏推定量であることがわかる。

解説

[1]でFisher-Neymanの分解定理を用いて示した十分統計量に関しては[3]の式が$\theta$に依存しないことを確認することで示すことができます。[1]と[3]が重複することでミスリードを生むとも思われるので、何かしら問題文に追記がある方が良い印象でした。
また、[4]で導出を行なった一様分布の不偏推定量が$\displaystyle \tilde{\theta} = \frac{n+1}{n} Y = \frac{n+1}{n} \max X_i$となるのは最尤推定量が$\max X_i$であるのと合わせて抑えておくと良いと思います。
20点配分なら[1]が5点、[2]が3点、[3]が3点、[4]が3点、[5]が3点、[6]が3点ほどが妥当だと思われました。

「統計検定1級 統計数理 問題解説 ~2019年11月実施 問3~」への1件の返信

  1. […] 以下では「現代数理統計学」の内容に基づいてラオ・ブラックウェルの定理を用いて不偏推定量の導出の確認を行なったが、議論がわかりにくい。一様分布の不偏推定量の導出に関しては下記の統計検定の解答の[3]の導出の方がシンプルで良いと思われる。https://www.hello-statisticians.com/toukei-kentei-1/stat_math/stat_certifi_1_math_19_3.html […]

コメントは受け付けていません。