統計検定準1級 問題解説 ~2021年6月実施 論述問題 問2 ベイズ法と事後分布~

問題

過去問題は統計検定公式が問題と解答例を公開しています。こちらを参照してください。

解答

[1] 解答

$[1$-$1]$
$(A)$と$(B)$が正しい。

$[1$-$2]$
$X=x_0$が得られたときの二項分布の確率関数を$p(X=x_0|n,\theta)$とおくと$p(X=x_0|n,\theta)$は下記のように表すことができる。
$$
\large
\begin{align}
p(X=x_0|n,\theta) = {}_{n} C_{x_0} \theta^{x_0} (1-\theta)^{n-x_0}
\end{align}
$$

よって、$\theta$の事後分布$f(\theta|x_0)$は下記のように考えることができる。
$$
\large
\begin{align}
f(\theta|x_0) & \propto p(X=x_0|n,\theta) f(\theta|\alpha_0,\beta_0) \\
& = {}_{n} C_{x_0} \theta^{x_0} (1-\theta)^{n-x_0} \times \frac{1}{B(\alpha_0,\beta_0)} \theta^{\alpha-1} \theta^{\beta_0-1} \\
& \propto \theta^{x_0+\alpha_0-1} \theta^{n-x_0+\beta_0-1}
\end{align}
$$

上記より、事後分布のベータ分布のパラメータに関して$\alpha_1=x_0+\alpha_0, \beta_1=n-x_0+\beta_0$のように表すことができる。

$[1$-$3]$
$[1$-$2]$で取り扱った$f(\theta|x_0)$が最大となる$\theta$がわかれば良い。以下$\log{f(\theta|x_0)}$の$\theta$に関する偏微分を考える。
$$
\large
\begin{align}
\frac{\partial \log{f(\theta|x_0)}}{\partial \theta} &= \frac{\partial}{\partial \theta} ( (x_0+\alpha_0-1) \log{\theta} + (n-x_0+\beta_0-1) \log{(1-\theta)} ) \\
&= \frac{x_0+\alpha_0-1}{\theta} – \frac{n-x_0+\beta_0-1}{1-\theta} \\
&= \frac{(x_0+\alpha_0-1)(1-\theta) – (n-x_0+\beta_0-1)\theta}{\theta(1-\theta)} \\
&= \frac{(x_0+\alpha_0-1) – (x_0+\alpha_0-1+n-x_0+\beta_0-1)\theta}{\theta(1-\theta)} \\
&= \frac{(x_0+\alpha_0-1) – (n+\alpha_0+\beta_0-2)\theta}{\theta(1-\theta)}
\end{align}
$$

上記が$0<\theta<1$で単調減少であることより、$\displaystyle \frac{\partial \log{f(\theta|x_0)}}{\partial \theta} = 0$を解けば良い。
$$
\large
\begin{align}
\frac{\partial \log{f(\theta|x_0)}}{\partial \theta} &= 0 \\
\frac{(x_0+\alpha_0-1) – (n+\alpha_0+\beta_0-2)\theta}{\theta(1-\theta)} &= 0 \\
(x_0+\alpha_0-1) – (n+\alpha_0+\beta_0-2)\theta &= 0 \\
(n+\alpha_0+\beta_0-2)\theta &= x_0+\alpha_0-1 \\
\theta &= \frac{x_0+\alpha_0-1}{n+\alpha_0+\beta_0-2}
\end{align}
$$

上記より、事後確率密度関数を最大にする$\theta$は$\displaystyle \theta=\frac{x_0+\alpha_0-1}{n+\alpha_0+\beta_0-2}$であると考えることができる。

[2] 解答

$[2$-$1]$
観測値とパラメータの事前分布がどちらも正規分布の場合事後分布は正規分布に従う。よって$(B)$が正しいことがわかる。

$[2$-$2]$
$[2$-$1]$と同様に事後分布は正規分布が得られる。事前分布を$f(\mu)$、観測値$X=x$に関する同時確率密度関数を$f(X_1=3.0,X_2=2.3,X_3=4.2,X_4=1.5)$のようにおくとき、事後分布$f(\mu|X_1=3.0,X_2=2.3,X_3=4.2,X_4=1.5)$は下記のように考えることができる。
$$
\large
\begin{align}
f(\mu| & X_1=3.0,X_2=2.3,X_3=4.2,X_4=1.5) \propto f(X_1=3.0,X_2=2.3,X_3=4.2,X_4=1.5) f(\mu) \\
& \propto \exp \left( – \frac{(3.0-\mu)^2}{2 \times 4} – \frac{(2.3-\mu)^2}{2 \times 4} – \frac{(4.2-\mu)^2}{2 \times 4} – \frac{(1.5-\mu)^2}{2 \times 4} \right) \times \exp \left( – \frac{\mu^2}{2} \right) \\
&= \exp \left[ -\frac{1}{8} \left(4 \mu^2 + 4 \mu^2 – 22 \mu + … \right) \right] \\
&= \exp \left[ -\frac{8}{8} \left( \mu^2 – \frac{11}{4} \mu + … \right) \right] \\
& \propto \exp \left[ -\frac{2}{2} \left( \mu – \frac{11}{8} \mu \right)^2 \right]
\end{align}
$$

よって、事後分布は$\displaystyle N \left( \frac{11}{8},\frac{1}{2} \right)$であるとわかる。

解説

オーソドックスな事後分布の計算の問題であり、論述問題に適した内容であるように思われました。$[1$-$2]$や$[2$-$2]$ではパラメータに関して着目するにあたって$\propto$をうまく活用することで記述量を減らせるので、この辺の書き方の工夫は重要だと思います。

また$[1$-$3]$では極値ではなく最大を示すにあたって、$\displaystyle \frac{\partial \log{f(\theta|x_0)}}{\partial \theta} = 0$を解くだけでなく$\displaystyle \frac{\partial \log{f(\theta|x_0)}}{\partial \theta}$が単調増加であることを示すことは本来必要です。教科書などの議論では省略されがちではありますが、式の形を整理すると単調増加がわかる場合が多いので、なるべく単調増加も同時に示すようにすると良いと思います。

参考

・統計検定準1級 まとめ
https://www.hello-statisticians.com/toukeikentei-semi1

「統計検定準1級 問題解説 ~2021年6月実施 論述問題 問2 ベイズ法と事後分布~」への1件の返信

コメントは受け付けていません。