統計検定1級 統計応用 問題解説 ~2018年11月実施 社会科学 問4、理工学 問3~

統計検定1級の2018年11月の「統計応用」の「社会科学 問4」、「理工学 問3」の解答例と解説について取り扱いました。他の問題の解答に関しては下記よりご確認ください。
https://www.hello-statisticians.com/stat_certifi_1_app

問題

詳しくは統計検定公式よりご確認ください。

解答

[1]
・期待値$E[X]$の導出
$y = \log{x}$とおき、置換積分の考え方を用いて期待値$E[X]$の計算を行うことを考える。
$$
\large
\begin{align}
E[X] &= \int_{0}^{\infty} x \times \frac{1}{\sqrt{2 \pi}\sigma x} \exp \left[ -\frac{(\log{x}-\mu)^2}{2 \sigma^2} \right] dx \\
&= \int_{0}^{\infty} \frac{1}{\sqrt{2 \pi}\sigma} \exp \left[ -\frac{(\log{x}-\mu)^2}{2 \sigma^2} \right] dx \\
&= \int_{-\infty}^{\infty} e^{y} \frac{1}{\sqrt{2 \pi}\sigma} \exp \left[ -\frac{(y-\mu)^2}{2 \sigma^2} \right] dy \\
&= \int_{-\infty}^{\infty} \frac{1}{\sqrt{2 \pi}\sigma} \exp \left[ y – \frac{(y-\mu)^2}{2 \sigma^2} \right] dy \\
&= \int_{-\infty}^{\infty} \frac{1}{\sqrt{2 \pi}\sigma} \exp \left[ – \frac{y^2 – 2 (\mu+\sigma^2)y + \mu^2}{2 \sigma^2} \right] dy \\
&= \int_{-\infty}^{\infty} \frac{1}{\sqrt{2 \pi}\sigma} \exp \left[ – \frac{(y – (\mu+\sigma^2))^2 – 2 \sigma^2(\mu + \sigma^2/2)}{2 \sigma^2} \right] dy \\
&= \exp \left( \mu + \frac{\sigma^2}{2} \right) \int_{-\infty}^{\infty} \frac{1}{\sqrt{2 \pi}\sigma} \exp \left[ – \frac{(y – (\mu+\sigma^2))^2}{2 \sigma^2} \right] dy \\
&= \exp \left( \mu + \frac{\sigma^2}{2} \right)
\end{align}
$$

・中央値$x_{median}$の導出
$Y = \log{X} \sim N(\mu,\sigma^2)$とおくと$Y$の中央値が$\mu$であることから下記が成立する。
$$
\large
\begin{align}
P(Y < \mu) &= P(\log{X} < \mu) = P(X < e^{\mu}) \\
&= 0.5
\end{align}
$$
よって、$x_{median}=\exp(\mu)$が成立する。

・最頻値$x_{mode}$の導出
下記のように確率密度関数$f(x)$を$x$で微分する。
$$
\large
\begin{align}
& f'(x) = \frac{d}{dx} \left( \frac{1}{\sqrt{2 \pi}\sigma x} \exp \left[ -\frac{(\log{x}-\mu)^2}{2 \sigma^2} \right] \right) \\
&= -\frac{1}{\sqrt{2 \pi}\sigma x^2} \exp \left[ -\frac{(\log{x}-\mu)^2}{2 \sigma^2} \right] + \frac{1}{\sqrt{2 \pi}\sigma x} \exp \left[ -\frac{(\log{x}-\mu)^2}{2 \sigma^2} \right] \times -\frac{(\log{x}-\mu)}{\sigma^2 x} \\
&= -\frac{1}{\sqrt{2 \pi}\sigma x^2} \exp \left[ -\frac{(\log{x}-\mu)^2}{2 \sigma^2} \right] \left( 1+\frac{\log{x}-\mu}{\sigma^2} \right)
\end{align}
$$

上記は$x>0$で単調減少であることから、$f'(x_{mode})=0$が成立する。
$$
\large
\begin{align}
f'(x) &= 0 \\
-\frac{1}{\sqrt{2 \pi}\sigma x_{mode}^2} \exp \left[ -\frac{(\log{x_{mode}}-\mu)^2}{2 \sigma^2} \right] \left( 1+\frac{\log{x}-\mu}{\sigma^2} \right) &= 0 \\
1+\frac{\log{x_{mode}}-\mu}{\sigma^2} &= 0 \\
\log{x_{mode}}-\mu &= -\sigma^2 \\
\log{x_{mode}} &= \mu – \sigma^2 \\
x_{mode} &= \exp(\mu – \sigma^2)
\end{align}
$$

ここまでの議論により、$x_{mode} < x_{median} < E[X]$であることがわかる。

[2]
観測値$x_1,x_2,…,x_n$が得られたときの$\mu$の尤度関数を$L(\mu)$とおくと、下記のように表すことができる。
$$
\large
\begin{align}
L(\mu) &= \prod_{i=1}^{n} f(x_i) \\
&= \prod_{i=1}^{n} \frac{1}{\sqrt{2 \pi}\sigma x_i} \exp \left[ -\frac{(\log{x_i}-\mu)^2}{2 \sigma^2} \right]
\end{align}
$$

ここで対数尤度を$l(\mu) = \log{L(\mu)}$のようにおくと、下記のように計算できる。
$$
\large
\begin{align}
l(\mu) &= \log{L(\mu)} \\
&= \log \prod_{i=1}^{n} \frac{1}{\sqrt{2 \pi}\sigma x_i} \exp \left[ -\frac{(\log{x_i}-\mu)^2}{2 \sigma^2} \right] \\
&= \sum_{i=1}^{n} \log \left( \frac{1}{\sqrt{2 \pi}\sigma x_i} \exp \left[ -\frac{(\log{x_i}-\mu)^2}{2 \sigma^2} \right] \right) \\
&= \sum_{i=1}^{n} \left( -\frac{(\log{x_i}-\mu)^2}{2 \sigma^2} + Const. \right) \\
&= -\sum_{i=1}^{n} \frac{(\log{x_i}-\mu)^2}{2 \sigma^2} + Const.
\end{align}
$$
上記では$\displaystyle \frac{\partial}{\partial \mu} l(\mu)$を計算するにあたって$\mu$に関係ない項は$Const.$のように表記した。

次に$\displaystyle \frac{\partial}{\partial \mu} l(\mu)$を計算する。
$$
\large
\begin{align}
\frac{\partial}{\partial \mu} l(\mu) &= \frac{\partial}{\partial \mu} \left( -\sum_{i=1}^{n} \frac{(\log{x_i}-\mu)^2}{2 \sigma^2} \right) \\
&= -\sum_{i=1}^{n} \frac{-2(\log{x_i}-\mu)}{2 \sigma^2} \\
&= \sum_{i=1}^{n} \frac{(\log{x_i}-\mu)}{\sigma^2}
\end{align}
$$

上記は$\mu$に関して単調増加であるので、$\displaystyle \frac{\partial}{\partial \mu} l(\mu) \Bigr|_{\mu=\hat{\mu}}=0$が成立する。
$$
\large
\begin{align}
\frac{\partial}{\partial \mu} l(\mu) \Bigr|_{\mu=\hat{\mu}} &= 0 \\
\sum_{i=1}^{n} \frac{(\log{x_i}-\hat{\mu})}{\sigma^2} &= 0 \\
\sum_{i=1}^{n} \log{x_i} &= \sum_{i=1}^{n} \hat{\mu} \\
\sum_{i=1}^{n} \log{x_i} &= n \hat{\mu} \\
\hat{\mu} &= \frac{1}{n} \sum_{i=1}^{n} \log{x_i}
\end{align}
$$

[3]
事前分布の確率密度関数を$p(\mu)$とおくと、$p(\mu)$は下記のように表すことができる。
$$
\large
\begin{align}
p(\mu) = \frac{1}{\sqrt{2 \pi}\tau} \exp \left[ -\frac{(\mu – \nu)^2}{2 \tau^2} \right]
\end{align}
$$

また、事後分布を$p(\mu|x_1,x_2,…,x_n)$とおくと、下記のように計算できる。
$$
\large
\begin{align}
p(\mu|x_1,x_2,…,x_n) & \propto f(x_1,…,x_n)p(\mu) \\
&= f(x_1)…f(x_n)p(\mu) \\
& \propto \exp \left[ -\frac{1}{2 \sigma^2} \sum_{i=1}^{n} (\log{x_i}-\mu)^2 \right] \times \frac{1}{\sqrt{2 \pi}\tau} \exp \left[ -\frac{(\mu – \nu)^2}{2 \tau^2} \right] \\
&= … \\
& \propto \exp \left[ – \frac{n \tau^2 + \sigma^2}{2 \sigma^2 \tau^2} \left( \mu – \frac{n \tau^2 \bar{y} + \sigma^2 \nu}{n \tau^2 + \sigma^2} \right)^2 \right]
\end{align}
$$
〜詳しい計算は平方完成によって得られますがやや複雑なのでここでは省略を行ないました。公式の解答に詳しい導出があるのでそちらを参照ください〜

上記より、$\mu$の事後分布は$\displaystyle N \left( \frac{n \tau^2 \bar{y} + \sigma^2 \nu}{n \tau^2 + \sigma^2},\frac{\sigma^2 \tau^2}{n \tau^2 + \sigma^2} \right)$であることがわかる。

[4]
表より$\hat{\mu}=7.72$である。これより各推定値は下記のように得られる。
$$
\large
\begin{align}
E[X] &= \exp \left( 7.72 + \frac{(0.25)^2}{2} \right) \\
&= 2324.47619… \simeq 2324.5 \\
x_{median} &= \exp \left( 7.72 \right) \\
&= 2252.9595… \simeq 2253.0 \\
x_{mode} &= \left( 7.72 – (0.25)^2 \right) \\
&= 2116.4596… \simeq 2116.5
\end{align}
$$

[5]
事前分布が$N(8,(0.5)^2)$のとき、[3]の結果を用いて事後分布の期待値は下記のように計算できる。
$$
\large
\begin{align}
\frac{n \tau^2 \bar{y} + \sigma^2 \nu}{n \tau^2 + \sigma^2} &= \frac{10 \times (0.5)^2 \times 7.72 + (0.25)^2 \times 8}{10 \times (0.25)^2 + (0.25)^2} \\
&= 7.72682… \simeq 7.73
\end{align}
$$

[6]
公式の解答が詳しいので省略。

解説

[1]と[3]の計算が複雑な一方で[4]と[5]は数式の導出結果を元に数値計算を行うだけなので簡単な印象でした。平方完成が関連する計算はなかなか複雑になるので、ある程度慣れが必要だと思います。特に[3]の計算は複雑だと思います。
20点配分なら[1]が5点、[2]が3点、[3]が7点、[4]が3点、[5]が2点、[6]が3点ほどが妥当な印象でした。