統計検定1級 統計応用 問題解説 ~2018年11月実施 理工学 問2~

統計検定1級の2018年11月の「統計応用、理工学」の問2の解答例と解説について取り扱いました。他の問題の解答に関しては下記よりご確認ください。
https://www.hello-statisticians.com/stat_certifi_1_app

問題

詳しくは統計検定公式よりご確認ください。

解答

[1]
・確率密度関数$f(x)$の導出
ワイブル分布$W(m,\eta)$の確率密度関数$f(x)$は$x \geq 0$で下記のように得ることができる。
$$
\large
\begin{align}
f(x) &= F'(x) = \frac{d}{dx} \left( 1 – \exp \left[ -\left( \frac{x}{\eta} \right)^m \right] \right) \\
&= -\exp \left[ -\left( \frac{x}{\eta} \right)^m \right] \times -m \frac{x^{m-1}}{\eta^{m}} \\
&= \left( \frac{m}{\eta} \right) \left( \frac{x}{\eta} \right)^{m-1} \exp \left[ -\left( \frac{x}{\eta} \right)^m \right]
\end{align}
$$

・最頻値$x_{mode}$の導出
確率密度関数$f(x)$を$x$に関して微分を行う。
$$
\large
\begin{align}
& f'(x) = \frac{d}{dx} \left( \left( \frac{m}{\eta} \right) \left( \frac{x}{\eta} \right)^{m-1} \exp \left[ -\left( \frac{x}{\eta} \right)^m \right] \right) \\
&= \frac{m(m-1)}{\eta^m} x^{m-2} \exp \left[ -\left(\frac{x}{\eta}\right)^{m} \right] + \frac{m}{\eta^m} x^{m-1} \exp \left[ -\left(\frac{x}{\eta}\right)^{m} \right] \times \frac{d}{dx} \left( -\left(\frac{x}{\eta}\right)^{m} \right) \\
&= \frac{m}{\eta^m} x^{m-2} \exp \left[ -\left(\frac{x}{\eta}\right)^{m} \right] \left( (m-1) – \frac{m}{\eta^{m}}x^{m} \right)
\end{align}
$$

ここで$x > 0$のとき、$\displaystyle \frac{m}{\eta^m} x^{m-2} \exp \left[ -\left(\frac{x}{\eta}\right)^{m} \right] > 0$が成立する。よって、$f'(x)$は$x > 0$で単調減少関数であり、$f'(x)=0$のとき最大値を取る。

よって$f'(x_{mode})=0$が成立することより、$x_{mode}$を下記のように導出することができる。
$$
\large
\begin{align}
f'(x_{mode}) &= 0 \\
(m-1) – \frac{m}{\eta^{m}}x_{mode}^{m} &= 0 \\
\frac{m}{\eta^{m}}x_{mode}^{m} &= m – 1 \\
x_{mode}^{m} &= \frac{(m – 1)\eta^{m}}{m} \\
x_{mode} &= \left( \frac{m – 1}{m} \right)^{\frac{1}{m}} \eta
\end{align}
$$

・$W(2,10), W(2,5)$のグラフの描画
ここでは省略するが、$m=2$を代入し、確率密度関数と$x_{mode}$を計算し、$\eta=5,10$を代入し、概形を作成すればよい。

[2]
ハザード関数$h(x)$は下記のように計算を行うことができる。
$$
\large
\begin{align}
h(x) &= \frac{f(x)}{1-F(x)} \\
&= \frac{\left( \frac{m}{\eta} \right) \left( \frac{x}{\eta} \right)^{m-1} \exp \left[ -\left( \frac{x}{\eta} \right)^m \right]}{\exp \left[ -\left( \frac{x}{\eta} \right)^m \right]} \\
&= \left( \frac{m}{\eta} \right) \left( \frac{x}{\eta} \right)^{m-1}
\end{align}
$$

上記よりハザード関数$h(x)$は、$m<1$では単調減少の関数、$m=1$では定数、$m>1$では単調増加の関数であることが分かる。

[3]
各部品の寿命を$X_1,X_2,…,X_k$、直列システムの寿命を$Y = \min(X_1,X_2,…,X_k)$のように定義する。このとき$Y$の分布関数を$F(y)$のように考えると、$F(y)$は下記のように計算できる。
$$
\large
\begin{align}
F(y) &= P(Y \leq y) = 1 – P(Y > y) \\
&= 1 – P(\min(X_1,X_2,…,X_k) > y) \\
&= 1 – P(X_1 > y, X_2 > y, …, X_k > y) \\
&= 1 – \prod_{i=1}^{k} P(X_i > y) \\
&= 1 – \prod_{i=1}^{k} \exp \left[ -\left( \frac{y}{\eta} \right)^m \right] \\
&= 1 – \left[ \exp \left[ -\left( \frac{y}{\eta} \right)^m \right] \right]^{k} \\
&= 1 – \exp \left[ -k \left( \frac{y}{\eta} \right)^m \right] \\
&= 1 – \exp \left[ -\left( \frac{y}{\eta / k^{\frac{1}{m}}} \right)^m \right]
\end{align}
$$

上記より$\displaystyle Y \sim W \left( m,\frac{\eta}{k^{\frac{1}{m}}} \right)$のように$Y$がワイブル分布$\displaystyle W \left( m,\frac{\eta}{k^{\frac{1}{m}}} \right)$に従うことが分かる。

[4]
$X$と$Y$の確率密度関数を
$f_1(x), f_2(y)$、$X$の累積分布関数を$F_1(x)$のようにそれぞれ定義する。このとき確率変数$X \sim W(2,10), Y \sim W(2,5)$に対して確率$P(X<Y)$は下記のように計算できる。
$$
\large
\begin{align}
P(X < Y) &= \int_{0}^{\infty} \int_{0}^{y} f_1(x)f_2(y) dx dy = \int_{0}^{\infty} F_1(y)f_2(y) dy \\
&= \int_{0}^{\infty} \left[ 1 – \exp \left[ -\left( \frac{y}{10} \right)^2 \right] \right] \left( \frac{2}{5} \right) \left( \frac{y}{5} \right)^{2-1} \exp \left[ -\left( \frac{y}{5} \right)^2 \right] dy \\
&= … = 0.2
\end{align}
$$

公式の解答を参考にしたが途中計算にわからない点があったので省略を行なった。

[5]
観測値$x_1,x_2,…,x_n$が得られた時の対数尤度関数$l(m,\eta)$は下記のように表すことができる。
$$
\large
\begin{align}
l(m,\eta) &= \log \prod_{i=1}^{n} \left( \frac{m}{\eta^{m}} x_i^{m-1} \exp \left[ \left( -\frac{x_i}{\eta} \right)^{m} \right] \right) \\
&= \sum_{i=1}^{n} \log \left( \frac{m}{\eta^{m}} x_i^{m-1} \exp \left[ \left( -\frac{x_i}{\eta} \right)^{m} \right] \right) \\
&= \sum_{i=1}^{n} \left( \log{m} – m \log{\eta} + (m-1) \log{x_i} – \left( \frac{x_i}{\eta} \right)^{m} \right)
\end{align}
$$

また、$\displaystyle \log \log{\frac{1}{1-F(x)}}$は下記のように計算できる。
$$
\large
\begin{align}
\log \log{\frac{1}{1-F(x)}} &= \log \log{\frac{1}{\exp \left[ -\left( \frac{x}{\eta} \right)^m \right]}} \\
&= \log{\left( \frac{x}{\eta} \right)^m} \\
&= m\log{x} – m\log{\eta}
\end{align}
$$
上記は$\log{x}$の1次式であると考えることができるので、$\displaystyle \left( \log{x_i},\log \log{\frac{1}{1-F(x_i)}} \right)$に関して回帰式を求めることでパラメータ$m,\eta$を算出することができる。

解説

[4]の導出過程がよくわからなかったので飛ばしましたが、全体的にオーソドックスな問題である印象でした。[5]に関しては対数尤度とワイブル確率紙の二つの手法を比較しているというのは問題文から読み取りやすいようにする方が良いのではという印象でした。
20点配分なら[1]が6点、[2]が3点、[3]が3点、[4]が3点、[5]が5点ほどが妥当である印象でした。ワイブル分布の計算は少々複雑なので、計算ミスなく解くのはなかなか大変そうでした。