確率変数の変換と対数正規分布(log-normal distribution)の導出

確率変数$X$に対してその関数の$X^2$や$\log{X}$などの確率分布を求めたい場合がある。この際に重要となるのが「確率変数の変換」という考え方である。当記事では「確率変数の変換」を具体的に考えるにあたって、「対数正規分布(log-normal distribution)」の導出に関して取り扱う。
https://www.hello-statisticians.com/explain-books-cat/workbook-sec3-2.html
確率変数の変換について上記でも取り扱ったが、「対数正規分布(log-normal distribution)」に関して具体的に取り扱うにあたって「基礎統計学Ⅰ 統計学入門(東京大学出版会)」の5.5節や6.11節などを参考にした。

確率変数の変換

以下の議論においては直感的なイメージを重視し、数式の厳密さはそれほど重視しないものとする。微分と差分の話を厳密に考えると難しいため、ここでは直感的なイメージを優先する。
確率変数の変換においては関数$Y=\phi(X)$を用いて$X$を$Y$に変換できると考える。

ここで、区間$x \leq X \leq x + \Delta x$が関数$\phi(x)$を用いて区間$y \leq Y \leq y + \Delta y$に移ったと考える。このとき、それぞれの区間の確率に関して下記が成立する。
$$
\large
\begin{align}
P(x \leq X \leq x + \Delta x) = P(y \leq Y \leq y + \Delta y)
\end{align}
$$

また、確率変数$X, Y$に対応する確率密度関数をそれぞれ$f(x), g(x)$とするとき、それぞれの微小区間$\Delta x, \Delta y$に対して下記が成立する。
$$
\large
\begin{align}
g(y) \Delta y = f(x) \Delta x
\end{align}
$$
上記の式は、下記のように変形できる。
$$
\large
\begin{align}
g(y) &= f(x) \frac{\Delta x}{\Delta y} \\
&\simeq f(x) \frac{d x}{d y} \qquad (1)
\end{align}
$$
厳密さは重視しないため、以下では$\simeq$を$=$と同様に考えることとする。

ここで$y=\phi(x)$より、$x=\phi^{-1}(y)$が成立する。これを$(1)$式に代入すると下記のようになる。
$$
\large
\begin{align}
g(y) &\simeq f(x) \frac{d x}{d y} \\
&= f(\phi^{-1}(y)) \left| \frac{d \phi^{-1}(y)}{d y} \right|
\end{align}
$$

対数正規分布の導出

確率変数の変換」のところで確認した式を用いて対数正規分布(log-normal distribution)の導出を行う。
$X$が正規分布の$N(\mu, \sigma^2)$に従っている時、$Y=e^X$の確率分布を求める。
$$
\large
\begin{align}
g(y) = f(\phi^{-1}(y)) \left| \frac{d \phi^{-1}(y)}{d y} \right|
\end{align}
$$

$y=\phi(x)=e^x, x=\phi^{-1}(y)=\log{y}$を考えて、上記の式に対応する関数を計算すると下記のようになる。
$$
\large
\begin{align}
\phi^{-1}(y) &= \log{y} \\
\left| \frac{d \phi^{-1}(y)}{d y} \right| &= \left| \frac{d \log{y}}{d y} \right| \\
&= \frac{1}{y}
\end{align}
$$

よって、確率密度関数の$g(y)$は下記のように表すことができる。
$$
\large
\begin{align}
g(y) &= f(\phi^{-1}(y)) \left| \frac{d \phi^{-1}(y)}{d y} \right| \\
&= f(\log{y}) \frac{1}{y} \\
&= \frac{1}{\sqrt{2 \pi \sigma^2}y} exp \left( -\frac{(\log{y}-\mu)^2}{2 \sigma^2} \right)
\end{align}
$$
ここで確率密度関数の$g(y)$の変数に関して、定義域が$y = e^x > 0$であることも抑えておくと良い。

ここまでに導出した、$y$を$x$に置き換えると、対数正規分布の確率密度関数の式に一致する。
$$
\large
\begin{align}
f(x) = \frac{1}{\sqrt{2 \pi \sigma^2}x} exp \left( -\frac{(\log{x}-\mu)^2}{2 \sigma^2} \right)
\end{align} \quad x > 0
$$
また、対数正規分布の期待値と分散は下記のようになる。
$$
\large
\begin{align}
E[X] &= \exp \left( \mu + \frac{\sigma^2}{2} \right) \\
V[X] &= \exp \left( 2\mu + 2\sigma^2 \right) – \exp \left( 2\mu + \sigma^2 \right)
\end{align}
$$

「確率変数の変換と対数正規分布(log-normal distribution)の導出」への2件のフィードバック

  1. […] 下記では1次元の確率変数の変換を対数正規分布の導出を例に確認を行った。https://www.hello-statisticians.com/explain-terms-cat/log_normal_dist1.html当記事では「多次元の確率変数の変換」を取り扱うにあたって、1次元の確率変数の変換の内容に基づきながら確認を行う。途中で平行四辺形の面積の計算も出てくるので、行列式と面積の計算について詳しく確認した上で詳細の確認を行う構成でまとめることにした。作成にあたっては「基礎統計学Ⅰ 統計学入門(東京大学出版会)」の第7章の「付節:数学的証明、多次元の確率変数の変換」を参考にした。 […]

コメントは受け付けていません。