ベータ分布(Beta distribution)の定義と期待値・分散の計算

ベータ分布(Beta distribution)は$F$分布などを考える際にも出てくる分布である。当記事ではベータ分布の基準化定数に関連するベータ関数がガンマ関数で表されることについて確認したのちに、ベータ分布の平均$E[X]$と分散$V[X]$について計算する。
作成にあたっては「現代数理統計学(学術図書出版社)」の2.4節の「主な1次元分布」や3.2節の「変数の変換とヤコビアン」を参考に、省略されている計算については追記を行った。

ベータ分布の定義とその理解

ベータ分布の定義

ベータ分布(Beta distribution)は$0 < x < 1$の連続分布である。$a>0,b>0$となる$a,b$をパラメータとするベータ分布の確率密度関数$f(x|a,b)$は下記のように定義される。
$$
\large
\begin{align}
f(x|a,b) = cx^{a-1}(1-x)^{b-1} \quad (0 < x < 1)
\end{align}
$$
ベータ分布は上記の確率密度関数を持ち、$Be(a,b)$のように表される。

基準化定数とベータ関数

ベータ分布の確率密度関数における基準化定数$c$の逆数はベータ関数と呼ばれ、下記のように表される。
$$
\large
\begin{align}
B(a,b) = \frac{1}{c} = \int_{0}^{1} x^{a-1}(1-x)^{b-1} dx
\end{align}
$$

ベータ関数とガンマ関数

ベータ関数とガンマ関数には下記のような式が成立する。
$$
\large
\begin{align}
B(a,b) = \frac{\Gamma(a)\Gamma(b)}{\Gamma(a+b)}
\end{align}
$$
以下では上記が成立することを確認する。

$X \sim Ga(a,1), Y \sim Ga(b,1)$かつ$X,Y$はそれぞれ独立であるとする。確率変数$X,Y$に対応するガンマ分布の確率密度関数$f(x|\nu=a),f(y|\nu=b)$は下記のように表すことができる。
$$
\large
\begin{align}
f(x|\nu=a) &= \frac{1}{\Gamma(a)} x^{a-1} e^{-x} \quad (x>0) \\
f(y|\nu=b) &= \frac{1}{\Gamma(b)} y^{b-1} e^{-y} \quad (y>0)
\end{align}
$$

ここで下記のような変換を考える。
$$
\large
\begin{align}
U &= \frac{X}{X+Y} \\
V &= X+Y
\end{align}
$$
この時、逆変換は連立方程式を$X,Y$に対して解くことで求めることができ、下記のようになる。
$$
\large
\begin{align}
X &= UV \\
Y &= V(1-U)
\end{align}
$$

変換前と変換後の確率密度関数をそれぞれ$f(x,y), g(u,v)$とすると、$f(x,y), g(u,v)$は下記のように求められる。
$$
\large
\begin{align}
f(x,y) &= f(x)f(y) \\
&= \frac{1}{\Gamma(a)} x^{a-1} e^{-x} \times \frac{1}{\Gamma(b)} y^{b-1} e^{-y} \\
g(u,v) &= f(uv,v(1-u)) \left| \begin{array}{cc} \frac{\partial x}{\partial u} & \frac{\partial x}{\partial v} \\ \frac{\partial x}{\partial u} & \frac{\partial y}{\partial v} \end{array} \right| \\
&= f(uv,v(1-u)) \left| \begin{array}{cc} v & u \\ -v & (1-u) \end{array} \right| \\
&= f(uv,v(1-u)) v \\
&= \frac{1}{\Gamma(a)} (uv)^{a-1} e^{-uv} \times \frac{1}{\Gamma(b)} (v(1-u))^{b-1} e^{-v(1-u)} v \\
&= \frac{1}{\Gamma(a)\Gamma(b)} v^{(a-1)+(b-1)+1} e^{-uv-v(1-u)} \times u^{a-1}(1-u)^{b-1} \\
&= \frac{1}{\Gamma(a)\Gamma(b)} v^{a+b-1} e^{-v} \times u^{a-1}(1-u)^{b-1} \quad (v>0, 0<u<1)
\end{align}
$$
上記に対して定数を無視して考えると、上記はガンマ分布の確率密度関数とベータ分布の確率密度関数の積の形で表されていることがわかる。関数のパラメータより、それぞれ$U \sim Be(a,b), V \sim Ga(a+b,1)$であることがわかる。これに合わせて$g(u,v)$の基準化定数を調整する。

$$
\large
\begin{align}
g(u,v) &= \frac{1}{\Gamma(a)\Gamma(b)} v^{a+b-1} e^{-v} \times u^{a-1}(1-u)^{b-1} \\
&= \frac{1}{\Gamma(a+b)} v^{a+b-1} e^{-v} \times \frac{\Gamma(a+b)}{\Gamma(a)\Gamma(b)} u^{a-1}(1-u)^{b-1}
\end{align}
$$
上記において、ベータ分布の確率密度関数の基準化定数$c$の逆数が$B(a,b)$であることより、$B(a,b)$は下記のようになる。
$$
\large
\begin{align}
\frac{1}{B(a,b)} &= c = \frac{\Gamma(a+b)}{\Gamma(a)\Gamma(b)} \\
B(a,b) &= \frac{\Gamma(a)\Gamma(b)}{\Gamma(a+b)}
\end{align}
$$

ここで導出したベータ関数とガンマ関数の式を用いて、次節ではベータ分布の期待値・分散の導出を行う。

ベータ分布の期待値・分散の計算

ベータ分布の期待値$E[X]$の計算

ベータ分布の定義より、ベータ分布の確率密度関数$f(x|a,b)$は下記のように表すことができる。
$$
\large
\begin{align}
f(x|a,b) = \frac{1}{B(a,b)} x^{a-1}(1-x)^{b-1} \quad (0 < x < 1)
\end{align}
$$

この時、$\displaystyle E[X] = \int_{0}^{1} xf(x|a,b) dx$より、$E[X]$は下記のように計算できる。
$$
\large
\begin{align}
E[X] &= \int_{0}^{1} xf(x|a,b) dx \\
&= \int_{0}^{1} x \frac{1}{B(a,b)} x^{a-1}(1-x)^{b-1} dx \\
&= \frac{1}{B(a,b)} \int_{0}^{1} x^{a}(1-x)^{b-1} dx \\
&= \frac{B(a+1,b)}{B(a,b)} \\
&= \frac{\Gamma(a+1)\Gamma(b)}{\Gamma(a+b+1)} \times \frac{\Gamma(a+b)}{\Gamma(a)\Gamma(b)} \\
&= \frac{a\Gamma(a)\Gamma(b)}{(a+b)\Gamma(a+b)} \times \frac{\Gamma(a+b)}{\Gamma(a)\Gamma(b)} \\
&= \frac{a}{a+b}
\end{align}
$$

ベータ分布の分散$V[X]$の計算

$V[X]=E[X^2]-E[X]^2$を活用する。$\displaystyle E[X^2] = \int_{0}^{1} x^2f(x|a,b) dx$は下記のように計算できる。
$$
\large
\begin{align}
E[X^2] &= \int_{0}^{1} x^2f(x|a,b) dx \\
&= \int_{0}^{1} x^2 \frac{1}{B(a,b)} x^{a-1}(1-x)^{b-1} dx \\
&= \frac{1}{B(a,b)} \int_{0}^{1} x^{a+1}(1-x)^{b-1} dx \\
&= \frac{B(a+2,b)}{B(a,b)} \\
&= \frac{\Gamma(a+2)\Gamma(b)}{\Gamma(a+b+2)} \times \frac{\Gamma(a+b)}{\Gamma(a)\Gamma(b)} \\
&= \frac{a(a+1)\Gamma(a)\Gamma(b)}{(a+b)(a+b+1)\Gamma(a+b)} \times \frac{\Gamma(a+b)}{\Gamma(a) \Gamma(b)} \\
&= \frac{a(a+1)}{(a+b)(a+b+1)}
\end{align}
$$

よって、$V[X]=E[X^2]-E[X]^2$は下記のように計算できる。
$$
\large
\begin{align}
V[X] &= E[X^2]-E[X]^2 \\
&= \frac{a(a+1)}{(a+b)(a+b+1)} – \left( \frac{a}{a+b} \right)^2 \\
&= \frac{a(a+1)}{(a+b)(a+b+1)} – \frac{a^2}{(a+b)^2} \\
&= \frac{a(a+1)(a+b)}{(a+b)^2(a+b+1)} – \frac{a^2(a+b+1)}{(a+b)^2(a+b+1)} \\
&= \frac{a(a+1)(a+b)-a^2(a+b+1)}{(a+b)^2(a+b+1)} \\
&= \frac{ab}{(a+b)^2(a+b+1)}
\end{align}
$$

「ベータ分布(Beta distribution)の定義と期待値・分散の計算」への4件のフィードバック

  1. […] ここでベータ分布$Be(a,b)$の期待値$E[X]$や分散の$V[X]$は、下記のように表すことができる。$$largebegin{align}E[X] &= frac{a}{a+b} quad (1) \V[X] &= frac{ab}{(a+b)^2(a+b+1)} quad (2)end{align}$$詳しい導出については下記で取りまとめを行った。https://www.hello-statisticians.com/explain-terms-cat/beta_distribution1.html#i-5 […]

  2. […] 数理統計学における「変数変換」は下記のように、ガウス積分やガンマ分布・ベータ分布に関する議論など、様々なところで出てきます。仕組みの理解も重要な一方で、計算のプロセスに慣れることも重要なので、実践的な演習を通して理解ができるような構成となるよう演習課題の作成を行いました。https://www.hello-statisticians.com/explain-terms-cat/beta_distribution1.htmlhttps://www.hello-statisticians.com/explain-terms-cat/gaussian_integral1.html […]

コメントは受け付けていません。