ベータ分布(Beta distribution)の定義と期待値・分散の計算

ベータ分布(Beta distribution)は$F$分布などを考える際にも出てくる分布である。当記事ではベータ分布の基準化定数に関連するベータ関数がガンマ関数で表されることについて確認したのちに、ベータ分布の平均$E[X]$と分散$V[X]$について計算する。
作成にあたっては「現代数理統計学（学術図書出版社）」の2.4節の「主な1次元分布」や3.2節の「変数の変換とヤコビアン」を参考に、省略されている計算については追記を行った。

Contents

1 ベータ分布の定義とその理解
2 ベータ分布の期待値・分散の計算
- 2.1 ベータ分布の期待値$E[X]$の計算
- 2.2 ベータ分布の分散$V[X]$の計算

ベータ分布の定義とその理解

ベータ分布の定義

ベータ分布(Beta distribution)は$0 < x < 1$の連続分布である。$a>0,b>0$となる$a,b$をパラメータとするベータ分布の確率密度関数$f(x|a,b)$は下記のように定義される。
$$
\large
\begin{align}
f(x|a,b) = cx^{a-1}(1-x)^{b-1} \quad (0 < x < 1)
\end{align}
$$
ベータ分布は上記の確率密度関数を持ち、$Be(a,b)$のように表される。

基準化定数とベータ関数

ベータ分布の確率密度関数における基準化定数$c$の逆数はベータ関数と呼ばれ、下記のように表される。
$$
\large
\begin{align}
B(a,b) = \frac{1}{c} = \int_{0}^{1} x^{a-1}(1-x)^{b-1} dx
\end{align}
$$

ベータ関数とガンマ関数

ベータ関数とガンマ関数には下記のような式が成立する。
$$
\large
\begin{align}
B(a,b) = \frac{\Gamma(a)\Gamma(b)}{\Gamma(a+b)}
\end{align}
$$
以下では上記が成立することを確認する。

$X \sim Ga(a,1), Y \sim Ga(b,1)$かつ$X,Y$はそれぞれ独立であるとする。確率変数$X,Y$に対応するガンマ分布の確率密度関数$f(x|\nu=a),f(y|\nu=b)$は下記のように表すことができる。
$$
\large
\begin{align}
f(x|\nu=a) &= \frac{1}{\Gamma(a)} x^{a-1} e^{-x} \quad (x>0) \\
f(y|\nu=b) &= \frac{1}{\Gamma(b)} y^{b-1} e^{-y} \quad (y>0)
\end{align}
$$

ここで下記のような変換を考える。
$$
\large
\begin{align}
U &= \frac{X}{X+Y} \\
V &= X+Y
\end{align}
$$
この時、逆変換は連立方程式を$X,Y$に対して解くことで求めることができ、下記のようになる。
$$
\large
\begin{align}
X &= UV \\
Y &= V(1-U)
\end{align}
$$

変換前と変換後の確率密度関数をそれぞれ$f(x,y), g(u,v)$とすると、$f(x,y), g(u,v)$は下記のように求められる。
$$
\large
\begin{align}
f(x,y) &= f(x)f(y) \\
&= \frac{1}{\Gamma(a)} x^{a-1} e^{-x} \times \frac{1}{\Gamma(b)} y^{b-1} e^{-y} \\
g(u,v) &= f(uv,v(1-u)) \left| \begin{array}{cc} \frac{\partial x}{\partial u} & \frac{\partial x}{\partial v} \\ \frac{\partial x}{\partial u} & \frac{\partial y}{\partial v} \end{array} \right| \\
&= f(uv,v(1-u)) \left| \begin{array}{cc} v & u \\ -v & (1-u) \end{array} \right| \\
&= f(uv,v(1-u)) v \\
&= \frac{1}{\Gamma(a)} (uv)^{a-1} e^{-uv} \times \frac{1}{\Gamma(b)} (v(1-u))^{b-1} e^{-v(1-u)} v \\
&= \frac{1}{\Gamma(a)\Gamma(b)} v^{(a-1)+(b-1)+1} e^{-uv-v(1-u)} \times u^{a-1}(1-u)^{b-1} \\
&= \frac{1}{\Gamma(a)\Gamma(b)} v^{a+b-1} e^{-v} \times u^{a-1}(1-u)^{b-1} \quad (v>0, 0<u<1)
\end{align}
$$
上記に対して定数を無視して考えると、上記はガンマ分布の確率密度関数とベータ分布の確率密度関数の積の形で表されていることがわかる。関数のパラメータより、それぞれ$U \sim Be(a,b), V \sim Ga(a+b,1)$であることがわかる。これに合わせて$g(u,v)$の基準化定数を調整する。

$$
\large
\begin{align}
g(u,v) &= \frac{1}{\Gamma(a)\Gamma(b)} v^{a+b-1} e^{-v} \times u^{a-1}(1-u)^{b-1} \\
&= \frac{1}{\Gamma(a+b)} v^{a+b-1} e^{-v} \times \frac{\Gamma(a+b)}{\Gamma(a)\Gamma(b)} u^{a-1}(1-u)^{b-1}
\end{align}
$$
上記において、ベータ分布の確率密度関数の基準化定数$c$の逆数が$B(a,b)$であることより、$B(a,b)$は下記のようになる。
$$
\large
\begin{align}
\frac{1}{B(a,b)} &= c = \frac{\Gamma(a+b)}{\Gamma(a)\Gamma(b)} \\
B(a,b) &= \frac{\Gamma(a)\Gamma(b)}{\Gamma(a+b)}
\end{align}
$$

ここで導出したベータ関数とガンマ関数の式を用いて、次節ではベータ分布の期待値・分散の導出を行う。

ベータ分布の期待値・分散の計算

ベータ分布の期待値$E[X]$の計算

ベータ分布の定義より、ベータ分布の確率密度関数$f(x|a,b)$は下記のように表すことができる。
$$
\large
\begin{align}
f(x|a,b) = \frac{1}{B(a,b)} x^{a-1}(1-x)^{b-1} \quad (0 < x < 1)
\end{align}
$$

この時、$\displaystyle E[X] = \int_{0}^{1} xf(x|a,b) dx$より、$E[X]$は下記のように計算できる。
$$
\large
\begin{align}
E[X] &= \int_{0}^{1} xf(x|a,b) dx \\
&= \int_{0}^{1} x \frac{1}{B(a,b)} x^{a-1}(1-x)^{b-1} dx \\
&= \frac{1}{B(a,b)} \int_{0}^{1} x^{a}(1-x)^{b-1} dx \\
&= \frac{B(a+1,b)}{B(a,b)} \\
&= \frac{\Gamma(a+1)\Gamma(b)}{\Gamma(a+b+1)} \times \frac{\Gamma(a+b)}{\Gamma(a)\Gamma(b)} \\
&= \frac{a\Gamma(a)\Gamma(b)}{(a+b)\Gamma(a+b)} \times \frac{\Gamma(a+b)}{\Gamma(a)\Gamma(b)} \\
&= \frac{a}{a+b}
\end{align}
$$

ベータ分布の分散$V[X]$の計算

$V[X]=E[X^2]-E[X]^2$を活用する。$\displaystyle E[X^2] = \int_{0}^{1} x^2f(x|a,b) dx$は下記のように計算できる。
$$
\large
\begin{align}
E[X^2] &= \int_{0}^{1} x^2f(x|a,b) dx \\
&= \int_{0}^{1} x^2 \frac{1}{B(a,b)} x^{a-1}(1-x)^{b-1} dx \\
&= \frac{1}{B(a,b)} \int_{0}^{1} x^{a+1}(1-x)^{b-1} dx \\
&= \frac{B(a+2,b)}{B(a,b)} \\
&= \frac{\Gamma(a+2)\Gamma(b)}{\Gamma(a+b+2)} \times \frac{\Gamma(a+b)}{\Gamma(a)\Gamma(b)} \\
&= \frac{a(a+1)\Gamma(a)\Gamma(b)}{(a+b)(a+b+1)\Gamma(a+b)} \times \frac{\Gamma(a+b)}{\Gamma(a) \Gamma(b)} \\
&= \frac{a(a+1)}{(a+b)(a+b+1)}
\end{align}
$$

よって、$V[X]=E[X^2]-E[X]^2$は下記のように計算できる。
$$
\large
\begin{align}
V[X] &= E[X^2]-E[X]^2 \\
&= \frac{a(a+1)}{(a+b)(a+b+1)} – \left( \frac{a}{a+b} \right)^2 \\
&= \frac{a(a+1)}{(a+b)(a+b+1)} – \frac{a^2}{(a+b)^2} \\
&= \frac{a(a+1)(a+b)}{(a+b)^2(a+b+1)} – \frac{a^2(a+b+1)}{(a+b)^2(a+b+1)} \\
&= \frac{a(a+1)(a+b)-a^2(a+b+1)}{(a+b)^2(a+b+1)} \\
&= \frac{ab}{(a+b)^2(a+b+1)}
\end{align}
$$

「ベータ分布(Beta distribution)の定義と期待値・分散の計算」への7件のフィードバック

Ch.2 「確率と1次元の確率変数」の章末問題の解答例〜現代数理統計学(学術図書出版社)〜 - あつまれ統計の森 より:

2021-11-03 20:06

[…] ベータ分布の平均と分散は下記のように導出できる。・平均https://www.hello-statisticians.com/explain-terms-cat/beta_distribution1.html#EX […]
Ch.4 「統計量と標本分布」の章末問題の解答例〜現代数理統計学(学術図書出版社)〜 - あつまれ統計の森 より:

2021-12-02 20:31

[…] ここでベータ分布$Be(a,b)$の期待値$E[X]$や分散の$V[X]$は、下記のように表すことができる。$$largebegin{align}E[X] &= frac{a}{a+b} quad (1) \V[X] &= frac{ab}{(a+b)^2(a+b+1)} quad (2)end{align}$$詳しい導出については下記で取りまとめを行った。https://www.hello-statisticians.com/explain-terms-cat/beta_distribution1.html#i-5 […]
「確率分布」の「変数変換」の仕組みの理解とその応用｜問題演習で理解する統計学【15】 - あつまれ統計の森 より:

2021-12-02 22:37

[…] 数理統計学における「変数変換」は下記のように、ガウス積分やガンマ分布・ベータ分布に関する議論など、様々なところで出てきます。仕組みの理解も重要な一方で、計算のプロセスに慣れることも重要なので、実践的な演習を通して理解ができるような構成となるよう演習課題の作成を行いました。https://www.hello-statisticians.com/explain-terms-cat/beta_distribution1.htmlhttps://www.hello-statisticians.com/explain-terms-cat/gaussian_integral1.html […]
統計量と標本分布(sampling distribution)の具体例 - あつまれ統計の森 より:

2021-12-28 23:17

[…] https://www.hello-statisticians.com/explain-terms-cat/transformation1.htmlhttps://www.hello-statisticians.com/explain-terms-cat/gaussian_integral1.htmlhttps://www.hello-statisticians.com/explain-terms-cat/beta_distribution1.html変数変換については詳しくは上記などで取り扱ったが、下記の式などを抑えておくと良い。 […]
「統計学実践ワークブック」演習問題etc Ch.31 「ベイズ法」 - あつまれ統計の森 より:

2022-03-30 22:46

[…] ・参考ベータ分布の定義と期待値・分散の計算ベータ分布の増減表とモード_確率分布の演習 […]
Pythonを用いたベイズ法のプログラミング〜事後分布、ベイズ推定量、予測分布 etc〜 - あつまれ統計の森 より:

2022-04-05 18:59

[…] ・参考ベータ分布の定義と期待値・分散の計算 […]
連続型確率分布の数式まとめ（正規分布、指数分布、一様分布、ガンマ分布、カイ二乗分布 etc） - あつまれ統計の森 より:

2022-05-26 23:34

[…] また、一様分布を拡張した分布であると考えることのできるベータ分布に関しては下記で詳しく取り扱った。https://www.hello-statisticians.com/explain-terms-cat/beta_distribution1.html […]

コメントは受け付けていません。