ベイズ統計学の用語まとめ 〜ベイズ統計学、ベイズ法、ベイズ推定、ベイズ推定量、ベイズの定理〜

ベイズ統計学(Bayes statistics)にはベイズ法、ベイズ推論、ベイズ推定など様々な用語が用いられる一方で、教科書・参考書などではそれぞれの定義がない場合が多いです。そこで当記事ではベイズ統計学に関連する用語に関して取りまとめを行いました。

前提の確認

概要

ベイズ統計学(Bayes statistics)では様々な用語が用いられる一方で、用語の定義が厳密になされる場合は少ない。

・ベイズ統計学(Bayes statistics)
・ベイズ推論
・ベイズ法
・ベイズ推定
・ベイズ推定量(Bayes estimator)
・ベイズの定理(Bayes theorem)

具体的には上記のような用語が「ベイズ統計学」を学ぶ上でよく出てくるが、「ベイズの定理(Bayes theorem)」以外では上記の使い分けは難しい。そこで当記事ではベイズ統計学の用語について取りまとめの作成を行なった。

参考書籍

「統計学準$1$級対応 ワークブック(学術図書出版社)」、「現代数理統計学(学術図書出版社)」、「数理統計学(共立出版)」などを用いた。

上記の書籍では定義が確認できない点が多く見受けられたので、そもそもの用語の意味やWikipediaの内容に加えて筆者の仮説なども交えながら取りまとめを行なった。確定版ではないので適切な参考文献が見つかり次第アップデートを行う予定である。

必要な事前知識

「ベイズ統計学」に関して一通り学んだことを前提としており、「事前確率」、「事後確率」、「尤度」、「最尤推定」、「MAP推定」、「推定量」、「推定値」、「予測分布」などについては解説なくそのまま用語を用いる。

用語の定義

定義が明示的になされており、確実であるものから順に以下取り扱う。

ベイズの定理

事象$A$の原因に互いに排反な$n$個の事象$H_1, H_2, \cdots , H_n$を考える。このとき条件付き確率$P(H_i|A)$は下記のように表せる。
$$
\large
\begin{align}
P(H_i|A) &= \frac{P(H_i)P(A|H_i)}{P(A)} \\
&= \frac{\displaystyle P(H_i)P(A|H_i)}{\displaystyle \sum_{i=1}^{n} P(A \cap H_i)}
\end{align}
$$

上記をベイズの定理(Bayes theorem)という。ベイズの定理は「条件付き確率の定義」や「確率の情報定理」に基づく数式であり、基本的に全ての文献で定義が一致する。

ベイズ推定量

ベイズ推定量(Bayes estimator)はパラメータ$\theta$の事後分布$P(\theta|x)$の期待値を元にパラメータ推定を行う際に用いる推定量である。「数理統計学(共立出版)」のようにEAP推定量(Expected a Posterior Estimator)と表されることもある。

「ベイズ推定量」と表すと「最大事後確率推定量(MAP推定量)」は「ベイズ的な推定量ではない」と見えなくもないので、「統計の森」では「期待事後推定量(EAP推定量)」と表す場合が多い。

ベイズ統計学

ベイズ統計学:Wikipedia」では「ベイズ統計学」は「確率のベイズ的解釈に基づく統計学」であるとされます。基本的には「ベイズの定理」を統計学に適用したと考えておけば良いと思われる。

ベイズ法

「現代数理統計学」では「ベイズ統計学の手法」が「ベイズ法」とされる。よって、前項の「ベイズ統計学」における手法であると解釈できる。

ベイズ推定

ベイズ推定:Wikipedia」では「ベイズ推定」は「ベイズ確率の考え方に基づき、観測事象から、推定したい事柄を、確率的な意味で推論すること」や、「ベイズ確率に基づいて推定量を計算すること」などの記載がある。

上記はあまり明確な定義ではないが、「推定」という用語は「母集団のパラメータを標本から推定する際に用いる」ことも合わせて考慮することで「ベイズ推定」は「事後分布に基づいて母集団のパラメータを推定することを指す」のではないかというのが筆者の仮説である。

「ベイズ推定:事後分布に基づいて行う母集団のパラメータの推定」であれば、「EAP推定量」や「MAP推定量」と同様に考えると良い。

ベイズ推論

「推定」と「推論」は基本的に同様の意味であるように思われるが、機械学習では「推論」が「未知サンプルの予測」という意味で用いられる。よって、「ベイズ推論」は「母集団のパラメータ推定」ではなく「予測分布」を指すのではないかというのが筆者の仮説である。