2.9.1 同時分布と周辺分布 〜統計検定2級対応・統計学入門まとめ〜

当まとめでは統計検定$2$級の公式テキストの副教材に用いることができるように、統計学入門に関して取り扱います。当記事では「統計検定$2$級対応 統計学基礎」の$2.9.1$節「同時分布と周辺分布」の内容を元に同時分布と周辺分布の定義に関して取りまとめました。
統計検定$2$級のテキストとの対応がわかりやすいように、目次を「統計検定$2$級対応 統計学基礎」と対応させました。学びやすさの観点からあえて目次を対応させましたが、当まとめは「統計の森」オリジナルのコンテンツであり、統計検定の公式とは一切関係ないことにご注意ください。

・統計検定$2$級対応・統計学入門まとめ
https://www.hello-statisticians.com/stat_basic

「同時分布と周辺分布」の概要

概要

前記事までは確率変数は「$1$つのサイコロの出目$X$」のように$1$変数のみを取り扱う場合についてのみ取り扱いましたが、$2$つのサイコロの出目をそれぞれ$X, Y$とおき、$2$変数の確率分布を取り扱うこともあります。

$2$変数の確率分布を同時確率分布といい、どちらかの確率変数に関して和や積分を考えることで消去した場合の確率分布を周辺分布といいます。当記事では以下、同時確率分布や周辺分布に関して詳しく取り扱います。

必要な数学

周辺分布の導出にあたっては$\displaystyle \sum$や「積分」を元に計算されるので、$\displaystyle \sum$の定義や「積分」の概念の理解が必要です。積分は定義のみを取り扱うので、数Ⅱレベルの積分を抑えておけば十分です。

同時分布と周辺分布

離散型

離散型の確率変数$X, Y$に関して同時確率分布(joint probability distribution)を考えるにあたっては、下記のように同時確率関数(joint probability function)の$p(x_i,y_i)$を定義します。
$$
\large
\begin{align}
p(x_i,y_i) = P(X=x_i, Y=y_i)
\end{align}
$$

このとき、確率変数$X$に関する周辺確率関数(marginal probability function)を$p_{x}(x_i)$、確率変数$Y$に関する周辺確率関数を$p_{y}(y_i)$とおくと、それぞれ下記のように定義されます。
$$
\large
\begin{align}
p_{x}(x_i) &= \sum_{j} p(x_i,y_j) = P(X=x_i) \\
p_{y}(y_j) &= \sum_{i} p(x_i,y_j) = P(Y=y_j)
\end{align}
$$

連続型

確率変数の$X, Y$が連続値をとる場合、同時確率分布を考えるにあたっては、下記のように同時確率密度関数(joint probability density function)の$f(x,y)$を定義します。
$$
\large
\begin{align}
P(x \leq X \leq x + \Delta x, y \leq Y \leq y + \Delta y) \simeq f(x,y) \Delta x \Delta y
\end{align}
$$

上記のように$f(x,y)$を考えると、周辺確率密度関数(marginal probability density function)の$f(x), f(y)$はそれぞれ下記のように定義されます。
$$
\large
\begin{align}
f(x) &= \int_{-\infty}^{\infty} f(x,y) dy \\
f(y) &= \int_{-\infty}^{\infty} f(x,y) dx
\end{align}
$$

また、確率密度関数は確率分布に対応することから$f(x,y)$に関して下記が成立する必要があります。
$$
\large
\begin{align}
0 \leq & f(x,y) \leq 1 \\
\int_{-\infty}^{\infty} \int_{-\infty}^{\infty} & f(x,y) dx dy = 1
\end{align}
$$