平行四辺形の面積の計算とヤコビ行列式・多次元の確率変数の変換

下記では1次元の確率変数の変換を対数正規分布の導出を例に確認を行った。
https://www.hello-statisticians.com/explain-terms-cat/log_normal_dist1.html
当記事では「多次元の確率変数の変換」を取り扱うにあたって、1次元の確率変数の変換の内容に基づきながら確認を行う。途中で平行四辺形の面積の計算も出てくるので、行列式と面積の計算について詳しく確認した上で詳細の確認を行う構成でまとめることにした。
作成にあたっては「基礎統計学Ⅰ 統計学入門(東京大学出版会)」の第7章の「付節:数学的証明、多次元の確率変数の変換」を参考にした。なお、$dx, dy$などの記号の用い方にあたっては厳密さよりも直感的な理解を重視しているので、厳密に考えた際に間違いが含まれる場合がある。

行列式を用いた平行四辺形の面積の公式と証明

行列式と平行四辺形の面積の公式

4点が$(0, 0), (a_1, a_2), (b_1, b_2), (a_1+b_1, a_2+b_2)$で与えられる平行四辺形の面積を計算することを考える。$\displaystyle \mathbf{a}=\left(\begin{array}{cc} a_1 \\ a_2 \end{array}\right), \mathbf{b}=\left(\begin{array}{cc} b_1 \\ b_2 \end{array}\right)$のように表し、$\mathbf{a}, \mathbf{b}$が$x$軸となす角をそれぞれ$\alpha, \beta$とし、$\displaystyle 0 < \alpha < \beta < \frac{\pi}{2}$が成立すると考える。

このとき、4点で表され平行四辺形の面積$S$は下記のように行列式を用いて表すことができる。
$$
\large
\begin{align}
S &= a_1b_2 – a_2b_1 \\
&= \left| \begin{array}{cc} a_1 & a_2 \\ b_1 & b_2 \end{array} \right|
\end{align}
$$

証明① 内積の式$\mathbf{a} \cdot \mathbf{b} = |\mathbf{a}||\mathbf{b}|\cos{\theta}$の活用

平行四辺形の面積$S$が下記のように表せることから導出を行う。
$$
\large
\begin{align}
S &= |\mathbf{a}||\mathbf{b}|\sin{\theta} \\
\theta &= \beta-\alpha
\end{align}
$$
上記の式は平行四辺形の公式の「底辺×高さ」に基づいているが、$\theta$は$\mathbf{a}$と$\mathbf{b}$のなす角を表すにあたって、$\theta = \beta-\alpha$によって定義した。

$$
\large
\begin{align}
\sin^2{\theta} &= 1-\cos^2{\theta} \\
\mathbf{a} \cdot \mathbf{b} &= |\mathbf{a}||\mathbf{b}|\cos{\theta}
\end{align}
$$
以下では上記の式に基づいて$S=|\mathbf{a}||\mathbf{b}|\sin{\theta}$を計算する。
$$
\large
\begin{align}
S &= |\mathbf{a}||\mathbf{b}|\sin{\theta} \\
&= |\mathbf{a}||\mathbf{b}|\sqrt{1-\cos^2{\theta}} \\
&= |\mathbf{a}||\mathbf{b}|\sqrt{1-\frac{(\mathbf{a} \cdot \mathbf{b})^2}{(|\mathbf{a}||\mathbf{b}|)^2}} \\
&= \sqrt{(|\mathbf{a}||\mathbf{b}|)^2-(\mathbf{a} \cdot \mathbf{b})^2} \quad (1)
\end{align}
$$

上記において、$\displaystyle \mathbf{a}=\left(\begin{array}{cc} a_1 \\ a_2 \end{array}\right), \mathbf{b}=\left(\begin{array}{cc} b_1 \\ b_2 \end{array}\right)$より下記が成立する。
$$
\large
\begin{align}
|\mathbf{a}| &= a_1^2+a_2^2 \\
|\mathbf{b}| &= b_1^2+b_2^2 \\
(\mathbf{a} \cdot \mathbf{b})^2 &= (a_1b_1+a_2b_2)^2
\end{align}
$$
上記を$(1)$式に代入する。
$$
\large
\begin{align}
S &= \sqrt{(|\mathbf{a}||\mathbf{b}|)^2-(\mathbf{a} \cdot \mathbf{b})^2} \quad (1) \\
&= \sqrt{(a_1^2+a_2^2)(b_1^2+b_2^2) – (a_1b_1+a_2b_2)^2} \\
&= \sqrt{a_1^2b_1^2 + a_1^2b_2^2 + a_2^2b_1^2 + a_2^2b_2^2 – (a_1^2b_1^2 + a_2^2b_2^2 – 2a_1a_2b_1b_2)} \\
&= \sqrt{a_1^2b_2^2 + a_2^2b_1^2 – 2a_1a_2b_1b_2} \\
&= \sqrt{(a_1b_2-a_2b_1)^2} \\
&= a_1b_2-a_2b_1 \\
&= \left| \begin{array}{cc} a_1 & a_2 \\ b_1 & b_2 \end{array} \right|
\end{align}
$$

証明② 加法定理$\sin{(\beta-\alpha)} = \sin{\beta}\cos{\alpha}-\cos{\beta}\sin{\alpha}$の活用

平行四辺形の面積$S$が下記のように表せることから導出を行う。
$$
\large
\begin{align}
S = |\mathbf{a}||\mathbf{b}|\sin{(\beta-\alpha)}
\end{align}
$$
上記における$\sin{(\beta-\alpha)}$に加法定理を用いることで、$S$は下記のように変形できる。
$$
\large
\begin{align}
S &= |\mathbf{a}||\mathbf{b}|\sin{(\beta-\alpha)} \\
&= |\mathbf{a}||\mathbf{b}|(\sin{\beta}\cos{\alpha}-\cos{\beta}\sin{\alpha}) \\
&= |\mathbf{a}|\cos{\alpha}|\mathbf{b}|\sin{\beta}-|\mathbf{a}|\sin{\alpha}|\mathbf{b}|\cos{\beta} \\
&= a_1b_2 – a_2b_1 \\
&= \left| \begin{array}{cc} a_1 & a_2 \\ b_1 & b_2 \end{array} \right|
\end{align}
$$

多次元の確率変数の変換

変換の公式

$x,y$に関する確率密度関数をそれぞれ$f(x), g(y)$、$x,y$の関係式を$y=\phi(x), x=\phi^{-1}(y)$のように表されるとき、「1次元の確率変数の変換」の式は下記を用いて導出することができる。
$$
\large
\begin{align}
g(y) &= f(\phi^{-1}(y)) \left| \frac{d \phi^{-1}(y)}{d y} \right|
\end{align}
$$

以下、2次元の確率変数の変換について具体的に取り扱う。$(x_1,x_2)$が下記のような変換によって$(y_1,y_2)$に移ったと考える。
$$
\large
\begin{align}
y_1 &= \phi_1(x_1,x_2) \\
y_2 &= \phi_2(x_1,x_2)
\end{align}
$$

この時、確率密度関数$f(x_1,x_2)$と$g(y_1,y_2)$の関係は下記のように表せる。
$$
\large
\begin{align}
g(y_1,y_2) &= f(\phi_1^{-1}(y_1,y_2), \phi_2^{-1}(y_1,y_2)) \frac{d S’}{d S} \quad (2)
\end{align}
$$
上記において$\displaystyle \frac{d S’}{d S}$は$\phi_1^{-1}, \phi_2^{-1}$による面積の伸縮率であるが、これは変動関数の関数で表される。これより式$(2)$は下記のように表すことができる。
$$
\large
\begin{align}
g(y_1,y_2) = f(\phi_1^{-1}(y_1,y_2), \phi_2^{-1}(y_1,y_2)) \left| \begin{array}{cc} \frac{\partial \phi_1^{-1}(y_1,y_2)}{\partial y_1} & \frac{\partial \phi_1^{-1}(y_1,y_2)}{\partial y_2} \\ \frac{\partial \phi_2^{-1}(y_1,y_2)}{\partial y_1} & \frac{\partial \phi_2^{-1}(y_1,y_2)}{\partial y_2} \end{array} \right|
\end{align}
$$
上記の行列式をヤコビ行列式という。ヤコビ行列の解釈については次項で取り扱う。

ヤコビ行列式の解釈

ここでは前項で導入されたヤコビ行列の解釈について確認する。

ヤコビ行列は$J$で表されることが多いので、ここでは$J$とおくと、$J$は下記のように表される。
$$
\large
\begin{align}
J = \left| \begin{array}{cc} \frac{\partial \phi_1^{-1}(y_1,y_2)}{\partial y_1} & \frac{\partial \phi_1^{-1}(y_1,y_2)}{\partial y_2} \\ \frac{\partial \phi_2^{-1}(y_1,y_2)}{\partial y_1} & \frac{\partial \phi_2^{-1}(y_1,y_2)}{\partial y_2} \end{array} \right|
\end{align}
$$
以下では、上記が前項で出てきた面積の伸縮率$\displaystyle \frac{d S’}{d S}$に対応することを確認する。

$dS$は$y$空間の4点の$(y_1,y_2), (y_1+d y_1,y_2), (y_1,y_2+d y_2), (y_1+d y_1,y_2+d y_2)$を頂点とする微小長方形の面積である。一方で$dS’$は$\phi_1^{-1}, \phi_2^{-1}$により$y$空間から$x$空間に変換された4点の$(\phi_1^{-1}(y_1,y_2),\phi_2^{-1}(y_1,y_2)), (\phi_1^{-1}(y_1,y_2)+a_{11}dy_1,\phi_2^{-1}(y_1,y_2)+a_{21}dy_1),$ $(\phi_1^{-1}(y_1,y_2)+a_{12}dy_2,\phi_2^{-1}(y_1,y_2)+a_{22}dy_2), (\phi_1^{-1}(y_1,y_2)+a_{11}dy_1+a_{12}dy_2,\phi_2^{-1}(y_1,y_2)+a_{21}dy_1+a_{22}dy_2)$を頂点とする微小平行四辺形の面積に対応する。ここで導入した$a_{11},a_{12},a_{21},a_{22}$は下記のように表すと考える。
$$
\large
\begin{align}
a_{11} &= \frac{\partial \phi_1^{-1}(y_1,y_2)}{\partial y_1} \\
a_{12} &= \frac{\partial \phi_1^{-1}(y_1,y_2)}{\partial y_2} \\
a_{21} &= \frac{\partial \phi_2^{-1}(y_1,y_2)}{\partial y_1} \\
a_{22} &= \frac{\partial \phi_2^{-1}(y_1,y_2)}{\partial y_2}
\end{align}
$$
この時、微小面積$dS, dS’$は下記のように表すことができる。
$$
\large
\begin{align}
dS &= dy_1dy_2 \\
dS’ &= 平行四辺形(0,0), (a_{11}dy_1,a_{21}dy_1), (a_{12}dy_2,a_{22}dy_2), (a_{11}dy_1+a_{12}dy_2,a_{21}dy_1+a_{22}dy_2)の面積 \\
&= \left| \begin{array}{cc} a_{11} dy_1 & a_{21}dy_1 \\ a_{12}dy_2 & a_{22}dy_2 \end{array} \right| \\
&= dy_1dy_2 \left| \begin{array}{cc} a_{11} & a_{21} \\ a_{12} & a_{22} \end{array} \right| \\
&= |J|dy_1dy_2
\end{align}
$$
上記に基づいて$\displaystyle \frac{d S’}{d S}=|J|$が導出できる。

「平行四辺形の面積の計算とヤコビ行列式・多次元の確率変数の変換」への2件のフィードバック

  1. […] 多次元の変数変換を行うにあたって、前問の$displaystyle frac{dx}{dy}$と同様に考えるのがヤコビ行列$mathbf{J}$やその行列式のヤコビアン$det mathbf{J}$である。https://www.hello-statisticians.com/explain-terms-cat/transformation1.html上記で取り扱ったようにヤコビ行列$mathbf{J}$は下記のように表される。$$largebegin{align}mathbf{J} = left| begin{array}{cc} frac{partial phi_1^{-1}(y_1,y_2)}{partial y_1} & frac{partial phi_1^{-1}(y_1,y_2)}{partial y_2} \ frac{partial phi_2^{-1}(y_1,y_2)}{partial y_1} & frac{partial phi_2^{-1}(y_1,y_2)}{partial y_2} end{array} right|end{align}$$上記に対して行列式の$det mathbf{J}$を考えるわけだが、このとき行列式の図形的解釈が理解の前提となるので、以下では行列式の図形的解釈について取り扱う。なお、ヤコビ行列については次問で取り扱う。 […]

コメントは受け付けていません。