平行四辺形の面積の計算とヤコビ行列式・多次元の確率変数の変換

下記では1次元の確率変数の変換を対数正規分布の導出を例に確認を行った。
https://www.hello-statisticians.com/explain-terms-cat/log_normal_dist1.html
当記事では「多次元の確率変数の変換」を取り扱うにあたって、1次元の確率変数の変換の内容に基づきながら確認を行う。途中で平行四辺形の面積の計算も出てくるので、行列式と面積の計算について詳しく確認した上で詳細の確認を行う構成でまとめることにした。
作成にあたっては「基礎統計学Ⅰ 統計学入門(東京大学出版会)」の第7章の「付節:数学的証明、多次元の確率変数の変換」を参考にした。なお、$dx, dy$などの記号の用い方にあたっては厳密さよりも直感的な理解を重視しているので、厳密に考えた際に間違いが含まれる場合がある。

行列式を用いた平行四辺形の面積の公式と証明

行列式と平行四辺形の面積の公式

4点が$(0, 0), (a_1, a_2), (b_1, b_2), (a_1+b_1, a_2+b_2)$で与えられる平行四辺形の面積を計算することを考える。$\displaystyle \mathbf{a}=\left(\begin{array}{cc} a_1 \\ a_2 \end{array}\right), \mathbf{b}=\left(\begin{array}{cc} b_1 \\ b_2 \end{array}\right)$のように表し、$\mathbf{a}, \mathbf{b}$が$x$軸となす角をそれぞれ$\alpha, \beta$とし、$\displaystyle 0 < \alpha < \beta < \frac{\pi}{2}$が成立すると考える。

このとき、4点で表され平行四辺形の面積$S$は下記のように行列式を用いて表すことができる。
$$
\large
\begin{align}
S &= a_1b_2 – a_2b_1 \\
&= \left| \begin{array}{cc} a_1 & a_2 \\ b_1 & b_2 \end{array} \right|
\end{align}
$$

証明① 内積の式$\mathbf{a} \cdot \mathbf{b} = |\mathbf{a}||\mathbf{b}|\cos{\theta}$の活用

平行四辺形の面積$S$が下記のように表せることから導出を行う。
$$
\large
\begin{align}
S &= |\mathbf{a}||\mathbf{b}|\sin{\theta} \\
\theta &= \beta-\alpha
\end{align}
$$
上記の式は平行四辺形の公式の「底辺×高さ」に基づいているが、$\theta$は$\mathbf{a}$と$\mathbf{b}$のなす角を表すにあたって、$\theta = \beta-\alpha$によって定義した。

$$
\large
\begin{align}
\sin^2{\theta} &= 1-\cos^2{\theta} \\
\mathbf{a} \cdot \mathbf{b} &= |\mathbf{a}||\mathbf{b}|\cos{\theta}
\end{align}
$$
以下では上記の式に基づいて$S=|\mathbf{a}||\mathbf{b}|\sin{\theta}$を計算する。
$$
\large
\begin{align}
S &= |\mathbf{a}||\mathbf{b}|\sin{\theta} \\
&= |\mathbf{a}||\mathbf{b}|\sqrt{1-\cos^2{\theta}} \\
&= |\mathbf{a}||\mathbf{b}|\sqrt{1-\frac{(\mathbf{a} \cdot \mathbf{b})^2}{(|\mathbf{a}||\mathbf{b}|)^2}} \\
&= \sqrt{(|\mathbf{a}||\mathbf{b}|)^2-(\mathbf{a} \cdot \mathbf{b})^2} \quad (1)
\end{align}
$$

上記において、$\displaystyle \mathbf{a}=\left(\begin{array}{cc} a_1 \\ a_2 \end{array}\right), \mathbf{b}=\left(\begin{array}{cc} b_1 \\ b_2 \end{array}\right)$より下記が成立する。
$$
\large
\begin{align}
|\mathbf{a}| &= a_1^2+a_2^2 \\
|\mathbf{b}| &= b_1^2+b_2^2 \\
(\mathbf{a} \cdot \mathbf{b})^2 &= (a_1b_1+a_2b_2)^2
\end{align}
$$
上記を$(1)$式に代入する。
$$
\large
\begin{align}
S &= \sqrt{(|\mathbf{a}||\mathbf{b}|)^2-(\mathbf{a} \cdot \mathbf{b})^2} \quad (1) \\
&= \sqrt{(a_1^2+a_2^2)(b_1^2+b_2^2) – (a_1b_1+a_2b_2)^2} \\
&= \sqrt{a_1^2b_1^2 + a_1^2b_2^2 + a_2^2b_1^2 + a_2^2b_2^2 – (a_1^2b_1^2 + a_2^2b_2^2 – 2a_1a_2b_1b_2)} \\
&= \sqrt{a_1^2b_2^2 + a_2^2b_1^2 – 2a_1a_2b_1b_2} \\
&= \sqrt{(a_1b_2-a_2b_1)^2} \\
&= a_1b_2-a_2b_1 \\
&= \left| \begin{array}{cc} a_1 & a_2 \\ b_1 & b_2 \end{array} \right|
\end{align}
$$

証明② 加法定理$\sin{(\beta-\alpha)} = \sin{\beta}\cos{\alpha}-\cos{\beta}\sin{\alpha}$の活用

平行四辺形の面積$S$が下記のように表せることから導出を行う。
$$
\large
\begin{align}
S = |\mathbf{a}||\mathbf{b}|\sin{(\beta-\alpha)}
\end{align}
$$
上記における$\sin{(\beta-\alpha)}$に加法定理を用いることで、$S$は下記のように変形できる。
$$
\large
\begin{align}
S &= |\mathbf{a}||\mathbf{b}|\sin{(\beta-\alpha)} \\
&= |\mathbf{a}||\mathbf{b}|(\sin{\beta}\cos{\alpha}-\cos{\beta}\sin{\alpha}) \\
&= |\mathbf{a}|\cos{\alpha}|\mathbf{b}|\sin{\beta}-|\mathbf{a}|\sin{\alpha}|\mathbf{b}|\cos{\beta} \\
&= a_1b_2 – a_2b_1 \\
&= \left| \begin{array}{cc} a_1 & a_2 \\ b_1 & b_2 \end{array} \right|
\end{align}
$$

加法定理の導出に関しては下記がわかりやすいのでこちらも抑えておくと良い。
https://www.hello-statisticians.com/explain-terms-cat/trigonometric_function1.html

多次元の確率変数の変換

変換の公式

$x,y$に関する確率密度関数をそれぞれ$f(x), g(y)$、$x,y$の関係式を$y=\phi(x), x=\phi^{-1}(y)$のように表されるとき、「1次元の確率変数の変換」の式は下記を用いて導出することができる。
$$
\large
\begin{align}
g(y) &= f(\phi^{-1}(y)) \left| \frac{d \phi^{-1}(y)}{d y} \right|
\end{align}
$$

以下、2次元の確率変数の変換について具体的に取り扱う。$(x_1,x_2)$が下記のような変換によって$(y_1,y_2)$に移ったと考える。
$$
\large
\begin{align}
y_1 &= \phi_1(x_1,x_2) \\
y_2 &= \phi_2(x_1,x_2)
\end{align}
$$

この時、確率密度関数$f(x_1,x_2)$と$g(y_1,y_2)$の関係は下記のように表せる。
$$
\large
\begin{align}
g(y_1,y_2) &= f(\phi_1^{-1}(y_1,y_2), \phi_2^{-1}(y_1,y_2)) \frac{d S’}{d S} \quad (2)
\end{align}
$$
上記において$\displaystyle \frac{d S’}{d S}$は$\phi_1^{-1}, \phi_2^{-1}$による面積の伸縮率であるが、これは変動関数の関数で表される。これより式$(2)$は下記のように表すことができる。
$$
\large
\begin{align}
g(y_1,y_2) = f(\phi_1^{-1}(y_1,y_2), \phi_2^{-1}(y_1,y_2)) \left| \begin{array}{cc} \frac{\partial \phi_1^{-1}(y_1,y_2)}{\partial y_1} & \frac{\partial \phi_1^{-1}(y_1,y_2)}{\partial y_2} \\ \frac{\partial \phi_2^{-1}(y_1,y_2)}{\partial y_1} & \frac{\partial \phi_2^{-1}(y_1,y_2)}{\partial y_2} \end{array} \right|
\end{align}
$$
上記の行列式をヤコビ行列式という。ヤコビ行列の解釈については次項で取り扱う。

ヤコビ行列式の解釈

ここでは前項で導入されたヤコビ行列の解釈について確認する。

ヤコビ行列は$J$で表されることが多いので、ここでは$J$とおくと、$J$は下記のように表される。
$$
\large
\begin{align}
J = \left( \begin{array}{cc} \frac{\partial \phi_1^{-1}(y_1,y_2)}{\partial y_1} & \frac{\partial \phi_1^{-1}(y_1,y_2)}{\partial y_2} \\ \frac{\partial \phi_2^{-1}(y_1,y_2)}{\partial y_1} & \frac{\partial \phi_2^{-1}(y_1,y_2)}{\partial y_2} \end{array} \right)
\end{align}
$$
以下では、上記が前項で出てきた面積の伸縮率$\displaystyle \frac{d S’}{d S}$に対応することを確認する。

$dS$は$y$空間の4点の$(y_1,y_2), (y_1+d y_1,y_2), (y_1,y_2+d y_2), (y_1+d y_1,y_2+d y_2)$を頂点とする微小長方形の面積である。一方で$dS’$は$\phi_1^{-1}, \phi_2^{-1}$により$y$空間から$x$空間に変換された4点の$(\phi_1^{-1}(y_1,y_2),\phi_2^{-1}(y_1,y_2)), (\phi_1^{-1}(y_1,y_2)+a_{11}dy_1,\phi_2^{-1}(y_1,y_2)+a_{21}dy_1),$ $(\phi_1^{-1}(y_1,y_2)+a_{12}dy_2,\phi_2^{-1}(y_1,y_2)+a_{22}dy_2), (\phi_1^{-1}(y_1,y_2)+a_{11}dy_1+a_{12}dy_2,\phi_2^{-1}(y_1,y_2)+a_{21}dy_1+a_{22}dy_2)$を頂点とする微小平行四辺形の面積に対応する。ここで導入した$a_{11},a_{12},a_{21},a_{22}$は下記のように表すと考える。計算の詳細は次項で確認を行う。
$$
\large
\begin{align}
a_{11} &= \frac{\partial \phi_1^{-1}(y_1,y_2)}{\partial y_1} \\
a_{12} &= \frac{\partial \phi_1^{-1}(y_1,y_2)}{\partial y_2} \\
a_{21} &= \frac{\partial \phi_2^{-1}(y_1,y_2)}{\partial y_1} \\
a_{22} &= \frac{\partial \phi_2^{-1}(y_1,y_2)}{\partial y_2}
\end{align}
$$
この時、微小面積$dS, dS’$は下記のように表すことができる。
$$
\large
\begin{align}
dS &= dy_1dy_2 \\
dS’ &= 平行四辺形(0,0), (a_{11}dy_1,a_{21}dy_1), (a_{12}dy_2,a_{22}dy_2), (a_{11}dy_1+a_{12}dy_2,a_{21}dy_1+a_{22}dy_2)の面積 \\
&= \left| \begin{array}{cc} a_{11} dy_1 & a_{21}dy_1 \\ a_{12}dy_2 & a_{22}dy_2 \end{array} \right| \\
&= dy_1dy_2 \left| \begin{array}{cc} a_{11} & a_{21} \\ a_{12} & a_{22} \end{array} \right| \\
&= |J|dy_1dy_2
\end{align}
$$
上記に基づいて$\displaystyle \frac{d S’}{d S}=|J|$が導出できる。

具体例を用いた変換に関する計算の詳細の確認とテイラー展開

前項で用いた$a_{11}$〜$a_{22}$を用いた変換に関する計算の詳細に関して以下確認を行う。まず変換が1次式で表される場合に関しては、「ヤコビ行列$\mathbf{J}$とヤコビアン$det \mathbf{J}$」の演習で取り扱ったのでこちらを元に確認を行う。

$$
\large
\begin{align}
y_1 &= 2x_1 + x_2 \\
y_2 &= x_1 + 2x_2
\end{align}
$$
上記のような変換で$x_1, x_2$に対して$y_1, y_2$が得られるとき、逆変換$\phi_1^{-1}, \phi_2^{-1}$は下記のように表される。
$$
\large
\begin{align}
x_1 &= \phi_1^{-1}(y_1,y_2) = \frac{2}{3}y_1 – \frac{1}{3}y_2 \\
x_2 &= \phi_2^{-1}(y_1,y_2) = -\frac{1}{3}y_1 + \frac{2}{3}y_2
\end{align}
$$

このとき、$\phi_1^{-1}(y_1+dy_1,y_2+dy_2)$は下記のように表すことができる。
$$
\large
\begin{align}
\phi_1^{-1}(y_1+dy_1,y_2+dy_2) &= \frac{2}{3}(y_1+dy_1) – \frac{1}{3}(y_2+dy_2) \\
&= \left( \frac{2}{3}y_1 – \frac{1}{3}y_2 \right) + \frac{2}{3}dy_1 – \frac{1}{3}dy_2 \\
&= \phi_1^{-1}(y_1,y_2) + \frac{\partial \phi_1^{-1}(y_1,y_2)}{\partial y_1}dy_1 +
\frac{\partial \phi_1^{-1}(y_1,y_2)}{\partial y_2}dy_2
\end{align}
$$
上記と同様に他の変換も考えることで、この例におけるヤコビ行列を考える際の変換が導出できる。また、1次式に関してはここで行なった議論と同じ議論を行うことで、同様の結果を示すことができる。

1次式以外に関しては1次のテイラー展開による近似であると考えると良い。
$$
\large
\begin{align}
\phi_1^{-1}(y_1+dy_1,y_2+dy_2) \simeq \phi_1^{-1}(y_1,y_2) + \frac{\partial \phi_1^{-1}(y_1,y_2)}{\partial y_1}dy_1 + \frac{\partial \phi_1^{-1}(y_1,y_2)}{\partial y_2}dy_2
\end{align}
$$
上記の式の$y_1$に注目する際に、$y_1$を$a$、$dy_1$を$x_1-a$と考えればテイラー展開の1次の項の$\displaystyle \frac{f'(a)}{1!}(x_1-a)^1=\frac{d f(x_1)}{d x_1}(x_1-a)$に対し、$\displaystyle \frac{\partial \phi_1^{-1}(y_1,y_2)}{\partial y_1}dy_1$を対応させて理解することができる。$y_2$に注目する際も同様に、$y_2$を$b$、$dy_2$を$x_2-b$と考えればテイラー展開の1次の項の$\displaystyle \frac{f'(b)}{1!}(x_2-b)^1=\frac{d f(x_2)}{d x_2}(x_2-b)$に対し、$\displaystyle \frac{\partial \phi_1^{-1}(y_1,y_2)}{\partial y_2}dy_2$を対応させて理解することができる。

「平行四辺形の面積の計算とヤコビ行列式・多次元の確率変数の変換」への4件のフィードバック

  1. […] 多次元の変数変換を行うにあたって、前問の$displaystyle frac{dx}{dy}$と同様に考えるのがヤコビ行列$mathbf{J}$やその行列式のヤコビアン$det mathbf{J}$である。https://www.hello-statisticians.com/explain-terms-cat/transformation1.html上記で取り扱ったようにヤコビ行列$mathbf{J}$は下記のように表される。$$largebegin{align}mathbf{J} = left| begin{array}{cc} frac{partial phi_1^{-1}(y_1,y_2)}{partial y_1} & frac{partial phi_1^{-1}(y_1,y_2)}{partial y_2} \ frac{partial phi_2^{-1}(y_1,y_2)}{partial y_1} & frac{partial phi_2^{-1}(y_1,y_2)}{partial y_2} end{array} right|end{align}$$上記に対して行列式の$det mathbf{J}$を考えるわけだが、このとき行列式の図形的解釈が理解の前提となるので、以下では行列式の図形的解釈について取り扱う。なお、ヤコビ行列については次問で取り扱う。 […]

  2. […] $$largebegin{align}det{A} = left(begin{array}{ccc} a_{11} & a_{12} a_{21} & a_{22} end{array} right)end{align}$$下記で詳しく取り扱ったが、上記の$2 times 2$行列の行列式は$4$点$(0,0), (a_{11},a_{12}), (a_{11}+a_{21},a_{12}+a_{22}), (a_{21},a_{22})$で構成される平行四辺形の面積に一致する。https://www.hello-statisticians.com/explain-terms-cat/transformation1.html […]

コメントは受け付けていません。