部分行列表記と単位三角行列を用いた行列式の公式$|AB|=|A||B|$の導出

行列式(determinants)に関する$|AB|=|A||B|$の公式は$|A|$を固有値で表す場合などの導出に用いるなど、様々な導出で必須の公式です。当記事では部分行列表記と単位三角行列を用いた$|AB|=|A||B|$の導出について取り扱いました。

「統計のための行列代数(Matrix Algebra From a Statistician’s Perspective)」のCh.$13$や「パターン認識と機械学習」のAppendix.Cを参考に作成を行いました。

・参考
$n$次正方行列の行列式の定義・公式とその解釈
https://www.hello-statisticians.com/explain-books-cat/matrix_determinants1.html

$\mathrm{Theorem}$や$\mathrm{Corollary}$の番号は「統計のための行列代数」に対応します。

前提の確認

行列式の定義

$$
\large
\begin{align}
\det{A} = |A| = \sum_{\sigma \in \mathrm{Aut}(n)} \left[ \mathrm{sgn} (\sigma) \prod_{i=1}^{n} a_{i,\sigma(i)} \right]
\end{align}
$$

$n$次正方行列の行列式の定義・公式とその解釈」では行列式を上記のように定義した。上記では$\displaystyle \prod_{i=1}^{n} a_{i,\sigma(i)}$が行と列から一つずつ要素を選んだ際の積に対応し、$\mathrm{sgn} (\sigma)$が積の符号に対応する。ここで$\sigma(i)$は$1$から$n$を並べ替えたのちの$i$番目のインデックスと考えることができるが、たとえば$1,2,3$を$2,1,3$のように並べ替えた際に$\sigma(1)=2,\sigma(2)=1,\sigma(3)=3$がそれぞれ対応する。

このとき下記$\mathrm{sgn} (\sigma)$をのように表すことを考える。
$$
\large
\begin{align}
\mathrm{sgn} (\sigma) &= (-1)^{\phi_{n}(\sigma(1),\sigma(2),…,\sigma(n))} \\
\phi_{n}(\sigma(1),\sigma(2),…,\sigma(n)) &= \sum_{i=1}^{n-1} p_i
\end{align}
$$

上記の$p_i$は$\sigma(i) > \sigma(i+k),k=1,2,…$となる$\sigma(i+k)$がいくつあるかを表すと定義する。定義だけでは抽象的でわかりにくいので、以下具体的な例に基づいて確認を行う。

・$\phi_{3}(\sigma(1),\sigma(2),\sigma(3))=\phi_{3}(1,3,2)$
$$
\large
\begin{align}
\phi_{3}(1,3,2) &= 0 + 1 = 1 \\
\mathrm{sgn} (\sigma) &= (-1)^{\phi_{3}(1,3,2)} \\
&= (-1)^{1} = -1
\end{align}
$$

上記は$a_{11}a_{23}a_{32}$の符号が$-1$であることに対応する。

・$\phi_{5}(\sigma(1),\sigma(2),\sigma(3),\sigma(4),\sigma(5))=\phi_{5}(3,4,1,5,2)$
$$
\large
\begin{align}
\phi_{5}(3,4,1,5,2) &= 2 + 2 + 0 + 1 = 5 \\
\mathrm{sgn} (\sigma) &= (-1)^{\phi_{5}(3,4,1,5,2)} \\
&= (-1)^{5} = -1
\end{align}
$$

上記は$a_{13}a_{24}a_{31}a_{45}a_{52}$の符号が$-1$であることに対応する。

このように$\phi_{n}(\sigma(1),\sigma(2),…,\sigma(n))$を定義することで具体的な計算が行いやすくなるので、以下ではこのような$\phi$の表記を用いる。また、「統計のための行列代数」ではよく出てくる表記なので、参照する際は先に抑えておくと良い。

三角行列の行列式

三角行列は対角成分より「右上の成分が全て$0$」か「左下の成分が全て$0$」の行列である。一旦対角成分より左下の成分が全て$0$の三角行列を元に考える。具体的には下記のような$n \times n$正方行列$A$を考える。
$$
\large
\begin{align}
A = \left(\begin{array}{cccc} a_{11} & a_{12} & \cdots & a_{1n} \\ 0 & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & a_{nn} \end{array} \right)
\end{align}
$$

上記の行列$A$に関する行列式を考えると、$0$が出てこない要素の選び方が対角成分しかないので$\displaystyle \det{A}=|A|=\prod_{i=1}^{n}a_{ii}$が成立する。行列式は「行と列から$1$つずつ成分を選ぶことから三角行列は対角成分の積のみが残る」と考えると直感的に解釈を行える。

行列式の積と部分行列の行列式の対応

前項の三角行列の行列式の結果を元に考えることで、$m \times m$正方行列$V$と$n \times n$正方行列$W$の行列式の積の$|V||W|$は下記のような部分行列の行列の行列式で表すことができる。
$$
\large
\begin{align}
|V||W| = \left|\begin{array}{cc} V & O \\ X & W \end{array} \right| = \left|\begin{array}{cc} V & X \\ O & W \end{array} \right| \qquad (\mathrm{Theorem}.13.3.1)
\end{align}
$$

上記の理解にあたっては、$\sigma(1),…,\sigma(m),\sigma(m+1),…,\sigma(m+n)$を考えるにあたって、$O$があることにより$\sigma(1),…,\sigma(m) < \sigma(m+1),…,\sigma(m+n)$が成立することから考えると良い。

また、$\sigma(1),…,\sigma(m) < \sigma(m+1),…,\sigma(m+n)$が成立することより、下記も成り立つ。
$$
\large
\begin{align}
\phi(\sigma(1) &,…,\sigma(m),…,\sigma(m+n)) \\
&= \phi(\sigma(1),…,\sigma(m)) + \phi(\sigma(m+1),…,\sigma(m+n)) \\
&= \phi(\sigma(1),…,\sigma(m)) + \phi(\sigma(1),…,\sigma(n))
\end{align}
$$

これにより$|V||W|$の符号に補正をかける必要がないことが確認できる。同様に$m \times m$正方行列$V$と$n \times n$正方行列$W$に関して下記のような部分行列の行列式を考える。
$$
\large
\begin{align}
\left|\begin{array}{cc} O & V \\ W & X \end{array} \right| = \left|\begin{array}{cc} X & W \\ V & O \end{array} \right|
\end{align}
$$

このとき下記が成立する。
$$
\large
\begin{align}
\left|\begin{array}{cc} O & V \\ W & X \end{array} \right| = \left|\begin{array}{cc} X & W \\ V & O \end{array} \right| = (-1)^{mn}|V||W| \qquad (\mathrm{Corollary}.13.3.2)
\end{align}
$$

上記も$O$があることより$X$の要素が行列式の要素に出てこないことから$\mathrm{Theorem}.13.3.1$と同様に$|V||W|$で式が表されるが、$(-1)^{m+n}$で補正が行われる点は異なる。このことは$\mathrm{Theorem}.13.3.1$では$\sigma(1),…,\sigma(m) < \sigma(m+1),…,\sigma(m+n)$が成立していたのに対して、$\mathrm{Corollary}.13.3.2$は$\sigma(1),…,\sigma(m) > \sigma(m+1),…,\sigma(m+n)$が成立することに起因する。$V$の$1$行あたりに$W$の行数である$n$個分の入れ替わりがあるので、その$m$回分の$mn$回の入れ替わりが部分行列の単位で発生すると考えられる。

また、ここで$m=n$が成立し、$V=-I_{n}$のように$T$が単位行列に$-1$をかけた行列であると仮定する。このとき$\mathrm{Corollary}.13.3.2$より下記が成立する。
$$
\large
\begin{align}
\left|\begin{array}{cc} O & -I_{n} \\ W & X \end{array} \right| &= \left|\begin{array}{cc} X & W \\ -I_{n} & O \end{array} \right| \\
&= (-1)^{n^2}|-I_{n}||W| = (-1)^{n^2}(-1)^{n}|I_{n}||W| \\
&= (-1)^{n(n+1)}|W| = |W| \qquad (\mathrm{Corollary}.13.3.3)
\end{align}
$$

|AB|=|A||B|の導出

単位三角行列の積の行列式

単位三角行列は対角成分が$1$の三角行列である。単位三角行列$T$は下記のように表すことができる。
$$
\large
\begin{align}
T = \left(\begin{array}{cccc} 1 & t_{12} & \cdots & t_{1n} \\ 0 & 1 & \cdots & t_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & 1 \end{array} \right)
\end{align}
$$

上記のように定義した単位三角行列$T$に対して下記が成立する。
$$
\large
\begin{align}
|XT| = |TX| = |X| \qquad (\mathrm{Corollary}.13.2.11)
\end{align}
$$

$\mathrm{Corollary}.13.2.11$の詳しい導出は下記で取り扱った。
https://www.hello-statisticians.com/explain-terms-cat/matrix_determinants3.html

$|AB|=|A||B|$の導出

ここまでに確認した式より、下記のように$|AB|=|A||B|$を示せる。

$$
\large
\begin{align}
|A|B| &= \left|\begin{array}{cc} A & 0 \\ -I & B \end{array} \right| \qquad (\mathrm{Theorem}.13.3.1) \\
&= \left| \left( \begin{array}{cc} A & O \\ -I & B \end{array} \right) \left( \begin{array}{cc} I & B \\ O & I \end{array} \right) \right| \qquad (\mathrm{Theorem}.13.2.11) \\
&= \left|\begin{array}{cc} A & AB \\ -I & O \end{array} \right| = |AB| \qquad (\mathrm{Corollary}.13.3.3)
\end{align}
$$

「部分行列表記と単位三角行列を用いた行列式の公式$|AB|=|A||B|$の導出」への2件のフィードバック

コメントは受け付けていません。