転置行列(transposed matrix)の定義とよく出てくる公式

行列$A$の転置行列$A^{\mathrm{T}}$は様々な場面でよく出てきますが、$(AB)^{\mathrm{T}}=B^{\mathrm{T}}A^{\mathrm{T}}$などは詳しく確認していないとわからなくなりがちです。そこで当記事では転置行列の定義とよく出てくる公式に関して取りまとめを行いました。
統計のための行列代数(Matrix Algebra From a Statistician’s Perspective)」のCh.$1$を参考に作成を行いました。

基本的な考え方

転置行列の定義

「統計のための行列代数(Matrix Algebra From a Statistician’s Perspective)」のSection$1$.$2$.$d$「Transposition」の例を元に$2 \times 3$行列の$A$を下記のように考える。
$$
\large
\begin{align}
A = \left(\begin{array}{ccc} 2 & -3 & 0 \\ 1 & 4 & 2 \end{array} \right)
\end{align}
$$

このとき、$A$の転置行列(transposed matrix)$A^{\mathrm{T}}$は下記のように表される。
$$
\large
\begin{align}
A^{\mathrm{T}} = \left(\begin{array}{cc} 2 & 1 \\ -3 & 4 \\ 0 & 2 \end{array} \right)
\end{align}
$$

このように$A$の転置行列$A^{\mathrm{T}}$は、「$A$の$(i,j)$成分を$(j,i)$成分に持つ行列である」と定義される。上記では$2 \times 3$行列で考えたが、$m \times n$行列でも同様に考えることができる。

行列の成分表示

$m \times n$の行列$A$の$i$行$j$列の要素(element)を$a_{ij}$のように定義し、行列$A$を下記のように表すことを考える。
$$
\large
\begin{align}
A = ( a_{ij} )
\end{align}
$$

上記のような行列の表記を考えることで、行列の式を示す際に「要素全てに対してではなく、$1$つの要素に関してのみ示す」ことで等号の成立を示すことができる。このことに基づくと行列に関する式の導出などがシンプルになり行いやすくなる。

ここで、行列$A$の$(i,j)$成分を考えるにあたって$A = ( a_{ij} )$のようにおき、$a_{ij}$のように取り扱う場合、$A-B+C$の成分を考える場合などに表記が複雑になると思われる。よって、行列$A$の$(i,j)$成分を$(A)_{ij}$のように表す場合がある。

以下、表記の簡略化にあたって、基本的には行列$A$の$(i,j)$成分は$(A)_{ij}$のように表す。また、「統計の森」では表記の簡略化を行うにあたって$(A)_{ij}$の表記をメインで用いる。

抑えておきたい公式とその導出

$(AB)^{\mathrm{T}}=B^{\mathrm{T}}A^{\mathrm{T}}$の導出

行列に関する導出を行うにあたって、$m \times k$行列の$A$と$k \times n$行列の$B$に対して$(AB)^{\mathrm{T}}=B^{\mathrm{T}}A^{\mathrm{T}}$は用いることがかなり多い。よって、単に式表記を抑えるだけでなく、式の意図も合わせて掴んでおく必要がある。

前項の「行列の成分表示」の内容を元に、$(AB)_{ij} = (B^{\mathrm{T}}A^{\mathrm{T}})_{ji}$であることを示せばこの式が成立することが確認できる。
$$
\large
\begin{align}
(AB)_{ij} &= \left(\begin{array}{cccc} a_{i1} & a_{i2} & \cdots & a_{ik} \end{array} \right) \left(\begin{array}{c} b_{1j} \\ b_{2j} \\ \vdots \\ b_{kn} \end{array} \right) \\
&= \sum_{k} a_{ik} b_{kj} \\
(B^{\mathrm{T}}A^{\mathrm{T}})_{ji} &= \left(\begin{array}{cccc} b_{1j} & b_{2j} & \cdots & b_{kj} \end{array} \right) \left(\begin{array}{c} a_{i1} \\ a_{i2} \\ \vdots \\ a_{ik} \end{array} \right) \\
&= \sum_{k} b_{kj} a_{ik} \\
&= \sum_{k} a_{ik} b_{kj}
\end{align}
$$

上記は任意の$(i,j)$成分に関して成立するので、$(AB)^{\mathrm{T}}=B^{\mathrm{T}}A^{\mathrm{T}}$が成立することを示すことができる。

参考

・行列の定義まとめ
https://www.hello-statisticians.com/explain-terms-cat/matrix_def1.html

・統計のための行列代数 Ch.$1$ Matrices