ブログ

標本分布の変数変換を用いた導出や平均・分散の計算|問題演習で理解する統計学【5】

下記などで取り扱った、標本分布に関する問題演習を通した理解ができるように問題・解答・解説をそれぞれ作成しました。

・標準演習$100$選
https://www.hello-statisticians.com/practice_100

基本問題

$\chi^{2}$分布の確率密度関数の導出

・問題
標準正規分布を$\mathcal{N}(0,1)$、自由度$1$の$\chi^2$分布を$\chi^{2}(1)$のように表す。ここで、確率変数$X$に関して$X \sim \mathcal{N}(0,1)$が成立するとき、$Y = X^2 \sim \chi^{2}(1)$が成立する。また、$\mathcal{N}(0,1)$の確率密度関数$f(x)$は下記のように表せる。
$$
\large
\begin{align}
f_1(x) = \frac{1}{\sqrt{2 \pi}} \exp \left( -\frac{x^2}{2} \right)
\end{align}
$$

このとき、$y = x^2$で定義される$y$で上記の$f_1(x)$に対し、変数変換を行うことで自由度$1$の$\chi^2$分布$\chi^{2}(1)$の確率密度関数の導出を行うことができる。$\chi^{2}(1)$の確率密度関数を$g(y)$とおき、以下$g_1(y)$の導出を行う。

ここまでの内容を元に下記の問題に答えよ。
i) $P(0 \leq Y \leq u)$が下記のように表せることを示せ。
$$
\begin{align}
P(0 \leq Y \leq u) = \int_{-\sqrt{u}}^{\sqrt{u}} f(x) dx
\end{align}
$$
ⅱ) 関数$l(x)$に関して$\displaystyle \int_{-c}^{c} l(x) dx = 2 \int_{0}^{c} l(x) dx$が成立する際の$l(x)$の形状を答えよ。また、i)の式に対し、下記が成立することを示せ。
$$
\begin{align}
P(0 \leq Y \leq u) = 2 \int_{0}^{\sqrt{u}} f_1(x) dx = 2 \int_{0}^{\sqrt{u}} \frac{1}{\sqrt{2 \pi}} \exp \left( -\frac{x^2}{2} \right) dx
\end{align}
$$
ⅲ) $\displaystyle P(0 \leq Y \leq u) = 2 \int_{0}^{\sqrt{u}} \frac{1}{\sqrt{2 \pi}} \exp \left( -\frac{x^2}{2} \right) dx$に対し、$y=x^2$を用いて置換積分を行い下記を示せ。
$$
\begin{align}
P(0 \leq Y \leq u) = \int_{0}^{\sqrt{u}} \frac{1}{\sqrt{2 \pi y}} \exp \left( -\frac{y}{2} \right) dy
\end{align}
$$
iv) $\chi^{2}(1)$はガンマ分布であるのでガンマ分布も合わせて抑えておくと良い。
$$
\large
\begin{align}
f_2(x) &= \frac{1}{\Gamma(\alpha)} x^{\alpha-1} e^{-x} \\
\Gamma(\alpha) &= \int_{0}^{\infty} x^{\alpha-1} e^{-x} dx
\end{align}
$$

上記で定めた$f_2(x)$がガンマ分布$\mathrm{Ga}(\alpha)$の確率密度関数であるが、この確率密度関数を$\displaystyle x = \frac{y}{\beta}$で変数変換を行った分布が$\mathrm{Ga}(\alpha, \beta)$である。$\mathrm{Ga}(\alpha, \beta)$の確率密度関数$g_2(y)$を導出せよ。

v) ⅲ)の式より、$\chi^{2}(1)$の確率密度関数$g_1(y)$が$\displaystyle g_1(y) = \frac{1}{\sqrt{2 \pi y}} \exp \left( -\frac{y}{2} \right)$であると考えることができる。iv)で得た確率密度関数$g_2(y)$を元に、$\chi^{2}(1)$が一致するガンマ分布$\mathrm{Ga}(\alpha, \beta)$の$\alpha$と$\beta$を答えよ。

・解答
i)
$P(0 \leq Y \leq u) = P(-\sqrt{u} \leq X \leq \sqrt{u})$より、$P(0 \leq Y \leq u)$は下記のように表すことができる。
$$
\large
\begin{align}
P(0 \leq Y \leq u) &= P(-\sqrt{u} \leq X \leq \sqrt{u}) \\
&= \int_{-\sqrt{u}}^{\sqrt{u}} f_1(x) dx
\end{align}
$$

ⅱ)
$\displaystyle \int_{-c}^{c} l(x) dx = 2 \int_{0}^{c} l(x) dx$が成立する$l(x)$は直線$x=0$に線対称な関数である。また、$f(x)$は標準正規分布$\mathcal{N}(0,1)$の確率密度関数であり$x=0$で線対称であることから下記が成立する。
$$
\large
\begin{align}
P(0 \leq Y \leq u) &= \int_{-\sqrt{u}}^{\sqrt{u}} f_1(x) dx \\
&= 2 \int_{0}^{\sqrt{u}} f_1(x) dx \\
&= 2 \int_{0}^{\sqrt{u}} \frac{1}{\sqrt{2 \pi}} \exp \left( -\frac{x^2}{2} \right) dx
\end{align}
$$

ⅲ)
$y=x^2, y \geq 0$であるから$x=\sqrt{y}$と考えることができる。よって、$\displaystyle dx = \frac{1}{2 \sqrt{y}}$が成立する。また、$x$と$y$の範囲の対応は下記のように表せる。

$x$$0 \to \sqrt{u}$
$y$$0 \to u$

ⅲ)
$y=x^2, y \geq 0$であるから$x=\sqrt{y}$と考えることができる。よって、$\displaystyle dx = \frac{1}{2 \sqrt{y}}$が成立する。また、$x$と$y$の範囲の対応は下記のように表せる。
$x$ $0 \to \sqrt{u}$
$y$ $0 \to u$

よって、下記のように置換積分を考えることができる。
$$
\begin{align}
\large
P(0 \leq Y \leq u) &= 2 \int_{0}^{\sqrt{u}} \frac{1}{\sqrt{2 \pi}} \exp \left( -\frac{x^2}{2} \right) dx \\
&= 2 \int_{0}^{u} \frac{1}{\sqrt{2 \pi}} \exp \left( -\frac{y}{2} \right) \cdot \frac{1}{2 \sqrt{y}} dy \\
&= \int_{0}^{\sqrt{u}} \frac{1}{\sqrt{2 \pi y}} \exp \left( -\frac{y}{2} \right) dy
\end{align}
$$

iv)
$\displaystyle x = \frac{y}{\beta}$より、$\displaystyle \left| \frac{dx}{dy} \right| = \frac{1}{\beta}$である。よって$g_2(y)$は下記のように表せる。
$$
\large
\begin{align}
g_2(y) &= f_2(x) \left| \frac{dx}{dy} \right| = f_2 \left( \frac{y}{\beta} \right) \cdot \frac{1}{\beta} \\
&= \frac{1}{\Gamma(\alpha)} \left( \frac{y}{\beta} \right)^{\alpha-1} e^{-\frac{y}{\beta}} \cdot \frac{1}{\beta} \\
&= \frac{1}{\beta^{\alpha} \Gamma(\alpha)} y^{\alpha-1} e^{-\frac{y}{\beta}}
\end{align}
$$

v)
ⅲ)の導出結果より$g_1(y)$は下記のように表せる。
$$
\large
\begin{align}
g_1(y) &= \frac{1}{\sqrt{2 \pi y}} \exp \left( -\frac{y}{2} \right) \\
&= \frac{1}{2^{\frac{1}{2}} \sqrt{\pi}} y^{\frac{1}{2}-1} \exp \left( -\frac{y}{2} \right) \\
&= \frac{1}{2^{\frac{1}{2}} \Gamma \left( \frac{1}{2} \right)} y^{\frac{1}{2}-1} \exp \left( -\frac{y}{2} \right)
\end{align}
$$

上記とiv)で導出を行った$g_2(y)$より、$\displaystyle \alpha = \frac{1}{2}, \beta = 2$であることが確認できる。

・解説
自由度$1$の$\chi^2$分布を$\chi^{2}(1)$の導出に関して取り扱いを行いましたが、$Y=X^2$のように変数変換を行うことから単に確率密度関数を用いるのではなく、積分を元に確率を$P(0 \leq Y \leq u) = P(-\sqrt{u} \leq X \leq \sqrt{u})$のように表して計算を行ったのちに確率密度関数を取り出すと考えると良いです。置換積分と確率密度関数の$2$つの式を用いましたが、確率密度関数の式は置換積分の式を簡略化して取り扱ったものであると理解しておくと良いと思います。

ガンマ分布に基づく$\chi^2$分布の平均・分散や$k$次モーメントの計算

・問題
前問では、自由度$1$の$\chi^2$分布$\chi^2(1)$がガンマ分布$\displaystyle \mathrm{Ga} \left( \frac{1}{2}, 2 \right)$に一致することを確認した。この問題では$\chi^2$分布の平均・分散や$k$次モーメントの計算を行うにあたって、ガンマ分布に関する導出結果を活用する。

以下、ガンマ分布$\mathrm{Ga}(\alpha,\beta)$の平均$E[X]$、分散$V[X]$や$k$次モーメント$E[X^k]$の計算を行い、結果を$\chi^2$分布に適用する。下記の問いにそれぞれ答えよ。
i) ガンマ分布$\mathrm{Ga}(\alpha,\beta)$の確率密度関数$f(x)$を下記のように定める。
$$
\begin{align}
f(x) = \frac{1}{\beta^{\alpha} \Gamma(\alpha)} x^{\alpha-1} \exp{\left( -\frac{x}{\beta} \right)}
\end{align}
$$
上記に対し$\Gamma(\alpha+1) = \alpha \Gamma(\alpha)$を用いることで、ガンマ分布$\mathrm{Ga}(\alpha,\beta)$の期待値$E[X]$が下記のように表せることを示せ。
$$
\begin{align}
E[X] = \beta \alpha
\end{align}
$$
ⅱ) $\Gamma(\alpha+2) = \alpha(\alpha+1) \Gamma(\alpha)$であることを用いてi)と同様にガンマ分布$\mathrm{Ga}(\alpha,\beta)$の$2$次のモーメント$E[X^2]$が下記のように表せることを示せ。
$$
\begin{align}
E[X^2] = \beta \alpha (\alpha + 1)
\end{align}
$$
また、$V[X]=E[X^2]-E[X]^2$であることに基づいて分散$V[X]$を計算せよ。
ⅲ) i)とⅱ)と同様に考えることで$k$次のモーメント$E[X^k]$が下記のように表せることを示せ。
$$
\begin{align}
E[X^k] = \frac{\beta^{k} \Gamma(\alpha+k)}{\Gamma(\alpha)}
\end{align}
$$
iv) 確率変数$X$が$X \sim \mathrm{Ga}(\alpha_1,\beta)$であるとき$X$のモーメント母関数$m_{X}(t)$が下記のように表せることを示せ。
$$
\begin{align}
m_{X}(t) = \frac{1}{(1-t \beta)^{\alpha_1}}
\end{align}
$$
v) 確率変数$X, Y$が$X \sim \mathrm{Ga}(\alpha_1,\beta), Y \sim \mathrm{Ga}(\alpha_2,\beta)$であるとき、$X+Y$のモーメント母関数$m_{X+Y}(t)$を考えることで$X+Y \sim \mathrm{Ga}(\alpha_1+\alpha_2,\beta)$を示せ。
vi) $X_i \sim \mathcal{N}(0,1), X_i^2 \sim \chi^2(1)$のとき$\displaystyle Z = \sum_{i=1}^{n} X_i^2 \sim \chi^2(n)$を示せ。
vⅱ) vi)で定めた$Z$に関してi)、ⅱ)の結果を適用することで$E[Z], V[Z]$を示せ。また、$Z \sim \chi^2(n)$の確率密度関数を$g(z)$とおくとき、vi)であることに基づいて$g(z)$を表せ。

・解答
i)
ガンマ分布$\mathrm{Ga}(\alpha,\beta)$の期待値$E[X]$は期待値の定義に基づいて下記のように表せる。
$$
\large
\begin{align}
E[X] &= \int_{0}^{\infty} x f(x) dx \\
&= \int_{0}^{\infty} x \times \frac{1}{\beta^{\alpha} \Gamma(\alpha)} x^{\alpha-1} \exp{\left( -\frac{x}{\beta} \right)} dx \\
&= \int_{0}^{\infty} \frac{1}{\Gamma(\alpha)} \left( \frac{x}{\beta} \right)^{\alpha} \exp{\left( -\frac{x}{\beta} \right)} dx
\end{align}
$$

上記に対し、$\displaystyle y = \frac{x}{\beta}$のように変数変換を行うことを考える。このとき$x = \beta y$より$dx = \beta dy$である。また$\beta>0$より、$x$と$y$の範囲は下記のように対応する。

$x$$0 \to \infty$
$y$$0 \to \infty$

よって、$E[X]$は変数変換$\displaystyle y = \frac{x}{\beta}$を元に下記のように式変形できる。
$$
\large
\begin{align}
E[X] &= \int_{0}^{\infty} \frac{1}{\Gamma(\alpha)} \left( \frac{x}{\beta} \right)^{\alpha} \exp{\left( -\frac{x}{\beta} \right)} dx \\
&= \int_{0}^{\infty} \frac{1}{\Gamma(\alpha)} y^{\alpha} \exp{(-y)} \cdot \beta dy \\
&= \int_{0}^{\infty} \frac{\beta}{\Gamma(\alpha+1)/\alpha} y^{(\alpha+1)-1} \exp{(-y)}dy \\
&= \int_{0}^{\infty} \frac{\beta \alpha}{\Gamma(\alpha+1)} y^{(\alpha+1)-1} \exp{(-y)}dy \\
&= \beta \alpha \int_{0}^{\infty} \frac{1}{\Gamma(\alpha+1)} y^{(\alpha+1)-1} \exp{(-y)}dy \\
&= \beta \alpha \times 1 = \beta \alpha
\end{align}
$$

ⅱ)
ガンマ分布$\mathrm{Ga}(\alpha,\beta)$の$2$次のモーメント$E[X^2]$は期待値の定義に基づいて下記のように表せる。
$$
\large
\begin{align}
E[X^2] &= \int_{0}^{\infty} x^2 f(x) dx \\
&= \int_{0}^{\infty} x^2 \times \frac{1}{\beta^{\alpha} \Gamma(\alpha)} x^{\alpha-1} \exp{\left( -\frac{x}{\beta} \right)} dx \\
&= \int_{0}^{\infty} \frac{\beta}{\Gamma(\alpha)} \left( \frac{x}{\beta} \right)^{\alpha+1} \exp{\left( -\frac{x}{\beta} \right)} dx
\end{align}
$$

上記に対し、$\displaystyle y = \frac{x}{\beta}$のように変数変換を行うことを考える。このとき$x = \beta y$より$dx = \beta dy$である。また$\beta>0$より、$x$と$y$の範囲は下記のように対応する。

$x$$0 \to \infty$
$y$$0 \to \infty$

よって、$E[X^2]$は変数変換$\displaystyle y = \frac{x}{\beta}$を元に下記のように式変形できる。
$$
\large
\begin{align}
E[X] &= \int_{0}^{\infty} \frac{\beta}{\Gamma(\alpha)} \left( \frac{x}{\beta} \right)^{\alpha+1} \exp{\left( -\frac{x}{\beta} \right)} dx \\
&= \int_{0}^{\infty} \frac{\beta}{\Gamma(\alpha)} y^{\alpha+1} \exp{(-y)} \cdot \beta dy \\
&= \int_{0}^{\infty} \frac{\beta^2}{\Gamma(\alpha+2)/\alpha(\alpha+1)} y^{(\alpha+2)-1} \exp{(-y)} dy \\
&= \beta^2 \alpha(\alpha+1) \int_{0}^{\infty} \frac{1}{\Gamma(\alpha+2)} y^{(\alpha+2)-1} \exp{(-y)} dy \\
&= \beta^2 \alpha(\alpha+1) \times 1 = \beta^2 \alpha(\alpha+1)
\end{align}
$$

このとき$V[X]=E[X^2]-E[X]^2$は下記のように計算できる。
$$
\large
\begin{align}
V[X] &= E[X^2] – E[X]^2 \\
&= \beta^2 \alpha(\alpha+1) – (\beta \alpha)^2 \\
&= \cancel{\beta^2 \alpha^2} + \beta^2 \alpha – \cancel{\beta^2 \alpha^2} = \beta^2 \alpha
\end{align}
$$

ⅲ)
ガンマ分布$\mathrm{Ga}(\alpha,\beta)$の$k$次のモーメント$E[X^k]$は期待値の定義に基づいて下記のように表せる。
$$
\large
\begin{align}
E[X^k] &= \int_{0}^{\infty} x^k f(x) dx \\
&= \int_{0}^{\infty} x^k \times \frac{1}{\beta^{\alpha} \Gamma(\alpha)} x^{\alpha-1} \exp{\left( -\frac{x}{\beta} \right)} dx \\
&= \int_{0}^{\infty} \frac{\beta^{k-1}}{\Gamma(\alpha)} \left( \frac{x}{\beta} \right)^{\alpha+k-1} \exp{\left( -\frac{x}{\beta} \right)} dx
\end{align}
$$

上記に対し、$\displaystyle y = \frac{x}{\beta}$のように変数変換を行うことを考える。このとき$x = \beta y$より$dx = \beta dy$である。また$\beta>0$より、$x$と$y$の範囲は下記のように対応する。

$x$$0 \to \infty$
$y$$0 \to \infty$

よって、$E[X^k]$は変数変換$\displaystyle y = \frac{x}{\beta}$を元に下記のように式変形できる。
$$
\large
\begin{align}
E[X^k] &= \int_{0}^{\infty} \frac{\beta^{k-1}}{\Gamma(\alpha)} \left( \frac{x}{\beta} \right)^{\alpha+k-1} \exp{\left( -\frac{x}{\beta} \right)} dx \\
&= \int_{0}^{\infty} \frac{\beta^{k-1}}{\Gamma(\alpha)} y^{\alpha+k-1} \exp{(-y)} \cdot \beta dy \\
&= \int_{0}^{\infty} \frac{\beta^{k}}{\Gamma(\alpha)} y^{\alpha+k-1} \exp{(-y)} dy \\
&= \frac{\beta^{k} \Gamma(\alpha+k)}{\Gamma(\alpha)} \int_{0}^{\infty} \frac{1}{\Gamma(\alpha+k)} y^{\alpha+k-1} \exp{(-y)} dy \\
&= \frac{\beta^{k} \Gamma(\alpha+k)}{\Gamma(\alpha)} \times 1 = \frac{\beta^{k} \Gamma(\alpha+k)}{\Gamma(\alpha)}
\end{align}
$$

iv)
モーメント母関数の定義の$m_{X}(t)=E[e^{tX}]$に基づいて、$\displaystyle t < \frac{1}{\beta}$のとき下記のように導出できる。
$$
\large
\begin{align}
m_{X}(t) &= E[e^{tX}] = \int_{0}^{\infty} e^{tx} f(x) dx \\
&= \int_{0}^{\infty} \exp{(tx)} \times \frac{1}{\beta^{\alpha_1} \Gamma(\alpha_1)} x^{\alpha_1-1} \exp{\left( -\frac{x}{\beta} \right)} dx \\
&= \int_{0}^{\infty} \frac{1}{\beta^{\alpha_1} \Gamma(\alpha_1)} x^{\alpha_1-1} \exp{\left( -\frac{x}{\beta} + t \beta \right)} dx \\
&= \int_{0}^{\infty} \frac{1}{\beta^{\alpha_1} \Gamma(\alpha_1)} x^{\alpha_1-1} \exp{\left( -\frac{x}{\beta/(1 – t \beta)} \right)} dx \\
&= \frac{1}{(1 – t \beta)^{\alpha_1}} \int_{0}^{\infty} \frac{(1 – t \beta)^{\alpha_1}}{\beta^{\alpha_1} \Gamma(\alpha_1)} x^{\alpha_1-1} \exp{\left( -\frac{x}{\beta/(1 – t \beta)} \right)} dx \\
&= \frac{1}{(1 – t \beta)^{\alpha_1}} \times 1 = \frac{1}{(1-t \beta)^{\alpha_1}}
\end{align}
$$

v)
$X \sim \mathrm{Ga}(\alpha_1,\beta), Y \sim \mathrm{Ga}(\alpha_2,\beta)$より、$X+Y$のモーメント母関数$m_{X+Y}(t)$は下記のように考えることができる。
$$
\large
\begin{align}
m_{X+Y}(t) &= E[e^{X+Y}] \\
&= E[e^{X}e^{Y}] \\
&= E[e^{X}] E[e^{Y}] \\
&= \frac{1}{(1-t \beta)^{\alpha_1}} \times \frac{1}{(1-t \beta)^{\alpha_2}} \\
&= \frac{1}{(1-t \beta)^{\alpha_1 + \alpha_2}}
\end{align}
$$

上記は$\mathrm{Ga}(\alpha_1+\alpha_2,\beta)$のモーメント母関数に一致するので、確率分布とモーメント母関数の$1$対$1$対応より、$X+Y \sim \mathrm{Ga}(\alpha_1+\alpha_2,\beta)$が成立する。

vi)
自由度$1$の$\chi^2$分布$\chi^2(1)$がガンマ分布$\displaystyle \mathrm{Ga} \left( \frac{1}{2}, 2 \right)$に一致するので、$X_i^2 \sim \chi^2(1)$のとき$\displaystyle X_i^2 \sim \mathrm{Ga} \left( \frac{1}{2}, 2 \right)$である。

このときv)の結果を元に$\displaystyle Z = \sum_{i=1}^{n} X_i^2 \sim \mathrm{Ga} \left( \frac{n}{2}, 2 \right)$が成立するが、$\displaystyle \mathrm{Ga} \left( \frac{n}{2}, 2 \right)$は自由度$n$の$\chi^2$分布$\chi^2(n)$に一致するので$Z \sim \chi^2(n)$が成立する。

vⅱ)
i)、ⅱ)の結果を用いることで$E[Z],V[Z]$は下記のように計算できる。
$$
\large
\begin{align}
E[X] &= \beta \alpha \\
&= 2 \times \frac{n}{2} \\
&= n \\
V[X] &= \beta^2 \alpha \\
&= 2^2 \times \frac{n}{2} \\
&= 2n
\end{align}
$$

・解説
$\chi^2$分布はガンマ分布を元に考えることができます。ガンマ分布のモーメントの計算やモーメント母関数の導出は一見複雑そうに見えますが、確率密度関数の全区間での積分が$1$であることに着目することでメインの計算はシンプルになることは抑えておくと良いと思います。

発展問題

$t$分布の確率密度関数の導出

・問題
$t$分布は母分散が未知の場合の母平均の区間推定や仮説検定の際に主に用いる標本分布であり、自由度$n$の$t$分布$t(n)$の確率変数を$Z$、確率密度関数を$f(z)$とおくと、$f(z)$は下記のように表される。
$$
\large
\begin{align}
f(z) = \frac{\Gamma((n+1)/2)}{\sqrt{\pi n} \Gamma(n/2)} \left( 1+\frac{z^2}{n} \right)^{-\frac{n+1}{2}} = \frac{1}{\sqrt{n} B(1/2,n/2)} \left( 1+\frac{z^2}{n} \right)^{-\frac{n+1}{2}}
\end{align}
$$

以下、上記で表した$t$分布の確率密度関数の導出と期待値$E[Z]$、分散$E[Z]$の計算、$t$分布の極限と正規分布の対応について確認を行う。

「母分散が未知の場合の母平均の区間推定」にあたっては、標本平均$\overline{X}$と不偏標本分散$\displaystyle s^2 = \frac{1}{n-1} \sum_{i=1}^{n}(X_i-\overline{X})^2$に関して下記が成立することを元に計算を行う。
$$
\begin{align}
\frac{\bar{x}}{\sqrt{s^2/n}} \sim t(n-1) \quad (1)
\end{align}
$$

上記に対応させて、確率変数$X \sim \mathcal{N}(0,1), Y \sim \chi^{2}(n)$に関する同時確率密度関数$f_{X,Y}f(x,y)$の変数変換や変数の積分などを行うことで$t$分布の確率密度関数の導出を行うことができる。

ここまでの内容を元に下記の問いにそれぞれ答えよ。
i) $X \sim \mathcal{N}(0,1), Y \sim \chi^{2}(n)$かつ$X, Y$が独立であるとき、同時確率密度関数$f_{X,Y}(x,y)$を$x,y$の式で表せ。

ⅱ) i)で考えた同時確率密度関数$f_{X,Y}(x,y)$に対し、$(1)$を元に下記のような変数変換を考える。
$$
\begin{align}
Z &= \frac{X}{\sqrt{Y/n}} \\
Y &= Y
\end{align}
$$
このとき、$X,Y$から$Z,Y$に変換するにあたってのヤコビアン$J(Z,Y)$を計算せよ。

ⅲ) i)とⅱ)の結果に基づき、確率変数$Z,Y$に関する確率密度関数$f_{Z,Y}(z,y)$が下記に一致することを示せ。
$$
\begin{align}
f_{Z,Y}(z,y) = \frac{1}{\sqrt{\pi n}} \frac{\displaystyle y^{\frac{n+1}{2}-1} \exp{\left[ -\frac{y}{2} \left( 1+\frac{z^2}{n} \right) \right]} }{\displaystyle 2^{\frac{n+1}{2}} \Gamma \left( \frac{n}{2} \right)} \quad (2)
\end{align}
$$

iv) $(2)$式に対し、下記のような変数変換を考える。
$$
\begin{align}
Z &= Z \\
W &= \frac{1}{2} \left( 1+\frac{Z^2}{n} \right) Y
\end{align}
$$
このとき、$Z,Y$から$Z,W$に変換するにあたってのヤコビアン$J(Z,W)$を計算せよ。

v) ⅲ)とiv)の結果に基づき、確率変数$Z,W$に関する確率密度関数$f_{Z,W}(z,w)$が下記に一致することを示せ。
$$
\begin{align}
f_{Z,W}(z,w) = \frac{1}{\sqrt{\pi n}} \frac{\displaystyle w^{\frac{n+1}{2}-1} \exp(-w)}{\displaystyle \Gamma \left( \frac{n}{2} \right)} \left( 1+\frac{z^2}{n} \right)^{-\frac{n+1}{2}}
\end{align}
$$

vi) $(3)$式に対して$\displaystyle f_{Z}(z) = \int_{0}^{w}f_{Z,W}(z,w) dw$を元に下記を示せ。
$$
\begin{align}
f_{Z}(z) = \frac{\Gamma((n+1)/2)}{\sqrt{\pi n} \Gamma(n/2)} \left( 1+\frac{z^2}{n} \right)^{-\frac{n+1}{2}} = \frac{1}{\sqrt{n} B(1/2,n/2)} \left( 1+\frac{z^2}{n} \right)^{-\frac{n+1}{2}}
\end{align}
$$

$\displaystyle Z = \frac{X}{\sqrt{Y/n}}, E \left[ \frac{1}{Y} \right] = \frac{1}{n-2}$であることに基づいて自由度$n$の$t$分布$t(n)$の期待値$E[Z]$と分散$V[Z]$を計算せよ。

vⅲ) 自由度$n$が$n \to \infty$であるときの$t$分布は標準正規分布に一致する。確率密度関数の変数$z$に対し下記が成立することを示し、$n \to \infty$の$t$分布が標準正規分布に一致することが妥当であることを確認せよ。
$$
\begin{align}
\lim_{n \to \infty} \left( 1+\frac{z^2}{n} \right)^{-\frac{n+1}{2}} = e^{-\frac{z^2}{2}}
\end{align}
$$

・解答
i)
同時確率密度関数$f_{X,Y}(x,y)$は下記のように表せる。
$$
\large
\begin{align}
f_{X,Y}(x,y) &= \frac{1}{\sqrt{2 \pi}} \exp{\left( -\frac{x^2}{2} \right)} \times \frac{1}{2^{\frac{n}{2}} \Gamma(n/2)} y^{\frac{n}{2}-1} \exp{ \left( -\frac{y}{2} \right) } \\
&= \frac{1}{\sqrt{2 \pi}} \exp{\left( -\frac{x^2}{2} \right)} \frac{\displaystyle y^{\frac{n}{2}-1} \exp{ \left( -\frac{y}{2} \right) }}{\displaystyle 2^{\frac{n}{2}} \Gamma \left( \frac{n}{2} \right)}
\end{align}
$$

ⅱ)
$X = Z\sqrt{Y/n}$であることから、$J(Z,Y)$は下記のように計算できる。
$$
\large
\begin{align}
J(Z,Y) &= \left| \begin{array}{cc} \frac{\partial x}{\partial z} & \frac{\partial x}{\partial y} \\ \frac{\partial y}{\partial z} & \frac{\partial y}{\partial y} \end{array} \right| \\
&= \left| \begin{array}{cc} \sqrt{y/n} & z/\sqrt{2ny} \\ 0 & 1 \end{array} \right| \\
&= \sqrt{\frac{y}{n}}
\end{align}
$$

ⅲ)
確率変数$Z,Y$に関する確率密度関数$f_{Z,Y}(z,y)$は下記のように表せる。
$$
\large
\begin{align}
f_{Z,Y}(z,y) &= f_{X,Y}(x,y) J(Z,Y) = f_{X,Y} \left( z\sqrt{\frac{y}{n}},y \right) J(Z,Y) \\
&= \frac{1}{\sqrt{2 \pi}} \exp{\left( -\frac{yz^2}{2n} \right)} \frac{\displaystyle y^{\frac{n}{2}-1} \exp{ \left( -\frac{y}{2} \right) }}{\displaystyle 2^{\frac{n}{2}} \Gamma \left( \frac{n}{2} \right)} \times \sqrt{\frac{y}{n}} \\
&= \frac{1}{\sqrt{\pi n}} \frac{\displaystyle y^{\frac{n+1}{2}-1} \exp{\left[ -\frac{y}{2} \left( 1+\frac{z^2}{n} \right) \right]} }{\displaystyle 2^{\frac{n+1}{2}} \Gamma \left( \frac{n}{2} \right)} \quad (2)
\end{align}
$$

iv)
$\displaystyle Y = \frac{2W}{\displaystyle 1+\frac{Z^2}{n}}$であることから、$J(Z,W)$は下記のように計算できる。
$$
\large
\begin{align}
J(Z,Y) &= \left| \begin{array}{cc} \frac{\partial z}{\partial z} & \frac{\partial z}{\partial w} \\ \frac{\partial y}{\partial z} & \frac{\partial y}{\partial w} \end{array} \right| \\
&= \left| \begin{array}{cc} 1 & 0 \\ \frac{\partial y}{\partial z} & \frac{\partial y}{\partial w} \end{array} \right| \\
&= \frac{\partial y}{\partial w} = \frac{2}{\displaystyle 1+\frac{z^2}{n}}
\end{align}
$$

v)
確率変数$Z,W$に関する確率密度関数$f_{Z,W}(z,w)$は下記のように表せる。
$$
\large
\begin{align}
f_{Z,W}(z,w) &= f_{Z,Y}(z,y) J(Z,W) = f_{X,Y} \left( z,\frac{2w}{1+\frac{z^2}{n}} \right) J(Z,Y) \\
&= \frac{1}{\sqrt{\pi n}} \frac{\exp{(-w)} }{\displaystyle \cancel{2^{\frac{n+1}{2}}} \Gamma \left( \frac{n}{2} \right)} \left( \frac{\cancel{2}w}{1+\frac{z^2}{n}} \right)^{\frac{n+1}{2}-1} \times \frac{\cancel{2}}{\displaystyle 1+\frac{z^2}{n}} \\
&= \frac{1}{\sqrt{\pi n}} \frac{\displaystyle w^{\frac{n+1}{2}-1} \exp(-w)}{\displaystyle \Gamma \left( \frac{n}{2} \right)} \left( 1+\frac{z^2}{n} \right)^{-\frac{n+1}{2}} \quad (3)
\end{align}
$$

vi)
下記のように$(3)$式に対して$\displaystyle f_{Z}(z) = \int_{0}^{w}f_{Z,W}(z,w) dw$を計算できる。
$$
\large
\begin{align}
f_{Z}(z) &= \int_{0}^{w}f_{Z,W}(z,w) dw = \int_{0}^{w} \frac{1}{\sqrt{\pi n}} \frac{\displaystyle w^{\frac{n+1}{2}-1} \exp(-w)}{\displaystyle \Gamma \left( \frac{n}{2} \right)} \left( 1+\frac{z^2}{n} \right)^{-\frac{n+1}{2}} dw \\
&= \frac{\displaystyle \Gamma \left( \frac{n+1}{2} \right)}{\displaystyle \sqrt{\pi n} \Gamma \left( \frac{n}{2} \right)} \left( 1+\frac{z^2}{n} \right)^{-\frac{n+1}{2}} \int_{0}^{w} \frac{\displaystyle w^{\frac{n+1}{2}-1} \exp(-w)}{\displaystyle \Gamma \left( \frac{n+1}{2} \right)} dw \\
&= \frac{\Gamma((n+1)/2)}{\sqrt{\pi n} \Gamma(n/2)} \left( 1+\frac{z^2}{n} \right)^{-\frac{n+1}{2}} = \frac{1}{\sqrt{n} B(1/2,n/2)} \left( 1+\frac{z^2}{n} \right)^{-\frac{n+1}{2}}
\end{align}
$$

vⅱ)
$\displaystyle Z = \frac{X}{\sqrt{Y/n}}$より、$E[Z], E[Z^2]$は下記のように計算できる。
$$
\large
\begin{align}
E[Z] &= E \left[ \frac{X}{\sqrt{Y/n}} \right] \\
&= E[X]E \left[ \sqrt{\frac{n}{Y}} \right] \\
&= 0 \times E \left[ \sqrt{\frac{n}{Y}} \right] = 0 \\
E[Z^2] &= E \left[ \frac{nX^2}{Y} \right] \\
&= E[X^2] E \left[ \frac{n}{Y} \right] \\
&= n E[X^2] E \left[ \frac{1}{Y} \right] \\
&= n \times 1 \times \frac{1}{n-2} \\
&= \frac{n}{n-2}
\end{align}
$$

上記より、分散$V[Z]=E[Z^2]-E[Z]^2$は下記のように計算できる。
$$
\large
\begin{align}
V[Z] &= E[Z^2] – E[Z]^2 \\
&= \frac{n}{n-2} – 0^2 = \frac{n}{n-2}
\end{align}
$$

vⅲ)
下記のように式変形を考えることができる。
$$
\large
\begin{align}
\lim_{n \to \infty} \left( 1+\frac{z^2}{n} \right)^{-\frac{n+1}{2}} &= \lim_{n \to \infty} \left( 1+\frac{z^2}{n} \right)^{-\frac{n}{2}} \left( 1+\frac{z^2}{n} \right)^{-\frac{1}{2}} \\
&= \lim_{n \to \infty} \left( 1+\frac{z^2}{n} \right)^{-\frac{n}{z^2} \frac{z^2}{2}} \left( 1+\frac{z^2}{n} \right)^{-\frac{1}{2}} \\
&= \lim_{n \to \infty} \left[ \left( 1+\frac{z^2}{n} \right)^{\frac{n}{z^2}} \right]^{-\frac{z^2}{2}} \left( 1+\frac{z^2}{n} \right)^{-\frac{1}{2}} \\
&= e^{-\frac{z^2}{2}} \cdot 1 \\
&= e^{-\frac{z^2}{2}}
\end{align}
$$

・解説
vⅱ)で用いた$\displaystyle E \left[ \frac{1}{Y} \right] = \frac{1}{n-2}$は前問「ガンマ分布に基づく$\chi^2$分布の平均・分散や$k$次モーメントの計算」のⅲ)の結果に$\displaystyle k=-1, \alpha=n/2, \beta=2$を代入することで得ることができます。

$F$分布の確率密度関数の導出

・問題
$F$分布は分散分析などを行う際に主に用いる標本分布であり、自由度$m,n$の$F$分布$F(m,n)$の確率変数を$Z$、確率密度関数を$f(z)$とおくと、$f(z)$は下記のように表される。
$$
\large
\begin{align}
f(z) = \frac{z^{\frac{m}{2}-1}}{\displaystyle B \left( \frac{m}{2},\frac{n}{2} \right)} \left( \frac{m}{n} \right)^{\frac{m}{2}} \left( 1+\frac{m}{n}z \right)^{-\frac{m+n}{2}}, \quad z>0
\end{align}
$$

以下、上記で表した$F$分布の確率密度関数の導出と期待値$E[Z]$、分散$E[Z]$の計算について確認を行う。

「分散分析」にあたっては、自由度$\phi_A$の水準間平方和$S_A$と自由度$\phi_E$の誤差平方和$S_E$に関して下記が成立することを元に計算を行う。
$$
\begin{align}
\frac{S_A/\phi_A}{S_E/\phi_E} \sim F(a-1,a(n-1)) \quad (1)
\end{align}
$$

上記に対応させて、確率変数$X \sim \chi^{2}(m), Y \sim \chi^{2}(n)$に関する同時確率密度関数$f_{X,Y}(x,y)$の変数変換や変数の積分などを行うことで$F$分布の確率密度関数の導出を行うことができる。

ここまでの内容を元に下記の問いにそれぞれ答えよ。
i) $X \sim \chi^{2}(m), Y \sim \chi^{2}(n)$かつ$X, Y$が独立であるとき、同時確率密度関数$f_{X,Y}(x,y)$を$x,y$の式で表せ。

ⅱ) i)で考えた同時確率密度関数$f_{X,Y}(x,y)$に対し、$(1)$を元に下記のような変数変換を考える。
$$
\begin{align}
Z &= \frac{X/m}{Y/n} \\
Y &= Y
\end{align}
$$
このとき、$X,Y$から$Z,Y$に変換するにあたってのヤコビアン$J(Z,Y)$を計算せよ。

ⅲ) i)とⅱ)の結果に基づき、確率変数$Z,Y$に関する確率密度関数$f_{Z,Y}(z,y)$が下記に一致することを示せ。
$$
\begin{align}
f_{Z,Y}(z,y) = \frac{z^{\frac{m}{2}-1} y^{\frac{m+n}{2}-1}}{\displaystyle 2^{\frac{m+n}{2}} \Gamma \left( \frac{m}{2} \right) \Gamma \left( \frac{n}{2} \right)} \left( \frac{m}{n} \right)^{\frac{m}{2}} \exp{\left[ -\frac{y}{2} \left( 1+\frac{mz}{n} \right) \right]} \quad (2)
\end{align}
$$

iv) $(2)$式に対し、下記のような変数変換を考える。
$$
\begin{align}
Z &= Z \\
W &= \frac{1}{2} \left( 1+\frac{m Z}{n} \right) Y
\end{align}
$$
このとき、$Z,Y$から$Z,W$に変換するにあたってのヤコビアン$J(Z,W)$を計算せよ。

v) ⅲ)とiv)の結果に基づき、確率変数$Z,W$に関する確率密度関数$f_{Z,W}(z,w)$が下記に一致することを示せ。
$$
\begin{align}
f_{Z,W}(z,w) = \frac{z^{\frac{m}{2}-1}}{\displaystyle \Gamma \left( \frac{m}{2} \right) \Gamma \left( \frac{n}{2} \right)} \left( \frac{m}{n} \right)^{\frac{m}{2}} \left( 1+\frac{m}{n}z \right)^{-\frac{m+n}{2}} w^{\frac{m+n}{2}-1} \exp(-w) \quad (3)
\end{align}
$$

vi) $(3)$式に対して$\displaystyle f_{Z}(z) = \int_{0}^{w}f_{Z,W}(z,w) dw$を元に下記を示せ。
$$
\begin{align}
f_{Z}(z) = \frac{z^{\frac{m}{2}-1}}{\displaystyle B \left( \frac{m}{2}, \frac{n}{2} \right)} \left( \frac{m}{n} \right)^{\frac{m}{2}} \left( 1+\frac{m}{n}z \right)^{-\frac{m+n}{2}}
\end{align}
$$

・解答
i)
同時確率密度関数$f_{X,Y}(x,y)$は下記のように表すことができる。
$$
\large
\begin{align}
f_{X,Y}(x,y) &= \frac{1}{2^{\frac{m}{2}} \Gamma(n/2)} x^{\frac{m}{2}-1} \exp{ \left( -\frac{x}{2} \right) } \times \frac{1}{2^{\frac{n}{2}} \Gamma(n/2)} y^{\frac{n}{2}-1} \exp{ \left( -\frac{y}{2} \right) } \\
&= \frac{\displaystyle x^{\frac{m}{2}-1} y^{\frac{n}{2}-1} \exp{\left( -\frac{x}{2}-\frac{y}{2} \right)}}{\displaystyle 2^{\frac{m+n}{2}} \Gamma \left( \frac{m}{2} \right) \Gamma \left( \frac{n}{2} \right)}
\end{align}
$$

ⅱ)
$\displaystyle X = \frac{mYZ}{n}$であることから、$J(Z,Y)$は下記のように計算できる。
$$
\large
\begin{align}
J(Z,Y) &= \left| \begin{array}{cc} \frac{\partial x}{\partial z} & \frac{\partial x}{\partial y} \\ \frac{\partial y}{\partial z} & \frac{\partial y}{\partial y} \end{array} \right| = \left| \begin{array}{cc} \frac{\partial x}{\partial z} & \frac{\partial x}{\partial y} \\ 0 & 1 \end{array} \right| \\
&= \frac{\partial x}{\partial z} \\
&= \frac{my}{n}
\end{align}
$$

ⅲ)
確率変数$Z,Y$に関する確率密度関数$f_{Z,Y}(z,y)$は下記のように表せる。
$$
\large
\begin{align}
f_{Z,Y}(z,y) &= f_{X,Y}(x,y) J(Z,Y) = f_{X,Y} \left( \frac{myz}{n},y \right) J(Z,Y) \\
&= \frac{\displaystyle y^{\frac{n}{2}-1}}{\displaystyle 2^{\frac{m+n}{2}} \Gamma \left( \frac{m}{2} \right) \Gamma \left( \frac{n}{2} \right)} \left( \frac{myz}{n} \right)^{\frac{m}{2}-1} \exp{\left( -\frac{myz}{2n}-\frac{y}{2} \right)} \times \frac{my}{n} \\
&= \frac{\displaystyle z^{\frac{m}{2}-1} y^{\frac{m+n}{2}-1}}{\displaystyle 2^{\frac{m+n}{2}} \Gamma \left( \frac{m}{2} \right) \Gamma \left( \frac{n}{2} \right)} \left( \frac{m}{n} \right)^{\frac{m}{2}} \exp{\left[ -\frac{y}{2} \left( 1+\frac{mz}{n} \right) \right]}
\end{align}
$$

iv)
$\displaystyle Y = \frac{2W}{\displaystyle 1+\frac{mZ}{n}}$であることから、$J(Z,W)$は下記のように計算できる。
$$
\large
\begin{align}
J(Z,Y) &= \left| \begin{array}{cc} \frac{\partial z}{\partial z} & \frac{\partial z}{\partial w} \\ \frac{\partial y}{\partial z} & \frac{\partial y}{\partial w} \end{array} \right| \\
&= \left| \begin{array}{cc} 1 & 0 \\ \frac{\partial y}{\partial z} & \frac{\partial y}{\partial w} \end{array} \right| \\
&= \frac{\partial y}{\partial w} = \frac{2}{\displaystyle 1+\frac{mz}{n}}
\end{align}
$$

v)
確率変数$Z,W$に関する確率密度関数$f_{Z,W}(z,w)$は下記のように表せる。
$$
\large
\begin{align}
f_{Z,W}(z,w) &= f_{Z,Y}(z,y) J(Z,W) = f_{X,Y} \left( z,\frac{2w}{1+\frac{z^2}{n}} \right) J(Z,Y) \\
&= \frac{\displaystyle z^{\frac{m}{2}-1}}{\displaystyle \cancel{2^{\frac{m+n}{2}}} \Gamma \left( \frac{m}{2} \right) \Gamma \left( \frac{n}{2} \right)} \left( \frac{\cancel{2}}{\displaystyle 1+\frac{mz}{n}} \right)^{\frac{m+n}{2}-1} \left( \frac{m}{n} \right)^{\frac{m}{2}} \exp{(-w)} \times \frac{\cancel{2}}{\displaystyle 1+\frac{mz}{n}} \\
&= \frac{z^{\frac{m}{2}-1}}{\displaystyle \Gamma \left( \frac{m}{2} \right) \Gamma \left( \frac{n}{2} \right)} \left( \frac{m}{n} \right)^{\frac{m}{2}} \left( 1+\frac{m}{n}z \right)^{-\frac{m+n}{2}} w^{\frac{m+n}{2}-1} \exp(-w) \quad (3)
\end{align}
$$

vi)
下記のように$(3)$式に対して$\displaystyle f_{Z}(z) = \int_{0}^{w}f_{Z,W}(z,w) dw$を計算できる。
$$
\large
\begin{align}
f_{Z}(z) &= \int_{0}^{w}f_{Z,W}(z,w) dw \\
&= \int_{0}^{w} \frac{z^{\frac{m}{2}-1}}{\displaystyle \Gamma \left( \frac{m}{2} \right) \Gamma \left( \frac{n}{2} \right)} \left( \frac{m}{n} \right)^{\frac{m}{2}} \left( 1+\frac{m}{n}z \right)^{-\frac{m+n}{2}} w^{\frac{m+n}{2}-1} \exp(-w) dw \\
&= \frac{z^{\frac{m}{2}-1}}{\displaystyle \Gamma \left( \frac{m}{2} \right) \Gamma \left( \frac{n}{2} \right)} \left( \frac{m}{n} \right)^{\frac{m}{2}} \left( 1+\frac{m}{n}z \right)^{-\frac{m+n}{2}} \int_{0}^{w} w^{\frac{m+n}{2}-1} \exp(-w) dw \\
&= \frac{z^{\frac{m}{2}-1}}{\displaystyle \Gamma \left( \frac{m}{2} \right) \Gamma \left( \frac{n}{2} \right)} \left( \frac{m}{n} \right)^{\frac{m}{2}} \left( 1+\frac{m}{n}z \right)^{-\frac{m+n}{2}} \times \Gamma \left( \frac{m+n}{2} \right) \\
&= \frac{z^{\frac{m}{2}-1}}{\displaystyle B \left( \frac{m}{2}, \frac{n}{2} \right)} \left( \frac{m}{n} \right)^{\frac{m}{2}} \left( 1+\frac{m}{n}z \right)^{-\frac{m+n}{2}}
\end{align}
$$

・解説

ガンマ分布に基づく$F$分布の期待値・分散の計算

・問題
前問の「$F$分布の確率密度関数の導出」で取り扱ったように$X_1 \sim \chi^{2}(m), X_2 \sim \chi^{2}(n)$のとき、確率変数$\displaystyle Z = \frac{X_1/m}{X_2/n}$に関して$Z \sim F(m,n)$が成立する。

確率密度関数の導出に関しては前問で確認を行ったので、この問題ではガンマ分布の$k$次のモーメントの式に基づいて$F$分布の期待値$E[Z]$と分散$V[Z]$の計算について取り扱う。以下の問いにそれぞれ答えよ。

i) 確率変数$Y$がガンマ分布$\mathrm{Ga}(\alpha,\beta)$に従うとき、確率密度関数$g(y)$を$y$の式で表せ。
ⅱ) i)で表した確率密度関数$f(y)$を元にガンマ分布$\mathrm{Ga}(\alpha,\beta)$の$k$次のモーメント$E[Y^{k}]$が下記に一致することを示せ。
$$
\begin{align}
E[Y^k] = \frac{\beta^{k} \Gamma(\alpha+k)}{\Gamma(\alpha)}
\end{align}
$$
ⅲ) ⅱ)で計算した$E[Y^{k}]$の式が成立する$k$の範囲を答えよ。
iv) $\alpha>2$のとき、ⅱ)、ⅲ)を元に$E[Y^{-1}]$を表せ。
v) $\alpha>2$のとき、ⅱ)、ⅲ)を元に$E[Y^{-2}]$を表せ。
vi) $n>2$のとき、期待値$E[Z]$を導出せよ。
vⅱ) $n>4$のとき、$E[Z^2]$を導出し、$V[Z]=E[Z^2]-E[Z]^2$を用いて分散$V[Z]$を導出せよ。

・解答
i)
$Y \sim \mathrm{Ga}(\alpha,\beta)$のとき確率密度関数$g(y)$は下記のように表せる。
$$
\large
\begin{align}
g(y) = \frac{1}{\beta^{\alpha} \Gamma(\alpha)} y^{\alpha-1} e^{-\frac{y}{\beta}}
\end{align}
$$

ⅱ)
ガンマ分布$\mathrm{Ga}(\alpha,\beta)$の$k$次のモーメント$E[Y^k]$は期待値の定義に基づいて下記のように表せる。
$$
\large
\begin{align}
E[Y^k] &= \int_{0}^{\infty} y^k g(y) dy \\
&= \int_{0}^{\infty} y^k \times \frac{1}{\beta^{\alpha} \Gamma(\alpha)} x^{\alpha-1} \exp{\left( -\frac{y}{\beta} \right)} dy \\
&= \int_{0}^{\infty} \frac{\beta^{k-1}}{\Gamma(\alpha)} \left( \frac{y}{\beta} \right)^{\alpha+k-1} \exp{\left( -\frac{y}{\beta} \right)} dy
\end{align}
$$

上記に対し、$\displaystyle u = \frac{y}{\beta}$のように変数変換を行うことを考える。このとき$y = \beta u$より$dy = \beta du$である。また$\beta>0$より、$y$と$u$の範囲は下記のように対応する。

$y$$0 \to \infty$
$u$$0 \to \infty$

よって、$E[Y^k]$は変数変換$\displaystyle u = \frac{y}{\beta}$を元に下記のように式変形できる。
$$
\large
\begin{align}
E[Y^k] &= \int_{0}^{\infty} \frac{\beta^{k-1}}{\Gamma(\alpha)} \left( \frac{y}{\beta} \right)^{\alpha+k-1} \exp{\left( -\frac{y}{\beta} \right)} dy \\
&= \int_{0}^{\infty} \frac{\beta^{k-1}}{\Gamma(\alpha)} u^{\alpha+k-1} \exp{(-u)} \cdot \beta du \\
&= \int_{0}^{\infty} \frac{\beta^{k}}{\Gamma(\alpha)} u^{\alpha+k-1} \exp{(-u)} du \\
&= \frac{\beta^{k} \Gamma(\alpha+k)}{\Gamma(\alpha)} \int_{0}^{\infty} \frac{1}{\Gamma(\alpha+k)} u^{\alpha+k-1} \exp{(-u)} du \\
&= \frac{\beta^{k} \Gamma(\alpha+k)}{\Gamma(\alpha)} \times 1 = \frac{\beta^{k} \Gamma(\alpha+k)}{\Gamma(\alpha)}
\end{align}
$$

ⅲ)
ⅱ)の式変形にあたってはガンマ分布の定義を用いているので、$\alpha+k>0$が前提である。よって$k>-\alpha$のとき、$k$次の積率を考えることができる。

iv)
ⅱ)で導出した式に$k=-1$を代入することで下記が得られる。
$$
\large
\begin{align}
E[Y^{-1}] &= \frac{\beta^{-1} \Gamma(\alpha-1)}{\Gamma(\alpha)} \\
&= \frac{\beta^{-1} \cancel{\Gamma(\alpha-1)}}{\cancel{\Gamma(\alpha-1)}(\alpha-1)} \\
&= \frac{1}{\beta(\alpha-1)}
\end{align}
$$

v)
ⅱ)で導出した式に$k=-2$を代入することで下記が得られる。
$$
\large
\begin{align}
E[Y^{-2}] &= \frac{\beta^{-2} \Gamma(\alpha-2)}{\Gamma(\alpha)} \\
&= \frac{\beta^{-2} \cancel{\Gamma(\alpha-2)}}{\cancel{\Gamma(\alpha-2)}(\alpha-1)(\alpha-2)} \\
&= \frac{1}{\beta^2(\alpha-1)(\alpha-2)}
\end{align}
$$

vi)
$\chi^{2}(n)$は$\displaystyle \mathrm{Ga} \left( \frac{n}{2},2 \right)$なので、$F$分布の期待値$E[Z]$は$\displaystyle Z = \frac{X_1/m}{X_2/n}$より下記のように計算することができる。
$$
\large
\begin{align}
E[Z] &= E \left[ \frac{X_1/m}{X_2/n} \right] = \frac{n}{m} E[X_1] E \left[ \frac{1}{X_2} \right] \\
&= \frac{n}{\cancel{m}} \times \cancel{m} \times \frac{1}{2(n/2-1)} \\
&= \frac{n}{n-2}
\end{align}
$$

vⅱ)
$E[Z^2]$は$\displaystyle Z = \frac{X_1/m}{X_2/n}$より下記のように計算することができる。
$$
\large
\begin{align}
E[Z^2] &= E \left[ \left( \frac{X_1/m}{X_2/n} \right)^2 \right] = \frac{n^2}{m^2} E[X_1^2] E \left[ \frac{1}{X_2^2} \right] \\
&= \frac{n^2}{m^2} \times m(m+2) \times \frac{1}{2^2(n/2-1)(n/2-2)} \\
&= \frac{n^2}{m^2} \frac{m(m+2)}{(n-2)(n-4)}
\end{align}
$$

よって分散$V[Z]$は下記のように得られる。
$$
\large
\begin{align}
V[Z] &= E[Z^2] – E[Z]^2 \\
&= \frac{n^2}{m^2} \frac{m(m+2)}{(n-2)(n-4)} – \frac{n^2}{(n-2)^2} \\
&= \frac{2n^2(m+n-2)}{m(n-2)^2(n-4)}
\end{align}
$$

・解説
vi)、vⅱ)の途中計算で出てくる$E[X_1], E[X_1^2]$に関しては設問を作成しませんでしたが、$\displaystyle E \left[ \frac{1}{X_2} \right], E \left[ \frac{1}{X_2^2} \right]$と同様にⅱ)で導出した式より表すことができます。

参考書籍

・現代数理統計学(学術図書出版社)

・数理統計学 統計的推論の基礎(共立出版)

標本分布の確率密度関数と数値積分による近似に基づく統計数値表の作成

数理統計学の教科書・参考書では$\chi^2$分布、$t$分布、$F$分布の確率密度関数の導出に関して解説されますが、累積分布関数に相当する統計数値表の作成にあたっては取り扱われません。そこで当記事では台形公式に基づいて確率密度関数を元に統計数値表の作成に関して取りまとめました。
「現代数理統計学(学術図書出版社)」、「数理統計学(共立出版)」、「統計学のための数学入門$30$講(朝倉書店)」などを参考に作成を行いました。

・統計学に関するPythonプログラミング集
https://www.hello-statisticians.com/stat_program

基本方針

標本分布の確率密度関数

標本関数の確率密度関数はそれぞれ下記のように表される。
・自由度$n$の$\chi^2$分布$\chi^2(n)$の確率密度関数
自由度$n$の$\chi^2$分布$\chi^2(n)$の確率密度関数を$f(z)$とおくと$f(z)$は下記のように表せる。
$$
\large
\begin{align}
f(z) = \frac{1}{2^{n/2} \Gamma(n/2)} z^{\frac{n}{2}-1} \exp{\left( -\frac{z}{2} \right)}
\end{align}
$$

・自由度$n$の$t$分布$t(n)$の確率密度関数
自由度$n$の$t$分布$t(n)$の確率密度関数を$f(z)$とおくと$f(z)$は下記のように表せる。
$$
\large
\begin{align}
f(z) = \frac{1}{\sqrt{n} B(1/2,n/2)} \left( 1+\frac{z^2}{n} \right)^{-\frac{n+1}{2}}
\end{align}
$$

・自由度$m,n$の$F$分布$F(m,n)$の確率密度関数
自由度$m,n$の$F$分布$F(m,n)$の確率密度関数を$f(z)$とおくと$f(z)$は下記のように表せる。
$$
\large
\begin{align}
f(z) = \frac{z^{\frac{m}{2}-1}}{B(m/2,n/2)} \left( \frac{m}{n} \right)^{\frac{m}{2}} \left( 1+\frac{m}{n}z \right)^{-\frac{m+n}{2}}
\end{align}
$$

数値積分と台形公式

台形公式に基づいて関数$f(x)$の区間$[a,b]$における定積分の近似は下記のように考えることができる。
$$
\large
\begin{align}
\int_{a}^{b} f(x) dx & \simeq \frac{b-a}{2n} [y_0 + 2(y_1 + y_2 + \cdots y_{n-1}) + y_n] \\
y_k &= f(x_k) \\
x_k &= a + \frac{k(b-a)}{n}, \quad k=0, 1, \cdots , n
\end{align}
$$

詳しくは下記で取り扱った。

精度的には台形公式ではなくシンプソンの公式などを用いるべきだが、直感的な理解が目的であれは微小区間の設定次第で精度的には十分であると考えた。台形の公式をそのまま用いたので、算数や初等の数学と同様に理解することができる。

台形公式の使用例:標準正規分布$\mathcal{N}(0,1)$

$$
\begin{align}
\Phi(x) &= \int_{-\infty}^{\infty} f(x) dx \\
f(x) &= \frac{1}{\sqrt{2 \pi}} \exp{ \left( -\frac{x^2}{2} \right) }
\end{align}
$$

標準正規分布$\mathcal{N}(0,1)$の確率密度関数を$f(x)$とおくとき、$f(x)$は上記のように表せる。ここで$f(x)$に対し下記を実行することで台形公式に基づいて統計数値表の近似を行うことができる。

import numpy as np
import matplotlib.pyplot as plt
from scipy import stats

x = np.arange(-25., 25., 0.01)
f_x = np.e**(-x**2/2.)/np.sqrt(2*np.pi)
delta = 0.01

cum_prob = np.zeros(x.shape[0])
for i in range(x.shape[0]-1):
    cum_prob[i+1] = cum_prob[i] + (f_x[i]+f_x[i+1])*delta/2.

plt.subplot(211)
plt.plot(x[2000:-2000],f_x[2000:-2000])
plt.xlim([-5,5])
plt.subplot(212)
plt.plot(x[2000:-2000],cum_prob[2000:-2000])
plt.plot(x[2000:-2000],0.975*np.ones(x[2000:-2000].shape[0]),"g--")
plt.xlim([-5,5])
plt.show()

・実行結果

下の図の青の実線と緑の点線が$1.96$付近で交わることが確認できる

また、台形公式に基づく計算にあたっては標準正規分布の累積分布関数に関して$\Phi(-25) \simeq 0$と見なせることを用いた。より厳密に計算する際は$\Phi(0)=0.5$を元に$0$からの積分を考えると良い。

標本分布の統計数値表

自由度$n=10$の$\chi^2$分布$\chi^2(10)$

自由度$n=10$の$\chi^2$分布$\chi^2(10)$の確率密度関数$f(z)$は下記のように考えることができる。
$$
\large
\begin{align}
f(z) &= \frac{1}{2^{n/2} \Gamma(n/2)} z^{\frac{n}{2}-1} \exp{\left( -\frac{z}{2} \right)} \\
&= \frac{1}{2^{10/2} \Gamma(10/2)} z^{\frac{10}{2}-1} \exp{\left( -\frac{z}{2} \right)} \\
&= \frac{1}{2^{5} (5-1)!} z^{5-1} \exp{\left( -\frac{z}{2} \right)}
\end{align}
$$

上記に基づいて下記を実行することで統計数値表と同様の結果を得ることができる。

import numpy as np
import matplotlib.pyplot as plt
import math

x = np.arange(0., 25., 0.01)
f_x = x**(5-1) * np.e**(-x/2.) /(2**5 * math.factorial(5-1))
delta = 0.01

cum_prob = np.zeros(x.shape[0])
for i in range(x.shape[0]-1):
    cum_prob[i+1] = cum_prob[i] + (f_x[i]+f_x[i+1])*delta/2.

plt.subplot(211)
plt.plot(x,f_x)
plt.subplot(212)
plt.plot(x,cum_prob)
plt.plot(x,0.975*np.ones(x.shape[0]),"g--")
plt.show()

・実行結果

下の図の青の実線と緑の点線が$20.48$付近で交わることが確認できる

自由度$n=10$の$t$分布$t(10)$

自由度$n=10$の$F$分布$t(10)$の確率密度関数$f(z)$は下記のように考えることができる。
$$
\large
\begin{align}
f(z) &= \frac{1}{\sqrt{n} B(1/2,n/2)} \left( 1+\frac{z^2}{n} \right)^{-\frac{n+1}{2}} \\
&= \frac{\Gamma((n+1)/2)}{\sqrt{n} \Gamma(1/2) \Gamma(n/2)} \left( 1+\frac{z^2}{n} \right)^{-\frac{n+1}{2}} \\
&= \frac{\Gamma((10+1)/2)}{\sqrt{10} \sqrt{\pi} \Gamma(10/2)} \left( 1+\frac{z^2}{10} \right)^{-\frac{10+1}{2}} \\
&= \frac{\Gamma(11/2)}{\sqrt{10} \sqrt{\pi} \Gamma(5)} \left( 1+\frac{z^2}{10} \right)^{-\frac{11}{2}} \\
&= \frac{9!! \cancel{\sqrt{\pi}}}{2^{5} \sqrt{10} \cancel{\sqrt{\pi}} (5-1)!} \left( 1+\frac{z^2}{10} \right)^{-\frac{11}{2}} \\
&= \frac{9!!}{2^{5} \sqrt{10} (5-1)!} \left( 1+\frac{z^2}{10} \right)^{-\frac{11}{2}}
\end{align}
$$

上記に基づいて下記を実行することで統計数値表と同様の結果を得ることができる。

import numpy as np
import matplotlib.pyplot as plt
import math

x = np.arange(-25., 25., 0.01)
f_x = 9.*7.*5.*3.*(1+x**2/10.)**(-11./2.) / (2.**5*np.sqrt(10)*math.factorial(5-1)) 
delta = 0.01

cum_prob = np.zeros(x.shape[0])
for i in range(x.shape[0]-1):
    cum_prob[i+1] = cum_prob[i] + (f_x[i]+f_x[i+1])*delta/2.

plt.subplot(211)
plt.plot(x[2000:-2000],f_x[2000:-2000])
plt.xlim([-5,5])
plt.subplot(212)
plt.plot(x[2000:-2000],cum_prob[2000:-2000])
plt.plot(x[2000:-2000],0.975*np.ones(x[2000:-2000].shape[0]),"g--")
plt.xlim([-5,5])
plt.show()

・実行結果

下の図の青の実線と緑の点線が$2.228$付近で交わることが確認できる

自由度$m=10,n=10$の$F$分布$F(10,10)$

自由度$n=10$の$\chi^2$分布$\chi^2(10)$の確率密度関数$f(z)$は下記のように考えることができる。
$$
\large
\begin{align}
f(z) &= \frac{z^{\frac{m}{2}-1}}{B(m/2,n/2)} \left( \frac{m}{n} \right)^{\frac{m}{2}} \left( 1+\frac{m}{n}z \right)^{-\frac{m+n}{2}} \\
&= \frac{z^{\frac{10}{2}-1}}{B(10/2,10/2)} \left( \frac{10}{10} \right)^{\frac{10}{2}} \left( 1+\frac{10}{10}z \right)^{-\frac{10+10}{2}} \\
&= \frac{z^{5-1}}{B(5,5)} (1+z)^{-10} \\
&= \frac{z^{5-1} \Gamma(5+5)}{\Gamma(5)\Gamma(5)} (1+z)^{-10} \\
&= \frac{z^{5-1} (10-1)!}{(5-1)!(5-1)!} (1+z)^{-10}
\end{align}
$$

上記に基づいて下記を実行することで統計数値表と同様の結果を得ることができる。

import numpy as np
import matplotlib.pyplot as plt
import math

x = np.arange(0., 7., 0.01)
f_x = x**(5-1) * (1+x)**(-10) * math.factorial(5+5-1) / math.factorial(5-1)**2
delta = 0.01

cum_prob = np.zeros(x.shape[0])
for i in range(x.shape[0]-1):
    cum_prob[i+1] = cum_prob[i] + (f_x[i]+f_x[i+1])*delta/2.

plt.subplot(211)
plt.plot(x,f_x)
plt.subplot(212)
plt.plot(x[200:],cum_prob[200:])
plt.plot(x[200:],0.975*np.ones(x[200:].shape[0]),"g--")
plt.show()

・実行結果

下の図の青の実線と緑の点線が$3.717$付近で交わることが確認できる

【桃太郎電鉄検証】目的地に到着できるかどうかをどのように判定するかの考察①

桃太郎電鉄では目的地や特定のマスに到着できるか判定できる機能がありますが、ルート選択が複数あることから判定のアルゴリズムを考えるにあたっては考慮する点が多いです。当記事では特定のマスに到着できるサイコロの目の和を整数に関する問題を解く視点から考察を行いました。

・ゲーム × 統計 まとめ
https://www.hello-statisticians.com/game_stat

ループの取り扱いに関する基本的な考え方

問題の簡易化

問題の簡易化にあたって、「目的地に対する一番近いルートが得られている際に、より大きな目が出た際に目的地に到着できるか」を一旦取り扱います。

具体的に考えるにあたって、「上記の点間がそれぞれ$1$であるとき緑から赤に到達できる出目」に関して確認します。このとき一番近いルートは$5$であるので、$5$が出れば目的地に到着できます。

ここで注目すべきなのが、途中に存在するループです。たとえば桃太郎電鉄では下記のようなルートを考えることで$7$でも目的地に到着することができます。

出目$7$で目的地に到着できる場合

また、下記のように考えることで$9$進む場合も目的地に到着できます。

出目$9$で目的地に到着できる場合

ここで確認した図のように$5$マス先への目的地へのルートに長さ$4$のループが存在する場合は、$7=5+2$と$9=5+4$の場合も目的地に到着できます。また、ループは何度も可能であるので、「$n \geq 0$のときに$5+4n+2, 5+4n$であれば目的地に到着できる」と考えられます。

ここまでで確認を行った考察により、$5$以上の奇数であれば目的地に到着できることから、サイコロを$1$つではなく$2$つ以上用いることで目的地に到着できる確率を上げると考えられます。下記で取り扱った「複数サイコロの出目の確率分布」を考慮することでサイコロの数の最適化を行うことができます。

ここまでは簡単な問題で確認を行いましたが、特に途中で取り扱ったループの取り扱いによって到着可能な出目が左右されます。よって、次節ではループの取り扱いに関して詳しく確認を行います。

ループの取り扱い

ループの長さが変わる場合

前節の例では長さが$4$のループに関して取り扱いましたが、下記のように長さが$5$のループを考えることができます。

ループの長さが$5$の場合

上記では$5, 10, 15, \cdots$と$8, 13, 18, \cdots$の二パターンの到着方法があります。一般的に考える場合は、「$n \geq 0$のときに$5n+5, 5n+8$」であれば目的地に到着できます。

基本的にはループの長さが$4$の場合と同様に考えられますが、「$4n+5, 4n+7$」と「$5n+5, 5n+8$」の対応に関してより詳しく考察を行います。$4n+5$と$4n+7$の差は途中のループエリアを$1+4n$で抜けるか$3+4n$で抜けるかに対応します。

一方で$5n+5, 5n+8$の差は途中のループエリアを$5n+1$で抜けるか$5n+4$で抜けるかに対応します。この考察は次項で確認する「ループがルートに最小で$2$以上含まれる場合」を考える際に重要になります。

ループがルートに最小で$2$以上含まれる場合

前項でも簡単に確認を行いましたが、ルート中にルートが最小でどのくらい含まれるかによって取り扱いが変わることは抑えておくと良いです。たとえば下記のような例を元に考えます。

ループの長さが$5$の場合かつループがルートに最小で$2$含まれる

上記の場合、「$n \geq 0$の場合に$5n+5, 5n+6$」で目的地に到着することができます。ここで$5n+5, 5n+6$の差はループ地点を$2$で抜けるか$3$で抜けるかに対応します。

このように「ループの長さ」と同時に「ループがルートに最小でどのくらい含まれるか」の確認が必要です。ループの長さが$4$の場合も同様に確認を行います。

ループの長さが$4$の場合かつループがルートに最小で$2$含まれる

上記の場合は途中のループエリアを$4n+2$でしか抜けられないので、目的地に到達できる出目が$4n+5$のみであることに注意が必要です。より一般的にはループの長さの半分の長さがルートに含まれる場合に同様の事象が起こると把握しておけば良いと思います。

複数ループの取り扱い

当項では複数ループの取り扱いについて確認を行います。基本的には複数ループもループが$1$つの場合と同様に取り扱うことができます。

上記のような複数のループがある場合、「長さ$4$のループが経路に$1$含まれる」+「長さ$5$のループが経路に$1$含まれる」と解釈できます。よって、$n \geq 0, m \geq 0$のときに$4n+5, 4n+7$と$5m+5, 5m+8$がそれぞれ目的地に到着できる出目であると考えられます。

上記をまとめると$n \geq 0, m \geq 0$のときに「$4n+5m+5, 4n+5m+7, 4n+5m+8$」で目的地に到着できると考えることができます。また、$m=0, m=1$を元に下記のように考えることができます。

・$m=0$のとき
$$
\large
\begin{align}
4n + 5m + 5 &= 4(n+1) + 1 \\
4n + 5m + 7 &= 4(n+1) + 3 \\
4n + 5m + 8 &= 4(n+2)
\end{align}
$$

・$m=1$のとき
$$
\large
\begin{align}
4n + 5m + 5 &= 4n + 5 + 5 = 4(n+2) + 2 \\
4n + 5m + 7 &= 4n + 5 + 7 = 4(n+3) \\
4n + 5m + 8 &= 4n + 5 + 8 = 4(n+3) + 1
\end{align}
$$

ここで上記の式に$n=0, 1, 2 \cdots$を代入することで、「$7$以上の出目であればどの目が出ても目的地に到着できる」と考えられることは抑えておくと良いと思います。ここまでのループの取り扱いを用いることで、多くのルートを考慮できるので、ループ内のループに関しては一旦省略します。

Ch.13 「広義積分」の演習問題の解答例 〜統計学のための数学入門30講(朝倉書店)〜

当記事は「統計学のための数学入門$30$講(朝倉書店)」の読解サポートにあたってChapter.$13$の「ガンマ関数とベータ関数」の章末問題の解答の作成を行いました。
基本的には書籍の購入者向けの解説なので、まだ入手されていない方は購入の上ご確認ください。また、解説はあくまでサイト運営者が独自に作成したものであり、書籍の公式ページではないことにご注意ください。

・書籍解答まとめ
https://www.hello-statisticians.com/answer_textbook_math#math_stat

本章のまとめ

演習問題解答

問題$13.1$

・$[1]$
下記のように計算を行える。
$$
\large
\begin{align}
\int_{0}^{2} \frac{1}{x^2} dx &= \left[ -\frac{1}{x} \right]_{0}^{2} \\
&= -\left( \frac{1}{2} – 1 \right) \\
&= \frac{1}{2}
\end{align}
$$

・$[2]$
$\displaystyle \int_{0}^{1} \frac{1}{x^2} dx$は下記のように計算を行える。
$$
\large
\begin{align}
\int_{0}^{1} \frac{1}{x^2} dx &= \int_{0}^{1} \frac{1}{x^2} dx \\
&= \lim_{\varepsilon \to +0} \int_{\varepsilon}^{1} \frac{1}{x^2} dx \\
&= \lim_{\varepsilon \to +0} \left[ -\frac{1}{x} \right]_{\varepsilon}^{1} \\
&= \lim_{\varepsilon \to +0} \left( -\frac{1}{1} + \frac{1}{\varepsilon} \right) \\
&= \infty
\end{align}
$$

上記より、広義積分$\displaystyle \int_{-1}^{1} \frac{1}{x^2} dx$は発散する。

問題$13.2$

Ch.12 「数値積分」の演習問題の解答例 〜統計学のための数学入門30講(朝倉書店)〜

当記事は「統計学のための数学入門$30$講(朝倉書店)」の読解サポートにあたってChapter.$12$の「数値積分」の章末問題の解答の作成を行いました。
基本的には書籍の購入者向けの解説なので、まだ入手されていない方は購入の上ご確認ください。また、解説はあくまでサイト運営者が独自に作成したものであり、書籍の公式ページではないことにご注意ください。

・書籍解答まとめ
https://www.hello-statisticians.com/answer_textbook_math#math_stat

本章のまとめ

台形公式

台形公式に基づいて関数$f(x)$の区間$[a,b]$における定積分の近似は下記のように考えることができる。
$$
\large
\begin{align}
\int_{a}^{b} f(x) dx & \simeq \frac{b-a}{2n} [y_0 + 2(y_1 + y_2 + \cdots y_{n-1}) + y_n] \\
y_k &= f(x_k) \\
x_k &= a + \frac{k(b-a)}{n}, \quad k=0, 1, \cdots , n
\end{align}
$$

上記は微小区間$[x_k,x_{k+1}]$の面積$S_k$を下記のように「底辺×高さ÷$2$」の台形の面積で近似することに基づいて表される。
$$
\large
\begin{align}
S_k & \simeq \frac{1}{2} \cdot \frac{b-a}{n} (y_k+y_{k+1}) \\
&= \frac{b-a}{2n} (y_k+y_{k+1})
\end{align}
$$

また、上記では微小区間$\Delta$が$\displaystyle \Delta = \frac{b-a}{n}$のように表される。この式は$b-a$の区間を$n$等分したと考えることで理解できる。

シンプソンの公式

演習問題解答

問題$12.1$

・$[1]$

・$[2]$

・$[3]$

・$[4]$

問題$12.2$

・$[1]$
台形公式を用いることで$\displaystyle \int_{0}^{2} x^4 dx$は下記のように計算できる。
$$
\large
\begin{align}
\int_{0}^{2} x^4 dx &= \frac{2-0}{2 \cdot 4} (f(0)+f(2) + 2(f(0.5)+f(1)+f(1.5))) \\
&= \frac{1}{4} \cdot \frac{1}{2} (0^4 + 2^4 + 2(0.5^4 + 1^4 + 1.5^4) \\
&= \frac{113}{16} = 7.0625
\end{align}
$$

・$[2]$
シンプソンの公式を用いることで$\displaystyle \int_{0}^{2} x^4 dx$は下記のように計算できる。
$$
\large
\begin{align}
\int_{0}^{2} x^4 dx &= \frac{2-0}{6 \cdot 2} (f(0)+f(2) + 4(f(0.5)+f(1.5)) + 2f(1)) \\
&= \frac{1}{6} (0^4 + 2^4 + 4(0.5^4 + 1.5^4) + 2 \cdot 1^4) \\
&= \frac{77}{12} \simeq 6.4167
\end{align}
$$

【コラム・検証実験:区間推定】95%区間が本当に95%の確率で成立する推定結果であるかの確認

区間推定と仮説検定は推測統計を学ぶ上で主要なトピックです。一方で、教科書や参考書の解説は抽象的で直感的な理解が難しい場合も多いです。そこで当記事では$95$%区間が本当に$95$%で成立するかに関してSciPyを用いて生成したサンプルを元に検証実験を行いました。

・コラム
https://www.hello-statisticians.com/column

基本方針の確認

サンプルの生成

サンプルの生成はscipy.statsを用いて行うことができます。たとえば標準正規分布$\mathcal{N}(0,1)$に従う$n=20$のサンプルは下記のように生成できます。

import numpy as np
from scipy import stats

np.random.seed(10)

x = stats.norm.rvs(size=20)

print(x)

・実行結果

[ 1.3315865   0.71527897 -1.54540029 -0.00838385  0.62133597 -0.72008556
  0.26551159  0.10854853  0.00429143 -0.17460021  0.43302619  1.20303737
 -0.96506567  1.02827408  0.22863013  0.44513761 -1.13660221  0.13513688
  1.484537   -1.07980489]

上記のプログラムではnp.random.seed(10)を実行することで乱数のseedを固定しました。seedが変わると結果の再現ができなくなるので、検証実験などを行う場合は必須になります。

実験の方針

区間推定によって得られる$95$%区間は「$95$%の確率で推定した区間に母数(パラメータ)が含まれる」ことを意味します。もう少し直感的に考えると「$20$回推定を行った場合に$19$回は正しい区間が得られ、$1$回は正しくない区間が得られる」と解釈することができます。

よって、次節における実験では正規分布$\mathcal{N}(1,3^2)$に基づいて$n=20$のサンプルを元に区間推定を$300$回行った際に、正しい区間が何回得られるかに関して検証を行います。

検証実験

母分散未知の場合の母平均の推定

$$
\large
\begin{align}
t_{\alpha=0.975}(n-1) \leq & \frac{\sqrt{n}(\overline{X}-\mu)}{s} \leq t_{\alpha=0.025}(n-1) \\
-\frac{s}{\sqrt{n}} t_{\alpha=0.025}(n-1) \leq & \mu-\overline{X} \leq -\frac{s}{\sqrt{n}} t_{\alpha=0.975}(n-1) \\
\overline{X} – \frac{s}{\sqrt{n}} t_{\alpha=0.025}(n-1) \leq & \mu \leq \overline{X} + \frac{s}{\sqrt{n}} t_{\alpha=0.025}(n-1)
\end{align}
$$

上側$2.5$%点を$t_{\alpha=0.025}$のように表すとき、自由度$n-1$の$95$%区間は上記のように表すことができます。上記が$95$%の確率で成立するかを以下を実行することで検証を行います。

import numpy as np
from scipy import stats

np.random.seed(15)

alpha = 0.025
for i in range(300):
    x = stats.norm.rvs(loc=1, scale=3, size=20)
    s2 = np.sum((x-np.mean(x))**2)/(20.-1.)
    L_mu, U_mu = np.mean(x)-np.sqrt(s2/20.)*stats.t.ppf(1-0.025,20-1), np.mean(x)+np.sqrt(s2/20.)*stats.t.ppf(1-0.025,20-1)
    if 1 < L_mu or U_mu < 1:
        print("Experiment.{}, L_mu: {:.3f}, U_mu: {:.3f}".format(i+1, L_mu, U_mu))

・実行結果

Experiment.81, L_mu: -0.974, U_mu: 0.969
Experiment.91, L_mu: 1.390, U_mu: 3.136
Experiment.114, L_mu: 1.035, U_mu: 3.295
Experiment.122, L_mu: 1.390, U_mu: 4.255
Experiment.138, L_mu: -1.843, U_mu: 0.548
Experiment.158, L_mu: 1.007, U_mu: 2.841
Experiment.190, L_mu: -1.916, U_mu: 0.834
Experiment.212, L_mu: -3.025, U_mu: 0.544
Experiment.227, L_mu: 1.849, U_mu: 4.206
Experiment.234, L_mu: 1.390, U_mu: 4.532
Experiment.235, L_mu: 2.005, U_mu: 4.980
Experiment.236, L_mu: 1.205, U_mu: 4.013
Experiment.239, L_mu: 1.292, U_mu: 3.212
Experiment.292, L_mu: 1.039, U_mu: 3.742
Experiment.298, L_mu: -1.644, U_mu: 0.980

上記より$300$回中$15$回の区間推定が正しくない結果を出力したことが確認できます。よって、乱数のseedに注意が必要ですが、母平均の区間推定に関して$95$%区間が概ね$95$%で成立するであろうことが上記から考察できます。

母分散の推定

$$
\large
\begin{align}
\chi^{2}_{\alpha=0.975}(n-1) \leq & \frac{(n-1)s^2}{\sigma^2} \leq \chi^{2}_{\alpha=0.025}(n-1) \\
\frac{1}{\chi^{2}_{\alpha=0.025}(n-1)} \leq & \frac{\sigma^2}{(n-1)s^2} \leq \frac{1}{\chi^{2}_{\alpha=0.975}(n-1)} \\
\frac{(n-1)s^2}{\chi^{2}_{\alpha=0.025}(n-1)} \leq & \sigma^2 \leq \frac{(n-1)s^2}{\chi^{2}_{\alpha=0.975}(n-1)}
\end{align}
$$

上側$2.5$%点を$\chi^{2}_{\alpha=0.025}$のように表すとき、自由度$n-1$の$95$%区間は上記のように表すことができます。上記が$95$%の確率で成立するかを以下を実行することで検証を行います。

import numpy as np
from scipy import stats

np.random.seed(10)

alpha = 0.025
for i in range(300):
    x = stats.norm.rvs(loc=1, scale=3, size=20)
    s2 = np.sum((x-np.mean(x))**2)/(20.-1.)
    L_sigma2, U_sigma2 = (20.-1.)*s2/stats.chi2.ppf(1-alpha,20-1), (20.-1.)*s2/stats.chi2.ppf(alpha,20-1)
    if 3**2 < L_sigma2 or U_sigma2 < 3**2:
        print("Experiment.{}, L_sigma2: {:.3f}, U_sigma2: {:.3f}".format(i+1, L_sigma2, U_sigma2))

・実行結果

Experiment.12, L_sigma2: 2.437, U_sigma2: 8.989
Experiment.20, L_sigma2: 1.820, U_sigma2: 6.712
Experiment.28, L_sigma2: 1.273, U_sigma2: 4.697
Experiment.30, L_sigma2: 9.716, U_sigma2: 35.840
Experiment.62, L_sigma2: 9.903, U_sigma2: 36.529
Experiment.66, L_sigma2: 2.363, U_sigma2: 8.717
Experiment.83, L_sigma2: 2.007, U_sigma2: 7.403
Experiment.131, L_sigma2: 10.366, U_sigma2: 38.235
Experiment.138, L_sigma2: 2.439, U_sigma2: 8.998
Experiment.171, L_sigma2: 9.448, U_sigma2: 34.848
Experiment.201, L_sigma2: 9.716, U_sigma2: 35.837
Experiment.277, L_sigma2: 0.971, U_sigma2: 3.580
Experiment.281, L_sigma2: 10.045, U_sigma2: 37.053
Experiment.285, L_sigma2: 1.894, U_sigma2: 6.984
Experiment.287, L_sigma2: 2.186, U_sigma2: 8.062

上記より$300$回中$15$回の区間推定が正しくない結果を出力したことが確認できます。よって、乱数のseedに注意が必要ですが、母分散の区間推定に関して$95$%区間が概ね$95$%で成立するであろうことが上記から考察できます。

Ch.3 「順列・組合せと2項定理・多項定理」の演習問題の解答例 〜統計学のための数学入門30講〜

当記事は「統計学のための数学入門$30$講(朝倉書店)」の読解サポートにあたってChapter.$3$の「順列・組合せと$2$項定理・多項定理」の章末問題の解答の作成を行いました。
基本的には書籍の購入者向けの解説なので、まだ入手されていない方は購入の上ご確認ください。また、解説はあくまでサイト運営者が独自に作成したものであり、書籍の公式ページではないことにご注意ください。

・書籍解答まとめ
https://www.hello-statisticians.com/answer_textbook_math#math_stat

本章のまとめ

演習問題解答

問題$3.1$

・$[1]$
$8$文字のカードから$3$つの文字を選んで並べるときの順列の総数は${}_8 P_3$であるので、下記のように計算できる。
$$
\large
\begin{align}
{}_8 P_3 = 8 \cdot 7 \cdot 6 = 336
\end{align}
$$

・$[2]$
$8$文字のカードから$3$つの文字を選んで並べるときの組合せの総数は${}_8 C_3$であるので、下記のように計算できる。
$$
\large
\begin{align}
{}_8 C_3 &= \frac{8 \cdot 7 \cdot \cancel{6}}{\cancel{3} \cdot \cancel{2} \cdot 1} \\
&= 56
\end{align}
$$

・$[3]$
$8$文字のカードから$5$つの文字を選んで並べるときの組合せの総数は${}_8 C_5$であるので、下記のように計算できる。
$$
\large
\begin{align}
{}_8 C_5 &= \frac{8 \cdot 7 \cdot \cancel{6} \cdot \cancel{5} \cdot \cancel{4}}{\cancel{5} \cdot \cancel{4} \cdot \cancel{3} \cdot \cancel{2} \cdot 1} \\
&= 56
\end{align}
$$

問題$3.2$

・$[1]$

・$[2]$

2.6 モーメントの概要と式表記 〜統計検定2級対応・統計学入門まとめ〜

当まとめでは統計検定$2$級の公式テキストの副教材に用いることができるように、統計学入門に関して取り扱います。当記事では「統計検定$2$級対応 統計学基礎」の$2.6$節「モーメント」の内容を元に統計学におけるモーメントの概要と表記に関して取りまとめました。
統計検定$2$級のテキストとの対応がわかりやすいように、目次を「統計検定$2$級対応 統計学基礎」と対応させました。学びやすさの観点からあえて目次を対応させましたが、当まとめは「統計の森」オリジナルのコンテンツであり、統計検定の公式とは一切関係ないことにご注意ください。

・統計検定$2$級対応・統計学入門まとめ
https://www.hello-statisticians.com/stat_basic

モーメントの概要

モーメントの概要

モーメント(moment)は平均や分散を一般化した概念であり、物理で出てくるモーメントのように「ある点を中心に考える何らかの指標」であるとざっくり理解すると良いです。たとえば「平均」は「原点を中心とする値」、「分散」は「平均を中心とする値」であると解釈できます。

「モーメント」は「積率」と表されることもあり、「モーメント母関数」を学ぶ際などに「モーメント母関数」と「積率母関数」が同一であることを抑えておくとスムーズです。

モーメントの式表記

統計学におけるモーメントの式表記を理解する際は「原点が中心のモーメント」と「平均が中心のモーメント」を分けて考えると良いです。まず基本的なモーメントである平均を下記のように定義します。
$$
\large
\begin{align}
\mu_1 \equiv E[X]
\end{align}
$$

平均は確率変数$X$の期待値であり、$E[X]$が対応します。上記では$\mu_1=E[X]$のように表しました。平均は原点が中心のモーメントですが、同様に$X^k$の原点を中心とするモーメントを下記のように定めます。
$$
\large
\begin{align}
\mu_k \equiv E[X^k]
\end{align}
$$

同様に$k$次の平均$\mu_1=E[X]$を中心とするモーメントを下記のように定めます。
$$
\large
\begin{align}
\mu_{k}’ \equiv E[(X-E[X])^k] = E[(X-\mu_1)^k]
\end{align}
$$

上記に基づいて分散$V[X]$を$V[X]=\mu_{2}’$のように表すことができます。

下記のまとめの表記と統一するにあたって、当項で用いた$\mu_k$と$\mu_{k}’$は「統計検定$2$級対応 統計学基礎」と逆に定義を行いました。

平均・分散・歪度・尖度

平均・分散・歪度・尖度はそれぞれ$1$〜$4$次のモーメントを元に定義される指標で、分布の特徴に対応する指標です。平均・分散・歪度・尖度を$E[X], V[X], S[X], K[X]$とおくと、$V[X], S[X], K[X]$はそれぞれ下記のように定義されます。
$$
\large
\begin{align}
V[X] &= E[(X-E[X])^2] \\
S[X] &= \frac{E[(X-E[X])^3]}{V[X]^{\frac{3}{2}}} \\
K[X] &= \frac{E[(X-E[X])^4]}{V[X]^{2}} – 3
\end{align}
$$

歪度の$S[X]$と尖度の$K[X]$は一般的に用いられる定義ではありませんが、$E[X], V[X]$と同様に表すにあたって歪度(skewness)、尖度(kurtosis)の頭文字を用いました。

具体的な確率分布とモーメント

正規分布

指数分布

Ch.16 「いろいろな行列」の演習問題の解答例 〜統計学のための数学入門30講(朝倉書店)〜

当記事は「統計学のための数学入門$30$講(朝倉書店)」の読解サポートにあたってChapter.$16$の「いろいろな行列」の章末問題の解答の作成を行いました。
基本的には書籍の購入者向けの解説なので、まだ入手されていない方は購入の上ご確認ください。また、解説はあくまでサイト運営者が独自に作成したものであり、書籍の公式ページではないことにご注意ください。

・書籍解答まとめ
https://www.hello-statisticians.com/answer_textbook_math#math_stat

本章のまとめ

演習問題解答

問題$16.1$

書籍の解答では$3 \times 3$行列で示されているので、以下では$n \times n$行列で示す。

・$[1]$
$n$次の対角行列を$D=(d_{ij}), \overline{D}=(\bar{d}_{ij})$のようにおく。このとき$D\overline{D}$が対角行列となることを以下示す。$D\overline{D}$の$ij$成分を$(D\overline{D})_{ij}$と定めると、$i \neq j$のとき$(D\overline{D})_{ij}$は下記のように表せる。
$$
\large
\begin{align}
(D\overline{D})_{ij} &= \sum_{k=1}^{n} d_{ik} \bar{d}_{kj} \\
&= d_{i1} \bar{d}_{1j} + d_{i2} \bar{d}_{2j} + \cdots + d_{in} \bar{d}_{nj} \\
&= d_{ii} \bar{d}_{ij} + d_{ij} \bar{d}_{jj} \\
&= 0 \times d_{ii} + 0 \times \bar{d}_{jj} \\
&= 0
\end{align}
$$

また$i=j$のとき$(D\overline{D})_{ij}$は下記のように表せる。
$$
\large
\begin{align}
(D\overline{D})_{ij} &= (D\overline{D})_{ii} = \sum_{k=1}^{n} d_{ik} \bar{d}_{ki} \\
&= d_{i1} \bar{d}_{1i} + d_{i2} \bar{d}_{2i} + \cdots + d_{in} \bar{d}_{ni} \\
&= d_{ii} \bar{d}_{ii}
\end{align}
$$

上記より、$i=j$のとき$(D\overline{D})_{ij}=d_{ii}\bar{d}_{ii}$、$i \neq j$のとき$(D\overline{D})_{ij}=0$が得られる。任意の成分に関して同様であることから$D\overline{D}$は対角行列であることが示される。また、$\overline{D}D$に関しても同様に示せる。

・$[2]$
$n$次の上三角行列を$U=(u_{ij}), \overline{U}=(\bar{u}_{ij})$のようにおく。このとき$U\overline{U}$が上三角行列となることを以下示す。$U\overline{U}$の$ij$成分を$(U\overline{U})_{ij}$と定めると、$(U\overline{U})_{ij}$は下記のように表せる。
$$
\large
\begin{align}
(U\overline{U})_{ij} &= \sum_{k=1}^{n} u_{ik} \bar{u}_{kj} \\
&= d_{i1} \bar{d}_{1j} + d_{i2} \bar{d}_{2j} + \cdots + u_{i,i-1}\bar{u}_{i-1,j} + u_{ii}\bar{u}_{ij} + \cdots + d_{in} \bar{d}_{nj} \\
&= u_{ii}\bar{u}_{ij} + \cdots + d_{in} \bar{d}_{nj}
\end{align}
$$

ここで$\overline{U}$が上三角行列であることから、$i>j$のとき$\bar{u}_{ij}, \bar{u}_{i,j+1}, \cdots \bar{u}_{in}$はどれも$0$である。よって、$i>j$で$(U\overline{U})_{ij}=0$であり、$U\overline{U}$が上三角行列であることが示される。

$\overline{U}U$が上三角行列であることも同様に示せる。また、下三角行列$L,\overline{L}$に関しても同様に$L\overline{L}$や$\overline{L}L$の$(i,j)$成分を考えることで示すことができる。

問題$16.2$

行列$A$が非負定値行列であるとき、任意のベクトル$\mathbf{x}$に関して$\mathbf{x}^{\mathrm{T}}A\mathbf{x} \geq 0$が成立する。ここで$B^{\mathrm{T}}B$に関して下記のように考えることができる。
$$
\large
\begin{align}
\mathbf{x}^{\mathrm{T}} B^{\mathrm{T}} B \mathbf{x} &= (B \mathbf{x})^{\mathrm{T}} B \mathbf{x} \\
&= ||B \mathbf{x}||^2 \geq 0
\end{align}
$$

$\mathbf{x}^{\mathrm{T}} B^{\mathrm{T}} B \mathbf{x} \geq 0$であることから非負定値行列の定義より$B^{\mathrm{T}}B$は非負定値行列である。$BB^{\mathrm{T}}$に関しても同様に示すことができる。

Ch.15 「2次形式」の演習問題の解答例 〜統計学のための数学入門30講(朝倉書店)〜

当記事は「統計学のための数学入門$30$講(朝倉書店)」の読解サポートにあたってChapter.$15$の「$2$次形式」の章末問題の解答の作成を行いました。
基本的には書籍の購入者向けの解説なので、まだ入手されていない方は購入の上ご確認ください。また、解説はあくまでサイト運営者が独自に作成したものであり、書籍の公式ページではないことにご注意ください。

・書籍解答まとめ
https://www.hello-statisticians.com/answer_textbook_math#math_stat

本章のまとめ

演習問題解答

問題$15.1$

$$
\large
\begin{align}
\mathbf{x} = \left( \begin{array}{c} 2 \\ 1 \\ 2 \end{array} \right), \, \mathbf{y} = \left( \begin{array}{cc} -1 \\ 2 \\ 3 \end{array} \right), \, \mathbf{z} = \left( \begin{array}{c} 2 \\ -1 \\ c \end{array} \right)
\end{align}
$$

・$[1]$
$\mathbf{x}$と$\mathbf{y}$の内積は下記のように計算できる。
$$
\large
\begin{align}
\mathbf{x} \cdot \mathbf{y} &= \left( \begin{array}{c} 2 \\ 1 \\ 2 \end{array} \right) \cdot \left( \begin{array}{c} -1 \\ 2 \\ 3 \end{array} \right) \\
&= -2 + 2 + 6 = 6
\end{align}
$$

・$[2]$
$\mathbf{x}$と$\mathbf{y}$に平行な単位ベクトルは下記のように考えられる。
$$
\large
\begin{align}
\mathbf{x} &= \left( \begin{array}{c} 2 \\ 1 \\ 2 \end{array} \right) \propto \frac{1}{3} \left( \begin{array}{cc} 2 \\ 1 \\ 2 \end{array} \right) \\
\mathbf{y} &= \left( \begin{array}{c} -1 \\ 2 \\ 3 \end{array} \right) \propto \frac{1}{\sqrt{14}} \left( \begin{array}{cc} -1 \\ 2 \\ 3 \end{array} \right)
\end{align}
$$

・$[3]$
$\mathbf{x}$と$\mathbf{z}$が直交するとき、$\mathbf{x} \cdot \mathbf{z} = 0$が成立するので、$c$は下記より定められる。
$$
\large
\begin{align}
\mathbf{x} \cdot \mathbf{z} &= \left( \begin{array}{c} 2 \\ 1 \\ 2 \end{array} \right) \cdot \left( \begin{array}{c} 2 \\ -1 \\ c \end{array} \right) \\
&= 4 \, – \, 1 + 2c = 0 \\
c &= -\frac{3}{2}
\end{align}
$$

・$[4]$
$2 \mathbf{x} \, – \, \mathbf{y}$は下記のように計算できる。
$$
\large
\begin{align}
2\mathbf{x} \, – \, \mathbf{y} &= 2 \left( \begin{array}{c} 2 \\ 1 \\ 2 \end{array} \right) – \left( \begin{array}{c} -1 \\ 2 \\ 3 \end{array} \right) \\
&= \left( \begin{array}{c} 5 \\ 0 \\ 1 \end{array} \right)
\end{align}
$$

よって$||2 \mathbf{x} \, – \, \mathbf{y}||^{2}$は下記のように得られる。
$$
\large
\begin{align}
||2 \mathbf{x} \, – \, \mathbf{y}||^{2} &= 5^2 + 0^2 + 1^2 \\
&= 26
\end{align}
$$

問題$15.2$

$$
\large
\begin{align}
A = \left( \begin{array}{ccc} 1 & -1 & 2 \\ -2 & 3 & -1 \\ 3 & -2 & 4 \end{array} \right), \, B = \left( \begin{array}{ccc} 2 & 3 & -5 \\ -3 & 1 & 2 \\ 4 & -1 & 2 \end{array} \right)
\end{align}
$$

・$[1]$
$$
\large
\begin{align}
AB &= \left( \begin{array}{ccc} 1 & -1 & 2 \\ -2 & 3 & -1 \\ 3 & -2 & 4 \end{array} \right) \left( \begin{array}{ccc} 2 & 3 & -5 \\ -3 & 1 & 2 \\ 4 & -1 & 2 \end{array} \right) = \left( \begin{array}{ccc} 13 & 0 & -3 \\ -17 & -2 & 14 \\ 28 & 3 & -11 \end{array} \right) \\
BA &= \left( \begin{array}{ccc} 2 & 3 & -5 \\ -3 & 1 & 2 \\ 4 & -1 & 2 \end{array} \right) \left( \begin{array}{ccc} 1 & -1 & 2 \\ -2 & 3 & -1 \\ 3 & -2 & 4 \end{array} \right) = \left( \begin{array}{ccc} -19 & 17 & -19 \\ 1 & 2 & 1 \\ 12 & -11 & 17 \end{array} \right) \\
B^{\mathrm{T}} A^{\mathrm{T}} &= \left( \begin{array}{ccc} 2 & -3 & 4 \\ 3 & 1 & -1 \\ -5 & 2 & 2 \end{array} \right) \left( \begin{array}{ccc} 1 & -2 & 3 \\ -1 & 3 & -2 \\ 2 & -1 & 4 \end{array} \right) = \left( \begin{array}{ccc} 13 & -17 & 28 \\ 0 & -2 & 3 \\ -3 & 14 & -11 \end{array} \right) \\
A^{\mathrm{T}} A &= \left( \begin{array}{ccc} 1 & -2 & 3 \\ -1 & 3 & -2 \\ 2 & -1 & 4 \end{array} \right) \left( \begin{array}{ccc} 1 & -1 & 2 \\ -2 & 3 & -1 \\ 3 & -2 & 4 \end{array} \right) = \left( \begin{array}{ccc} 14 & -13 & 16 \\ -13 & 14 & -13 \\ 16 & -13 & 21 \end{array} \right) \\
A A^{\mathrm{T}} &= \left( \begin{array}{ccc} 1 & -1 & 2 \\ -2 & 3 & -1 \\ 3 & -2 & 4 \end{array} \right) \left( \begin{array}{ccc} 1 & -2 & 3 \\ -1 & 3 & -2 \\ 2 & -1 & 4 \end{array} \right) = \left( \begin{array}{ccc} 6 & -7 & 13 \\ -7 & 14 & -16 \\ 13 & -16 & 29 \end{array} \right)
\end{align}
$$

・$[2]$
$[1]$の計算結果より確認できる。

・$[3]$
$\mathrm{tr}(AB), \, \mathrm{tr}(BA)$はそれぞれ下記のように計算できる。
$$
\large
\begin{align}
\mathrm{tr}(AB) &= 13 \, – \, 2 \, – \, 11 = 0 \\
\mathrm{tr}(BA) &= -19 + 2 + 17 = 0
\end{align}
$$

上記より$\mathrm{tr}(AB) = \mathrm{tr}(BA)$が成立することが確認できる。

・$[4]$
$\mathrm{tr}(A^{\mathrm{T}} A), \, \mathrm{tr}(A A^{\mathrm{T}})$はそれぞれ下記のように計算できる。
$$
\large
\begin{align}
\mathrm{tr}(A^{\mathrm{T}} A) &= 14 + 14 + 21 = 49 \\
\mathrm{tr}(A A^{\mathrm{T}}) &= 6 + 14 + 29 = 49
\end{align}
$$

上記より$\mathrm{tr}(A^{\mathrm{T}} A) = \mathrm{tr}(A A^{\mathrm{T}})$が成立することが確認できる。