ブログ

ド・モアブルの定理(de Moivre’s theorem)の導出と適用例の確認

複素数平面や極形式を考えるにあたってよく出てくるのが極形式の累乗に関するド・モアブルの定理(de Moivre’s theorem)です。当記事では三角関数の加法定理を用いる方法と複素指数関数を用いる方法の$2$通りの方法でド・モアブルの定理の導出と適用例の確認に関して取り扱いました。

・数学まとめ
https://www.hello-statisticians.com/math_basic

前提知識の確認

複素数平面

極形式

複素数$z=x+yi$の絶対値を$r$とおくと、$r$は下記のように表せる。
$$
\large
\begin{align}
z = \sqrt{x^2+y^2}
\end{align}
$$

ここで、複素平面の偏角を$\theta$とおくとき、$z=x+yi$は下記のように表せる。
$$
\large
\begin{align}
z = x+yi = r(\cos{\theta} + i \sin{\theta})
\end{align}
$$

上記を$z$の極形式という。

極形式の積

$$
\large
\begin{align}
z_1 &= r_1(\cos{\theta_1} + i \sin{\theta_1}) \\
z_2 &= r_2(\cos{\theta_2} + i \sin{\theta_2})
\end{align}
$$

上記のように極形式$z_1, z_2$を定めると、極形式の積$z_1 z_2$は下記のように変形することができる。
$$
\large
\begin{align}
z_1 z_2 &= r_1(\cos{\theta_1} + i \sin{\theta_1}) \times r_2(\cos{\theta_2} + i \sin{\theta_2}) \\
&= r_1 r_2 (\cos{\theta_1}\cos{\theta_2} + i^2\sin{\theta_1}\sin{\theta_2} + i(\sin{\theta_1}\cos{\theta_2})+\cos{\theta_1}\sin{\theta_2}) \\
&= r_1 r_2 (\cos{(\theta_1+\theta_2)} + i \sin{(\theta_1+\theta_2)})
\end{align}
$$

複素数の和・差と複素数平面

オイラーの公式

$$
\large
\begin{align}
e^{i \theta} = \cos{\theta} + i \sin{\theta}
\end{align}
$$

上記の式をオイラーの公式という。

ド・モアブルの定理

加法定理を用いた導出

前節の「極形式の積」より下記が成立する。
$$
\large
\begin{align}
(\cos{\theta_1} + i \sin{\theta_1})(\cos{\theta_2} + i \sin{\theta_2}) = \cos{(\theta_1+\theta_2)} + i \sin{(\theta_1+\theta_2)}
\end{align}
$$

$(\cos{\theta} + i \sin{\theta})^n$に上記を$n$回適用することで下記が得られる。
$$
\large
\begin{align}
(\cos{\theta} + i \sin{\theta})^n = \cos{n \theta} + i \sin{n \theta}
\end{align}
$$

上記がド・モアブルの定理である。

オイラーの公式と複素指数関数を用いた導出

前節で取り扱った「オイラーの公式」より$(\cos{\theta} + i \sin{\theta})^n$は下記のように表すことができる。
$$
\large
\begin{align}
(\cos{\theta} + i \sin{\theta})^n = ( e^{i \theta} )^n
\end{align}
$$

上記に対して$( e^{i \theta} )^n = e^{i n \theta}$が成立するので、$(\cos{\theta} + i \sin{\theta})^n$について下記が成立する。
$$
\large
\begin{align}
(\cos{\theta} + i \sin{\theta})^n &= ( e^{i \theta} )^n \\
&= e^{i n \theta} \\
&= \cos{n \theta} + i \sin{n \theta}
\end{align}
$$

上記はド・モアブルの定理に一致する。

ド・モアブルの定理の活用例

1.4.2 箱ひげ図 〜統計検定2級対応・統計学入門まとめ〜

当まとめでは統計検定$2$級の公式テキストの副教材に用いることができるように、統計学入門に関して取り扱います。当記事では「統計検定$2$級対応 統計学基礎」の$1.4.2$節「箱ひげ図」の内容を元に$5$数要約の可視化にあたって用いられる箱ひげ図の概要や描き方に関して取り扱いました。
統計検定$2$級のテキストとの対応がわかりやすいように、目次を「統計検定$2$級対応 統計学基礎」と対応させました。学びやすさの観点からあえて目次を対応させましたが、当まとめは「統計の森」オリジナルのコンテンツであり、統計検定の公式とは一切関係ないことにご注意ください。

・統計検定$2$級対応・統計学入門まとめ
https://www.hello-statisticians.com/stat_basic

箱ひげ図の概要

概要

$5$数要約を用いることで四分位範囲や中央値を元に観測値を把握することができますが、単に計算結果だけではなく図を用いて可視化を行うことでより直感的な把握が可能になります。$5$数要約の可視化にあたってよく用いられるのが箱ひげ図(box whisker plot)です。

箱ひげ図は上図のような図であり、第$1$四分位数と第$3$四分位数を元に箱を作成し、中央値を箱の中に書き入れます。ひげの描き方はいくつかあるので詳しくは次節や「$1.4.3.$ 外れ値」などで確認します。

必要な数学

中央値、四分位数を主に取り扱うので、$2$級範囲では数学知識は特に必要ありません。

箱ひげ図

箱ひげ図の解釈

上図のような箱ひげ図の解釈にあたっては、箱によって第$1$四分位数$Q1$と第$3$四分位数$Q2$が表され、箱の中に中央値が記入されることをまず抑えると良いです。ひげの描き方は最大値・最小値を元に作成する場合と、四分位範囲$IQR$を元に作成する場合などがあります。上図では「$1.4.3.$ 外れ値」の内容も考慮し、$Q3 + 1.5 IQR$と$Q1 – 1.5 IQR$を元にひげを作成しました。+のマーカーは例外のような観測値であると解釈しておけば良いです。

Pythonを用いた箱ひげ図の作成

下記を実行することでPythonで箱ひげ図を作成することができます。

import numpy as np
import matplotlib.pyplot as plt
from scipy import stats

np.random.seed(0)

x1 = stats.norm.rvs(loc=0,scale=1,size=100)
x2 = stats.norm.rvs(loc=0,scale=1.5,size=100)
x3 = stats.norm.rvs(loc=1,scale=1,size=100)

plt.boxplot([x1, x2, x3])
plt.show()

・実行結果

上記はx1が$\mathcal{N}(0,1^2)$に基づくサンプル、x2が$\mathcal{N}(0,1.5^2)$に基づくサンプル、x3が$\mathcal{N}(1,1^2)$に基づくサンプルにそれぞれ対応しますが、概ね妥当な結果が得られたことが確認できると思います。

1.4.1 5数要約 〜統計検定2級対応・統計学入門まとめ〜

当まとめでは統計検定$2$級の公式テキストの副教材に用いることができるように、統計学入門に関して取り扱います。当記事では「統計検定$2$級対応 統計学基礎」の$1.4.1$節「$5$数要約」の内容を元に最小値・第$1$四分位数・中央値・第$3$四分位数・最大値を用いた観測値の要約に関して取り扱いました。
統計検定$2$級のテキストとの対応がわかりやすいように、目次を「統計検定$2$級対応 統計学基礎」と対応させました。学びやすさの観点からあえて目次を対応させましたが、当まとめは「統計の森」オリジナルのコンテンツであり、統計検定の公式とは一切関係ないことにご注意ください。

・統計検定$2$級対応・統計学入門まとめ
https://www.hello-statisticians.com/stat_basic

5数要約の概要

概要

得られた観測値を数字で要約するにあたっては、中央値や四分位数のように大まかにパターンがあるので、表の形式で数字をまとめて取り扱うと作成や解釈がしやすいです。

当記事では最小値・第$1$四分位数・中央値・第$3$四分位数・最大値を元に構成される要約の$5$数要約(five-number summary)について以下具体的な例を元に詳しく確認します。変数の分類で取り扱った例を同じく取り扱うので合わせて確認しておくと良いです。

必要な数学

中央値、四分位数を主に取り扱うので、$2$級範囲では数学知識は特に必要ありません。

5数要約

ID 近さ家賃間取り大きさ($m^2$)方角築年数(年)
$1$ B$68,000$$1K$$19$西$12$
$2$ B$68,000$$1K$$19$$12$
$3$ B$69,000$$1K$$19$北西$14$
$\vdots$ $\vdots$$\vdots$$\vdots$$\vdots$$\vdots$$\vdots$
$139$ A$148,000$$1LDK$$42$$13$
$140$ B$150,000$$1LDK$$41$南東$5$
統計検定$2$級対応 統計学基礎 表$1.1$

上記の詳細は下記より入手することができます。
http://www.tokyo-tosho.co.jp/books/978-4-489-02227-2/

家賃、大きさ、築年数の$5$数要約は下記のように作成できます。

項目 家賃(円)大きさ($m^2$)築年数(年)
最小値 $68,000$$15.00$$0.00$
第$1$四分位数 $86,750$$21.75$$6.00$
中央値 $98,750$$25.00$$9.00$
第$3$四分位数 $113,250$$29.00$$13.00$
最大値 $150,000$$60.00$$28.00$
統計検定$2$級対応 統計学基礎 表$1.9$

数学検定2級 解説 〜公式問題集 解説&解答 Ch.6「複素数と複素数平面」〜

数学検定$2$級は数ⅡBまで相当の数学の基本トピックに関して取り扱った検定であり、統計学に必要な数学を身につける際の指標に役に立ちます。当記事では「日本数学検定協会 監修」の「数学検定問題集 $2$級」より、第$6$章の「複素数と複素数平面」の解説と演習問題の解答例などを取り扱いました。

・数学検定$2$級まとめ
https://www.hello-statisticians.com/math_certificate_2

本章のまとめ

複素数と方程式の解

複素数平面

図形と複素数

演習

計算技能問題

問題.$1$

$x^2-2x+3=0$の$2$解を$\alpha, \beta$とおくと、下記が成立する。
$$
\large
\begin{align}
(x-\alpha)(x-\beta) &= 0 \\
x^2 – (\alpha+\beta)x + \alpha \beta &= 0 \\
x^2 – 2x + 3 &= 0
\end{align}
$$

よって$\alpha+\beta$と$\alpha \beta$は下記のようになる。
$$
\large
\begin{align}
\alpha + \beta &= 2 \\
\alpha \beta &= 3
\end{align}
$$

$[1]$
$\alpha^3 + \beta^3$は下記のように計算できる。
$$
\large
\begin{align}
\alpha^3 + \beta^3 &= (\alpha+\beta)^{3} – 3 \alpha \beta(\alpha+\beta) \\
&= 2^3 – 3 \cdot 3 \cdot 2 \\
&= 8-18 = -10
\end{align}
$$

$[2]$
$$
\large
\begin{align}
(2 \alpha^2 + 1)(2 \beta^2 + 1) &= 4 \alpha^2 \beta^2 + 2(\alpha^2 + \beta^2) + 1 \\
&= 4(\alpha \beta)^{2} + 2((\alpha+\beta)^2 – 2\alpha \beta) + 1 \\
&= 4 \cdot 3^2 + 2 \cdot (2^2 – 2 \cdot 3) + 1 \\
&= 36 – 4 + 1 \\
&= 33
\end{align}
$$

問題.$2$

$[1]$
$2$解$\alpha,\beta$について下記が成立する。
$$
\large
\begin{align}
\alpha + \beta &= 2 + \sqrt{6} + 2 – \sqrt{6} \\
&= 4 \\
\alpha \beta &= (2 + \sqrt{6})(2 – \sqrt{6}) \\
&= 4 – 6 \\
&= -2
\end{align}
$$

よって二次方程式は$x^2-4x-2=0$である。

$[2]$
$2$解$\alpha,\beta$について下記が成立する。
$$
\large
\begin{align}
\alpha + \beta &= 2 + 3i + 2 – 3i \\
&= 4 \\
\alpha \beta &= (2 + 3i)(2 – 3i) \\
&= 4 – 9i^2 \\
&= 13
\end{align}
$$

よって二次方程式は$x^2-4x+13=0$である。

問題.$3$

和が$4$、積が$6$である$2$数は$2$次方程式$x^2-4x+6=0$の解であるので、解の公式より下記のように得られる。
$$
\large
\begin{align}
x^2 – 4x + 6 &= 0 \\
x &= 2 \pm \sqrt{2^2-6} \\
&= 2 \pm \sqrt{2}i
\end{align}
$$

問題.$4$

$[1]$
$x=1$は解であるので、$(x-1)$でくくることで下記のように方程式を変形できる。
$$
\large
\begin{align}
x^3 – 3x + 2 &= 0 \\
(x-1)(x^2+x-2) &= 0 \\
(x+2)(x-1)^2 &= 0
\end{align}
$$

上記より$x=1, -2$である。

$[2]$
$x=2$は解であるので、$(x-2)$でくくることで下記のように方程式を変形できる。
$$
\large
\begin{align}
x^3 + 2x^2 – 5x + 6 &= 0 \\
(x-2)(x^2+4x+3) &= 0 \\
(x-2)(x+1)(x+3) &= 0
\end{align}
$$

上記より$x=-1, 2, -3$である。

問題.$5$

・$[1]$
絶対値$|1-i|$は下記のように計算できる。
$$
\large
\begin{align}
|1-i| &= \sqrt{1^2+1^2} \\
&= \sqrt{2}
\end{align}
$$

よって、$1-i$は極形式で下記のように表せる。
$$
\large
\begin{align}
1-i &= \sqrt{2} \left( \frac{1}{\sqrt{2}} – \frac{i}{\sqrt{2}} \right) \\
&= \sqrt{2} \left( \cos{ \left( -\frac{\pi}{4} \right)} + i \sin{ \left( -\frac{\pi}{4} \right)} \right)
\end{align}
$$

・$[2]$
絶対値$|\sqrt{3}+3i|$は下記のように計算できる。
$$
\large
\begin{align}
|\sqrt{3}+3i| &= \sqrt{\sqrt{3}^2+3^2} \\
&= \sqrt{12} = 2 \sqrt{3}
\end{align}
$$

よって、$\sqrt{3}+3i$は極形式で下記のように表せる。
$$
\large
\begin{align}
\sqrt{3}+3i &= 2 \sqrt{3} \left( \frac{1}{2} + \frac{\sqrt{3}}{2} \right) \\
&= 2 \sqrt{3} \left( \cos{ \left( \frac{\pi}{3} \right)} + i \sin{ \left( \frac{\pi}{3} \right)} \right)
\end{align}
$$

・$[3]$
$i(i-1)=i^2-i=-1-i$が成立する。このとき絶対値$|-1-i|$は下記のように計算できる。
$$
\large
\begin{align}
|-1-i| &= \sqrt{1^2+1^2} \\
&= \sqrt{2}
\end{align}
$$

よって、$i(i-1)$は極形式で下記のように表せる。
$$
\large
\begin{align}
i(i-1) &= -1-i \\
&= \sqrt{2} \left( -\frac{1}{\sqrt{2}} – \frac{i}{\sqrt{2}} \right) \\
&= \sqrt{2} \left( \cos{ \left( \frac{5 \pi}{4} \right)} + i \sin{ \left( \frac{5 \pi}{4} \right)} \right)
\end{align}
$$

問題.$6$

$z=2+2\sqrt{3}$より、$|z|$は下記のように表すことができる。
$$
\large
\begin{align}
|z| &= \sqrt{2^2+(2\sqrt{3}^2)} \\
&= \sqrt{16} = 4
\end{align}
$$

よって、$z$は下記のような極形式で表せる。
$$
\large
\begin{align}
z &= 4 \left( \frac{1}{2} + \frac{\sqrt{3}}{2} i \right) \\
&= 4 \left( \cos{\left( \frac{\pi}{3} \right)} + i \sin{\left( \frac{\pi}{3} \right)} \right)
\end{align}
$$

上記に対しド・モアブルの定理を用いることで$z^3, z^4, z^5$はそれぞれ下記のように計算できる。
・$z^3$
$$
\large
\begin{align}
z^3 &= 4^3 \left( \cos{\left( \frac{\pi}{3} \right)} + i \sin{\left( \frac{\pi}{3} \right)} \right)^3 \\
&= 4^3 (\cos{\pi} + i \sin{\pi}) \\
&= -64
\end{align}
$$

・$z^4$
$$
\large
\begin{align}
z^3 &= 4^4 \left( \cos{\left( \frac{\pi}{3} \right)} + i \sin{\left( \frac{\pi}{3} \right)} \right)^4 \\
&= 4^4 \left( \cos{\left( \frac{4 \pi}{3} \right)} + i \sin{\left( \frac{4 \pi}{3} \right)} \right) \\
&= 4^4 \left( -\frac{1}{2} – i \frac{\sqrt{3}}{2} \right) = -128 – 128\sqrt{3} i
\end{align}
$$

・$z^5$
$$
\large
\begin{align}
z^5 &= 4^5 \left( \cos{\left( \frac{\pi}{3} \right)} + i \sin{\left( \frac{\pi}{3} \right)} \right)^5 \\
&= 4^5 \left( \cos{\left( \frac{5 \pi}{3} \right)} + i \sin{\left( \frac{5 \pi}{3} \right)} \right) \\
&= 4^5 \left( \frac{1}{2} – i \frac{\sqrt{3}}{2} \right) = 512 – 512 \sqrt{3} i
\end{align}
$$

問題.$7$

$z=2+i$に対し、$z(\cos{120^{\circ}} + i \sin{120^{\circ}})$は下記のように計算できる。
$$
\large
\begin{align}
z(\cos{120^{\circ}} + i \sin{120^{\circ}}) &= (2+i) \left( -\frac{1}{2} + \frac{\sqrt{3}}{2} i \right) \\
&= -1 + \frac{\sqrt{3}}{2} i^2 + \sqrt{3} i – \frac{1}{2}i \\
&= -1 – \frac{\sqrt{3}}{2} + \left( \sqrt{3} – \frac{1}{2} \right)i
\end{align}
$$

問題.$8$

ドモアブルの定理より$(\cos{\theta}+i\sin{\theta})^{n}=\cos{n \theta}+i\sin{n \theta}$が成立するので与式は下記のように計算できる。
$$
\large
\begin{align}
\frac{(\cos{3 \theta}+i\sin{3 \theta})(\cos{4 \theta}+i\sin{4 \theta})}{\cos{\theta}+i\sin{\theta}} &= \frac{(\cos{\theta}+i\sin{\theta})^{3}(\cos{\theta}+i\sin{\theta})^{4}}{\cos{\theta}+i\sin{\theta}} \\
&= \cos{6 \theta}+i\sin{6 \theta} \\
&= \cos{90^{\circ}}+i\sin{90^{\circ}} = i
\end{align}
$$

数理技能問題

問題.$1$

$$
\large
\begin{align}
\alpha + \beta &= -1 \\
\alpha \beta &= 2
\end{align}
$$

$[1]$
$(2\alpha+\beta)+(2\beta+\alpha), (2\alpha+\beta)(2\beta+\alpha)$はそれぞれ下記のように得られる。
$$
\large
\begin{align}
(2\alpha+\beta)+(2\beta+\alpha) &= 3(\alpha+\beta) \\
&= -3 \\
(2\alpha+\beta)(2\beta+\alpha) &= 4 \alpha \beta + 2 \alpha^{2} + 2 \beta^{2} + \alpha \beta \\
&= 2(\alpha+\beta)^{2} + \alpha \beta \\
&= 2 \cdot (-1)^{2} + 2 = 4
\end{align}
$$

上記に対して解と係数の関係より、求める$2$次方程式は$x^2+3x+4=0$である。

$[2]$
$(\alpha-1)^{2}+(\beta-1)^{2}, (\alpha-1)^{2}(\beta-1)^{2}$はそれぞれ下記のように得られる。
$$
\large
\begin{align}
(\alpha-1)^{2} + (\beta-1)^{2} &= \alpha^{2} – 2 \alpha + 1 + \beta^{2} – 2 \beta + 1 \\
&= (\alpha+\beta)^{2} – 2 \alpha \beta – 2(\alpha + \beta) + 2 \\
&= (-1)^{2} – 2 \cdot 2 – 2 \cdot (-1) + 2 = 1 \\
(\alpha-1)^{2}(\beta-1)^{2} &= [(\alpha-1)(\beta-1)]^{2} \\
&= (\alpha\beta – (\alpha+\beta) + 1)^{2} \\
&= (2+1+1)^{2} = 16
\end{align}
$$

よって解と係数の関係より、求める$2$次方程式は$x^2-x+16=0$である。

問題.$2$

$z^{4} = 8(-1+\sqrt{3}i)$は下記のように変形できる。
$$
\large
\begin{align}
z^{4} &= 8(-1+\sqrt{3}i) \\
&= 16 \left( -\frac{1}{2} + \frac{\sqrt{3}}{2}i \right) \\
&= 2^{4} \left[ \cos{\left(\frac{2 \pi}{3}\right)} + i\sin{\left(\frac{2 \pi}{3}\right)} \right] \quad (1)
\end{align}
$$

ここで$z=r(\cos{\theta}+i\sin{\theta})$とおくと、$(1)$より下記が成立する。
$$
\large
\begin{align}
r &= 2 \\
4 \theta &= \frac{2 \pi}{3} + 2 n \pi
\end{align}
$$

$0 \leq \theta < 2 \pi$が成立する整数$n$は$n=0,1,2,3$であり、このとき$\theta$に関して下記が成立する。
$$
\large
\begin{align}
\theta &= \frac{\pi + 3n \pi}{6} \\
&= \frac{\pi}{6}, \, \frac{2 \pi}{3}, \, \frac{7 \pi}{6}, \, \frac{5 \pi}{3}
\end{align}
$$

よって$z$は下記のように表せる。
$$
\large
\begin{align}
z = \sqrt{3}+i, \, -1+\sqrt{3}i, \, -\sqrt{3}-i, \, 1-\sqrt{3}i
\end{align}
$$

問題.$3$

ドモアブルの定理より$(\cos{\theta}+i\sin{\theta})^{n}=\cos{n \theta}+i\sin{n \theta}$が成立するので、$\cos{3 \theta}+i\sin{3 \theta}$は下記のように計算できる。
$$
\large
\begin{align}
\cos{3 \theta}+i\sin{3 \theta} &= (\cos{\theta}+i\sin{\theta})^{3} \\
&= \cos^{3}{\theta} + 3i\cos^{2}{\theta}\sin{\theta} + 3i^2 \cos{\theta}\sin^{2}{\theta} + i^{3} \sin^{3}{\theta} \\
&= \cos^{3}{\theta} + 3i\cos^{2}{\theta}\sin{\theta} – 3 \cos{\theta}\sin^{2}{\theta} – i \sin^{3}{\theta} \\
&= \cos^{3}{\theta} – 3\cos{\theta}\sin^{2}{\theta} + i(3\cos^{2}{\theta}\sin{\theta}-\sin^{3}{\theta}) \\
&= \cos^{3}{\theta} – 3\cos{\theta}(1-\cos^{2}{\theta}) + i(3(1-\sin^{2}{\theta})\sin{\theta}-\sin^{3}{\theta}) \\
&= 4\cos^{3}{\theta} – 3\cos{\theta} + i(3\sin{\theta}-4\sin^{3}{\theta})
\end{align}
$$

上記より下記が成立する。
$$
\large
\begin{align}
\cos{3 \theta} &= 4\cos^{3}{\theta} – 3\cos{\theta} \\
\sin{3 \theta} &= 3\sin{\theta} – 4\sin^{3}{\theta}
\end{align}
$$

問題.$4$

問題.$5$

問題.$6$

1.3.5 範囲・四分位範囲 〜統計検定2級対応・統計学入門まとめ〜

当まとめでは統計検定$2$級の公式テキストの副教材に用いることができるように、統計学入門に関して取り扱います。当記事では「統計検定$2$級対応 統計学基礎」の$1.3.5$節「範囲・四分位範囲」の内容を元に、左右対称でない分布の散らばり度合いを表す指標に用いられる四分位範囲に関して取り扱いました。
統計検定$2$級のテキストとの対応がわかりやすいように、目次を「統計検定$2$級対応 統計学基礎」と対応させました。学びやすさの観点からあえて目次を対応させましたが、当まとめは「統計の森」オリジナルのコンテンツであり、統計検定の公式とは一切関係ないことにご注意ください。

・統計検定$2$級対応・統計学入門まとめ
https://www.hello-statisticians.com/stat_basic

「範囲・四分位範囲」の概要

概要

観測値の散らばりを表すにあたっては分散に基づく標準偏差が用いられることが多い一方で、標準偏差は平均を用いて計算することから左右対称でない分布に対しては適切ではない場合が多いです。

このような場合に中心を表す指標である中央値・最頻値と同時に用いられることが多いのが「範囲・四分位範囲」です。範囲は最大値・最小値が外れ値である場合も多いので、実用的には四分位範囲が用いられることが多いです。以下、範囲・四分位範囲に関して詳しく確認を行います。

必要な数学

四分位範囲は基本的に中央値と同様に考えるので、定義さえ理解できれば数学的な表現はそれほど重要ではありません。

範囲・四分位範囲

範囲

範囲$R$は「最大値$-$最小値」で定義されます。範囲を考えることで値がどのくらい散らばっているかを判断することができます。たとえば試験の最高点と最低点を元に範囲を計算することで、試験の各問題の難易度の評価などを行うことが可能です。

範囲は左右対称でない分布に関しても計算することができますが、外れ値が存在する場合に範囲が大きくなるなど、全体の傾向を見るには適さない場合があります。よって、一般に散らばり度合いを確認する際は次項で確認する四分位範囲を用いることが多いです。

四分位範囲

四分位範囲は、中央値と同じ要領で考えると理解しやすいです。観測値を小さい順に並べた際に、全体の$25$%、$50$%、$75$%にある値をそれぞれ$Q1, Q2, Q3$とおきます。このとき$Q1, Q2, Q3$をそれぞれ第$1$四分位数、第$2$四分位数、第$3$四分位数といいます。

ここで第$2$四分位数の$Q2$が中央値に一致することも合わせて抑えておくと良いです。また四分位範囲(interquartile range)を$IQR$とおくと、$IQR$は下記のように定義されます。
$$
\large
\begin{align}
IQR = Q3 – Q1
\end{align}
$$

上記の$1/2$の$IQR/2$を四分位偏差(quartile deviation)といい、分布が左右対称でない場合に標準偏差の代わりに用いられることが多いです。

1.3.4 中央値・最頻値 〜統計検定2級対応・統計学入門まとめ〜

当まとめでは統計検定$2$級の公式テキストの副教材に用いることができるように、統計学入門に関して取り扱います。当記事では「統計検定$2$級対応 統計学基礎」の$1.3.4$節「中央値・最頻値」の内容を元に、左右対称ではない観測値の分布の中心の表し方に関して取りまとめました。
統計検定$2$級のテキストとの対応がわかりやすいように、目次を「統計検定$2$級対応 統計学基礎」と対応させました。学びやすさの観点からあえて目次を対応させましたが、当まとめは「統計の森」オリジナルのコンテンツであり、統計検定の公式とは一切関係ないことにご注意ください。

・統計検定$2$級対応・統計学入門まとめ
https://www.hello-statisticians.com/stat_basic

「中央値」・「最頻値」の概要

概要

観測値が左右対称に分布するとき、平均と標準偏差を計算することで観測値の分布を大まかに把握することができますが、左右対称でない分布では平均や標準偏差が意味をなさない場合があります。

役職 平社員平社員平社員平社員役員
年収 $220$$230$$270$$280$$4,000$

たとえば上記のような会社がある場合に、$5$人の平均年収は$1,000$万ですが、平社員の年収は$220$〜$280$万であり、平均年収$1,000$万の会社と見るのはそれほど適切ではありません。このように偏りのある分布を取り扱う場合によく用いられるのが中央値や最頻値です。当記事では以下で詳しく確認します。

必要な数学

中央値・最頻値は数式で表すと必要以上に複雑になるので、$2$級範囲では数学の前提知識は必要ありません。それぞれの定義を抑えるだけで基本的に十分なので、難しく考えないというのが重要だと思います。

中央値・最頻値

中央値

中央値(median)は数字を小さい順に並べた際に真ん中の値になります。$5$個の観測値の場合は$3$番目、$9$個の観測値の場合は$5$番目の観測値の値をそれぞれ考えれば良いです。前節の年収の例では$3$番目が$270$万なので中央値は$270$万になり、概ね中心であると考えても直感的に妥当であると思います。

観測値の数が奇数の場合はちょうど真ん中の観測値が存在しますが、偶数の場合は$6$個の観測値の場合の$3$番目と$4$番目のように中心の値が$2$つ存在します。このような場合は$3$番目と$4$番目の観測値の平均を計算することが多いです。

最頻値

最頻値(mode)は、度数分布表の一番大きな区間を抽出することに対応します。直感的にはヒストグラムの一番高い区間を最頻値とすれば良いです。

2.10.2 t分布 〜統計検定2級対応・統計学入門まとめ〜

当まとめでは統計検定$2$級の公式テキストの副教材に用いることができるように、統計学入門に関して取り扱います。当記事では「統計検定$2$級対応 統計学基礎」の$2.10.2$節「$t$分布」の内容に基づいて$t$分布の定義や確率密度関数のグラフ化に関して取りまとめました。
統計検定$2$級のテキストとの対応がわかりやすいように、目次を「統計検定$2$級対応 統計学基礎」と対応させました。学びやすさの観点からあえて目次を対応させましたが、当まとめは「統計の森」オリジナルのコンテンツであり、統計検定の公式とは一切関係ないことにご注意ください。

・統計検定$2$級対応・統計学入門まとめ
https://www.hello-statisticians.com/stat_basic

t分布の概要

概要

必要な数学

確率密度関数の図示にあたって、指数関数やベータ関数の理解が必要になります。統計検定$2$級範囲では$t$分布の確率密度関数は出てきませんが、「統計数値表」の形式で使用する必要があるので確率密度関数の式とグラフの描画に関しては抑えておくと良いと思います。

ベータ関数はガンマ関数を用いて表すことができますが、下記でガンマ関数とベータ関数に関する計算について取りまとめました。

t分布

確率変数の対応

$$
\large
\begin{align}
X & \sim \mathcal{N}(0,1) \\
Y & \sim \chi^{2}(n)
\end{align}
$$

上記のように確率変数$X$が標準正規分布$\mathcal{N}(0,1)$、確率変数$Y$が自由度$n$の$\chi^2$分布$\chi^{2}(n)$に従う場合を仮定します。このとき、下記のように$t$を定義します。
$$
\large
\begin{align}
t = \frac{X}{\sqrt{Y/n}}
\end{align}
$$

上記の式で定めた$t$は自由度$n$の$t$分布(t-distribution)$t(n)$に従い、$t \sim t(n)$のように表されます。

確率密度関数

確率密度関数の数式

自由度$n$の$t$分布$F(n)$の確率変数を$Z$、確率密度関数を$f(z)$とおくと、$f(z)$は下記のように表すことができます。
$$
\large
\begin{align}
f(z) = \frac{\Gamma((n+1)/2)}{\sqrt{\pi n} \Gamma(n/2)} \left( 1+\frac{z^2}{n} \right)^{-\frac{n+1}{2}} = \frac{1}{\sqrt{n} B(1/2,n/2)} \left( 1+\frac{z^2}{n} \right)^{-\frac{n+1}{2}}
\end{align}
$$

ガンマ関数とベータ関数

ガンマ関数$\Gamma(\alpha)$は下記のように定義されます。
$$
\large
\begin{align}
\Gamma(\alpha) = \int_{0}^{\infty} x^{\alpha-1} e^{-x} dx \quad (1)
\end{align}
$$

このとき、ガンマ関数$\Gamma(\alpha)$に関して以下の式が成立します。
$$
\large
\begin{align}
\Gamma(\alpha+1) &= \alpha \Gamma(\alpha), \quad (2) \\
\Gamma(1) &= 1, \quad (3) \\
\Gamma(n) &= (n-1)!, n \in \mathbb{N}, \quad (4) \\
\Gamma \left( \frac{1}{2} \right) &= \sqrt{\pi}, \quad (5)
\end{align}
$$

また、ベータ関数$B(\alpha,\beta)$は下記のように定義されます。
$$
\large
\begin{align}
B(\alpha,\beta) = \int_{0}^{\infty} x^{\alpha-1} (1-x)^{\beta-1} dx \quad (6)
\end{align}
$$

上記で定義したベータ関数$B(\alpha,\beta)$に関して以下の式が成立します。
$$
\large
\begin{align}
B(\alpha,\beta) &= B(\beta,\alpha), \quad (7) \\
B(\alpha,\beta) &= \frac{\Gamma(\alpha)\Gamma(\beta)}{\Gamma(\alpha+\beta)}, \quad (8) \\
\Gamma(m,n) &= \frac{(m-1)!(n-1)!}{(m+n-1)!}, m,n \in \mathbb{N}, \quad (9)
\end{align}
$$

詳しい導出はそれぞれ下記で取り扱いました。

発展事項①

$t$分布の確率密度関数の導出にあたっては統計検定準$1$級や$1$級で出てくる変数変換などが必要で難しいので当記事では省略しました。詳しくは下記で取り扱いましたので、導出を確認する際は下記などをご確認ください。

確率密度関数の図示

以下では$t(1), t(2), t(10)$の$t$分布の図示を行います。それぞれの分布のベータ関数は前項の式に基づいて下記のように計算できます。
$$
\large
\begin{align}
B \left( \frac{1}{2},\frac{1}{2} \right) &= \frac{\Gamma(1/2)\Gamma(1/2)}{\Gamma(1/2+1/2)} \\
&= \frac{\sqrt{\pi} \times \sqrt{\pi}}{1!} = \pi \\
B \left( \frac{1}{2},\frac{2}{2} \right) &= \frac{\Gamma(1/2)\Gamma(1)}{\Gamma(1/2+1)} \\
&= \frac{\sqrt{\pi}}{\sqrt{\pi}/2} = 2 \\
B \left( \frac{1}{2},\frac{10}{2} \right) &= \frac{\Gamma(1/2)\Gamma(5)}{\Gamma(1/2+5)} \\
&= \frac{3 \cdot 2^8}{9 \cdot 7 \cdot 5 \cdot 3}
\end{align}
$$

上記より、確率密度関数の式に基づいて下記を実行することで$t$分布の確率密度関数を描くことができます。

import numpy as np
import matplotlib.pyplot as plt

z = np.arange(-5.01,5.01,0.01)

f_z = {}

f_z[0] = (1+z**2/1.)**(-(1.+1.)/2.) / (np.sqrt(1.) * np.pi)
f_z[1] = (1+z**2/2.)**(-(2.+1.)/2.) / (np.sqrt(2.) * 2.)
f_z[2] = (1+z**2/10.)**(-(10.+1.)/2.) * 9. * 7. * 5. * 3. / (np.sqrt(10.) * 3. * 2.**8)

label_z = {}
label_z[0], label_z[1], label_z[2] = "n = 1", "n = 2", "n = 10"

for i in range(3):
    plt.plot(z,f_z[i],label=label_z[i])

plt.legend()
plt.ylim([0.,0.5])
plt.show()

・実行結果

上図は「統計検定$2$級対応 統計学基礎」の図$2.10$に対応します。

発展事項②

標本分布の確率密度関数から「統計数値表」の作成にあたっては「数値積分」が用いられます。教科書などで取り扱われることは少ないですが、台形の公式などに基づいて近似値の計算ができるので、概要は抑えておくと良いかもしれません。

1.3.3 変動係数 〜統計検定2級対応・統計学入門まとめ〜

当まとめでは統計検定$2$級の公式テキストの副教材に用いることができるように、統計学入門に関して取り扱います。当記事では「統計検定$2$級対応 統計学基礎」の$1.3.3$節「変動係数」の内容を元に、平均の値を元に散らばり具合を判定する変動係数に関して取り扱いました。
統計検定$2$級のテキストとの対応がわかりやすいように、目次を「統計検定$2$級対応 統計学基礎」と対応させました。学びやすさの観点からあえて目次を対応させましたが、当まとめは「統計の森」オリジナルのコンテンツであり、統計検定の公式とは一切関係ないことにご注意ください。

・統計検定$2$級対応・統計学入門まとめ
https://www.hello-statisticians.com/stat_basic

変動係数の概要

概要

標準偏差を元に散らばり具合を数値化することができますが、「食料品の購買」と「車の購買」のように品物の平均金額が変わると散らばり具合も大きくなることに注意が必要です。

たとえば卵$1$個あたりの金額は高級品も含めて数十円〜数百円で入手が可能ですが、車は数百万〜数千万が概ねの相場だと思います。このとき、卵の標準偏差はせいぜい数十円〜数百円程度であるのに対して、車の場合は百万以上になるということはあり得ます。

このように平均価格が大きく異なる観測値を考える際に、平均価格が大きいものがばらつきが大きいという結果になりがちです。そこで平均価格に関係なくばらつきを表すにあたって変動係数(CV; Coefficient of Variation)という値を定義します。当記事では変動係数について詳しく確認を行いました。

必要な数学

変動係数の計算に用いる平均や標準偏差の式の定義にあたって、和を表す記号の$\displaystyle \sum$が用いられることが多いので、抑えておく必要があります。

変動係数

変動係数の式定義

変動係数を$CV$とおくと、$CV$は平均$\bar{x}$と標準偏差$S$を用いて下記のように定義されます。
$$
\large
\begin{align}
CV = \frac{S}{\bar{x}}
\end{align}
$$

変動係数の解釈

変動係数の解釈にあたっては、変動係数の逆数が下記のように$x_i = 2 \bar{x}$の標準化得点に一致することを元に考えると良いと思います。
$$
\large
\begin{align}
CV &= \frac{S}{\bar{x}} \\
&= \frac{1}{\bar{x}/S} \\
&= \left( \frac{2 \bar{x} – \bar{x}}{S} \right)^{-1}
\end{align}
$$

1.3.2 標準化得点と偏差値 〜統計検定2級対応・統計学入門まとめ〜

当まとめでは統計検定$2$級の公式テキストの副教材に用いることができるように、統計学入門に関して取り扱います。当記事では「統計検定$2$級対応 統計学基礎」の$1.3.2$節「標準化得点」の内容を元に観測値が平均を基準にどのくらいの値であるかを表す標準化得点と偏差値に関して取り扱いました。
統計検定$2$級のテキストとの対応がわかりやすいように、目次を「統計検定$2$級対応 統計学基礎」と対応させました。学びやすさの観点からあえて目次を対応させましたが、当まとめは「統計の森」オリジナルのコンテンツであり、統計検定の公式とは一切関係ないことにご注意ください。

・統計検定$2$級対応・統計学入門まとめ
https://www.hello-statisticians.com/stat_basic

標準化得点と偏差値の概要

概要

成績評価は試験の結果などによって行われることが多いですが、試験によって簡単だったり難しかったりと得点の取りやすさにはばらつきが生じます。たとえば共通テストのように科目選択式の場合など、全員が同じ科目を受けない際などは科目を横断した評価が難しいです。

このような際によく用いられるのが、「平均点を基準にどのくらいの得点であるかの指標」の「標準化得点」や「偏差値」です。一般的には「偏差値」が使われることが多いですが、統計では「標準化得点」が用いられることもあります。当記事では以下、標準化得点と偏差値に関して取り扱いました。

必要な数学

標準化得点や偏差値の計算に用いる平均や標準偏差の式の定義にあたって、和を表す記号の$\displaystyle \sum$が用いられることが多いので、抑えておく必要があります。

標準化得点・偏差値の概要

標準化得点

$n$個の観測値を$x_1, x_2, x_3 \cdots , x_{n-1}, x_{n}$のように定義します。このとき、観測値の平均$\bar{x}$と標準偏差$S$を下記のように定めます。
$$
\large
\begin{align}
\bar{x} &= \frac{1}{n} (x_1 + x_2 + \cdots + x_n) \\
S &= \sqrt{ \frac{1}{n} \sum_{i=1}^{n} (x_i-\bar{x})^2 }
\end{align}
$$

上記を元に$i$番目の観測値$x_i$の標準化得点$z_i$を下記のように定義します。
$$
\large
\begin{align}
z_i = \frac{x_i-\bar{x}}{S}
\end{align}
$$

上記のように定義した標準化得点を用いることで得点から平均を引き、標準偏差で割ることで複数の試験の結果を統合して成績評価を行うことが可能になります。

観測値が概ね正規分布に従うときは、$-1.96 \leq z_i \leq 1.96$に$95$%の観測値が入るので、「標準偏差$\pm 2$よりも外にある観測値は特殊な観測値であることが多い」と大まかに解釈しておくと良いです。

偏差値

偏差値は標準化得点の値の基準を$0$から$50$や$100$にずらしたものです。平均を$50$とする場合は下記のような式で表されます。
$$
\large
\begin{align}
10 z_i + 50
\end{align}
$$

偏差値$60$は標準偏差$1$つ分平均を上回る、偏差値$70$は標準偏差$2$つ分平均を上回ると大まかに理解しておくと良いと思います。

Ch.25 「偏微分と微分」の演習問題の解答例 〜統計学のための数学入門30講(朝倉書店)〜

当記事は「統計学のための数学入門$30$講(朝倉書店)」の読解サポートにあたってChapter.$25$の「偏微分と微分」の章末問題の解答の作成を行いました。
基本的には書籍の購入者向けの解説なので、まだ入手されていない方は購入の上ご確認ください。また、解説はあくまでサイト運営者が独自に作成したものであり、書籍の公式ページではないことにご注意ください。

・書籍解答まとめ
https://www.hello-statisticians.com/answer_textbook_math#math_stat

本章のまとめ

演習問題解答

問題$25.1$

$$
\large
\begin{align}
f(x,y) = e^{-x}y^2 + xy^3
\end{align}
$$

上記に対し、$f_x, x_{xx}, f_{xy}, f_y, f_{yx}, f_{yy}$はそれぞれ下記のように計算できる。
$$
\large
\begin{align}
f_x &= -e^{-x}y^2 + y^3 \\
f_{xx} &= e^{-x}y^2 \\
f_{xy} &= -2e^{-x}y + 3y^2 \\
f_y &= 2e^{-x}y + 3xy^2 \\
f_{yx} &= -2e^{-x}y + 3y^2 \\
f_{yy} &= 2e^{-x} + 6xy
\end{align}
$$

問題$25.2$

問題$25.1$の結果より下記が成立する。
$$
\large
\begin{align}
f_x &= -e^{-x}y^2 + y^3 \\
f_y &= 2e^{-x}y + 3xy^2
\end{align}
$$

上記を元に$f_x(x,y)=-e^{-x}y^2 + y^3, f_y(x,y)=2e^{-x}y + 3xy^2$のように定めると、$f_x(1,2), f_y(1,2), f(1,2)$は下記のように得られる。
$$
\large
\begin{align}
f_x(1,2) &= -e^{-1} \cdot 2^2 + 2^3 = 8-4e^{-1} \\
f_y(1,2) &= 2e^{-1} \cdot 2 + 3 \cdot 1 \cdot 2^2 = 12+4e^{-1} \\
f(1,2) &= e^{-1} \cdot 2^2 + 1 \cdot 2^3 = 8+4e^{-1}
\end{align}
$$

よって点$(1,2,f(1,2))$における接平面の方程式は下記のように得られる。
$$
\large
\begin{align}
z – f(1,2) &= f_x(1,2)(x-1) + f_y(1,2)(y-2) \\
z – (8+4e^{-1}) &= (8-4e^{-1})(x-1) + (12+4e^{-1})(y-2)
\end{align}
$$