ブログ

数学検定2級 解説 〜過去問題① 解答例・解説 1次:計算技能検定・2次:数理技能検定〜

数学検定$2$級は数ⅡBまで相当の数学の基本トピックに関して取り扱った検定であり、統計学に必要な数学を身につける際の目安になります。当記事では「日本数学検定協会 監修」の「数学検定問題集 $2$級」の数学検定$2$級の内容に基づき、過去問題①の解答例と解説の作成を行いました。

・数学検定$2$級まとめ
https://www.hello-statisticians.com/math_certificate_2

$1$次:計算技能検定

問題$1 \,$ 多項式の展開

下記のように式の展開を行うことができる。
$$
\large
\begin{align}
(x^2-1)(1+x^2+x^4+x^6) &= (\cancel{x^2}+\cancel{x^4}+\cancel{x^6}+x^8) – (1+\cancel{x^2}+\cancel{x^4}+\cancel{x^6}) \\
&= x^8 – 1
\end{align}
$$

・参考
$(A-B)(A^2+AB+B^2)=A^3-B^3$と同様な式であることは抑えておくと良い。

問題$2 \,$ 因数分解

下記のように因数分解を行うことができる。
$$
\large
\begin{align}
x^3 – \frac{3}{10}x^2y + \frac{3}{100}xy^2 – \frac{1}{1000}y^3 &= x^3 – 3x^2\left( \frac{y}{10} \right) + 3x\left( \frac{y}{10} \right)^2 – \left( \frac{y}{10} \right)^3 \\
&= \left( x – \frac{y}{10} \right)^3
\end{align}
$$

問題$3 \,$ 展開の公式と分数関数

$\displaystyle x-\frac{1}{x}=3$より、$\displaystyle \left( x-\frac{1}{x} \right)^2=9$が成立し、下記のように変形できる。
$$
\large
\begin{align}
\left( x-\frac{1}{x} \right)^2 &= 9 \\
x^2 + \frac{1}{x^2} – 2 x \cdot \frac{1}{x} &= 9 \\
x^2 + \frac{1}{x^2} &= 11
\end{align}
$$

問題$4 \,$ 三角比と三角形の面積

面積を$S$とおくと三角形の公式に基づいて下記のように計算できる。
$$
\large
\begin{align}
S &= \frac{1}{2} \times 8 \times 5 \sin{60^{\circ}} \\
&= \frac{1}{2} \times 8 \times 5 \times \frac{\sqrt{3}}{2} \\
&= 10 \sqrt{3}
\end{align}
$$

問題$5 \,$ 組み合わせ

$10$人から赤組$5$人を選ぶ組み合わせ${}_{10} C_{5}$を計算すれば良い。
$$
\large
\begin{align}
{}_{10} C_{5} &= \frac{10 \cdot 9 \cdot 8 \cdot 7 \cdot 6}{5!} \\
&= 252
\end{align}
$$

よって$252$通りの分け方が存在する。

問題$6 \,$

問題$7 \,$ 三角関数の倍角の公式と二次方程式

$[1]$
$\cos{2 \theta} = \sin{\theta}$は下記のように解くことができる。
$$
\large
\begin{align}
\cos{2 \theta} &= \sin{\theta} \\
\cos^{2}{\theta}-\sin^{2}{\theta} &= \sin{\theta} \\
(\cos^{2}{\theta}+\sin^{2}{\theta})-\sin^{2}{\theta}-\sin^{2}{\theta} &= \sin{\theta} \\
1 – 2 \sin^{2}{\theta} &= \sin{\theta} \\
2 \sin^{2}{\theta} + \sin{\theta} – 1 &= 0 \\
(2 \sin{\theta} – 1)(\sin{\theta} + 1) &= 0 \\
\sin{\theta} &= \frac{1}{2}, \, -1
\end{align}
$$

$[2]$
$\displaystyle \sin{\theta} = \frac{1}{2}, \, -1$と$0^{\circ} \leq \theta \leq 360^{\circ}$より$\theta = 30^{\circ}, 150^{\circ}, 270^{\circ}$が得られる。

問題$8 \,$ 円の方程式

中心が$(2,2)$の円の方程式は下記のように表すことができる。
$$
\large
\begin{align}
(x-2)^2 + (y-2)^2 = r^2
\end{align}
$$

ここで上記は$(0,0)$を通るので下記が成立する。
$$
\large
\begin{align}
(0-2)^2 + (0-2)^2 &= r^2 \\
r^2 &= 8
\end{align}
$$

よって、円の方程式は下記のように表せる。
$$
\large
\begin{align}
(x-2)^2 + (y-2)^2 = 8
\end{align}
$$

問題$9 \,$ 二次方程式の複素数解

$x^2-4x+5=0$の複素数解は二次方程式の解の公式を用いることで下記のように得られる。
$$
\large
\begin{align}
x^2 – 4x + 5 &= 0 \\
x &= 2 \pm \sqrt{2^2-5} \\
&= 2 \pm \sqrt{-1} = 2 \pm i
\end{align}
$$

問題$10 \,$ 等差数列の一般項

等差数列$\{ a_n \}$の一般項を$a_n = a_0 + nd$とおく。$a_{1000}=-256, a_{3000}=1024$より下記が成立する。
$$
\large
\begin{align}
a_{1000} &= a_{0} + 1000d = -256 \\
a_{3000} &= a_{0} + 3000d = 1024
\end{align}
$$

上記より$d=0.64, a_0=-896$が得られるので$a_{2000}$は下記のように計算できる。
$$
\large
\begin{align}
a_{2000} &= a_{0} + 2000d \\
&= -896 + 2000 \cdot 0.64 \\
&= 1280 – 896 = 384
\end{align}
$$

問題$11 \,$ 指数法則

下記のように計算できる。
$$
\large
\begin{align}
2^{\frac{1}{6}} \times 4^{\frac{1}{6}} \times 8^{\frac{1}{6}} &= 2^{\frac{1}{6}} \times 2^{\frac{2}{6}} \times 2^{\frac{3}{6}} \\
&= 2^{\frac{1+2+3}{6}} \\
&= 2^1 = 2
\end{align}
$$

問題$12 \,$ 判別式と二次方程式の解

$x^2 – 4kx – k + 5 = 0$の判別式$D$に関して$D<0$が成立すれば良い。
$$
\large
\begin{align}
\frac{D}{4} &= (2k)^{2} – (-k+5) < 0 \\
4k^2 + k – 5 & < 0 \\
(4k+5)(k-1) & < 0
\end{align}
$$

上記より$\displaystyle -\frac{5}{4} < k < 1$が得られる。

問題$13 \,$ 空間ベクトルの成分表示

$\overrightarrow{OA}, \overrightarrow{OB}$はそれぞれ下記のように表すことができる。
$$
\large
\begin{align}
\overrightarrow{OA} &= \left( \begin{array}{c} -1 \\ 4 \\ -2 \end{array} \right) \\
\overrightarrow{OB} &= \left( \begin{array}{c} -3 \\ -3 \\ 1 \end{array} \right)
\end{align}
$$

このとき$\overrightarrow{OB} – \overrightarrow{OA}$は下記のように計算できる。
$$
\large
\begin{align}
\overrightarrow{OB} – \overrightarrow{OA} &= \left( \begin{array}{c} -3 \\ -3 \\ 1 \end{array} \right) – \left( \begin{array}{c} -1 \\ 4 \\ -2 \end{array} \right) \\
&= \left( \begin{array}{c} -2 \\ -7 \\ 3 \end{array} \right)
\end{align}
$$

問題$14 \,$ 多項式関数の定積分

下記のように計算を行うことができる。
$$
\large
\begin{align}
\int_{1}^{2} (6x^2 – 6x + 6) dx &= \left[ 2x^3 – 3x^2 + 6x \right]_{1}^{2} \\
&= (16 – 12 + 12) – (2 – 3 + 6) \\
&= 11
\end{align}
$$

問題$15 \,$ 多項式関数の除算

$2x^3 – 4x + 3$は下記のように表すことができる。
$$
\large
\begin{align}
2x^3 – 4x + 3 = (x+2)(2x^2-4x+4) – 5
\end{align}
$$

上記より商は$2x^2-4x+4$、余りは$-5$である。

$2$次:数理技能検定

問題$1 \,$

問題$2 \,$ 組み合わせと確率

${}_{9} C_{k}$が最大になる$k$が正答率を最小にするので、$k=4, 5$が該当する。

問題$3 \,$ 二項係数とΣの公式

${}_{2} C_{2} + \cdots {}_{n} C_{2}$は下記のように計算できる。
$$
\large
\begin{align}
{}_{2} C_{2} + \cdots {}_{n} C_{2} &= \sum_{k=1}^{n-1} {}_{k+1} C_{2} \\
&= \sum_{k=1}^{n-1} \frac{k(k-1)}{2} \\
&= \frac{1}{2} \sum_{k=1}^{n-1} (k^2 – k) \\
&= \frac{1}{2} \left( \frac{1}{6}(n-1)(n-1+1)(2(n-1)+1) – \frac{1}{2}(n-1)(n-1+1) \right) \\
&= \frac{1}{2} \left( \frac{1}{6}n(n-1)(2n-1) – \frac{1}{2}n(n-1) \right) \\
&= \frac{1}{12} n(n-1)(2n-1-1) \\
&= \frac{1}{6}n(n-1)(n+1)
\end{align}
$$

問題$4 \,$ 三角関数の加法定理

$\sin{2011^{\circ}}$は加法定理などを用いることで下記のように計算できる。
$$
\large
\begin{align}
\sin{2011^{\circ}} &= \sin{(5 \times 360^{\circ} + 211^{\circ})} \\
&= \sin{211^{\circ}} \\
&= \sin{(210^{\circ}+1^{\circ})} \\
&= \sin{210^{\circ}} \cos{1^{\circ}} + \cos{210^{\circ}} \sin{1^{\circ}} \\
&= -\frac{1}{2} \cdot 0.9998 – \frac{\sqrt{3}}{2} \cdot 0.0175 \\
&= -0.515055
\end{align}
$$

・参考
加法定理の公式は下図などを元に抑えておくと良い。

問題$5 \,$ 整数と魔法陣

魔法陣の数字を下記のように$x_1$〜$x_9$を用いて表す。
$$
\large
\begin{align}
\begin{array}{cc} x_1 & x_2 & x_3 \\ x_4 & x_5 & x_6 \\ x_7 & x_8 & x_9 \end{array}
\end{align}
$$

$[1]$
$$
\large
\begin{align}
& x_1 + x_2 + x_3 = x_4 + x_5 + x_6 = x_7 + x_8 + x_9 \\
& x_1 + x_2 + x_3 + x_4 + x_5 + x_6 + x_7 + x_8 + x_9 = 45
\end{align}
$$

上記より、$x_1 + x_2 + x_3 = x_4 + x_5 + x_6 = x_7 + x_8 + x_9 = 15$が得られる。よって魔法陣が成立する場合、数の和は$15$である。

$[2]$
$[1]$より下記が成立する。
$$
\large
\begin{align}
x_1 + x_5 + x_9 = x_3 + x_5 + x_7 = x_2 + x_5 + x_8 = x_4 + x_5 + x_6 = 15
\end{align}
$$

よって下記が得られる。
$$
\large
\begin{align}
(x_1 + x_5 + x_9) + (x_3 + x_5 + x_7) + (x_2 + x_5 + x_8) + (x_4 + x_5 + x_6) &= 60 \\
\sum_{k=1}^{9} x_k + 3x_5 &= 60 \\
45 + 3x_5 &= 60 \\
3x_5 &= 15 \\
x_5 &= 5
\end{align}
$$

上記より$x_5=5$である。

問題$6 \,$ 三角形の相似と$2$次方程式の解の公式・判別式

$[1]$
$BD:AD=AD:CD$が成立するが、$BD, AD, CD$はそれぞれ下記のように表せる。
$$
\large
\begin{align}
BD &= b-x \\
AD &= a \\
CD &= x
\end{align}
$$

よって下記が成立する。
$$
\large
\begin{align}
BD:AD &= AD:CD \\
(b-x):a &= a:x \\
a^2 &= x(b-x) \\
a^2 &= bx – x^2 \\
x^2 – bx + a^2 &= 0
\end{align}
$$

上記より$2$次方程式$x^2 – bx + a^2 = 0$が得られる。

$[2]$
$[1]$で得られた$2$次方程式$x^2 – bx + a^2 = 0$が実数解を持つことから方程式の判別式$D$について$D \geq 0$が成立する。よって下記が成立する。
$$
\large
\begin{align}
D = b^2 – 4 a^2 & \geq 0 \\
b^2 & \geq 4a^2
\end{align}
$$

ここで$a>0, b>0$より$b \geq 2a$が成立する。

$[3]$
$2$次方程式$x^2 – bx + a^2 = 0$は公式より下記のように得られる。
$$
\large
\begin{align}
x = \frac{b \pm \sqrt{b^2-4a^2}}{2}
\end{align}
$$

ここで$BD \geq CD, BD+CD=BC=b$より、$BD$と$CD$はそれぞれ下記のように表すことができる。
$$
\large
\begin{align}
BD &= \frac{b + \sqrt{b^2-4a^2}}{2} \\
CD &= \frac{b – \sqrt{b^2-4a^2}}{2}
\end{align}
$$

問題$7 \,$ 対数関数に基づく関数の最小値・最大値

$[1]$
$1 \leq x \leq 8$のとき$\log_{2}{1} \leq t \leq \log_{2}{8}$であるので$t$の変域は$0 \leq t \leq 3$である。

$[2]$
$y = (\log_{2}{x})^{3} – 3(\log_{2}{x})^{2} + 1$は$t$を用いて下記のように表せる。
$$
\large
\begin{align}
(\log_{2}{x})^{3} – 3(\log_{2}{x})^{2} + 1 = t^3 – 3t^2 + 1
\end{align}
$$

ここで$f(t) = t^3 – 3t^2 + 1$とおくと、$f'(t) = 3t^2-6t = 3t(t-2)$より、$0 \leq t \leq 3$における増減表は下記のようにかける。
$$
\large
\begin{array}{|c|*5{c|}}\hline x & 0 & \cdots & 2 & \cdots & 3 \\
\hline f'(x) & & – & 0 & + & \\
\hline f(x) & 1 & \searrow & -3 & \nearrow & 1 \\
\hline
\end{array}
$$

上記より$\log_{2}{x}=0,3$すなわち$x=1,8$のとき最小値、$\log_{2}{x}=2$すなわち$x=4$のとき最大値をとる。

Ch.10 「統計的仮説検定の考え方」の章末問題の解答例 〜数理統計学(共立出版)〜

当記事は「数理統計学(共立出版)」の読解サポートにあたってChapter.$10$の「統計的仮説検定の考え方」の章末問題の解答の作成を行いました。
基本的には書籍の購入者向けの解説なので、まだ入手されていない方は購入の上ご確認ください。また、解説はあくまでサイト運営者が独自に作成したものであり、書籍の公式ページではないことにご注意ください。

・解答まとめ
https://www.hello-statisticians.com/answer_textbook_math_stat#green

章末の演習問題について

問題10.1の解答例

$X_1, \cdots , X_n \sim \mathcal{N}(\mu,\sigma^2)$に関して同時確率密度関数$f(x_1,\cdots,x_n; \mu,\sigma^2)$は下記のように表すことができる。
$$
\large
\begin{align}
f(x_1,\cdots,x_n; \mu,\sigma^2) &= \prod_{i=1}^{n} f(x_i; \mu,\sigma^2) \\
&= \prod_{i=1}^{n} \frac{1}{\sqrt{2 \pi \sigma^2}} \exp{\left[ -\frac{(x-\mu)^2}{2 \sigma^2} \right]} \\
&= \prod_{i=1}^{n} \exp{\left[ -\frac{(x-\mu)^2}{2 \sigma^2} – \frac{1}{2}\log{(2 \pi \sigma^2)} \right]} \\
&= \prod_{i=1}^{n} h(x_i) \exp{ \left[ \frac{x_i}{\sigma^2}\mu + g(\mu) \right] } \\
&= \exp{ \left[ \sum_{i=1}^{n} \left( \frac{x_i}{\sigma^2}\mu + g(\mu) \right) \right] } \prod_{i=1}^{n} h(x_i) \\
&= \exp{ \left[ \frac{\mu}{\sigma^2} \sum_{i=1}^{n} x_i + n g(\mu) \right] } \prod_{i=1}^{n} h(x_i) \\
&= \exp{ \left[ \bar{x} \frac{n \mu}{\sigma^2} + n g(\mu) \right] } \prod_{i=1}^{n} h(x_i)
\end{align}
$$

上記が「指数型分布族の確率密度関数の形式で表される」かつ$\bar{x}$に関して単調増加であるので、尤度関数の$L(\mu)=f(x_1,\cdots,x_n; \mu,\sigma^2)$は標本平均$\bar{x}$について単調尤度比を持つ。
$$
\large
\begin{align}
\left\{\bar{x} \middle| \bar{x} < a \, \mathrm{or} \, b < \bar{x} \right\}
\end{align}
$$

よって上記のように表される検定の「①有意水準が$\alpha$」で「②不偏」の場合を考えれば良い。正規分布に基づく検定が「②不偏」であるには棄却域が左右対称であるので、棄却域が左右対象で「①有意水準が$\alpha$」の場合は下記のように表される。
$$
\large
\begin{align}
\left\{\bar{x} \middle| \frac{\sqrt{n}(\bar{x} – \mu_0)}{\sigma} \leq z_{\alpha/2} \, \mathrm{or} \, z_{\alpha/2} \leq \frac{\sqrt{n}(\bar{x} – \mu_0)}{\sigma} \right\} = \left\{\bar{x} \middle| \frac{\sqrt{n}|\bar{x} – \mu_0|}{\sigma} \geq z_{\alpha/2} \right\}
\end{align}
$$

「不偏」の定義に関連する正規分布の検出関数は下記などで取り扱った。

まとめ

指数分布における両側検定の検出力関数とニュートン法を用いた棄却域の数値計算

数理統計学の検定論で出てくる検出力関数(power function)は一様最強力検定や一様最強力検定の理解にあたって重要な概念です。当記事では指数分布の両側検定の検出力関数を示し、$95$%両側検定における棄却域について多次元ニュートン法を用いて数値計算を行いました。
「数理統計学 統計的推論の基礎(共立出版)」の$10$章の「統計的仮説検定の考え方」の例$10.8$を主に参考に、作成を行いました。

・参考:正規分布の母平均の片側検定・両側検定における検出力関数の描画
https://www.hello-statisticians.com/explain-terms-cat/power_function1.html

指数分布の両側検定の検出力関数

指数分布の確率密度関数

$X \sim \mathrm{Ex}(\lambda)$のとき、確率密度関数を$f(x; \lambda)$とおくと$f(x; \lambda)$は下記のように表される。
$$
\large
\begin{align}
f(x; \lambda) = \lambda e^{-\lambda x}, \, \lambda > 0
\end{align}
$$

指数分布に関しては詳しくは下記などで取り扱った。

両側検定の検出力関数

統計的仮説検定に用いるパラメータ空間$\Theta$を定義するとき、$\theta \in \Theta$の棄却域$C$に関する検出力関数を確率密度関数$f(x; \theta)$を用いて下記のように定める。
$$
\large
\begin{align}
1-\beta(C,\theta) = \int_{C} f(x; \theta) dx
\end{align}
$$

仮説検定では$\Theta$を帰無仮説に対応する$\Theta_0$と対立仮説に対応する$\Theta_1$に分割するので、$\Theta = \Theta_0 \cup \Theta_1$かつ$\phi = \Theta_0 \cap \Theta_1$が成立することも抑えておくと良い。検出力関数に関しては下記で詳しく取りまとめた。

指数分布における両側検定

$X \sim \mathrm{Ex}(\lambda)$のとき、下記のような仮説検定を定義する。
$$
\large
\begin{align}
H_0: \, \lambda = 1 \\
H_1: \, \lambda \neq 1
\end{align}
$$

以下、上記に関して有意水準$\alpha=0.05$の不偏検定の構築を行う。具体的には下記のように定める棄却域$C$の$c_1, c_2$の計算を行う。
$$
\large
\begin{align}
C = (0,c_1) \cup (c_2,\infty)
\end{align}
$$

このとき、検出力関数$1-\beta(C,\lambda)$は下記のように表せる。
$$
\large
\begin{align}
1-\beta(C,\mu) &= \int_{C} f(x; \lambda) dx \\
&= \int_{0}^{c_1} \lambda e^{-\lambda x} dx + \int_{c_2}^{\infty} \lambda e^{-\lambda x} dx \\
&= \left[ -e^{-\lambda x} \right]_{0}^{c_1} + \left[ -e^{-\lambda x} \right]_{c_2}^{\infty} \\
&= -(e^{-c_1 \lambda} – 1) – (0 – e^{-c_2 \lambda}) \\
&= 1 – \exp{(-c_1 \lambda)} + \exp{(-c_2 \lambda)}
\end{align}
$$

ここで$\alpha=0.05$の不偏検定では$\alpha=1-\beta(C,1)=0.05$であるので下記が成立する。
$$
\large
\begin{align}
1-\beta(C,1) = 1 – \exp{(-c_1)} + \exp{(-c_2)} = 0.05 \quad (1)
\end{align}
$$

また、有意水準$\alpha=0.05$の不偏検定であれば検出力関数は$H_0: \, \lambda = 1$より$\lambda=1$で極小値を取るので下記が成立する。
$$
\large
\begin{align}
\frac{d(1-\beta(C,\lambda))}{d \lambda} &= c_1 \exp{(-c_1 \lambda)} – c_2 \exp{(-c_2 \lambda)} \\
\frac{d(1-\beta(C,\lambda))}{d \lambda} \Bigr|_{\lambda=1} &= c_1 \exp{(-c_1)} – c_2 \exp{(-c_2)} = 0 \quad (2)
\end{align}
$$

$(1), (2)$の連立方程式より棄却域に対応する$c_1, c_2$を得ることができる。この連立方程式を解析的に解くことは難しいので、次節では多次元ニュートン法を用いて計算を行う。

棄却域の数値計算

多次元ニュートン法

$$
\large
\begin{align}
\left(\begin{array}{c} x_1^{(n+1)} \\ x_2^{(n+1)} \end{array} \right) &= \left(\begin{array}{c} x_1^{(n)} \\ x_2^{(n)} \end{array} \right) – J(x_1^{(n)},x_2^{(n)})^{-1} \left(\begin{array}{c} f_1(x_1^{(n)},x_2^{(n)}) \\ f_2(x_1^{(n)},x_2^{(n)}) \end{array} \right) \\
J(x_1^{(n)},x_2^{(n)}) &= \left(\begin{array}{cc} \displaystyle \frac{\partial f_1}{\partial x_1} & \displaystyle \frac{\partial f_1}{\partial x_2} \\ \displaystyle \frac{\partial f_2}{\partial x_1} & \displaystyle \frac{\partial f_2}{\partial x_2} \end{array} \middle) \right|_{x_1=x_1^{(n)},x_2=x_2^{(n)}}
\end{align}
$$

二次元のニュートン法は上記のように表すことができる。多次元に拡張する際も同様に考えれば良い。導出は下記で取り扱った。

多次元ニュートン法による棄却域の計算

$$
\large
\begin{align}
\left(\begin{array}{c} f_1(c_1,c_2) \\ f_2(c_1,c_2) \end{array} \right) = \left(\begin{array}{c} 0.95 – \exp(-c_1) + \exp(-c_2) \\ c_1\exp(-c_1) – c_2\exp(-c_2) \end{array} \right) = \left(\begin{array}{c} 0 \\ 0 \end{array} \right)
\end{align}
$$

上記に対し、ヤコビ行列$J(x_1,x_2)$は下記のように計算できる。
$$
\large
\begin{align}
J(c_1,c_2) &= \left(\begin{array}{cc} \displaystyle \frac{\partial f_1}{\partial c_1} & \displaystyle \frac{\partial f_1}{\partial c_2} \\ \displaystyle \frac{\partial f_2}{\partial c_1} & \displaystyle \frac{\partial f_2}{\partial c_2} \end{array} \right) \\
&= \left(\begin{array}{cc} \exp{(-c_1)} & -\exp{(-x_2)} \\ (1-c_1)\exp{(-c_1)} & -(1-c_2)\exp{(-c_2)} \end{array} \right)
\end{align}
$$

上記の連立方程式の解は$(3)$式を元に下記のように計算を行うことができる。

import numpy as np

def calc_f1(c_1, c_2):
    return 0.95 - np.exp(-c_1) + np.exp(-c_2)

def calc_f2(c_1, c_2):
    return c_1*np.exp(-c_1) - c_2*np.exp(-c_2)

c = np.array([[0.7],[1.5]])

for i in range(10):
    J = np.array([[np.exp(-c[0,0]), -np.exp(-c[1,0])], [(1.-c[0,0])*np.exp(-c[0,0]), (c[1,0]-1.)*np.exp(-c[1,0])]])
    c = c - np.linalg.solve(J, np.array([[calc_f1(c[0,0],c[1,0])], [calc_f2(c[0,0],c[1,0])]]))

print(c)

・実行結果

print(calc_f1(0.04236333, 4.76516825))
print(calc_f2(0.04236333, 4.76516825))

上記の結果が適切であることは、下記を実行することで確認することができる。

print(calc_f1(0.04236333, 4.76516825))
print(calc_f2(0.04236333, 4.76516825))

・実行結果

-3.30993582195e-09
-3.0646387858e-09

数学検定2級 解説 〜公式問題集 解説&解答 Ch.1「指数関数・対数関数」〜

数学検定$2$級は数ⅡBまで相当の数学の基本トピックに関して取り扱った検定であり、統計学に必要な数学を身につける際の指標に役に立ちます。当記事では「日本数学検定協会 監修」の「数学検定問題集 $2$級」より、第$1$章の「指数関数・対数関数」の解説と演習問題の解答例などを取り扱いました。

・数学検定$2$級まとめ
https://www.hello-statisticians.com/math_certificate_2

本章のまとめ

指数関数

対数関数

演習

計算技能問題

問題.$1$

$[1]$
$$
\large
\begin{align}
\sqrt[3]{5} \div (\sqrt[4]{5})^2 \times \sqrt[3]{5^4} &= 5^{\frac{1}{3}} \times 5^{-\frac{1}{2}} \times 5^{\frac{4}{3}} \\
&= 5^{\frac{1}{3} -\frac{1}{2} + \frac{4}{3}} \\
&= 5^{\frac{7}{6}} = 5 \sqrt[6]{5}
\end{align}
$$

$[2]$
$$
\large
\begin{align}
(9^{\frac{2}{3}} \times 3^{-2})^{\frac{3}{2}} &= (3^{\frac{4}{3}} \times 3^{-2})^{\frac{3}{2}} \\
&= (3^{-\frac{2}{3}})^{\frac{3}{2}} \\
&= 3^{-1} = \frac{1}{3}
\end{align}
$$

$[3]$
$$
\large
\begin{align}
(4^{\frac{1}{4}} + 4^{-\frac{1}{4}})(4^{\frac{1}{4}} – 4^{-\frac{1}{4}}) &= (2^{\frac{1}{2}} + 2^{-\frac{1}{2}})(2^{\frac{1}{2}} – 2^{-\frac{1}{2}}) \\
&= 2^{1} – 2^{-1} = \frac{3}{2}
\end{align}
$$

$[4]$
$$
\large
\begin{align}
\log_{3}{8} \log_{4}{9} &= 3 \log_{3}{2} \times \frac{\log_{3}{9}}{\log_{3}{4}} \\
&= 3 \cancel{\log_{3}{2}} \times \frac{\cancel{2}}{\cancel{2} \cancel{\log_{3}{2}}} \\
&= 3
\end{align}
$$

$[5]$
$$
\large
\begin{align}
\log_{2}{48} – \log_{4}{36} &= \log_{2}{48} – \frac{\log_{2}{36}}{\log_{2}{4}} \\
&= \log_{2}{48} – \log_{2}{\sqrt{36}} \\
&= \log_{2}{48} – \log_{2}{6} \\
&= \log_{2}{\frac{48}{6}} \\
&= \log_{2}{8} = 3
\end{align}
$$

$[6]$
$$
\large
\begin{align}
(\log_{6}{4}+\log_{6}{9})^{2} &= (\log_{6}{36})^{2} \\
&= 2^2 = 4
\end{align}
$$

問題.$2$

$[1]$
$\sqrt{2}, \sqrt[3]{2}, \sqrt[5]{4}, \sqrt[9]{16}$はそれぞれ下記のように表すことができる。
$$
\large
\begin{align}
\sqrt{2} &= 2^{\frac{1}{2}} \\
\sqrt[3]{2} &= 2^{\frac{1}{3}} \\
\sqrt[5]{4} &= 2^{\frac{2}{5}} \\
\sqrt[9]{16} &= 2^{\frac{4}{9}}
\end{align}
$$

ここで$\displaystyle \frac{1}{3} < \frac{2}{5} < \frac{4}{9} < \frac{1}{2}$より、$\sqrt[3]{2} < \sqrt[5]{4} < \sqrt[9]{16} < \sqrt{2}$である。

$[2]$
$\displaystyle \log_{4}{7}, \frac{3}{2}$はそれぞれ下記のように表すことができる。
$$
\large
\begin{align}
\log_{4}{7} &= \frac{\log_{2}{7}}{\log_{2}{4}} \\
&= \frac{1}{2} \log_{2}{7} \\
&= \log_{2}{\sqrt{7}} \\
\frac{3}{2} &= \log_{2}{2^{\frac{3}{2}}} \\
&= \log_{2}{2 \sqrt{2}}
\end{align}
$$

ここで$\displaystyle \sqrt{7} < 2 \sqrt{2} < 3$より、$\displaystyle \log_{4}{7} < \frac{3}{2} < \log_{2}{3}$である。

問題.$3$

$[1]$
$4^{3x-1}=(\sqrt{2})^{x}$は下記のように変形できる。
$$
\large
\begin{align}
4^{3x-1} &= (\sqrt{2})^{x} \\
2^{2(3x-1)} &= 2^{\frac{x}{2}}
\end{align}
$$

上記より$x$は下記のように得られる。
$$
\large
\begin{align}
2(3x-1) &= \frac{x}{2} \\
\frac{11}{2} x &= 2 \\
x &= \frac{4}{11}
\end{align}
$$

$[2]$
$$
\large
\begin{align}
2^{2x} – 6 \cdot 2^{x+1} + 32 &= 0 \\
(2^{x} – 4)(2^{x} – 8) &= 0 \\
2^{x} &= 4, 8
\end{align}
$$

上記より$x=2,3$である。

$[3]$
$$
\large
\begin{align}
\left( \frac{1}{4} \right)^{x} & \geq \left( \frac{1}{8} \right) \\
\left( \frac{1}{2} \right)^{2x} & \geq \left( \frac{1}{2} \right)^{3}
\end{align}
$$

上記より$2x \leq 3$であるので、$\displaystyle x \leq \frac{3}{2}$が得られる。

$[4]$
$$
\large
\begin{align}
2^{2x} – 2^{x+3} & \geq 0 \\
2^{2x} & \geq 2^{x+3}
\end{align}
$$

上記より$2x \geq x+3$であるので$x \geq 3$が得られる。

問題.$4$

$[1]$
$$
\large
\begin{align}
\log_{3}{(2x-1)} &= 2 \\
\log_{3}{(2x-1)} &= \log_{3}{3^2}
\end{align}
$$

上記より$2x-1=3^2$であるので、下記が得られる。
$$
\large
\begin{align}
2x-1 &= 3^2 \\
2x &= 10 \\
x &= 5
\end{align}
$$

$[2]$
$$
\large
\begin{align}
(\log_{5}{x})^2 – 3 \log_{5}{x} + 2 &= 0 \\
(\log_{5}{x} – 1)(\log_{5}{x} – 2) &= 0 \\
\log_{5}{x} &= 1, 2
\end{align}
$$

上記より$x=5,25$が得られる。

$[3]$
$$
\large
\begin{align}
\log_{2}{x} + \log_{2}{(x-1)} & \leq 1 \\
\log_{2}{(x^2-x)} & \leq \log_{2}{2}
\end{align}
$$

上記より$x^2-x \leq 2$が必要条件であるので、下記が得られる。
$$
\large
\begin{align}
x^2-x & \leq 2 \\
(x+1)(x-2) & \leq 0 \\
-1 \leq & x \leq 2
\end{align}
$$

ここで対数関数の定義域に関して$x>0, x-1>0$より、$x>1$であるから、$1 < x \leq 2$が得られる。

問題.$5$

$[1]$
$\log_{10}{6^{20}}$は下記のように表すことができる。
$$
\large
\begin{align}
\log_{10}{6^{20}} &= 20 \log_{10}{6} \\
&= 20 (\log_{10}{2} + \log_{10}{3}) \\
&= 20 \times (0.301 + 0.4771) = 15.562
\end{align}
$$

上記より$10^{15} < 10^{\log_{10}{6^{20}}} < 10^{16}$であり、$6^{20} = 10^{\log_{10}{6^{20}}}$であるので$6^{20}$は16桁の数である。

$[2]$
$\displaystyle \log_{10}{\left( \frac{1}{2} \right)^{20}}$は下記のように表すことができる。
$$
\large
\begin{align}
\log_{10}{\left( \frac{1}{2} \right)^{20}} &= \log_{10}{2^{-20}} \\
&= -20 \log_{2}{10} \\
&= -20 \times 0.301 = -6.02
\end{align}
$$

上記より$\displaystyle 10^{-7} < 10^{\log_{10}{\left( \frac{1}{2} \right)^{20}}} < 10^{-6}$であり、$\displaystyle \left( \frac{1}{2} \right)^{20} = 10^{\log_{10}{\left( \frac{1}{2} \right)^{20}}}$であるので最初に$0$ではない数字が現れるのは少数第$7$位である。

問題.$6$

$t = 2^x + 2^{-x}$より$t^2$は下記のように計算できる。
$$
\large
\begin{align}
t^2 &= (2^x + 2^{-x})^2 \\
&= 2^{2x} + 2^{-2x} + 2 \cdot \cancel{2^x} \cdot \cancel{2^{-x}} \\
&= 2^{2x} + 2^{-2x} + 2
\end{align}
$$

このとき$y=2^{2x}+2^{x}+2^{-x}+2^{-2x}$は下記のように表すことができる。
$$
\large
\begin{align}
y &= 2^{2x} + 2^{x} + 2^{-x} + 2^{-2x} \\
&= (2^{2x} + 2^{x} + 2) + (2^{-x} + 2^{-2x}) – 2 \\
&= t^2 + t -2
\end{align}
$$

数理技能問題

問題.$1$

問題.$2$

$\displaystyle \frac{f(x)+f(y)}{2} – f \left( \frac{x+y}{2} \right)$は下記のように変形できる。
$$
\large
\begin{align}
\frac{f(x)+f(y)}{2} – f \left( \frac{x+y}{2} \right) &= \frac{3^{x}+3^{y}}{2} – 3^{\frac{x+y}{2}} \\
&= \frac{1}{2} (3^{x} + 3^{y} – 2 \cdot 3^{\frac{x}{2}} \cdot 3^{\frac{y}{2}}) \\
&= \frac{1}{2}(3^{\frac{x}{2}}-3^{\frac{y}{2}})^{2} \geq 0
\end{align}
$$

上記より下記の不等式が成立する。
$$
\large
\begin{align}
\frac{f(x)+f(y)}{2} \geq f \left( \frac{x+y}{2} \right)
\end{align}
$$

問題.$3$

$y=4^x-2^{x+1}-1$は下記のように変形できる。
$$
\large
\begin{align}
y &= 4^x – 2^{x+1} – 1 \\
&= (2^{x})^2 – 2 \cdot 2^{x} – 1 \\
&= (2^{x}-1)^2 -2
\end{align}
$$

$2^{x}$を変数と見るとき指数関数の定義より定義域は$2^x>0$である。よって$2^x=1, x=0$のとき$y$は最小値$-2$をとる。

問題.$4$

$x=\log_{a}{M}, y=\log_{a}{N}$とおくと対数の定義より下記が成立する。
$$
\large
\begin{align}
a^{x} &= M \\
a^{y} &= N
\end{align}
$$

ここで$MN$について下記が成立する。
$$
\large
\begin{align}
MN &= a^{x} a^{y} \\
&= a^{x+y}
\end{align}
$$

上記に対数の定義を適用すると下記が成立することが確認できる。
$$
\large
\begin{align}
\log_{a}{MN} &= x + y \\
&= \log_{a}{M} + \log_{a}{N}
\end{align}
$$

問題.$5$

$2^5 < 50 < 2^6$より$n=5$である。

問題.$6$

$\log_{10}{5^{n}}$は下記のように表せる。
$$
\large
\begin{align}
\log_{10}{5^{n}} &= n \log_{10}{5} \\
&= n \log_{10}{\frac{10}{2}} \\
&= n(\log_{10}{10} – \log_{10}{2}) \\
&= n(1 – 0.301) \\
&= 0.699 n
\end{align}
$$

ここで$5^{n}$が$15$桁の数字であるので、$14 \leq 0.699n < 15$が成立すれば良い。$\displaystyle \frac{14}{0.699} = 20.028 \cdots, \frac{15}{0.699} = 21.459 \cdots$であるので、$n=21$である。

問題.$7$

$47^{100}$が$168$桁の数であるから下記が成立する。
$$
\large
\begin{align}
167 \leq & \log_{10}{47^{100}} < 168 \\
167 \leq & 100 \log_{10}{47} < 168 \\
1.67 \leq & \log_{10}{47} < 1.68
\end{align}
$$

上記より$47^{17}$に関して下記が成立する。
$$
\large
\begin{align}
1.67 \leq & \log_{10}{47} < 1.68 \\
17 \times 1.67 \leq & 17 \log_{10}{47} < 17 \times 1.68 \\
28.39 \leq & \log_{10}{47^{17}} < 28.56
\end{align}
$$

上記より$47^{17}$は$29$桁の数である。

問題.$8$

$n$年後に$2$倍になるとおくと、下記が成立する。
$$
\large
\begin{align}
1.08^{n} & \geq 2 \\
n \log_{10}{\frac{108}{100}} & \geq \log_{10}{2} \\
n(\log_{10}{108} – \log_{10}{100}) & \geq \log_{10}{2} \\
n(\log_{10}{(2^2 \times 3^3)} – \log_{10}{10^2}) & \geq \log_{10}{2} \\
n & \geq \frac{\log_{10}{2}}{\log_{10}{2^2 \times 3^3} – \log_{10}{10^2})} \\
n & \geq 9.039 \cdots
\end{align}
$$

よって、元金が$2$倍になるのは$10$年後である。

データ可視化のためのプラットフォームの基礎: jupyterlab

データの可視化は、データを様々な角度から確認し、データ自体を理解する目的で行われることが多い印象です。探索的データ分析(EDA)と呼ばれることもあります。このような背景から、データ可視化にあたっては、あらかじめ仕様を設定してソースコードを書いていくソフトウェア開発と比較して、柔軟なプラットフォームが求められます。このようなプラットフォームとして、Jupyterlabがよく使われていると思います。

ここでは、jupyterlabの環境構築の一例とjupyterlabの使い方の基礎をまとめます。

jupyterlab

jupyterlabは、pythonの他、Rやjuliaなど各種のプログラミング言語のインタラクティブな実行環境です。ソースコードと実行結果、また、ドキュメント(Markdownをサポート)を一つのnotebookという単位でまとめることが特徴です。

データ分析では、仮説に基づいてデータを色々な角度から確認することが多いですが(探索的データ分析)、その際にjupyterlabのインタラクティブな実行環境が役に立ちます。また、notebook単位で実験結果をまとめるなどすることで、実験の管理や関係者への情報共有に有効です。

jupyterlabについての詳細は、公式ドキュメントを参照してください。

https://jupyterlab.readthedocs.io/en/stable/

jupyterlabの導入

様々な形態

jupyterlabの実行形式として有名なものに下記のものがあります。

提供形態概要環境構築難易度
Jupyterlab各自の環境に実行環境を構築する。もっともメジャーでカスタマイズの自由もあるが、python環境の構築と管理など多少難易度が高い。
公式ドキュメントで環境構築手順が紹介されている。
jupyterlab-desktopjupyterlabのデスクトップアプリ。公式のGithubリポジトリでインストールイメージが提供されており、基本的には通常のアプリと同じ手順(インストールイメージのダブルクリック)でインストールが可能。○(インストーラのダブルクリック)
Google colab正確にはjupyterlabではないが、Googleが提供するWebサービス。jupyterlabとインターフェースが共通で、同じnotebookが実行可能。
環境構築の手間がなく、notebookの共有なども容易なので、初学者はまずこちらを利用するのが良い。(Google colabの利用で基本的な使い方としては十分と思われる。)
https://colab.research.google.com/?hl=ja
◎(環境構築不要)

インストール: jupyterlab

ここではjupyterlabをローカルに導入する手順について簡単に紹介します。詳細はインストール手順は公式ドキュメントに記載されているのでそちらを参照してください。

前提

python実行環境が構築されていることを前提とします。

ここでは、pipを利用したインストール手順のみを紹介します。Anacondaなどを使った導入手順は公式ドキュメントに記載されているので、そちらを参照ください。(基本的にはあまり変わりません)

インストール

下記の通りpipコマンドでインストールできます。

> pip install jupyterlab

他にも、Dockerが使える場合には、jupyterlabが提供するjupyter/datascience-notebookを利用するとインストールの手間がなく導入できます。

起動

ローカルな環境で利用する場合には、下記のコマンドでサーバが起動します。

> jupyter lab

正常に立ち上がると、自動でWebブラウザが開き、Jupyterlabのスタート画面が表示されます。

Webブラウザが自動で立ち上がらない場合には、下記のようなURLで接続できます(接続先のアドレス、ポート番号を変更した場合は変更した値を指定)。

http://localhost:8888

利用の環境によっては、Jupyterlabの接続ポートを指定したい場合などがあると思います。その時には、起動オプションで --port パラメータを設定します。

> jupyter lab --port 58888

上記のように起動することで、接続先ポートは58888になります。

jupyterlab基本操作

画面構成

左サイドバーには、現在いるフォルダのファイル構成が表示されています。フォルダをダブルクリックするとさらに下の階層に遷移出来ます。

中央にはランチャー(Launcher)が表示されています。notebookの作成などはランチャーから行います。

notebookの作成

ランチャーが表示されている状態で、「Notebook」>「Python3」をクリックするとPythonのnotebookが作成されます(下記)。

notebookは「セル」という単位を基本にしており、このセルにコードやドキュメントを記入していきます。実行はセル単位で行うので、ひとまとまりの処理を一つのセルに書いていくのが良いと思います。

コード実行

コードの実行は、上部メニューの「▷」ボタンを押すか、Ctrlキーを押しながらEnterキーを押すことで、セルに記載のコードが実行されます。

実行結果として、print文など標準出力への出力はセルの下部に表示されます。また、matplotlibなどでのplotもセルの下部に表示されます。

notebookはコードだけでなく、ドキュメントも記述可能です。上図のように、セル単位でMarkdownタイプのセルにすることで、ドキュメントを記述することが出来ます。

出力(共有)

notebookは、ipynbというファイル形式(拡張子)です。実態はテキストファイルです。

このファイル自体を他者と共有することも可能ですが、レポートとして利用したい場合などでは、HTML形式に変換してダウンロードすることも可能です。

まとめ

参考

プログラミング これだけは知っとけ!: 0からのPython入門

小学校でのプログラミング教育も始まり、ますます「プログラミング」という技術が万人に求められる状況になっています。
しかしながら、「プログラミング」という技術に興味はあるが、苦手意識があるという方も少なくないと思います。

この苦手意識は、「プログラミング」というと何らかのプログラミング言語を駆使してアプリを作るなどソフトウェア開発に関する技術にばかり目がいくことが原因ではないかと考えています。
我々は、ソフトウェア開発はプログラミングのごく一部であると考えており、「プログラミング」的な考え方が重要であると考えています。

そこで本稿では、プログラミング的な考え方から始めて、最低限知っておくべき技術をまとめます。具体的な技術の解説にはPythonを利用しますが、ここで述べる考え方は他のどの言語でも共通する考え方です。

プログラミング的考え方

目標達成のための考え方

ここでいう「プログラミング的な考え方」とは、次の5つの考え方です。

プログラミング的考え方何をするのか得られるもの
目標設定まずは全体で何を達成したいのかを定義します。入力は何で、出力として何を得たいのかを決めましょう。入出力を明確にすることで、「やりたいこと」が明確になります
タスク分解設定した目標を達成するために、何が必要なのかを細かく分解します。大きな目標も小さなタスクの集まりとして考えることで、目標を達成するための筋道が見えてきますね
共通部分の抽出分解したタスクの中で、共通したタスクをまとめます。共通した部分はまとめて実行したりできますね
タスクフローの設計目標を達成するためにタスクの流れ、組み合わせを考えます。タスクの流れを組み替えるだけで効率化できたりします
シミュレーション上記のフローに矛盾がないか、頭の中で考えたり、実際に小さい問題を例に試したりします。これで計画が実現可能なのか、目標が達成できる見込みがあるのかが確認できます

この表を見て分かる通り、決して「ソフトウェア開発」だけに必要な考え方ではありません。多くの仕事で自然にこのような考え方をしていると思います。

プログラミング的な考え方を意識するということは、タスクの抽象化ということに繋がります。このような考え方は、あらゆる仕事、また、生活の中でも普遍的に役立つ考え方です。

手段としての「プログラミング」

プログラミングというのは、あくまで手段であり、目標を達成するために何をするのかが重要です。

「オブジェクト思考」などソフトウェア開発に関する技術や考え方は色々ありますが、これらは、効率的にとか、他人との共有をしやすくするなどの理由があって作られています。

自分だけが一時的に目標達成のために動かすだけなら、愚直に書いても良いわけです。いわゆる「スパゲッティコード」だとしても良いわけです。

あくまでもプログラミングは手段であるということを認識しましょう。

「意識の低いプログラミング」

上述の通り、プログラミングはあくまでも手段であるため、その目的が満たされれば、「可読性が高い」など、いわゆる「綺麗なソースコード」を書くことに囚われる必要はありません。

まず始めるにあたっては、意識を低く、とにかく動けば良いというつもりで書いていくことが重要です。
(まず書いてみないことには何も始まらないので)

なお、綺麗なソースコードや機能的な書き方、一目でわかる変数名などは他人とのシェアや数ヶ月先の自分自身がメンテナンスするためには重要な考え方です。なので、プログラミング自体に慣れていった後では、「書き方」というものにも拘っていくべきではあると思います。

プログラムを書いてみる

この後は実際にプログラムを書いてみます。

「プログラミング的考え方」を「意識低く」実現していきます。

実行環境の用意

世の中には、ソフトウェアを開発するための開発環境がたくさんあります。それらは、効率的な開発を進めたり、複数人での共有を容易にするなど色々な理由があって存在します。

しかし、上記のようにプログラミング的な考え方を実践するだけであれば、凝った環境は必要ありません。目標達成のためにもっともシンプルな環境を使えば良いのです。

ここでは、ブラウザとGoogleアカウントさえあれば即座にプログラミングができる環境として、Google Colabratoryを利用します。

Google Colabの基本的な使い方

https://colab.research.google.com/?hl=ja

最低限知っておくべきプログラミング技術

上記の通り、プログラミングとは手段であると捉えると、以下で解説する4つの項目でかなり多くのことが達成できます。これらはどのプログラミング言語でも共通の普遍的な要素なので、必ず抑えておくようにしましょう。

変数

値を代入するブロック。

このブロックをつなげて管理するものが「リスト」または「配列」と呼ばれる。

演算

変数に格納される「値」を処理する機能。もっとも単純な演算は四則演算。

演算をまとめて関数とする。

条件分岐

変数の値に依存して別の処理を実行させる機能。

ループ

一連の処理を繰り返す。

プログラミング実例

この後に何を知るべきか

ここまでは、本当に最低限知っておくべき技術を解説してきました。ここに挙げた技術だけで多くのタスクをこなすソフトウェアを開発することは可能です。ここでは、さらに知っておくと良い考え方を解説します。

ライブラリの利用

「プログラミング的な考え方」では目標をを分解して小さな処理に分割して整理することだと初めに書きました。

この「処理」は似たタスクに共通して適用できる場合が多くあります(できるだけ共通な一般的な処理に細分化できることが望ましい)。さまざまなタスクに利用できる処理は、世界中のどこか別の人にも必要な場合があります。

すると、誰かがその処理をする機能をまとめた「ライブラリ」を提供していることが少なくありません。自分が欲しい機能は誰か別の人も欲しがっていると考えることが重要です。プログラムを書く前に、その処理をするライブラリが公開されてないかを探しましょう。

実際のプログラム開発では、できるだけ独自のコードを書かずに、公開されているライブラリを利用していくことが望ましいです。なぜなら、公開されているコードは多くの人の目に晒され、堅牢で汎用的な書かれ方をしていることが多いからです。つまり、バグが減るということです。

参考

正規分布の母平均の片側検定・両側検定における検出力関数(power function)の描画

数理統計学の検定論で出てくる検出力関数(power function)は一様最強力検定や一様最強力検定の理解にあたって重要な概念です。当記事では不偏検定の導入の際に用いられる正規分布の母平均の両側検定を行う際の検出力関数の描画を取り扱いました。
「数理統計学 統計的推論の基礎(共立出版)」の$10$章の「統計的仮説検定の考え方」の内容を主に参考に、作成を行いました。

・参考:有意水準$\alpha$と検出力$1-\beta$の値に基づくサンプルサイズ設計
https://www.hello-statisticians.com/explain-terms-cat/sample_size1.html

前提の確認

正規分布の確率密度関数

当記事では分散$1$の正規分布$\mathcal{N}(\mu,1)$に関して考察を行う。$\mathcal{N}(\mu,1)$の確率密度関数を$\phi(x; \mu)$とおくと、$\phi(x; \mu)$は下記のように表すことができる。
$$
\large
\begin{align}
\phi(x; \mu) = \frac{1}{\sqrt{2 \pi}} \exp{ \left[ -\frac{(x-\mu)^2}{2} \right] } \quad (1)
\end{align}
$$

また、上記の累積分布関数を$\Phi(x; \mu)$とおくと下記のように表せる。
$$
\large
\begin{align}
\Phi(x; \mu) = \int_{-\infty}^{x} \phi(u; \mu) du
\end{align}
$$

有意水準・検出力の定義と解釈

正規分布の母平均$\mu$に関する仮説検定を行うにあたって帰無仮説$H_0: \, \mu=\mu_0$、対立仮説$H_1: \, \mu=\mu_1$を定義する。このとき$\mu_0 < \mu_1$であれば下記のような図で仮説検定を表すことができる。

青が$\mathcal{N}(\mu_0,1)$、緑が$\mathcal{N}(\mu_1,1)$に対応すると仮定する

ここで上記の検定統計量$T(x)$に関して$T(x) \geq 1.96$を棄却域(rejection region)の$C$と定義する。このとき有意水準を$\alpha(C)$、検出力を$1-\beta(C)$とおくと、図の青色の領域と$\alpha(C)$、図の緑色の領域と$\beta(C)$がそれぞれ対応する。

また、前項で確認を行なった正規分布の確率密度関数を表す$(1)$式を元に有意水準$\alpha(C)$と検出力を$1-\beta(C)$はそれぞれ下記のような数式で表すことができる。
$$
\large
\begin{align}
\alpha(C) &= \int_{C} \phi(x; \mu_0) dx \\
1-\beta(C) &= \int_{C} \phi(x; \mu_1) dx
\end{align}
$$

数式の理解にあたっては$\phi(x; \mu_0)$が図の青色の曲線に対応し、$\phi(x; \mu_1)$が図の緑色の曲線に対応することに着目しておくと良い。

検出力と検出力関数

サンプルサイズ設計のような統計学の活用の際は検出力が主に用いられるが、数理統計学における検定論では検出力関数を元に考察を行うので抑えておくと良い。

検出力は対立仮説のパラメータの集合である$\Theta_1$を元に表されることが多い一方で、検出力関数は帰無仮説のパラメータの集合の$\Theta_0$の範囲を含む$\theta \in \Theta_0 \cup \Theta_1$で表すことが多いので注意が必要である。

$\theta \in \Theta_0 \cup \Theta_1$で表すのは片側検定の場合は$\theta \in \Theta_1$に対して一様最強力検定があるが、両側検定では不偏検定を用いるにあたって$\theta \in \Theta_0$の区間も合わせて図示を行う必要があるからではないかと推察される。

上記に基づいて正規分布における検出力関数$1-\beta(C,\mu)$を下記のように定義する。
$$
\large
\begin{align}
1-\beta(C,\mu) = \int_{C} \phi(x; \mu) dx
\end{align}
$$

片側検定の検出力関数

$$
\large
\begin{align}
H_0 &: \, \mu = 0 \\
H_1 &: \, \mu > 0
\end{align}
$$

上記のように定義を行なった両側検定の帰無仮説$H_0$と対立仮説$H_1$に対し、下記のような棄却域$C_1, C_2, C_3$を仮定する。
$$
\large
\begin{align}
C_1 &= \left\{ \bar{x}: \bar{x} > \frac{1.645}{\sqrt{n}} \right\} \\
C_2 &= \left\{ \bar{x}: \bar{x} > \frac{1.96}{\sqrt{n}} \right\} \\
C_3 &= \left\{ \bar{x}: \bar{x} > \frac{2.576}{\sqrt{n}} \right\}
\end{align}
$$

このとき棄却域$C_1, C_2$に対してそれぞれの検出力関数は母平均$\mu$に関して下記のように計算できる。
$$
\large
\begin{align}
1-\beta(C_1,\mu) &= \int_{C_1} f(x; \mu) dx \\
&= P(Z > 1.645 – \sqrt{n} \mu) \\
1-\beta(C_2,\mu) &= \int_{C_2} f(x; \mu) dx \\
&= P(Z > 1.96 – \sqrt{n} \mu) \\
1-\beta(C_3,\mu) &= \int_{C_3} f(x; \mu) dx \\
&= P(Z > 2.576 – \sqrt{n} \mu)
\end{align}
$$

上記は$\mu$の関数であるので、次節で$\mu$の値に対応する検出力$1-\beta(C_1), 1-\beta(C_2), 1-\beta(C_3)$のグラフの描画を行う。

両側検定の検出力関数

$$
\large
\begin{align}
H_0 &: \, \mu = 0 \\
H_1 &: \, \mu \neq 0
\end{align}
$$

上記のように定義を行なった両側検定の帰無仮説$H_0$と対立仮説$H_1$に対し、下記のような棄却域$C_1, C_2, C_3$を仮定する。
$$
\large
\begin{align}
C_1 &= \left\{ \bar{x}: \bar{x} > \frac{1.645}{\sqrt{n}} \right\} \\
C_2 &= \left\{ \bar{x}: \bar{x} < -\frac{1.645}{\sqrt{n}} \right\} \\
C_3 &= \left\{ \bar{x}: |\bar{x}| > \frac{1.96}{\sqrt{n}} \right\}
\end{align}
$$

このとき棄却域$C_1, C_2, C_3$に対してそれぞれの検出力関数は母平均$\mu$に関して下記のように計算できる。
$$
\large
\begin{align}
1-\beta(C_1,\mu) &= \int_{C_1} f(x; \mu) dx \\
&= P(Z > 1.645 – \sqrt{n} \mu) \\
1-\beta(C_2,\mu) &= \int_{C_2} f(x; \mu) dx \\
&= P(Z < -1.645 – \sqrt{n} \mu) \\
1-\beta(C_3,\mu) &= \int_{C_3} f(x; \mu) dx \\
&= P(Z > 1.96 – \sqrt{n} \mu) + P(Z < -1.96 – \sqrt{n} \mu)
\end{align}
$$

上記は$\mu$の関数であるので、次節で$\mu$の値に対応する検出力$1-\beta(C_1), 1-\beta(C_2), 1-\beta(C_3)$のグラフの描画を行う。

検出力関数の描画

片側検定

$$
\large
\begin{align}
1-\beta(C_1,\mu) &= P(Z > 1.645 – \sqrt{n} \mu) \\
1-\beta(C_2,\mu) &= P(Z > 1.96 – \sqrt{n} \mu) \\
1-\beta(C_3,\mu) &= P(Z > 2.576 – \sqrt{n} \mu)
\end{align}
$$

ここで$n=1$の場合を考えると下記が得られる。
$$
\large
\begin{align}
1-\beta(C_1,\mu) &= P(Z > 1.645 – \mu) \\
1-\beta(C_2,\mu) &= P(Z > 1.96 – \mu) \\
1-\beta(C_3,\mu) &= P(Z > 2.576 – \mu)
\end{align}
$$

上記に基づいて下記を実行することでグラフの描画を行うことができる。

import numpy as np
import matplotlib.pyplot as plt
from scipy import stats

mu = np.arange(-5., 5.01, 0.01)

f_1 = 1. - stats.norm.cdf(1.645-mu)
f_2 = 1. - stats.norm.cdf(1.96-mu)
f_3 = 1. - stats.norm.cdf(2.576-mu)

plt.plot(mu, f_1, label="C_1")
plt.plot(mu, f_2, label="C_2")
plt.plot(mu, f_3, label="C_3")

plt.legend(loc="upper left")
plt.show()

・実行結果

ここで検出力関数は$C_1, C_2, C_3$の順に大きいが、$C_1, C_2, C_3$はそれぞれ$\alpha=0.05, 0.025, 0.005$に対応しており、それぞれの有意水準$\alpha$の値で一様最強力であることが確認できる。

また、片側検定では$\mu_0 < \mu_1$などを仮定することから、$\mu > \mu_0$と表すこともできる。一方で検出力関数の理解しやすさの観点から当記事では両側検定と同様な定義を用いた。

両側検定

$$
\large
\begin{align}
1-\beta(C_1,\mu) &= P(Z > 1.645 – \sqrt{n} \mu) \\
1-\beta(C_2,\mu) &= P(Z < -1.645 – \sqrt{n} \mu) \\
1-\beta(C_3,\mu) &= P(Z > 1.96 – \sqrt{n} \mu) + P(Z < -1.96 – \sqrt{n} \mu)
\end{align}
$$

ここで$n=1$の場合を考えると下記が得られる。
$$
\large
\begin{align}
1-\beta(C_1,\mu) &= P(Z > 1.645 – \mu) \\
1-\beta(C_2,\mu) &= P(Z < -1.645 – \mu) \\
1-\beta(C_3,\mu) &= P(Z > 1.96 – \mu) + P(Z < -1.96 – \mu)
\end{align}
$$

上記に基づいて下記を実行することでグラフの描画を行うことができる。

import numpy as np
import matplotlib.pyplot as plt
from scipy import stats

mu = np.arange(-5., 5.01, 0.01)

f_1 = 1.-stats.norm.cdf(1.645-mu)
f_2 = stats.norm.cdf(-1.645-mu)
f_3 = 1. - stats.norm.cdf(1.96-mu) + stats.norm.cdf(-1.96-mu)

plt.plot(mu, f_1, label="C_1")
plt.plot(mu, f_2, label="C_2")
plt.plot(mu, f_3, label="C_3")

plt.legend()
plt.show()

・実行結果

上図は「数理統計学 統計的推論の基礎(共立出版)」の図$10.4$と同様の図であることが確認できる。グラフより棄却域$C_3$は一様最強力検定ではないが、全区間で$\alpha=0.05$を上回る検出力を持つ不偏検定に限れば一様最強力である。このような検定を一様最強力不偏検定という。

多次元テイラー展開・多次元ニュートン法と連立方程式の近似解の計算

一様最強力不偏検定で両側検定の両側の棄却域を計算のような連立方程式はそのまま解くことができないので、多次元ニュートン法が適用されます。当記事では多次元テイラー展開を用いた多次元ニュートン法の導出や、多次元ニュートン法を用いた連立方程式の近似解の計算について取り扱いました。

・$1$次元のニュートン法
https://www.hello-statisticians.com/optimization/newton_taylor1.html

テイラー展開

$1$変数関数のテイラー展開

関数$f(x)$に関して点$x=a$を中心とするテイラー展開は下記のように表せる。
$$
\large
\begin{align}
f(x) &= \sum_{n=0}^{\infty} \frac{f^{(n)}(a)}{n!} (x-a)^{n} \\
&= \frac{f(a)}{0!}(x-a)^{0} + \frac{f'(a)}{1!} (x-a)^{1} + \frac{f^{”}(a)}{2!} (x-a)^{2} + \cdots \\
&= f(a) + f'(a)(x-a) + \frac{f^{”}(a)}{2} (x-a)^{2} + \cdots
\end{align}
$$

多変数関数のテイラー展開

以下具体的に表記を行うにあたって$2$変数関数$f_1(x_1,x_2)$と$f_2(x_1,x_2)$を元にテイラー展開の式を確認する。$(x_1,x_2)=(a_1,a_2)$を中心とするテイラー展開の式は下記のように表せる。
$$
\large
\begin{align}
\left(\begin{array}{c} f_1(x_1,x_2) \\ f_2(x_1,x_2) \end{array} \right) &= \left(\begin{array}{c} f_1(a_1,a_2) \\ f_2(a_1,a_2) \end{array} \right) + \left(\begin{array}{cc} \displaystyle \frac{\partial f_1}{\partial x_1} & \displaystyle \frac{\partial f_1}{\partial x_2} \\ \displaystyle \frac{\partial f_2}{\partial x_1} & \displaystyle \frac{\partial f_2}{\partial x_2} \end{array} \right) \left(\begin{array}{c} x_1-a_1 \\ x_2-a_2 \end{array} \right) + \cdots \quad (1) \\
&= \left(\begin{array}{c} f_1(a_1,a_2) \\ f_2(a_1,a_2) \end{array} \right) + \left(\begin{array}{c} \displaystyle \frac{\partial f_1}{\partial x_1}(x_1-a_1) + \frac{\partial f_1}{\partial x_2}(x_2-a_2) \\ \displaystyle \frac{\partial f_2}{\partial x_1}(x_1-a_1) + \frac{\partial f_2}{\partial x_2}(x_2-a_2) \end{array} \right) + \cdots
\end{align}
$$

ここで偏微分が含まれる行列を下記のように定義する。
$$
\large
\begin{align}
J(x_1,x_2) = \left(\begin{array}{cc} \displaystyle \frac{\partial f_1}{\partial x_1} & \displaystyle \frac{\partial f_1}{\partial x_2} \\ \displaystyle \frac{\partial f_2}{\partial x_1} & \displaystyle \frac{\partial f_2}{\partial x_2} \end{array} \right)
\end{align}
$$

上記の行列をヤコビ行列という。ここでは$2$変数関数を取り扱ったが、多変数関数でも同様な式で表される。

多次元ニュートン法の導出

$1$変数関数のテイラー近似とニュートン法の導出

$$
\large
\begin{align}
f(x_{n+1}) \simeq f(x_n) + f'(x_n)(x_{n+1}-x_{n}) = 0 \quad (2)
\end{align}
$$

$1$変数関数のニュートン法は上記の式を$x_{n+1}$ついて解くことで下記のように得られる。
$$
\large
\begin{align}
x_{n+1} = x_{n} – \frac{f(x_{n})}{f'(x_{n})}
\end{align}
$$

詳しい式変形は下記で取り扱ったので省略を行なった。

多次元ニュートン法の導出

前項の$(2)$式では$x_{n+1}-x_{n}$について式を解くことで$\displaystyle x_{n+1} = x_{n} – \frac{f(x_{n})}{f'(x_{n})}$を得ることができた。前節の$(1)$式についても同様な式変形を下記のように行うことができる。
$$
\begin{align}
\left(\begin{array}{c} f_1(x_1^{(n+1)},x_2^{(n+1)}) \\ f_2(x_1^{(n+1)},x_2^{(n+1)}) \end{array} \right) \simeq \left(\begin{array}{c} f_1(x_1^{(n)},x_2^{(n)}) \\ f_2(x_1^{(n)},x_2^{(n)}) \end{array} \right) + & \left(\begin{array}{cc} \displaystyle \frac{\partial f_1}{\partial x_1} & \displaystyle \frac{\partial f_1}{\partial x_2} \\ \displaystyle \frac{\partial f_2}{\partial x_1} & \displaystyle \frac{\partial f_2}{\partial x_2} \end{array} \middle) \right|_{x_1=x_1^{(n)},x_2=x_2^{(n)}} \left(\begin{array}{c} x_1^{(n+1)}-x_1^{(n)} \\ x_2^{(n+1)}-x_2^{(n)} \end{array} \right) = \left(\begin{array}{c} 0 \\ 0 \end{array} \right) \\
\left(\begin{array}{c} f_1(x_1^{(n)},x_2^{(n)}) \\ f_2(x_1^{(n)},x_2^{(n)}) \end{array} \right) + J(x_1^{(n)},x_2^{(n)}) \left(\begin{array}{c} x_1^{(n+1)}-x_1^{(n)} \\ x_2^{(n+1)}-x_2^{(n)} \end{array} \right) &= \left(\begin{array}{c} 0 \\ 0 \end{array} \right) \\
\left(\begin{array}{c} x_1^{(n+1)} \\ x_2^{(n+1)} \end{array} \right) &= \left(\begin{array}{c} x_1^{(n)} \\ x_2^{(n)} \end{array} \right) – J(x_1^{(n)},x_2^{(n)})^{-1} \left(\begin{array}{c} f_1(x_1^{(n)},x_2^{(n)}) \\ f_2(x_1^{(n)},x_2^{(n)}) \end{array} \right) \quad (3)
\end{align}
$$

上記は$2$変数の場合を表したが、$3$変数以上の場合も同様に導出することができる。

連立方程式の解

$$
\large
\begin{align}
\left(\begin{array}{c} f_1(x_1,x_2) \\ f_2(x_1,x_2) \end{array} \right) = \left(\begin{array}{c} 0.9 – \exp(-x_1) + \exp(-x_2) \\ x_1\exp(-x_1) – x_2\exp(-x_2) \end{array} \right) = \left(\begin{array}{c} 0 \\ 0 \end{array} \right)
\end{align}
$$

上記に対し、ヤコビ行列$J(x_1,x_2)$は下記のように計算できる。
$$
\large
\begin{align}
J(x_1,x_2) &= \left(\begin{array}{cc} \displaystyle \frac{\partial f_1}{\partial x_1} & \displaystyle \frac{\partial f_1}{\partial x_2} \\ \displaystyle \frac{\partial f_2}{\partial x_1} & \displaystyle \frac{\partial f_2}{\partial x_2} \end{array} \right) \\
&= \left(\begin{array}{cc} \exp{(-x_1)} & -\exp{(-x_2)} \\ (1-x_1)\exp{(-x_1)} & -(1-x_2)\exp{(-x_2)} \end{array} \right)
\end{align}
$$

上記の連立方程式の解は$(3)$式を元に下記のように計算を行うことができる。

import numpy as np

def calc_f1(x_1, x_2):
    return 0.9 - np.exp(-x_1) + np.exp(-x_2)

def calc_f2(x_1, x_2):
    return x_1*np.exp(-x_1) - x_2*np.exp(-x_2)

x = np.array([[0.7],[1.5]])

for i in range(10):
    J = np.array([[np.exp(-x[0,0]), -np.exp(-x[1,0])], [(1.-x[0,0])*np.exp(-x[0,0]), -(1.-x[1,0])*np.exp(-x[1,0])]])
    x = x - np.linalg.solve(J, np.array([[calc_f1(x[0,0],x[1,0])], [calc_f2(x[0,0],x[1,0])]]))

print(x)

・実行結果

array([[ 0.08381479],
       [ 3.93214595]])

上記の結果が適切であることは、下記を実行することで確認することができる。

print(calc_f1(0.08381479, 3.93214595))
print(calc_f2(0.08381479, 3.93214595))

実行結果がほぼ$0$であるので、連立方程式の近似解の$x_1 \simeq 0.083, x_2 \simeq 3.932$が得られたと解釈できる。

【ゲーム×幾何分布】確率分布・期待値に基づくポケモンの連続技に関する考察

確率分布や期待値の計算例に用いるにあたって、ポケモンの連続技は適した題材であると思われましたので、具体的な期待値の計算や考察などを取りまとめました。ポケモンの連続技は主に幾何分布の観点から考えると理解しやすいので、幾何分布を中心に取り扱いを行いました。

・ゲーム × 統計 まとめ
https://www.hello-statisticians.com/game_stat

前提の確認

問題設定:ポケモンの連続技の仕様

ポケモンの連続技の仕様は大きく分けて下記の$2$つがあります。

・①命中判定後に命中回数の判定がある場合
・②1回ごとに命中判定がある場合

「ダブルアタック」や「すいりゅうれんだ」のように攻撃回数が固定であるものもありますが、確率的な取り扱いがシンプルなのでここでは省略しました。①は「おうふくビンタ」や「タネマシンガン」、②は「トリプルキック」や「トリプルアクセル」がそれぞれ該当します。

①は$2$〜$5$回命中の場合は$2$回と$3$回が$\displaystyle \frac{1}{3}$、$4$回と$5$回が$\displaystyle \frac{1}{6}$のように設定されます。

統計的な取り扱いを考えるにあたっては、①は表で確率分布を表せばよく、②は幾何分布を考えれば良いです。各技と関連する期待値に関しては次節で取り扱いを行います。

幾何分布の概要

下記で詳しく取り扱いました。

連続技と関連する期待値

おうふくビンタ・タネマシンガン etc

「おうふくビンタ」や「タネマシンガン」の命中回数を確率変数$X$で表すと、下記のような確率分布を持ちます。

$X$$2$$3$$4$$5$
$p(x)$$\displaystyle \frac{1}{3}$$\displaystyle \frac{1}{3}$$\displaystyle \frac{1}{6}$$\displaystyle \frac{1}{6}$

このとき技の当たる回数の期待値$E[X]$は下記のように計算することができます。
$$
\large
\begin{align}
E[X] &= 2 \cdot \frac{1}{3} + 3 \cdot \frac{1}{3} + 4 \cdot \frac{1}{6} + 5 \cdot \frac{1}{6} \\
&= \frac{2 \cdot 2 + 3 \cdot 2 + 4 + 5}{6} \\
&= \frac{19}{6} = 3.16 \cdots
\end{align}
$$

上記より、「おうふくビンタ」や「タネマシンガン」が命中する期待値は$3.16 \cdots$であると考えることができます。

また、連続技は技の威力をポケモンの特性と合わせて計算する必要があります。具体的には「$1$回あたりの威力が$1.5$倍になるテクニシャン」と「必ず$5$回当たるスキルリンク」のそれぞれの期待値を計算する場合などがあります。

技の威力を定数$c$とおくとき、それぞれの威力の期待値をテクニシャン$E[Y_t]$、スキルリンク$E[Y_s]$とおくと、それぞれ期待値は下記のように計算できます。
$$
\large
\begin{align}
E[Y_t] &= c \times \frac{19}{6} \times \frac{3}{2} \\
&= \frac{19c}{4} \\
E[Y_s] &= 5c = \frac{20c}{4}
\end{align}
$$

上記より、$\displaystyle E[Y_s]-E[Y_t] = \frac{c}{4}$なので、技$1$回あたりが$20$のときに技の威力の期待値が$5$変わることが計算できます。

トリプルキック・トリプルアクセル

「トリプルキック」や「トリプルアクセル」は$1$回ごとに命中判定がある技であり、表す確率変数の取り得る値に上限がある場合の幾何分布であると考えることができます。$1$回あたりの外れる確率を$p$、当たる回数の確率変数を$X$とおくと、確率関数$p(x)$は下記のように表すことができます。
$$
\large
\begin{align}
p(x) &= p(1-p)^{x}, \quad x=0,1,2 \\
p(3) &= 1 – \sum_{x=0}^{2} p(x)
\end{align}
$$

上記に「トリプルキック」や「トリプルアクセル」の$p=0.1, 1-p=0.9$を代入することで下記のような確率分布の表を得ることができます。

$X$$0$$1$$2$$3$
$p(x)$$0.1$$0.09$$0.081$$0.729$

上記より、$3$回当たる確率が$72.9$%であることが確認できます。また、「トリプルキック」や「トリプルアクセル」の威力は$1$回目が$20$、$2$回目が$40$、$3$回目が$60$であるので、技の威力の期待値を$E[Y]$とおくと、$E[Y]$は下記のように計算できます。
$$
\large
\begin{align}
E[Y] &= 20 \times 0.09 + (20+40) \times 0.081 + (20+40+60) \times 0.729 \\
&= 94.14
\end{align}
$$

ねずみざん

「ねずみざん」は「トリプルキック」や「トリプルアクセル」と同様に$1$回あたりに命中判定のある技ですが、上限が$10$回なので、取り扱いがやや難しくなります。

import numpy as np

p = 0.1

prob = np.zeros(10+1)
prob[0] = p

for i in range(9):
    prob[i+1] = prob[i]*(1-p)
prob[-1] = 1.-np.sum(prob[:-1])

for i in range(11):
    print("Prob {} Hit: {:.3}".format(i,prob[i]))

・実行結果

Prob 0 Hit: 0.1
Prob 1 Hit: 0.09
Prob 2 Hit: 0.081
Prob 3 Hit: 0.0729
Prob 4 Hit: 0.0656
Prob 5 Hit: 0.059
Prob 6 Hit: 0.0531
Prob 7 Hit: 0.0478
Prob 8 Hit: 0.043
Prob 9 Hit: 0.0387
Prob 10 Hit: 0.349

上記の結果を表にまとめると下記のように表すことができます。

$X$$0$$1$$2$$3$$4$$5$$6$$7$$8$$9$$10$
$p(x)$$0.1$ $0.09$$0.081$$0.0729$$0.0656$$0.059$$0.0531$$0.0478$$0.043$$0.0387$$0.349$

また、$1$回あたりの威力が$20$であるので技威力の期待値は下記のように計算できます。

power = 20
num_attack = np.arange(0,11,1)
print(np.sum(power * num_attack * prob))

・実行結果

117.2...

単調尤度比(monotone likelihood ratio)と指数型分布族

ネイマン・ピアソンの補題で定義される尤度比(likelihood ratio)が標本や統計量の単調増加関数で得られるとき、単調尤度比といいます。当記事では確率密度関数が指数型分布族で表される際に、どのような場合に尤度比が単調尤度比になるかについて確認を行います。
「数理統計学(共立出版)」のCh.$10$「統計的仮説検定の考え方」の内容などに基づいて作成を行いました。

・「数理統計学 統計的推論の基礎」 解答まとめ
https://www.hello-statisticians.com/answer_textbook_math_stat#green

前提知識の確認

指数型分布族の確率密度関数

確率変数$X$に対応する指数型分布族の確率密度関数を$f_{X}(x|\theta)$とおくと、$f_{X}(x|\theta)$は下記のように表される。
$$
\large
\begin{align}
f_{X}(x|\theta) &= \exp{[h_1(x)g_1(\theta) + g_2(\theta) + h_2(x)]} \quad (1) \\
&= h_0(x)\exp{[h_1(x)g_1(\theta) + g_2(\theta)]} \quad (2)
\end{align}
$$

指数型分布族の確率密度関数は主に上記の$(1), (2)$のどちらかで表されることが多いが、単に$h_0(x)=\exp(h_2(x))$で置き換えられるのでそれほど難しくはない。ここでは$f_{X}(x|\theta_0)$と$f_{X}(x|\theta_1)$の比を考えるので、以下約分しやすい$(2)$の表記を用いる。

帰無仮説と対立仮説

統計的仮説検定では母数の$\theta$について帰無仮説$H_0: \, \theta \in \Theta_{0}$が成立するか、対立仮説$H_1: \, \theta \in \Theta_{1}$が成立するかを観測値に基づいて検定を行う。

以下、取り扱いをシンプルにするにあたって帰無仮説を$H_0: \, \theta = \theta_0$、対立仮説を$H_1: \, \theta = \theta_1, \, \theta_0 < \theta_1$で表すと仮定する。

帰無仮説$H_0$、対立仮説$H_1$、有意水準$\alpha$、検出力$1-\beta$の直感的な理解に関しては下記でも取り扱ったので合わせて確認しておくと良い。

尤度比の定義

尤度比$L(x)$は$f_{X}(x|\theta_0)$と$f_{X}(x|\theta_1)$の比を元に下記のように定義される。
$$
\large
\begin{align}
L(x) = \frac{f_{X}(x|\theta_1)}{f_{X}(x|\theta_0)}
\end{align}
$$

ここで任意の$\theta_0 < \theta_1$について尤度比$L(x)$が統計量$T(x)$に関する単調増加関数であるとき、$L(x)$を統計量$T$の単調尤度比(monotone likelihood ratio)であるという。

単調尤度比と指数型分布族

指数型分布族における単調尤度比

$$
\large
\begin{align}
f_{X}(x|\theta) = h_0(x)\exp{[h_1(x)g_1(\theta) + g_2(\theta)]} \quad (2)
\end{align}
$$

前節で取り扱った指数型分布族の確率密度関数の$(2)$式は上記のように表される。このとき、「$g_1(\theta)$が$\theta$の単調増加関数であれば、尤度比$L(x)$が単調尤度比である」ことを以下に示す。

・導出
$L(x)$は下記のように表すことができる。
$$
\large
\begin{align}
L(x) &= \frac{f_{X}(x|\theta_1)}{f_{X}(x|\theta_0)} \\
&= \frac{\cancel{h_0(x)}\exp{[h_1(x)g_1(\theta_1) + g_2(\theta_1)]}}{\cancel{h_0(x)}\exp{[h_1(x)g_1(\theta_0) + g_2(\theta_0)]}} \\
&= \frac{\exp{(g_2(\theta_1))}}{\exp{(g_2(\theta_0))}} \exp{[h_1(x)(g_1(\theta_1)-g_1(\theta_0))]}
\end{align}
$$

上記に対し$h_1(x)=T(x)$を適用すると、$g_1(\theta)$が$\theta$の単調増加関数であることから「$g_1(\theta_1)-g_1(\theta_0) \geq 0$」が成立するので、$L(x)$は$T(x)$の単調増加関数となる。よって、$L(x)$は$T(x)=h_1(x)$の単調尤度比である。

正規分布の母平均

$X \sim \mathcal{N}(\mu,1)$であるとき、正規分布の母平均の検定にあたって、帰無仮説$H_0: \, \mu=\mu_0$、対立仮説$H_1: \, \mu=\mu_1, \, \mu_0 < \mu_1$を仮定する。ここで正規分布$\mathcal{N}(\mu,1)$の尤度関数$L(\mu)$は下記のように表せる。
$$
\large
\begin{align}
L(\mu) &= \frac{1}{\sqrt{2 \pi}} \exp{ \left[ -\frac{(x-\mu)^2}{2} \right] } \\
&= \frac{1}{\sqrt{2 \pi}} \exp{ \left[ -\frac{1}{2}(x^2 – 2 x \mu + \mu^2) \right] } \\
&= h_0(x) \exp{ \left[ x \mu – \frac{\mu^2}{2} \right] }
\end{align}
$$

このとき$g_1(\mu)=\mu$は単調増加であるので、$L(\mu)$は$T(x)=h_1(x)=x$について単調尤度比である。