ブログ

「統計検定2級テキスト」 練習問題解答例 Ch.5 「線形モデル分析」

当記事は「統計検定$2$級対応 統計学基礎(東京図書)」の読解サポートにあたって第$5$章の「線形モデル分析」に関して演習問題を中心に解説を行います。線形回帰の結果の読み取りは実際に行うことが多いので、演習を通して抑えておくと良いのではないかと思います。

本章のまとめ

練習問題解説

問$5$.$1$

回帰式は「公転周期$=5.835$軌道長半径$-8.788$」のように表されることが読み取れる。公転周期に対する回帰係数の$t$値は十分大きいので、回帰係数の値は有意とみなせる。また、相関係数の$2$乗に対応する決定係数$R^2$は$0.9764$、自由度調整済み決定係数は$0.9724$と大きいので、公転周期の変動は軌道長半径の変動によって表されると考えて良い。$F$値に関しては変数が軌道長半径のみであるので回帰係数に関する検定の$P$値と等しく、有意であることが確認できる。

問$5$.$2$

・$[1]$

・$[2]$

問$5$.$3$

・$[1]$

・$[2]$

問$5$.$4$

参考

・統計検定$2$級 まとめ

「統計検定2級テキスト」 練習問題解答例 Ch.4 「統計的仮説検定」

当記事は「統計検定$2$級対応 統計学基礎(東京図書)」の読解サポートにあたって第4章の「統計的仮説検定」に関して演習問題を中心に解説を行います。統計的仮説検定は推測統計の重要なトピックである一方、手順が多いので演習を通して抑えておくと良いのではないかと思います。

本章のまとめ

練習問題解説

問$4$.$1$

問$4$.$2$

・$[1]$

・$[2]$

問$4$.$3$

・$[1]$
$$
\large
\begin{align}
Z = \frac{\overline{X}-E[\overline{X}]}{\sqrt{V[\overline{X}]}} = \frac{\overline{X}-E[X]}{\sqrt{V[X]/n}} \sim \mathcal{N}(0,1)
\end{align}
$$

標本平均の確率変数$\overline{X}$に関して上記が成立するので、統計量$z$は下記のように計算できる。
$$
\large
\begin{align}
z &= \frac{485-500}{\sqrt{10000/40}} \\
&= \frac{-15 \cdot 2\sqrt{10}}{100} \\
&= -\frac{3\sqrt{10}}{10} = -0.948…
\end{align}
$$

帰無仮説を$H_{0}: \, \mu=500$、対立仮説を$H_{1}: \, \mu<500$の$5$%片側検定を考えるとき、棄却点は上側確率$\alpha$に対し、$-z_{\alpha=0.05}=-1.64…$であるので、$z=-0.948…>-1.64…=-z_{\alpha=0.05}$より帰無仮説を棄却できない。よって英語力が低下したと判断できない。

・$[2]$
クラス単位で考える場合、「学部」や「学科」などによって平均が変わる可能性があるので注意が必要である。標本平均を考える場合は、標本が母集団から無作為に選ばれたかどうかについて確認する必要がある。

問$4$.$4$

・$[1]$

・$[2]$

・$[3]$

問$4$.$5$

・$[1]$

・$[2]$

・$[3]$

問$4$.$6$

・$[1]$

・$[2]$

・$[3]$

参考

・統計検定$2$級 まとめ

・推測統計フローチャート
https://www.hello-statisticians.com/explain-terms-cat/flow_chart_stat1.html

「統計検定2級テキスト」 練習問題解答例 Ch.1 「データの記述と要約」

当記事は「統計検定$2$級対応 統計学基礎(東京図書)」の読解サポートにあたって第$1$章の「データの記述と要約」に関して演習問題を中心に解説を行います。平均、分散、標準偏差、相関係数、回帰などを考える記述統計は統計学の実用にあたってよく用いられるので、演習を通して抑えておくと良いと思います。

本章のまとめ

練習問題解説

問$1$.$1$

問$1$.$2$

それぞれの計算を行うにあたってPythonを用いる。変数に関しては共通で用いるので、重複部分は省略を行った。

import numpy as np
import matplotlib.pyplot as plt

x1 = np.array([30., 30., 40., 40., 50., 50., 60., 60., 70., 70.])
x2 = np.array([45., 60., 50., 65., 70., 50., 55., 60., 70., 75.])

mean_x1 = np.mean(x1)
mean_x2 = np.mean(x2)

・$[1]$
下記を実行することで平均と標準偏差の計算を行うことができる。

sd1 = np.sqrt(np.mean(x1**2)-mean_x1**2)
sd2 = np.sqrt(np.mean(x2**2)-mean_x2**2)

print("Test1. mean: {:.1f}, sd: {:.2f}".format(mean_x1,sd1))
print("Test2. mean: {:.1f}, sd: {:.2f}".format(mean_x2,sd2))

実行結果

Test1. mean: 50.0, sd: 14.14
Test2. mean: 60.0, sd: 9.49

・$[2]$
$C$さんの標準化得点は下記のように計算できる。

z_c1 = (x1[2]-mean_x1)/sd1
z_c2 = (x2[2]-mean_x2)/sd2

print("z_c1: {:.2f}".format(z_c1))
print("z_c2: {:.2f}".format(z_c2))

実行結果

z_c1: -0.71
z_c2: -1.05

・$[3]$
下記を実行することで変動係数を計算できる。

print("CV1: {:.2f}".format(sd1/mean_x1))
print("CV2: {:.2f}".format(sd2/mean_x2))

実行結果

CV1: 0.28
CV2: 0.16

・$[4]$
下記を実行することで散布図の描画を行える。

plt.scatter(x1,x2)
plt.show()

実行結果

また、相関係数は下記を実行することで計算できる。

cov_x12 = np.mean(x1*x2)-mean_x1*mean_x2
r = cov_x12/(sd1*sd2)
print("r: {:.2f}".format(r)) 

実行結果

r: 0.60

・$[5]$
下記を計算することで$y_i=ax_i+b$の係数$a, b$を計算できる。

a = cov_x12/sd1**2
b = mean_x2 - a*mean_x1
print("a: {:.2f}, b: {:.2f}".format(a,b))

実行結果

a: 0.40, b: 40.00

・$[6]$
下記を実行することで計算できる。

print("R^2: {:2f}".format(r**2))

実行結果

R^2: 0.36

問$1$.$3$

・$[1]$
下記のような計算を行うことでそれぞれ計算できる。

import numpy as np

x = np.array([0.39, 0.72, 1., 1.52, 5.2, 9.54, 19.19, 30.07])
y = np.array([0.24, 0.62, 1., 1.88, 11.86, 29.46, 84.01, 164.79])

s_x_2 = np.mean((x-np.mean(x))**2)
s_y_2 = np.mean((y-np.mean(y))**2)
s_xy = np.mean((x-np.mean(x))*(y-np.mean(y)))

a = s_xy/s_x_2
b = np.mean(y) - a*np.mean(x)
r = s_xy / np.sqrt(s_x_2*s_y_2)

if b > 0:
    print("Estimated line: y={:.2f}x+{:.2f}".format(a,b))
else:
    print("Estimated: y={:.2f}x{:.2f}".format(a,b))
print("coef of determination: {:.2f}".format(r**2))

・実行結果

Estimated line: y=5.38x-8.79
coef of determination: 0.98

・$[2]$
下記のような計算を行うことでそれぞれ計算できる。

import numpy as np

x = np.array([0.39, 0.72, 1., 1.52, 5.2, 9.54, 19.19, 30.07])
x2 = x**2
y = np.array([0.24, 0.62, 1., 1.88, 11.86, 29.46, 84.01, 164.79])

s_x_2 = np.mean((x2-np.mean(x2))**2)
s_y_2 = np.mean((y-np.mean(y))**2)
s_xy = np.mean((x2-np.mean(x2))*(y-np.mean(y)))

a = s_xy/s_x_2
b = np.mean(y) - a*np.mean(x2)
r = s_xy / np.sqrt(s_x_2*s_y_2)

if b > 0:
    print("Estimated line: y={:.2f}x^2+{:.2f}".format(a,b))
else:
    print("Estimated: y={:.2f}x{:.2f}".format(a,b))
print("coef of determination: {:.2f}".format(r**2))

・実行結果

Estimated line: y=0.18x^2+4.80
coef of determination: 0.99

それぞれの結果は下記のように図示することができる。

import numpy as np
import matplotlib.pyplot as plt

x = np.array([0.39, 0.72, 1., 1.52, 5.2, 9.54, 19.19, 30.07])
x2 = x**2
y = np.array([0.24, 0.62, 1., 1.88, 11.86, 29.46, 84.01, 164.79])

s_x_2 = np.mean((x-np.mean(x))**2)
s_xy = np.mean((x-np.mean(x))*(y-np.mean(y)))
s_x_2_ = np.mean((x2-np.mean(x2))**2)
s_y_2 = np.mean((y-np.mean(y))**2)
s_xy_ = np.mean((x2-np.mean(x2))*(y-np.mean(y)))

a = s_xy/s_x_2
b = np.mean(y) - a*np.mean(x)
r = s_xy / np.sqrt(s_x_2*s_y_2)
a_ = s_xy_/s_x_2_
b_ = np.mean(y) - a_*np.mean(x2)
r_ = s_xy_ / np.sqrt(s_x_2_*s_y_2)

plt.scatter(x,y)
plt.plot(x,a*x+b,label="y=5.38x-8.79")
plt.plot(x,a_*x2+b_,label="y=0.18x^2+4.80")

plt.legend(loc="upper left")
plt.show()

・実行結果

参考

・統計検定$2$級 まとめ

テイラー展開から理解するニュートン法による「$f(x)=0$の解」と「$f(x)$の最小値」の計算

近似解の計算にあたってニュートン法は良く用いられますが、「$f(x)=0$の解」と「$f(x)$の最小値」に関して統一的に取り扱われるケースは少ないです。これらはテイラー展開を元に同様に取り扱えるので、当記事ではテイラー展開からそれぞれのニュートン法の漸化式の導出を行います。

「$f(x)=0$の解」に関しては「数学検定問題集 $1$級」、「$f(x)$の最小値」に関しては「ゼロから作るDeep Learning③」の内容を参考に、それぞれ作成を行いました。

テイラー展開

テイラー展開の概要

関数$f(x)$に関して点$x=a$を中心とするテイラー展開は下記のように表せる。
$$
\large
\begin{align}
f(x) &= \sum_{n=0}^{\infty} \frac{f^{(n)}(a)}{n!} (x-a)^{n} \\
&= \frac{f(a)}{0!}(x-a)^{0} + \frac{f'(a)}{1!} (x-a)^{1} + \frac{f^{”}(a)}{2!} (x-a)^{2} + \cdots \\
&= f(a) + f'(a)(x-a) + \frac{f^{”}(a)}{2} (x-a)^{2} + \cdots
\end{align}
$$

上記の$f^{(n)}(x)$は関数$f(x)$の$n$階微分を表す。

有限テイラー展開

有限テイラー展開やテイラーの定理に関しては下記で取り扱った。

ニュートン法の導出

$1$次のテイラー近似と「$f(x)=0$の解」

関数$f(x)$の点$x=a$を中心とする$1$次のテイラー展開は下記のように表せる。
$$
\large
\begin{align}
f(x) & \simeq \frac{f(a)}{0!}(x-a)^{0} + \frac{f'(a)}{1!} (x-a)^{1} \\
&= f(a) + f'(a)(x-a)
\end{align}
$$

上記の式に対して$x=x_{n+1}, a=x_{n}$を代入して$f(x_{n+1})=0$を解くと下記の式が得られる。
$$
\large
\begin{align}
f(x_{n}) + f'(x_{n})(x_{n+1}-x_{n}) &= 0 \\
x_{n+1}-x_{n} &= – \frac{f(x_{n})}{f'(x_{n})} \\
x_{n+1} &= x_{n} – \frac{f(x_{n})}{f'(x_{n})}
\end{align}
$$

$2$次のテイラー近似と「$f(x)$の最小値」

関数$f(x)$の点$x=a$を中心とする$2$次のテイラー展開は下記のように表せる。
$$
\large
\begin{align}
f(x) &\simeq \frac{f(a)}{0!}(x-a)^0 + \frac{f'(a)}{1!}(x-a)^1 + \frac{f^{”}(a)}{2!}(x-a)^2 \\
&= f(a) + f'(a)(x-a) + \frac{f^{”}(a)}{2}(x-a)^2 = g(x)
\end{align}
$$

上記で定めた近似関数の$g(x)$が最小値を持つ$x$の値を考えるにあたって、$g'(x)$の計算を行う。
$$
\large
\begin{align}
g'(x) &= \frac{d}{dx} \left( f(a) + f'(a)(x-a) + \frac{f^{”}(a)}{2}(x-a)^2 \right) \\
&= f'(a) + \frac{f^{”}(a)}{2} \cdot 2(x-a) \\
&= f'(a) + f^{”}(a)(x-a)
\end{align}
$$

ここで$x=a$の周辺で$f(x)$が下に凸であると仮定すると$f^{”}(a)>0$であり、$g(x)$は下に凸の関数なので、$g'(x)=0$の際に$g(x)$は最小値を持つ。
$$
\large
\begin{align}
g'(x) &= 0 \\
f'(a) + f^{”}(a)(x-a) &= 0 \\
\frac{f'(a)}{f^{”}(a)} + x – a &= 0 \\
x &= a – \frac{f'(a)}{f^{”}(a)}
\end{align}
$$

上記の式に対して$x=x_{n+1}, a=x_{n}$を代入すると下記の式が得られる。
$$
\large
\begin{align}
x_{n+1} = x_{n} – \frac{f'(x_{n})}{f^{”}(x_{n})}
\end{align}
$$

上記がニュートン法を用いて「$f(x)$の最小値」を計算する際の漸化式に一致する。同様の導出は下記でも取り扱った。
・ニュートン法と勾配法

「統計検定2級テキスト」 練習問題解答例 Ch.3 「統計的推定」

当記事は「統計検定$2$級対応 統計学基礎(東京図書)」の読解サポートにあたって第$3$章の「統計的推定」に関して演習問題を中心に解説を行います。母平均、母分散、母比率などの区間推定はよく出題されるので、演習を通して習得しておくと良いのではないかと思います。

本章のまとめ

練習問題解説

問$3$.$1$

・$[1]$
$\displaystyle Z_A = \frac{\overline{X}_{A}-\mu_1}{\sigma_1/\sqrt{n_A}} \sim \mathcal{N}(0,1), Z_B = \frac{\overline{X}_{B}-\mu_2}{\sigma_2/\sqrt{n_B}} \sim \mathcal{N}(0,1)$が成立すると考えられる。
よって$\mu_1$と$\mu_2$の$95$%区間は上側確率$\alpha$に関して$z_{\alpha=0.025}=1.96$であることを用いて下記のように計算できる。

$\mu_1$の区間推定
$$
\large
\begin{align}
-1.96 \leq & \frac{\overline{X}_{A}-\mu_1}{\sigma_1/\sqrt{n_A}} \leq 1.96 \\
\overline{X}_{A} – 1.96\frac{\sigma_1}{\sqrt{n_A}} \leq & \mu_1 \leq \overline{X}_{A} + 1.96\frac{\sigma_1}{\sqrt{n_A}} \\
58.38… \leq & \mu_1 \leq 66.01…
\end{align}
$$

$\mu_2$の区間推定
$$
\large
\begin{align}
-1.96 \leq & \frac{\overline{X}_{B}-\mu_2}{\sigma_2/\sqrt{n_B}} \leq 1.96 \\
\overline{X}_{B} – 1.96\frac{\sigma_2}{\sqrt{n_B}} \leq & \mu_1 \leq \overline{X}_{B} + 1.96\frac{\sigma_2}{\sqrt{n_B}} \\
67.82… \leq & \mu_2 \leq 74.97…
\end{align}
$$

・$[2]$
$\displaystyle t_A = \frac{\overline{X}_{A}-\mu_1}{\hat{\sigma}_1/\sqrt{n_A}} \sim t(n_{A}-1), t_B = \frac{\overline{X}_{B}-\mu_2}{\hat{\sigma}_2/\sqrt{n_B}} \sim t(n_{B}-1)$が成立すると考えられる。
よって$\mu_1$と$\mu_2$の$95$%区間は上側確率$\alpha$に関して$t_{\alpha=0.025}(n_{A}-1),t_{\alpha=0.025}(n_{B}-1)$を考えることで下記のように計算できる。

$\mu_1$の区間推定
$$
\large
\begin{align}
-t_{\alpha=0.025}(n_{A}-1) \leq & \frac{\overline{X}_{A}-\mu_1}{\hat{\sigma}_1/\sqrt{n_A}} \leq t_{\alpha=0.025}(n_{A}-1) \\
\overline{X}_{A} – t_{\alpha=0.025}(n_{A}-1)\frac{\hat{\sigma}_1}{\sqrt{n_A}} \leq & \mu_1 \leq \overline{X}_{A} + t_{\alpha=0.025}(n_{A}-1)\frac{\hat{\sigma}_1}{\sqrt{n_A}} \\
58.23… \leq & \mu_1 \leq 66.16…
\end{align}
$$

$\mu_2$の区間推定
$$
\large
\begin{align}
-1.96 \leq & \frac{\overline{X}_{B}-\mu_2}{\hat{\sigma}_2/\sqrt{n_B}} \leq 1.96 \\
\overline{X}_{B} – 1.96\frac{\hat{\sigma}_2}{\sqrt{n_B}} \leq & \mu_1 \leq \overline{X}_{B} + 1.96\frac{\hat{\sigma}_2}{\sqrt{n_B}} \\
67.69… \leq & \mu_2 \leq 75.10…
\end{align}
$$

問$3$.$2$

・$[1]$
母分散が未知であるが$n=2500$のように十分大きいので、$\displaystyle Z = \frac{\overline{X}-\mu}{\hat{\sigma}/\sqrt{n}} \sim \mathcal{N}(0,1)$であると考えて良い。
上側確率$\alpha$に関して$z_{\alpha=0.025}=1.96$が成立するので、下記のように$95$%区間を考えることができる。
$$
\large
\begin{align}
Z = \frac{\overline{X}-\mu}{\hat{\sigma}/\sqrt{n}} & \sim \mathcal{N}(0,1) \\
-z_{\alpha=0.025} \leq & \frac{\overline{x}-\mu}{\hat{\sigma}/\sqrt{n}} \leq z_{\alpha=0.025} \\
-1.96 \leq & \frac{\overline{x}-\mu}{\hat{\sigma}/\sqrt{n}} \leq 1.96 \\
-1.96 \frac{\hat{\sigma}}{\sqrt{n}} \leq & \overline{x}-\mu \leq 1.96 \frac{\hat{\sigma}}{\sqrt{n}} \\
-1.96 \frac{\hat{\sigma}}{\sqrt{n}} \leq & \mu-\overline{x} \leq 1.96 \frac{\hat{\sigma}}{\sqrt{n}} \\
\overline{x} – 1.96 \frac{\hat{\sigma}}{\sqrt{n}} \leq & \mu \leq \overline{x} + 1.96 \frac{\hat{\sigma}}{\sqrt{n}} \\
32.8 – 1.96 \times \frac{29.5}{\sqrt{2500}} \leq & \mu \leq 32.8 + 1.96 \times \frac{29.5}{\sqrt{2500}} \\
31.64… \leq & \mu \leq 33.95…
\end{align}
$$

・$[2]$
$n=25$より、$\displaystyle \frac{\overline{X}-\mu}{\hat{\sigma}/\sqrt{n}} \sim t(n-1)$であると考えられる。上側確率$\alpha$に関して$t_{\alpha=0.025}(25-1)=2.064$が成立するので、下記のように$95$%区間を考えることができる。
$$
\large
\begin{align}
Z = \frac{\overline{X}-\mu}{\hat{\sigma}/\sqrt{n}} & \sim t(25-1) \\
-2.064 \leq & \frac{\overline{x}-\mu}{\hat{\sigma}/\sqrt{n}} \leq 2.064 \\
\overline{x} – 1.96 \frac{\hat{\sigma}}{\sqrt{n}} \leq & \mu \leq \overline{x} + 1.96 \frac{\hat{\sigma}}{\sqrt{n}} \\
32.8 – 2.064 \times \frac{29.5}{\sqrt{25}} \leq & \mu \leq 32.8 + 2.064 \times \frac{29.5}{\sqrt{25}} \\
20.62… \leq & \mu \leq 44.97…
\end{align}
$$

上記のように推定した区間に幅があるなど、サンプルが少ない場合の推定した区間は意味のあるものにならない場合が多いことに注意する必要がある。

問$3$.$3$

・$[1]$

・$[2]$

・$[3]$

問$3$.$4$

・$[1]$

・$[2]$

問$3$.$5$

・$[1]$

・$[2]$

・$[3]$

・$[4]$

参考

・統計検定$2$級 まとめ

・推測統計フローチャート

「統計検定2級テキスト」 練習問題解答例 Ch.2 「確率と確率分布」

当記事は「統計検定$2$級対応 統計学基礎(東京図書)」の読解サポートにあたって第$2$章の「確率と確率分布」に関して演習問題を中心に解説を行います。統計学を学ぶにあたっては確率の基本トピックやベルヌーイ分布や正規分布などの確率分布などは重要なので演習を通して抑えておくと良いと思います。

本章のまとめ

練習問題解説

問$2$.$1$

・$[1]$
$P(A \cup B) = P(A) + P(B) – P(A \cap B)$より下記のように計算できる。
$$
\large
\begin{align}
P(A \cup B) &= P(A) + P(B) – P(A \cap B) \\
P(A \cap B) &= P(A) + P(B) – P(A \cup B) \\
&= 0.5 + 0.7 – 0.9 = 0.3
\end{align}
$$

・$[2]$
$\displaystyle P(B|A) = \frac{P(A \cap B)}{P(A)}$より下記のように計算できる。
$$
\large
\begin{align}
P(B|A) &= \frac{P(A \cap B)}{P(A)} \\
&= \frac{0.3}{0.5} = 0.6
\end{align}
$$

問$2$.$2$

問$2$.$3$

問$2$.$4$

問$2$.$5$

確率変数$X \sim \mathcal{N}(50,10^2), Z \sim \mathcal{N}(0,1)$を定める。この時、それぞれの確率は下記のように計算できる。

・$[1]$
$$
\large
\begin{align}
P(60 < X \leq 70) &= P \left( \frac{60-50}{10} < Z \leq \frac{70-50}{10} \right) \\
&= P(1 < Z \leq 2) \\
&= 0.1587 – 0.028 = 0.1307
\end{align}
$$

・$[2]$
$$
\large
\begin{align}
P(52 < X) &= P \left( \frac{52-50}{10} < Z \right) \\
&= P(0.2 < Z) \\
&= 0.4207
\end{align}
$$

・$[3]$
$$
\large
\begin{align}
P(52 < \overline{X}) &= 0.05 \\
P \left( \frac{\sqrt{n}(52-50)}{10} < Z \right) &= 0.05 \\
0.2 \sqrt{n} &= 1.645 \\
n &= 5^2 \times 1.645^2 \\
& \simeq 68
\end{align}
$$

問$2$.$6$

重量の合計を$\displaystyle S_{10} = \sum_{i=1}^{10} X_i$とおくと、$S_{10} \sim \mathcal{N}(556,10 \cdot 7.2^2)$であるので、$600 < S_{10}$である確率は下記のように計算できる。
$$
\large
\begin{align}
P(600 < S_{10}) &= P \left( \frac{(600-556)}{7.2 \sqrt{10}} < Z \right) \\
& \simeq P(1.93 < Z) \\
& \simeq 0.0268
\end{align}
$$

参考

・統計検定$2$級 まとめ

・離散型確率分布
・連続型確率分布

Ch.1 「データの整理」の章末問題の解答例 〜数理統計学(共立出版)〜

当記事は「数理統計学(共立出版)」の読解サポートにあたってChapter.$1$の「データの整理」の章末問題の解答の作成を行いました。
基本的には書籍の購入者向けの解説なので、まだ入手されていない方は購入の上ご確認ください。また、解説はあくまでサイト運営者が独自に作成したものであり、書籍の公式ページではないことにご注意ください。

・解答まとめ
https://www.hello-statisticians.com/answer_textbook_math_stat#green

章末の演習問題について

問題1.1の解答例

第$1$標本四分位数 $\, \leq \,$ 標本平均 $\, \leq \,$ 第$3$標本四分位数 $\quad (1)$

・$[1]$
$n=3$のときは第$1$標本四分位数が$x_1$、第$3$標本四分位数が$x_3$である。標本平均は$x_1$以上かつ$x_3$以下であるので、$(1)$式が成立する。

$n=4$のときは第$1$標本四分位数が$\displaystyle \frac{x_1+x_2}{2}$、第$3$標本四分位数が$\displaystyle \frac{x_3+x_4}{2}$である。よって「標本平均ー第$1$標本四分位数」は下記のように表せる。
$$
\large
\begin{align}
\frac{x_1+x_2+x_3+x_4}{4} – \frac{x_1+x_2}{2} = \frac{1}{4}(-x_1-x_2+x_3+x_4) \geq 0
\end{align}
$$

同様に「第$3$標本四分位数ー標本平均」は下記のように表せる。
$$
\large
\begin{align}
\frac{x_3+x_4}{2} – \frac{x_1+x_2+x_3+x_4}{4} = \frac{1}{4}(-x_1-x_2+x_3+x_4) \geq 0
\end{align}
$$

したがって$n=4$のとき$(1)$式が成立する。

$n=5$のときは第$1$標本四分位数が$\displaystyle \frac{x_1+x_2}{2}$、第$3$標本四分位数が$\displaystyle \frac{x_4+x_5}{2}$である。よって「標本平均ー第$1$標本四分位数」は下記のように表せる。
$$
\large
\begin{align}
\frac{x_1+x_2+x_3+x_4+x_5}{5} – \frac{x_1+x_2}{2} = \frac{1}{10}(-3x_1-3x_2+2x_3+2x_4+2x_5) \geq 0
\end{align}
$$

同様に「第$3$標本四分位数ー標本平均」は下記のように表せる。
$$
\large
\begin{align}
\frac{x_4+x_5}{2} – \frac{x_1+x_2+x_3+x_4+x_5}{5} = \frac{1}{10}(-2x_1-2x_2-2x_3+3x_4+3x_5) \geq 0
\end{align}
$$

したがって$n=5$のとき$(1)$式が成立する。

・$[2]$
$n=6$のとき、第$1$標本四分位数が$x_2$、第$3$標本四分位数が$x_5$である。よって、$1,1,1,1,1,100$のように$x_6$の値だけを大きく設定することで$(1)$式が成立しない標本の値の作成ができる。

問題1.2の解答例

問題1.3の解答例

指数・対数関数の公式やネイピア数$e$の定義に基づく微分|基本演習で理解する統計学【8】

指数関数・対数関数は統計学でよく用いられる関数であり、確率分布を考える際の正規分布などの指数型分布族や、最尤推定を行う際に対数尤度を計算するなどでも用いられます。当記事では指数関数・対数関数の式変形がスムーズに行えるように、基本的な定義や公式に関して演習の作成を行いました。

・統計学 基本演習$100$選
https://www.hello-statisticians.com/practice_100_basic

演習は主に下記の内容などに基づいて作成を行いましたので、以下を合わせて確認すると良いと思います。

基本問題

指数関数・対数関数の定義と公式

・問題

・解答

・解説

指数関数・対数関数のグラフ

・問題

・解答

・解説

ネイピア数$e$の定義と関連の式の導出

・問題
$$
\large
\begin{align}
\lim_{n \to \infty} \left( 1 + \frac{1}{n} \right)^{n} = e \quad (1)
\end{align}
$$

ネイピア数$e$は上記の$(1)$式で定義される数であり、数字で表すと$e=2.71…$である。指数関数・対数関数に関する微分などの演算は上記のように定めた$e$を用いるとシンプルに表すことができるので、$e$の定義の式は重要である。

一方で微分の公式の導出などの計算はなかなか複雑であるので、$e$の定義に関しては演習を繰り返すことで抑えておくと良い。よってこの問題では以下、$e$の定義や関連する式の導出に関して取り扱いを行う。ここまでの内容を元に下記の問題に答えよ。
i) $\displaystyle \left( 1 + \frac{1}{n} \right)^{n}$に$n=1,2,3$をそれぞれ代入し、値の計算を行え。
ⅱ) プログラムなどを用いることで$n=1$〜$n=100$までの$\displaystyle \left( 1 + \frac{1}{n} \right)^{n}$の値を計算し、グラフの描画を行え。
ⅲ) 下記の式が成立することを示せ。
$$
\begin{align}
\left( 1 – \frac{1}{t} \right)^{-t} = \left( 1 + \frac{1}{t-1} \right)^{t-1} \times \left( 1 + \frac{1}{t-1} \right)
\end{align}
$$
iv) 下記の式に対し、$t=-n$とおき、ⅲ)の変形を用いることで下記の式を示せ。
$$
\begin{align}
\lim_{n \to -\infty} \left( 1 + \frac{1}{n} \right)^{n} = e
\end{align}
$$
v) $\displaystyle n=\frac{1}{h}$を考えることで下記の式を示せ。
$$
\large
\begin{align}
\lim_{h \to 0} \left( 1 + h \right)^{\frac{1}{h}} = e
\end{align}
$$

・解答
i)
$\displaystyle \left( 1 + \frac{1}{1} \right)^{1}, \left( 1 + \frac{1}{2} \right)^{2}, \left( 1 + \frac{1}{3} \right)^{3}$はそれぞれ下記のように計算できる。
$$
\large
\begin{align}
\left( 1 + \frac{1}{1} \right)^{1} &= (1+1)^{1} =2 \\
\left( 1 + \frac{1}{2} \right)^{2} &= \left( \frac{3}{2} \right)^{2} \\
&= \frac{9}{4} = 2.25 \\
\left( 1 + \frac{1}{3} \right)^{3} &= \left( \frac{4}{3} \right)^{3} \\
&= \frac{64}{27} = 2.370370…
\end{align}
$$

ⅱ)
下記を実行することで$n=1$〜$n=100$までの$\displaystyle \left( 1 + \frac{1}{n} \right)^{n}$の値を計算し、グラフの描画を行うことができる。

import numpy as np
import matplotlib.pyplot as plt

n = np.arange(1.,101.,1.)
y_n = np.zeros([100])

for i in range(100):
    y_n[i] = (1.+1./n[i])**n[i]

plt.plot(n,y_n)
plt.show()

実行結果

ⅲ)
$\displaystyle \left( 1 – \frac{1}{t} \right)^{-t}$は下記のように式変形できる。
$$
\large
\begin{align}
\left( 1 – \frac{1}{t} \right)^{-t} &= \left( \frac{t-1}{t} \right)^{-t} \\
&= \left( \frac{t}{t-1} \right)^{t} \\
&= \left( \frac{(t-1)+1}{t-1} \right)^{t} \\
&= \left( 1 + \frac{1}{t-1} \right)^{t} \\
&= \left( 1 + \frac{1}{t-1} \right)^{t-1} \times \left( 1 + \frac{1}{t-1} \right)
\end{align}
$$

iv)
$t=-n$とおくことで、下記のように示すことができる。
$$
\large
\begin{align}
\lim_{n \to -\infty} \left( 1 + \frac{1}{n} \right)^{n} &= \lim_{t \to \infty} \left( 1 + \frac{1}{-t} \right)^{-t} \\
&= \lim_{t \to \infty} \left( 1 – \frac{1}{t} \right)^{-t} \\
&= \lim_{t \to \infty, t-1 \to \infty} \left[ \left( 1 + \frac{1}{t-1} \right)^{t-1} \times \left( 1 + \frac{1}{t-1} \right) \right] \\
&= e \times 1 \\
&= e
\end{align}
$$

v)
$h>0$のとき、$\displaystyle n=\frac{1}{h}$とおくことで、下記のように示すことができる。
$$
\large
\begin{align}
\lim_{h \to +0} \left( 1 + h \right)^{\frac{1}{h}} &= \lim_{n \to \infty} \left( 1 + \frac{1}{n} \right)^{n} \\
&= e
\end{align}
$$

$h<0$のときも同様に$\displaystyle n=\frac{1}{h}$とおくことで、下記のように示すことができる。
$$
\large
\begin{align}
\lim_{h \to -0} \left( 1 + h \right)^{\frac{1}{h}} &= \lim_{n \to -\infty} \left( 1 + \frac{1}{n} \right)^{n} \\
&= e
\end{align}
$$

・解説
v)の導出にあたっては$h \to +0$が$n \to \infty$に対応し、$h \to -0$が$n \to -\infty$に対応することは注意しておくと良いです。$n \to -\infty$の場合の式に関してはⅲ)、iv)で取り扱いましたが、式変形が少々複雑なので流れを抑えておくと良いと思います。
この問題で取り扱った$e$の定義は二項分布の確率関数の極限からポアソン分布の確率関数を導出する際に出てくるなど、統計学でもよく出てくるので重要なトピックであるので、繰り返して習得しておくと良いと思います。

発展問題

指数関数の微分の公式の導出

$$
\large
\begin{align}
f'(x) = \lim_{h \to 0} \frac{f(x+h)-f(x)}{h} \quad (1)
\end{align}
$$

関数$f(x)$の導関数$f'(x)$は$(1)$式のように定義される。指数関数$f(x)=e^{x}$を考える際に$f'(x)=e^{x}$のような公式があるが、公式は$(1)$式に基づいて導出されたものであるということは把握しておく必要がある。

この問題では以下、$(1)$式に基づいて指数関数$f(x)=e^{x}$の微分に関して$f'(x)=e^{x}$が成立することを示し、式変形を行うことで$a^{x}, \, a>0$の微分の公式について同時に示す。ここまでの内容を元に下記の問題に答えよ。
i) $f(x)=e^{x}$ に関して$(1)$式を適用し、$f'(x)$が下記のように表せることを確認せよ。
$$
\begin{align}
f'(x) = \lim_{h \to 0} e^{x} \cdot \frac{e^{h}-1}{h}
\end{align}
$$
ⅱ) $\displaystyle \lim_{h \to 0} \frac{e^{h}-1}{h}=1$を$k=e^{h}-1$とおくことで示せ。
ⅲ) $(e^{x})’=e^{x}$を示せ。
iv) $a^{x}=e^{\log_{e}{a} x}$が成立することを確認せよ。
v) iv)の結果と合成関数の微分の公式を用いて$(a^{x})’=a^{x}\log_{e}{a}$が成立することを示せ。

・解答
i)
$f(x)=e^{x}$ に関して$(1)$式を適用することで、$f'(x)$は下記のように表せる。
$$
\large
\begin{align}
f'(x) &= \lim_{h \to 0} \frac{e^{x+h}-e^{x}}{h} \\
&= \lim_{h \to 0} \frac{e^{x}e^{h}-e^{x}}{h} \\
&= \lim_{h \to 0} e^{x} \cdot \frac{e^{h}-1}{h}
\end{align}
$$

ⅱ)
$k=e^{h}-1$は$h$に関して下記のように解ける。
$$
\large
\begin{align}
k &= e^{h}-1 \\
e^{h} &= k+1 \\
h &= \log_{e}{(k+1)}
\end{align}
$$

また、$h \to 0$のとき$k \to 0$である。よって、$\displaystyle \lim_{h \to 0} \frac{e^{h}-1}{h}$は下記のように考えることができる。
$$
\large
\begin{align}
\lim_{h \to 0} \frac{e^{h}-1}{h} &= \lim_{k \to 0} \frac{k}{\log_{e}{(k+1)}} \\
&= \lim_{k \to 0} \frac{1}{\displaystyle \frac{1}{k} \log_{e}{(k+1)}} \\
&= \lim_{k \to 0} \frac{1}{\log_{e}{(1+k)^{\frac{1}{k}}}} \\
&= \frac{1}{\log_{e}{e}} \\
&= \frac{1}{1} = 1
\end{align}
$$

ⅲ)
i)、ⅱ)の結果を元に$(e^{x})’=e^{x}$は下記のように示すことができる。
$$
\large
\begin{align}
(e^{x})’ &= \lim_{h \to 0} \frac{e^{x+h}-e^{x}}{h} \\
&= \lim_{h \to 0} e^{x} \cdot \frac{e^{h}-1}{h} \\
&= e^{x} \cdot 1 = e^{x}
\end{align}
$$

iv)
対数の定義より、$e$の$\log_{e}{a}$乗は$a$である。よって$a=e^{\log_{e}{a}}$が成立するので、同時に$a^{x}=e^{\log_{e}{a} x}$も成立する。

v)
$(a^{x})’$は下記のように計算できる。
$$
\large
\begin{align}
(a^{x})’ &= (e^{\log_{e}{a} x}) \\
&= \log_{e}{a} e^{\log_{e}{a} x} \\
&= a^{x} \log_{e}{a}
\end{align}
$$

・解説
指数関数の微分を考えるにあたっては$(e^{x})’=e^{x}$に基づいて$(a^{x})’=a^{x} \log_{e}{a}$は導出できるので、$(e^{x})’=e^{x}$の導出の流れは一通り確認しておくと良いと思います。

対数関数の微分の公式の導出

・問題
$$
\large
\begin{align}
f'(x) = \lim_{h \to 0} \frac{f(x+h)-f(x)}{h} \quad (1)
\end{align}
$$

関数$f(x)$の導関数$f'(x)$は$(1)$式のように定義される。対数関数$f(x)=\log_{e}{x}$を考える際に$\displaystyle f'(x) = \frac{1}{x}$のような公式があるが、公式は$(1)$式に基づいて導出されたものであるということは把握しておく必要がある。

この問題では以下、$(1)$式に基づいて$\displaystyle (\log_{e}{x})’ = \frac{1}{x}$が成立することを示し、式変形を行うことで$\log_{a}{x}, \, a>0, a \neq 0$の微分の公式について同時に示す。ここまでの内容を元に下記の問題に答えよ。
i) $f(x)=\log_{e}{x}$ に関して$(1)$式を適用し、$f'(x)$が下記のように表せることを確認せよ。
$$
\begin{align}
f'(x) = \lim_{h \to 0} \log_{e}{\left( 1 + \frac{h}{x} \right)}^{\frac{1}{h}}
\end{align}
$$
ⅱ) $(2^3)^2, 2^6$をそれぞれ計算し、結果が一致することを確かめよ。
ⅲ) ⅱ)で確認したように$(a^{x})^{y}=a^{xy}$が成立することとネイピア数の定義に基づいて、$(1)$式を元に$\displaystyle (\log_{e}{x})’ = \frac{1}{x}$を導出せよ。
iv) 底の変換公式を用いて$\log_{a}{x}, \, a>0, a \neq 0$を$e$を底とする対数関数に変換せよ。
v) iv)の結果と合成関数の微分の公式を用いて$\displaystyle (\log_{a}{x})’=\frac{1}{x \log_{e}{a}}$が成立することを示せ。

・解答
i)
$f(x)=\log_{e}{x}$ に関して$(1)$式を適用することで、$f'(x)$は下記のように表せる。
$$
\large
\begin{align}
f'(x) &= \lim_{h \to 0} \frac{\log_{e}{(x+h)}-\log_{e}{x}}{h} \\
&= \lim_{h \to 0} \frac{1}{h} \log_{e}{\frac{x+h}{x}} \\
&= \lim_{h \to 0} \log_{e}{\left( 1 + \frac{h}{x} \right)}^{\frac{1}{h}}
\end{align}
$$

ⅱ)
$(2^3)^2=8^2=64, 2^6=64$より、$(2^3)^2=2^6$が成立することが確認できる。

ⅲ)
$\displaystyle (\log_{e}{x})’ = \frac{1}{x}$は下記のように示すことができる。
$$
\large
\begin{align}
(\log_{e}{x})’ &= \lim_{h \to 0} \frac{\log_{e}{(x+h)}-\log_{e}{x}}{h} \\
&= \lim_{h \to 0} \log_{e}{\left( 1 + \frac{h}{x} \right)}^{\frac{1}{h}} \\
&= \lim_{h \to 0} \log_{e}{\left[ \left( 1 + \frac{h}{x} \right)^{\frac{x}{h}} \right]^{\frac{1}{x}}} \\
&= \lim_{h \to 0} \frac{1}{x} \log_{e}{\left( 1 + \frac{h}{x} \right)^{\frac{x}{h}}} \\
&= \frac{1}{x} \log_{e}{e} = \frac{1}{x}
\end{align}
$$

iv)
底の変換公式を用いることで$\log_{a}{x}, \, a>0, a \neq 0$は下記のように変形できる。
$$
\large
\begin{align}
\log_{a}{x} &= \frac{\log_{e}{x}}{\log_{e}{a}}
\end{align}
$$

v)
$\displaystyle (\log_{a}{x})’$は下記のように計算できる。
$$
\large
\begin{align}
(\log_{a}{x})’ &= \left( \frac{\log_{e}{x}}{\log_{e}{a}} \right)’ \\
&= \frac{1}{x \log_{e}{a}}
\end{align}
$$

・解説
対数関数の微分を考えるにあたっては$\displaystyle (\log_{e}{x})’ = \frac{1}{x}$に基づいて$\displaystyle (\log_{a}{x})’=\frac{1}{x \log_{e}{a}}$は導出できるので、$(\log_{e}{x})’$の導出の流れは一通り確認しておくと良いと思います。

数学検定1級 解説 〜公式問題集 解説&解答 Ch.5「幾何・整数」〜

数学検定$1$級は数Ⅲまで相当の数学の基本トピックに関して取り扱った検定であり、統計学に必要な数学を身につける際の指標に役に立ちます。当記事では「日本数学検定協会 監修」の「数学検定問題集 $1$級」より、第$5$章の「幾何・整数」の解説と演習問題の解答例などを取り扱いました。

・数学検定まとめ
https://www.hello-statisticians.com/math_certificate

①幾何学

計算技能問題

問題.$1$

問題.$2$

問題.$3$

問題.$4$

数理技能問題

問題.$1$

問題.$2$

問題.$3$

②整数の性質

計算技能問題

問題.$1$

$$
\large
\begin{align}
x + 2y + 3z = 12
\end{align}
$$

$x,y,z$が正の整数であることより、係数の大きい$z,y,x$の順に考えれば良い。以下のように$z=1,2,3$に関してそれぞれ場合分けして考える。
i) $z=3, x+2y=3$
$(y,x)=(1,1)$

ⅱ) $z=2, x+2y=6$
$(y,x)=(2,2),(1,4)$

ⅲ) $z=1, x+2y=9$
$(y,x)=(4,1),(3,3),(2,5),(1,7)$

よって$(x,y,z)=(1,1,3), (1,4,1), (2,2,2), (3,3,1), (4,1,2), (5,2,1), (7,1,1)$のとき、式が成立する。

問題.$2$

問題.$3$

数理技能問題

問題.$1$

・$[1]$
分母を$1$〜$9$の総当たりで考えると、$\displaystyle \frac{5}{7} = 0.714…$であり、小数点以下が一番近い値をとる。よって$\displaystyle \frac{19}{7}$が最も近い値をとる。

・$[2]$
下記のプログラムを実行することによって計算できる。

import numpy as np

q = np.arange(1., 100., 1.)
min_error = 1.

for i in range(q.shape[0]):
    for j in range(i):
        delta = np.abs(q[j]/q[i]+2.-np.e)
        if delta < min_error:
            min_error = delta
            print(q[i],2*q[i]+q[j])

実行結果

(2.0, 5.0)
(3.0, 8.0)
(4.0, 11.0)
(7.0, 19.0)
(18.0, 49.0)
(25.0, 68.0)
(32.0, 87.0)
(39.0, 106.0)
(71.0, 193.0)

よって$\displaystyle \frac{193}{71}$が最も近い値をとる。

・注意事項
$[1]$の問題集付属の解答では$\displaystyle \frac{9}{7}$のようにあるが、$e=2.71…$の近似であることより$19$から$1$が抜けたと考えてよいと思われる。

問題.$2$

問題.$3$

三角関数の定義・加法定理・倍角の公式など|基本演習で理解する統計学【7】

三角関数は数多くの応用がある数学のトピックであり、統計学でも出てくることが多いですが、加法定理の派生の公式が多く、$1$つ$1$つ抑えるのもなかなか大変です。そこで当記事では単位円に基づく三角関数の定義や加法定理の図形的導出などを元に、三角関数に関して直感的に理解できる演習を作成しました。

・統計学 基本演習$100$選
https://www.hello-statisticians.com/practice_100_basic

基本問題

単位円と三角関数の定義

・問題
・解答
・解説

加法定理の図的理解

・問題
三角関数の加法定理の式の導出は色々とあるが、複雑な導出を毎度行うのは大変なので、図に基づいて導出する方法を知っておくと良い。この問題では以下、加法定理の図的理解に関して取り扱いを行う。

図.$1$ $\alpha+\beta$の描画

加法定理の理解にあたっては上記のように角度$\alpha, \beta$を考えるとき、$\sin{(\alpha+\beta)}$と$\cos{(\alpha+\beta)}$を図的に考えることができる。以下の問いにそれぞれ答えよ。
i) 図.$1$を元に$\sin{(\alpha+\beta)} = \sin{\alpha}\cos{\beta}+\cos{\alpha}\sin{\beta}$が成立することを確認せよ。
ⅱ) 図.$1$を元に$\cos{(\alpha+\beta)} = \cos{\alpha}\cos{\beta}-\sin{\alpha}\sin{\beta}$が成立することを確認せよ。

・解答
i)

上図を元に考えることで$\sin{(\alpha+\beta)} = \sin{\alpha}\cos{\beta}+\cos{\alpha}\sin{\beta}$が成立することが確認できる。

ⅱ)

上図を元に考えることで$\cos{(\alpha+\beta)} = \cos{\alpha}\cos{\beta}-\sin{\alpha}\sin{\beta}$が成立することが確認できる。

・解説
三角関数の加法定理は様々な導出法がありますが、式の形をなるべく速く導出できると良いのでこの問題で取り扱ったような図的な表現を抑えておくと良いと思います。この問題は下記を元に作成を行いましたので下記も合わせて参照ください。

倍角の公式の導出と応用

・問題
・解答
・解説

発展問題

和積・積和の公式

・問題
・解答
・解説

三角関数の極限とマクローリン展開

・問題
・解答
・解説