統計検定1級の2018年11月の「統計応用、全分野共通問題」の問5の解答例と解説について取り扱いました。他の問題の解答に関しては下記よりご確認ください。
https://www.hello-statisticians.com/stat_certifi_1_app
問題
詳しくは統計検定公式よりご確認ください。
解答
[1]
・期待値$\xi = E[X]$の導出
$X$の期待値$E[X]$は下記のように導出できる。
$$
\large
\begin{align}
E[X] &= \int_{-\infty}^{\infty} x f(x) dx \\
&= \int_{-\infty}^{\infty} x \cdot \frac{1}{2}(f_1(x)+f_2(x)) dx \\
&= \frac{1}{2} \int_{-\infty}^{\infty} x f_1(x) dx + \frac{1}{2} \int_{-\infty}^{\infty} x f_2(x) dx \\
&= \frac{1}{2} \mu_1 + \frac{1}{2} \mu_2 \\
&= \frac{\mu_1+\mu_2}{2}
\end{align}
$$
・分散$\tau^2 = V[X]$の導出
$$
\large
\begin{align}
(x-\xi)^2 &= \left( x-\frac{\mu_1+\mu_2}{2} \right)^2 \\
&= \left( (x-\mu_1) + \frac{\mu_1-\mu_2}{2} \right)^2 \\
&= (x-\mu_1)^2 + (x-\mu_1)(\mu_1-\mu_2) + \left( \frac{\mu_1-\mu_2}{2} \right)^2 \\
(x-\xi)^2 &= \left( x-\frac{\mu_1+\mu_2}{2} \right)^2 \\
&= \left( (x-\mu_2) + \frac{\mu_2-\mu_1}{2} \right)^2 \\
&= (x-\mu_2)^2 + (x-\mu_2)(\mu_2-\mu_1) + \left( \frac{\mu_1-\mu_2}{2} \right)^2
\end{align}
$$
上記が成立することを活用し、下記のように$\tau^2 = V[X]$を計算することができる。
$$
\large
\begin{align}
\tau^2 &= V[X] = \int_{-\infty}^{\infty} (x-\xi)^2 f(x) dx \\
&= \int_{-\infty}^{\infty} (x-\xi)^2 \cdot \frac{1}{2}(f_1(x)+f_2(x)) dx \\
&= \frac{1}{2} \int_{-\infty}^{\infty} (x-\xi)^2 f_1(x) dx + \frac{1}{2} \int_{-\infty}^{\infty} (x-\xi)^2 f_2(x) dx \quad (1)
\end{align}
$$
以下、$(1)$式の第1項と第2項をそれぞれ計算する。
・第1項
$$
\large
\begin{align}
\frac{1}{2} & \int_{-\infty}^{\infty} (x-\xi)^2 f_1(x) dx \\
&= \frac{1}{2} \int_{-\infty}^{\infty} \left( (x-\mu_1)^2 + (x-\mu_1)(\mu_1-\mu_2) + \left( \frac{\mu_1-\mu_2}{2} \right)^2 \right) f_1(x) dx \\
&= \frac{1}{2} \left( \int_{-\infty}^{\infty} (x-\mu_1)^2 f_1(x) dx + 0 + \left( \frac{\mu_1-\mu_2}{2} \right)^2 \int_{-\infty}^{\infty} f_1(x) dx \right) \\
&= \frac{1}{2} \left( \sigma^2 + \left( \frac{\mu_1-\mu_2}{2} \right)^2 \right) \quad (2)
\end{align}
$$
・第2項
$$
\large
\begin{align}
\frac{1}{2} & \int_{-\infty}^{\infty} (x-\xi)^2 f_2(x) dx \\
&= \frac{1}{2} \int_{-\infty}^{\infty} \left( (x-\mu_2)^2 + (x-\mu_2)(\mu_2-\mu_1) + \left( \frac{\mu_2-\mu_1}{2} \right)^2 \right) f_2(x) dx \\
&= \frac{1}{2} \left( \int_{-\infty}^{\infty} (x-\mu_2)^2 f_2(x) dx + 0 + \left( \frac{\mu_2-\mu_1}{2} \right)^2 \int_{-\infty}^{\infty} f_2(x) dx \right) \\
&= \frac{1}{2} \left( \sigma^2 + \left( \frac{\mu_2-\mu_1}{2} \right)^2 \right) \quad (3)
\end{align}
$$
$(2), (3)$式を$(1)$式に代入することで下記が得られる。
$$
\large
\begin{align}
\tau^2 &= V[X] = \frac{1}{2} \int_{-\infty}^{\infty} (x-\xi)^2 f_1(x) dx + \frac{1}{2} \int_{-\infty}^{\infty} (x-\xi)^2 f_2(x) dx \\
&= \frac{1}{2} \left( \sigma^2 + \left( \frac{\mu_1-\mu_2}{2} \right)^2 \right) + \frac{1}{2} \left( \sigma^2 + \left( \frac{\mu_2-\mu_1}{2} \right)^2 \right) \\
&= \sigma^2 + \left( \frac{\mu_1-\mu_2}{2} \right)^2
\end{align}
$$
・平均$\bar{x}$の計算
数学選択の学生の点数を$x_1,…,x_{50}$、数学非選択の学生の点数を$x_{51},…,x_{100}$のようにおく。このとき、それぞれの平均を$\bar{x}_1, \bar{x}_2$のように定義すると、全体の平均$\bar{x}$は下記のように計算できる。
$$
\large
\begin{align}
\bar{x} &= \frac{1}{100} \sum_{i=1}^{100} x_i \\
&= \frac{1}{100} \left( \sum_{i=1}^{50} x_i + \sum_{i=51}^{100} x_i \right) \\
&= \frac{1}{2} \left( \frac{1}{50} \sum_{i=1}^{50} x_i + \frac{1}{50} \sum_{i=51}^{100} x_i \right) \\
&= \frac{1}{2} (\bar{x}_1 + \bar{x}_2) \\
&= \frac{1}{2} (69.7 + 49.6) \\
&= 59.65
\end{align}
$$
・標準偏差$s$の計算
数学選択の学生の点数の標準偏差を$s_1^2$、非選択の学生の点数の標準偏差を$s_2^2$とおく。このとき、$s^2$に関して下記のように考えることができる。
$$
\large
\begin{align}
s^2 &= \frac{1}{100} \sum_{i=1}^{100} (x_i-\bar{x})^2 \\
&= \frac{1}{2} \times \frac{1}{50} \sum_{i=1}^{50} (x_i-\bar{x})^2 + \frac{1}{2} \times \sum_{i=51}^{100} (x_i-\bar{x})^2 \quad (4)
\end{align}
$$
以下、上記の第1項と第2項についてそれぞれ計算を行う。
・第1項
$$
\large
\begin{align}
\frac{1}{2} \times & \frac{1}{50} \sum_{i=1}^{50} (x_i-\bar{x})^2 = \frac{1}{2} \times \frac{1}{50} \sum_{i=1}^{50} ((x_i-\bar{x}_1)+(\bar{x}_1-\bar{x}))^2 \\
&= \frac{1}{2} \times \frac{1}{50} \sum_{i=1}^{50} ((x_i-\bar{x}_1)^2+(x_i-\bar{x}_1)(\bar{x}_1-\bar{x})+(\bar{x}_1-\bar{x})^2) \\
&= \frac{1}{2} (s_1^2 + (\bar{x}_1-\bar{x})^2) \quad (5)
\end{align}
$$
・第2項
$$
\large
\begin{align}
\frac{1}{2} \times & \frac{1}{50} \sum_{i=51}^{100} (x_i-\bar{x})^2 = \frac{1}{2} \times \frac{1}{50} \sum_{i=51}^{100} ((x_i-\bar{x}_2)+(\bar{x}_2-\bar{x}))^2 \\
&= \frac{1}{2} \times \frac{1}{50} \sum_{i=51}^{100} ((x_i-\bar{x}_2)^2+(x_i-\bar{x}_2)(\bar{x}_2-\bar{x})+(\bar{x}_2-\bar{x})^2) \\
&= \frac{1}{2} (s_2^2 + (\bar{x}_2-\bar{x})^2) \quad (6)
\end{align}
$$
$(4)$式に$(5), (6)$を代入することで、標準偏差の$s$は下記のように導出できる。
$$
\large
\begin{align}
s &= \sqrt{s^2} = \sqrt{\frac{1}{2} \times \frac{1}{50} \sum_{i=1}^{50} (x_i-\bar{x})^2 + \frac{1}{2} \times \frac{1}{50} \sum_{i=51}^{100} (x_i-\bar{x})^2} \\
&= \sqrt{\frac{1}{2}(s_1^2 + (\bar{x}_1-\bar{x})^2) + \frac{1}{2} (s_2^2 + (\bar{x}_2-\bar{x})^2)} \\
&= \sqrt{\frac{s_1^2+s_2^2}{2} + \frac{(\bar{x}_1-\bar{x})^2+(\bar{x}_2-\bar{x})^2}{2}} \\
&= \sqrt{\frac{6.8^2+7.8^2}{2} + \frac{(69.7-59.65)^2+(49.6-59.65)^2}{2}} \\
&= 12.431… \simeq 12.43
\end{align}
$$
[3]
・$1$次導関数$f'(x)$の導出
$1$次導関数$f'(x)$は下記のように導出することができる。
$$
\large
\begin{align}
f'(x) &= \frac{1}{2} \left( \frac{1}{\sqrt{2 \pi}\sigma} \exp \left[ -\frac{(x-\mu_1)^2}{2 \sigma^2} \right] \times -\frac{(x-\mu_1)}{\sigma^2} + \frac{1}{\sqrt{2 \pi}\sigma} \exp \left[ -\frac{(x-\mu_2)^2}{2 \sigma^2} \right] \times -\frac{(x-\mu_2)}{\sigma^2} \right) \\
&= \frac{1}{2} \cdot \frac{1}{\sqrt{2 \pi}\sigma} \left( – \frac{(x-\mu_1)}{\sigma^2} \exp \left[ -\frac{(x-\mu_1)^2}{2 \sigma^2} \right] – \frac{(x-\mu_2)}{\sigma^2} \exp \left[ -\frac{(x-\mu_2)^2}{2 \sigma^2} \right] \right)
\end{align}
$$
・$2$次導関数$f^{”}(x)$の導出
$2$次導関数$f^{”}(x)$は下記のように導出することができる。
$$
\large
\begin{align}
f^{”}(x) &= (f'(x))’ \\
&= \frac{1}{2} \cdot \frac{1}{\sqrt{2 \pi}\sigma} \left( – \frac{1}{\sigma^2} \exp \left[ -\frac{(x-\mu_1)^2}{2 \sigma^2} \right] + \left( \frac{(x-\mu_1)}{\sigma^2} \right)^2 \exp \left[ -\frac{(x-\mu_1)^2}{2 \sigma^2} \right] \right) \\
&+ \frac{1}{2} \cdot \frac{1}{\sqrt{2 \pi}\sigma} \left( – \frac{1}{\sigma^2} \exp \left[ -\frac{(x-\mu_2)^2}{2 \sigma^2} \right] + \left( \frac{(x-\mu_2)}{\sigma^2} \right)^2 \exp \left[ -\frac{(x-\mu_2)^2}{2 \sigma^2} \right] \right)
\end{align}
$$
・極値の議論
省略。
[4]
省略。
解説
[3]の極値に関しては$f'(\xi)=0$を示すだけでは必要条件にしかならないと思われるのですが、公式解答ではこの点の議論がないように思われました。[4]で$f^{”}(\xi)$を用いた議論が行われるので、ある程度厳密ではありますが、誘導の意図がわかりにくく試験問題の出題には不適だと思います。
「混合分布が単峰か多峰であるかの条件を答える」題材自体は良いと思うので、詳しく考察すると参考になると思います。
20点配分なら[1]が5点、[2]が5点、[3]が5点、[4]が5点ほどが妥当な印象でした。極値の厳密な議論はこの問題のように関数が複雑な際は難しいので、後半は部分点狙いでも良いように思われました。