統計検定1級 統計応用 問題解説 ~2018年11月実施 社会科学 問2~

統計検定1級の2018年11月の「統計応用」の「社会科学 問2」の解答例と解説について取り扱いました。他の問題の解答に関しては下記よりご確認ください。
https://www.hello-statisticians.com/stat_certifi_1_app

問題

詳しくは統計検定公式よりご確認ください。

解答

[1]
経済データでは値の大きさに比例して標準偏差が大きくなることが多いので、散らばりの指標には標準偏差よりも標準偏差を平均値で割った変動係数が妥当な指標となる。また、層1〜3における変動係数はそれぞれ$0.10, 0.10, 0.16$であり、層3の散らばりが最も大きいと考えることができる。

[2]
正規分布に基づく母平均の$95$%区間は、標本平均を$\bar{x}$、標準正規分布の上側$2.5$%点を$z_{\alpha=0.025}$とした際に下記のように与えられる。
$$
\large
\begin{align}
\bar{x} \pm z_{\alpha=0.025} \frac{\sigma}{\sqrt{n}}
\end{align}
$$

よって、$\displaystyle d \geq z_{\alpha=0.025} \frac{\sigma}{\sqrt{n}}$が得られる。これを$n$に関して解くと、下記が導出できる。
$$
\large
\begin{align}
d & \geq z_{\alpha=0.025} \frac{\sigma}{\sqrt{n}} \\
\sqrt{n} & \geq z_{\alpha=0.025} \frac{\sigma}{d} \\
n & \geq z_{\alpha=0.025}^2 \frac{\sigma^2}{d^2}
\end{align}
$$
上記は与式が成立することを示唆する。

また、$z_{\alpha=0.025}=1.96, \sigma^2=\sigma_1^2=10^2, d=5$を用いて$n_1^{*}$に関して下記が導出できる。
$$
\large
\begin{align}
n_1^{*} & \geq z_{\alpha=0.025}^2 \frac{\sigma_1^2}{d^2} \\
&= 1.96^2 \frac{10^2}{5^2} \\
&= 15.36… \simeq 15.4
\end{align}
$$
ここで$n_1^{*}$は整数なので$n_1^{*}=16$となる。

[3]
$\mu$の推定量$\hat{\mu}$の分散$V[\hat{\mu}]$は下記のように求めることができる。
$$
\large
\begin{align}
V[\hat{\mu}] &= V \left[ \sum_{i=1}^{3} \frac{N_i}{N} \bar{x_i} \right] \\
&= V \left[ \frac{N_1}{N} \bar{x_1} + \frac{N_2}{N} \bar{x_2} + \frac{N_3}{N} \bar{x_3} \right] \\
&= V \left[ \frac{N_1}{N} \bar{x_1} \right] + V \left[ \frac{N_2}{N} \bar{x_2} \right] + V \left[ \frac{N_3}{N} \bar{x_3} \right] \\
&= \frac{N_1^2}{N^2} V \left[\bar{x_1} \right] + \frac{N_2^2}{N^2} V \left[ \bar{x_2} \right] + \frac{N_3^2}{N^2} V \left[ \bar{x_3} \right] \\
&= \frac{N_1^2}{N^2} \cdot \frac{N_1-n_1}{N_1-1} \cdot \frac{\sigma_1^2}{n_1} + \frac{N_2^2}{N^2} \cdot \frac{N_2-n_2}{N_2-1} \cdot \frac{\sigma_2^2}{n_2} + \frac{N_3^2}{N^2} \cdot \frac{N_3-n_3}{N_3-1} \cdot \frac{\sigma_3^2}{n_3} \\
&= \sum_{i=1}^{3} \frac{N_i^2}{N^2} \frac{N_i-n_i}{N_i-1} \cdot \frac{\sigma_i^2}{n_i}
\end{align}
$$

[4]
ラグランジュの未定乗数法を用いることで下記の結果が得られる。
$$
\large
\begin{align}
n_i^{\#} = \frac{\frac{N_i}{N}\sigma_i}{\sum_{i=1}^{3}\frac{N_i}{N}\sigma_i} n
\end{align}
$$

[5]
与えられた値や[4]で導出した式を用いることで$n_1^{\#} \simeq 9.06, n_2^{\#} \simeq 20.38, n_3^{\#} \simeq 90.57$が得られる。したがって標本の大きさ$n=120$に対して、層1には$9$、層$2$には$20$、層$3$には$91$の標本をそれぞれ割り当てればよい。