統計検定1級 統計数理 問題解説 ~2018年11月実施 問2~

統計検定1級の2018年11月の「統計数理」の問2の解答例と解説について取り扱いました。他の問題の解答に関しては下記よりご確認ください。
https://www.hello-statisticians.com/stat_certifi_1_math

問題

詳しくは統計検定公式よりご確認ください。

解答

[1]
$P(X_i=1)$と$P(X_i=1,X_j=1), \quad i \neq j$はそれぞれ下記のように計算できる。
$$
\large
\begin{align}
P(X_i=1) &= \frac{{}_M P_1}{{}_N P_1} \\
&= \frac{M}{N} \\
P(X_i=1,X_j=1) &= \frac{{}_M P_2}{{}_N P_2} \\
&= \frac{M \times (M-1)}{N \times (N-1)} \\
&= \frac{M(M-1)}{N (N-1)}
\end{align}
$$

[2]
・期待値$E[X_i]$の導出
$$
\large
\begin{align}
E[X_i] &= 0 \times P(X_i=0) + 1 \times P(X_i=1) \\
&= \frac{M}{N}
\end{align}
$$

・分散$V[X_i]$の導出
$$
\large
\begin{align}
V[X_i] &= E[X_i^2] – E[X_i]^2 \\
&= 0^2 \times P(X_i=0) + 1^2 \times P(X_i=1) – \left( \frac{M}{N} \right)^2 \\
&= \frac{M}{N} – \left( \frac{M}{N} \right)^2 \\
&= \frac{MN – M^2}{N^2} \\
&= \frac{M(N – M)}{N^2}
\end{align}
$$

・共分散$Cov[X_i,X_j]$の導出
$$
\large
\begin{align}
Cov[X_i,X_j] &= E[X_iX_j] – E[X_i]E[X_j] \\
&= 1 \times P(X_i=1, X_j=1) – \left( \frac{M}{N} \right)^2 \\
&= \frac{M(M-1)}{N (N-1)} – \frac{M^2}{N^2} \\
&= \frac{MN(M-1) – M^2(N-1)}{N^2(N-1)} \\
&= \frac{M^2N – MN – M^2N + M^2}{N^2(N-1)} \\
&= \frac{M^2 – MN}{N^2(N-1)} \\
&= \frac{M(M – N)}{N^2(N-1)} \\
&= -\frac{M(N – M)}{N^2(N-1)}
\end{align}
$$

[3]
$P(X=x)$を考えるにあたっては$n$回の抽出のうち、赤球を$x$個、青球を$n-x$個引く確率だと考えれば良いので、下記のように求めることができる。
$$
\large
\begin{align}
P(X=x) &= \frac{{}_M C_x \times {}{N-M} C_{n-x}}{{}_N C_n} \\
&= \frac{{}_M C_x {}_{N-M} C_{n-x}}{{}_N C_n}
\end{align}
$$

[4]
・期待値$E[X]$の導出
$E[X]=E[X_1+…+X_n]=E[X_1]+…+E[X_n]$を元に下記のように導出することができる。
$$
\large
\begin{align}
E[X] &= E[X_1+…+X_n] \\
&= E[X_1] + … + E[X_n] \\
&= \frac{nM}{N}
\end{align}
$$

・分散$V[X]$の導出
$$
\large
\begin{align}
V[X] &= V[X_1+…+X_n] \\
&= \sum_{i=1}^{n} V[X_i] + \sum_{i \neq j} Cov[X_i,X_j] \\
&= n \times \frac{M(N – M)}{N^2} + n(n-1) \times -\frac{M(N – M)}{N^2(N-1)} \\
&= \frac{nM(N – M)(N-1) – n(n-1)M(N – M)}{N^2(N-1)} \\
&= \frac{nM(N – M)((N-1)-(n-1))}{N^2(N-1)} \\
&= \frac{nM(N – M)(N-n)}{N^2(N-1)}
\end{align}
$$

[5]
公式の解答が詳しいのでここでは省略する。

解説

$[3]$までは確率や期待値の定義に沿って計算を行えばそれほど難しくないと思います。また$[3]$の式が超幾何分布を表すことも抑えておくと良いです。また、$[4]$の導出にあたって$E[X]=E[X_1+…+X_n]=E[X_1]+…+E[X_n]$が成立する一方で、$V[X]=V[X_1+…+X_n]=V[X_1]+…+V[X_n]$が成立しないことは確認しておくと良いです。$X_1,…,X_n$が非復元抽出であることから類題の多くで成立する$i.i.d.,$がここでは成立していないことに注意が必要です。
20点配分なら[1]が3点、[2]が5点、[3]が2点、[4]が5点、[5]が5点が妥当な印象でした。[5]の議論に関しては複雑なように思われるので、飛ばして良いかもしれません。