統計検定準1級 問題解説 ~2017年6月実施 選択問題及び部分記述問題 問5~

過去問題

過去問題は統計検定公式が問題と解答例を公開しています。こちらを参照してください。

解答

[1] 解答

$\boxed{ \ \mathsf{2}\ }$ : ①

兄の身長150cmが与えられたときの弟の身長の条件付き期待値を求めればよい.

$(X,Y)$が2変量正規分布$N\left(\begin{pmatrix}  \mu_x \\
\mu_y
\end{pmatrix},
\begin{pmatrix}
\sigma_x^2 && \rho\sigma_{xy} \\
\rho\sigma_{xy} && \sigma_y^2 \\
\end{pmatrix}
\right)$に従うとき,$X=x$が与えられたときの$Y$の条件付き期待値は

\[
E[Y|X=x] = \mu_y + \rho\sigma_y\frac{x-\mu_x}{\sigma_x}
\]

である.これを利用すると,兄の身長150cmが与えられたときの弟の身長の条件付き期待値は

\[
E[Y|X=150] = 130 + 0.6\times 15\frac{150-140}{15} = 136
\]

となる.

補足: 条件付き期待値の求め方1

$X$と$Y$をそれぞれ次のように標準化し,

\[
       X^* = \dfrac{X-\mu_x}{\sigma_x}, \quad Y^* = \dfrac{Y-\mu_y}{\sigma_y}
\]

とする.さらに$Z=Y^* – \rho X^*$とすると期待値の線形性から$E[Z] = E[Y^*] – \rho E[X^*] = 0$と計算できる.これを利用して$X=x$を与えたときの$Y$の条件付き期待値は次のように計算できる.

$$
   \begin{align*}
       E[Y|X=x] &= E[\sigma_yY^* + \mu_y|X=x] \\
                &= \mu_y + \sigma_y E[Y^* |X=x] \\
                &= \mu_y + \sigma_y E[Z+ \rho X^* |X=x] \\
                &= \mu_y + \sigma_y E[Z]+ \sigma_y  E[\rho X^*|X=x] \\
                &= \mu_y + \sigma_y E\left[ \rho \dfrac{X-\mu_x}{\sigma_x}|X=x \right] \\
                &= \mu_y + \rho \sigma_y  \dfrac{x-\mu_x}{\sigma_x} \\
   \end{align*}
$$

補足:条件付き期待値の求め方2

正規分布の平均は期待値と一致するため、正規分布の条件付き分布からも求めることができる.

[2] 解答

$\boxed{ \ \mathsf{3}\ }$ : ⑤

$Y\sim N(130, 15^2)$ より $Z = \dfrac{Y-130}{15}$ とおくと $Z \sim N(0,1)$ である.したがって,

$$
\begin{align*}
P(Y \geq 115) &= P\left( \dfrac{Y-130}{15} \geq \dfrac{115-130}{15} \right) \\
             &= P(Z \geq -1) \\
             &= 0.8413
\end{align*}
$$

となる.

[3] 解答

$\boxed{ \ \mathsf{4}\ }$ : ①

$X\sim N(140, 15^2)$,$Y\sim N(130, 15^2)$ より,$X-Y$ も正規分布に従う.

$$
\begin{align*}
E[X-Y] &= E[X] – E[Y]    \\
              &= 140 -130 \\
              &= 10
\end{align*}
$$

$$
\begin{align*}
V[X-Y] &= V[X] + V[Y] – 2\mathrm{Cov}[X,Y] \\
              &= V[X] + V[Y] – 2\rho \sqrt{V[X]}\sqrt{V[Y]} \\
              &= 15^2 + 15^2 – 2\cdot 0.6 \cdot 15\cdot 15 \\
              &= 180
\end{align*}
$$

であるから,$X-Y \sim N(10, 180)$ である.よって,$Z’ = \dfrac{X-Y-10}{\sqrt{180}}$ とおくと,$Z’ \sim N(0,1)$ である.

$$
\begin{align*}
       P(X-Y \geq 20) &= P\left( \dfrac{X-Y-10}{\sqrt{180}} \geq \dfrac{20-10}{\sqrt{180}} \right) \\
                      &= P( Z’ \geq 0.745) \\
                      &= 0.23
\end{align*}
$$

となる.

参考

・準$1$級関連まとめ
https://www.hello-statisticians.com/toukeikentei-semi1

・多次元正規分布における周辺分布(Marginal distribution)の数式の導出を理解する
https://www.hello-statisticians.com/explain-terms-cat/multi_norm_dist4.html

・「条件付き期待値」と「期待値の繰り返しの公式」の定義の確認と直感的解釈
https://www.hello-statisticians.com/explain-terms-cat/conditional_expectation1.html