ブログ

Ch.23 「対称行列の固有値と固有ベクトル」の演習問題の解答例 〜統計学のための数学入門30講〜

当記事は「統計学のための数学入門$30$講(朝倉書店)」の読解サポートにあたってChapter.$23$の「対称行列の固有値と固有ベクトル」の章末問題の解答の作成を行いました。
基本的には書籍の購入者向けの解説なので、まだ入手されていない方は購入の上ご確認ください。また、解説はあくまでサイト運営者が独自に作成したものであり、書籍の公式ページではないことにご注意ください。

・書籍解答まとめ
https://www.hello-statisticians.com/answer_textbook_math#math_stat

本章のまとめ

対称行列の固有値・固有ベクトルの性質

問題$23.1$で使用するので、$23.1$節、P.$144$の「対称行列の固有値・固有ベクトルの性質」の内容を以下にまとめる。

$p$次の正方行列$A$の固有値$\lambda_i$に関して下記が成立する。
$(1) \,$ 対称行列の固有値は全て実数である。
$(2) \,$ 対称行列の相異なる固有値に対応する固有ベクトルは直交する

上記の導出については下記で詳しく取り扱った。

対称行列の対角化とスペクトル分解

$p$次の対称行列$A$について下記の$(1)$と$(2)$が成立する。
・$(1) \,$ $p$次の対称行列$A$は$A$の固有ベクトルによって作成される直交行列$U$を用いて下記のように対角化が可能である。
$$
\large
\begin{align}
U^{\mathrm{T}} A U &= \Lambda = \left(\begin{array}{ccccc} \lambda_1 & 0 & 0 & \cdots & 0 \\ 0 & \lambda_2 & 0 & \cdots & 0 \\ 0 & 0 & \lambda_3 & \cdots & 0 \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & 0 & \cdots & \lambda_{p} \end{array} \right)
\end{align}
$$

・$(2) \,$

・$2)$ $p$次の対称行列$A$は固有値$\lambda_1, \cdots , \lambda_{p}$とそれぞれの固有値に対応する長さ$1$の固有ベクトル$\mathbf{u}_{1}, \cdots , \mathbf{u}_{p}$を用いて次のように表せる。
$$
\large
\begin{align}
A &= U \Lambda U^{\mathrm{T}} = \sum_{i=1}^{p} \lambda_{i} \mathbf{u}_{i} \mathbf{u}_{i}^{\mathrm{T}}
\end{align}
$$

この変形をスペクトル分解という。上記の式変形や導出の詳細については下記で取り扱った。

演習問題解答

問題$23.1$

$$
\large
\begin{align}
A = \left(\begin{array}{ccc} 1 & 0 & 2 \\ 0 & 1 & 0 \\ 2 & 0 & 1 \end{array} \right)
\end{align}
$$

上記の行列$A$に対し、固有方程式$\det(\lambda I_3 – A)=0$は下記のように解くことができる。
$$
\large
\begin{align}
\det(\lambda I_3 – A) &= \left| \begin{array}{ccc} \lambda-1 & 0 & -2 \\ 0 & \lambda-1 & 0 \\ -2 & 0 & \lambda-1 \end{array} \right| \\
&= (\lambda-1) \cdot (-1)^{2+2} \cdot \left| \begin{array}{cc} \lambda-1 & -2 \\ -2 & \lambda-1 \end{array} \right| \\
&= (\lambda-1)[(\lambda-1)^2 – (-2)^2] = 0 \\
(\lambda-1)[(\lambda-1)^2 – 2^2] &= 0 \\
(\lambda-1)(\lambda-1+2)(\lambda-1-2) &= 0 \\
(\lambda+1)(\lambda-1)(\lambda-3) &= 0 \\
\lambda &= -1, \, 1 ,\ 3
\end{align}
$$

以下、上記で得られたそれぞれの固有値に対し、長さ$1$の固有ベクトル$\left(\begin{array}{c} x \\ y \\ z \end{array} \right)$の計算を行う。

・$\lambda_1=3$
$$
\large
\begin{align}
\left(\begin{array}{ccc} 1 & 0 & 2 \\ 0 & 1 & 0 \\ 2 & 0 & 1 \end{array} \right) \left(\begin{array}{c} x \\ y \\ z \end{array} \right) &= -\left(\begin{array}{c} x \\ y \\ z \end{array} \right) \\
\left(\begin{array}{c} x+2z \\ y \\ 2x+z \end{array} \right) &= \left(\begin{array}{c} 3x \\ 3y \\ 3z \end{array} \right)
\end{align}
$$

上記より$x=z, y=0$が得られるので、$\lambda_1=3$に対応する長さ$1$の固有ベクトル$\mathbf{u}_{1}=\left(\begin{array}{c} x \\ y \\ z \end{array} \right)$は下記のように得られる。
$$
\large
\begin{align}
\mathbf{u}_{1} = \frac{1}{\sqrt{2}} \left(\begin{array}{c} 1 \\ 0 \\ 1 \end{array} \right)
\end{align}
$$

・$\lambda_2=1$
$$
\large
\begin{align}
\left(\begin{array}{ccc} 1 & 0 & 2 \\ 0 & 1 & 0 \\ 2 & 0 & 1 \end{array} \right) \left(\begin{array}{c} x \\ y \\ z \end{array} \right) &= \left(\begin{array}{c} x \\ y \\ z \end{array} \right) \\
\left(\begin{array}{c} x+2z \\ y \\ 2x+z \end{array} \right) &= \left(\begin{array}{c} x \\ y \\ z \end{array} \right)
\end{align}
$$

上記より$x=z=0$が得られるので、$\lambda_2=1$に対応する長さ$1$の固有ベクトル$\mathbf{u}_{2}=\left(\begin{array}{c} x \\ y \\ z \end{array} \right)$は下記のように得られる。
$$
\large
\begin{align}
\mathbf{u}_{2} = \left(\begin{array}{c} 0 \\ 1 \\ 0 \end{array} \right)
\end{align}
$$

・$\lambda_1=-1$
$$
\large
\begin{align}
\left(\begin{array}{ccc} 1 & 0 & 2 \\ 0 & 1 & 0 \\ 2 & 0 & 1 \end{array} \right) \left(\begin{array}{c} x \\ y \\ z \end{array} \right) &= -\left(\begin{array}{c} x \\ y \\ z \end{array} \right) \\
\left(\begin{array}{c} x+2z \\ y \\ 2x+z \end{array} \right) &= \left(\begin{array}{c} -x \\ -y \\ -z \end{array} \right)
\end{align}
$$

上記より$x=-z, y=0$が得られるので、$\lambda_3=-1$に対応する長さ$1$の固有ベクトル$\mathbf{u}_{3}=\left(\begin{array}{c} x \\ y \\ z \end{array} \right)$は下記のように得られる。
$$
\large
\begin{align}
\mathbf{v}_{3} = \frac{1}{\sqrt{2}} \left(\begin{array}{c} 1 \\ 0 \\ -1 \end{array} \right)
\end{align}
$$

ここまでの導出結果に対し、$\lambda = 3, \, 1 ,\ -1$が全て実数で、固有ベクトル$\mathbf{u}_{1}, \mathbf{u}_{2}, \mathbf{u}_{3}$に対してそれぞれ内積を取ると$0$に一致することが確認できる。

よって行列$A$に対してP.$144$でまとめられた「対称行列の固有値・固有ベクトルの性質」が成立することが確認できる。

問題$23.2$

$$
\large
\begin{align}
U = \left(\begin{array}{ccc} \mathbf{u}_{1} & \mathbf{u}_{2} & \mathbf{u}_{3} \end{array} \right) = \frac{1}{\sqrt{2}} \left(\begin{array}{ccc} 1 & 0 & 1 \\ 0 & \sqrt{2} & 0 \\ 1 & 0 & -1 \end{array} \right)
\end{align}
$$

上記のように$U$を定義すると、「問題$23.1$の解答」より$U$が直交行列であるので、$U^{\mathrm{T}} = U^{-1}$は下記のように表すことができる。
$$
\large
\begin{align}
U^{\mathrm{T}} = \frac{1}{\sqrt{2}} \left(\begin{array}{ccc} 1 & 0 & 1 \\ 0 & \sqrt{2} & 0 \\ 1 & 0 & -1 \end{array} \right)
\end{align}
$$

よって$A$の対角化は下記のように$U^{\mathrm{T}} A U$を計算することで行うことができる。
$$
\large
\begin{align}
U^{\mathrm{T}} A U &= \frac{1}{\sqrt{2}} \left(\begin{array}{ccc} 1 & 0 & 1 \\ 0 & \sqrt{2} & 0 \\ 1 & 0 & -1 \end{array} \right)\left(\begin{array}{ccc} 1 & 0 & 2 \\ 0 & 1 & 0 \\ 2 & 0 & 1 \end{array} \right) U \\
&= \frac{1}{\sqrt{2}} \left(\begin{array}{ccc} 3 & 0 & 3 \\ 0 & \sqrt{2} & 0 \\ -1 & 0 & 1 \end{array} \right) U \\
&= \frac{1}{2} \left(\begin{array}{ccc} 3 & 0 & 3 \\ 0 & \sqrt{2} & 0 \\ -1 & 0 & 1 \end{array} \right) \left(\begin{array}{ccc} 1 & 0 & 1 \\ 0 & \sqrt{2} & 0 \\ 1 & 0 & -1 \end{array} \right) \\
&= \frac{1}{2} \left(\begin{array}{ccc} 6 & 0 & 0 \\ 0 & 2 & 0 \\ 0 & 0 & -2 \end{array} \right) \\
&= \left(\begin{array}{ccc} 3 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & -1 \end{array} \right) = \Lambda
\end{align}
$$

また、$A$は下記のようにスペクトル分解を行うことができる。
$$
\large
\begin{align}
A &= \lambda_{1} \mathbf{u}_{1} \mathbf{u}_{1}^{\mathrm{T}} + \lambda_{2} \mathbf{u}_{2} \mathbf{u}_{2}^{\mathrm{T}} + \lambda_{3} \mathbf{u}_{3} \mathbf{u}_{3}^{\mathrm{T}} \\
&= \frac{3}{2} \left( \begin{array}{c} 1 \\ 0 \\ 1 \end{array} \right) \left( \begin{array}{ccc} 1 & 0 & 1 \end{array} \right) + \left(\begin{array}{c} 0 \\ 1 \\ 0 \end{array} \right) \left(\begin{array}{ccc} 0 & 1 & 0 \end{array} \right) + \frac{-1}{2} \left(\begin{array}{c} 1 \\ 0 \\ -1 \end{array} \right) \left(\begin{array}{ccc} 1 & 0 & -1 \end{array} \right) \\
&= \frac{3}{2} \left( \begin{array}{ccc} 1 & 0 & 1 \\ 0 & 0 & 0 \\ 1 & 0 & 1 \end{array} \right) + \left(\begin{array}{ccc} 0 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 0 \end{array} \right) \, – \, \frac{1}{2} \left(\begin{array}{ccc} 1 & 0 & -1 \\ 0 & 0 & 0 \\ -1 & 0 & 1 \end{array} \right)
\end{align}
$$

同様に$A^{-1}$は下記のように得ることができる。
$$
\large
\begin{align}
A^{-1} &= \frac{1}{\lambda_{1}} \mathbf{u}_{1} \mathbf{u}_{1}^{\mathrm{T}} + \frac{1}{\lambda_{2}} \mathbf{u}_{2} \mathbf{u}_{2}^{\mathrm{T}} + \frac{1}{\lambda_{3}} \mathbf{u}_{3} \mathbf{u}_{3}^{\mathrm{T}} \\
&= \frac{1}{6} \left( \begin{array}{c} 1 \\ 0 \\ 1 \end{array} \right) \frac{1}{\sqrt{2}} \left( \begin{array}{ccc} 1 & 0 & 1 \end{array} \right) + \left(\begin{array}{c} 0 \\ 1 \\ 0 \end{array} \right) \left(\begin{array}{ccc} 0 & 1 & 0 \end{array} \right) + \frac{-1}{2} \left(\begin{array}{c} 1 \\ 0 \\ -1 \end{array} \right) \left(\begin{array}{ccc} 1 & 0 & -1 \end{array} \right) \\
&= \frac{1}{6} \left( \begin{array}{ccc} 1 & 0 & 1 \\ 0 & 0 & 0 \\ 1 & 0 & 1 \end{array} \right) + \left(\begin{array}{ccc} 0 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 0 \end{array} \right) \, – \, \frac{1}{2} \left(\begin{array}{ccc} 1 & 0 & -1 \\ 0 & 0 & 0 \\ -1 & 0 & 1 \end{array} \right) \\
&= \frac{1}{6} \left(\begin{array}{ccc} 1 \, – \, 3 & 0 & 1+3 \\ 0 & 6 & 0 \\ 1+3 & 0 & 1 \, – \, 3 \end{array} \right) \\
&= \frac{1}{6} \left(\begin{array}{ccc} -2 & 0 & 4 \\ 0 & 6 & 0 \\ 4 & 0 & -2 \end{array} \right) \\
&= \frac{1}{3} \left(\begin{array}{ccc} -1 & 0 & 2 \\ 0 & 3 & 0 \\ 2 & 0 & -1 \end{array} \right)
\end{align}
$$

・解説
$A^{-1} A$が下記のように計算できることも合わせて確認しておくと良いと思います。
$$
\large
\begin{align}
A^{-1} A &= \frac{1}{3} \left(\begin{array}{ccc} -1 & 0 & 2 \\ 0 & 3 & 0 \\ 2 & 0 & -1 \end{array} \right) \left(\begin{array}{ccc} 1 & 0 & 2 \\ 0 & 1 & 0 \\ 2 & 0 & 1 \end{array} \right) \\
&= \frac{1}{3} \left(\begin{array}{ccc} 3 & 0 & 0 \\ 0 & 3 & 0 \\ 0 & 0 & 3 \end{array} \right) \\
&= \left(\begin{array}{ccc} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \end{array} \right) = I
\end{align}
$$

統計検定2級 公式問題集 CBT対応版 解答例まとめ 〜3. データ収集〜

「統計検定$2$級 公式問題集 CBT対応版」の解答例を取りまとめるにあたって、当記事では「PART.$2$ 分野・項目別 問題・解説」のCategory.$3$「データ収集」の解答例を作成しました。解答例は「統計の森」オリジナルのコンテンツであり、統計検定の公式とは一切関係ないことにご注意ください。

解答例

Q.1

Ⅰ 母集団に対応する全ての搭乗客に対して無作為に$200$名抽出し調査を行ったので「単純無作為抽出法」である。
Ⅱ 母集団に対応する全ての搭乗客を「重複しないグループ」に分け、それぞれの層から無作為に標本抽出し調査を行ったので「層化抽出法」である。
Ⅲ 母集団に対応する全ての搭乗客に対し「重複のないグループ」に分け、グループ単位で無作為に抽出し調査を行ったので「集落抽出法」である。

上記より、正解は④である。

Q.2

標本に対し、何らかの「介入」を行うのが「実験研究」、「介入」を行わないのが「観察研究」である。
A 費用に関する調査であり、「介入」を行っていないので「観察研究」
B 被験者に対して治療法を適用する「介入」を行ったので「実験研究」
C 被験者に対して「介入」は行っていないので「観察研究」

よって④が正解である。

Q.3

Ⅰ 「無作為化」により制御できない要因を偶然誤差に転化できるので正しい。
Ⅱ 臨床試験では個体差があるので多くの被験者に対して調査が必要であり、多くの被験者に対する調査も「繰り返し」であると見なされるので正しくない。
Ⅲ 「局所管理」は実験条件をできる限り均一に保つように管理されたブロックに実験を分けることを意味するので正しくない。

上記より。正解は①である。

Q.4

標本調査の際の「標本誤差」は「標本の取り方によって偶然に生じる誤差」であり、「非標本誤差」は「誤回答や未回答などに起因する誤差」である。①が標本の取り方に起因する誤差であるので、①が正解である。

参考

・【統計検定$2$級対応】統計学入門まとめ
https://www.hello-statisticians.com/stat_basic

統計検定2級 公式問題集 CBT対応版 解答例まとめ 〜8. 検定〜

「統計検定$2$級 公式問題集 CBT対応版」の解答例を取りまとめるにあたって、当記事では「PART.$2$ 分野・項目別 問題・解説」のCategory.$8$「検定」の解答例を作成しました。解答例は「統計の森」オリジナルのコンテンツであり、統計検定の公式とは一切関係ないことにご注意ください。

解答例

Q.1

ア)
検定統計量$Z$に関して$Z \sim \mathcal{N}(0,1)$が成立するので、有意水準$5$%の両側検定を考えると$|Z|>1.96$が棄却域となる。

イ)
検定統計量$T$に関して$T \sim t(20)$が成立するので、有意水準$5$%の両側検定を考えると$|T|>2.086$が棄却域となる。

ウ)
$T$に関して中心極限定理に基づく世紀近似を用いる場合の有意水準$5$%の両側検定の棄却域は$|T|>1.96$となる。

上記より、①が正解である。

Q.2

「第$1$種の過誤」は「帰無仮説$H_0$が正しいにも関わらず棄却すること」に該当するので、この問題では「$p=0.62$が正しいにも関わらず棄却すること」に対応する。よって①か②に絞られる。また、有意水準$\alpha$は棄却する確率に対応するので$0.62^3+0.38^3=0.2932$であり、②が正解である。

Q.3

検定統計量$T$の実現値を$t$とおくと、下記のように計算できる。
$$
\large
\begin{align}
t &= \frac{\bar{x}-\mu}{\hat{\sigma}/\sqrt{n}} \\
&= \frac{3.23 \times 2 \sqrt{6}}{8.72} \\
&= 1.81 \cdots
\end{align}
$$

自由度$n-1=23$の$t$分布$t(23)$の上側$\alpha’$点を$t_{\alpha=\alpha’}(23)$とおくとき、$t_{\alpha=0.01}(23)$〜$t_{\alpha=0.1}(23)$は下記のような値を持つ。
$$
\large
\begin{align}
t_{\alpha=0.01}(23) &= 2.500 \\
t_{\alpha=0.025}(23) &= 2.069 \\
t_{\alpha=0.05}(23) &= 1.714 \\
t_{\alpha=0.1}(23) &= 1.319
\end{align}
$$

$t_{\alpha=0.05}(23) < 1.81 < t_{\alpha=0.025}(23)$より、③が正解である。

Q.4

ア)
対立仮説が$H_1: \, p \neq p_0$であるので、両側検定を行う。

イ)
両側検定なので$|Z|>z_{\alpha=0.025}=1.96$が棄却域である。

ウ)
$|Z|>1.96$のとき棄却されるのは帰無仮説である。

よって、⑤が正解である。

Q.5

標本の不良品率を$\hat{r}$とおくとき、検定統計量$Z$と実現値$z$に関して下記が成り立つ。
$$
\large
\begin{align}
Z \sim \mathcal{N} \left( r, np(1-p) \right) \\
z &= \frac{\hat{r}-r}{\sqrt{p(1-p)/n}} \quad (1) \\
\hat{r} &= \frac{x}{n}
\end{align}
$$

上記の$(1)$式に$x=16, n=200, r=0.05$を代入すると下記が得られる。
$$
\large
\begin{align}
z &= \frac{\hat{r}-r}{\sqrt{p(1-p)/n}} \quad (1) \\
&= \frac{16/200-0.05}{\sqrt{0.05 \cdot 0.95 / 200}} \\
&= 1.946 \cdots
\end{align}
$$

$P$値は$P(Z \geq z)=P(Z \geq 1.95)=0.0256$が対応するので、正解は②である。

Q.6

セリーグの不偏標本分散を$\hat{\sigma}_{1}^{2}$、パリーグの不偏標本分散を$\hat{\sigma}_{2}^{2}$、共通の不偏標本分散を$\hat{\sigma}^{2}$とおくと、$\hat{\sigma}^{2}$は下記のように表される。
$$
\large
\begin{align}
\hat{\sigma}^{2} &= \frac{(m-1)\hat{\sigma}_{1}^{2} + (n-1)\hat{\sigma}_{2}^{2}}{m+n-2} \\
&= \frac{\sum(x_i-\bar{x})^2 + \sum(y_i-\bar{y})^2}{m+n-2}
\end{align}
$$

また、検定統計量の実現値を$t$とおくと、$t$は下記のように表される。
$$
\large
\begin{align}
t &= \frac{(\bar{x}-\bar{y}) – 0}{\displaystyle \sqrt{\frac{1}{m}+\frac{1}{n}} \hat{\sigma}} \\
&= \frac{\bar{x}-\bar{y}}{\displaystyle \sqrt{ \left( \frac{1}{m}+\frac{1}{n} \right) \frac{\sum(x_i-\bar{x})^2 + \sum(y_i-\bar{y})^2}{m+n-2}}}
\end{align}
$$

上記に$\displaystyle \sum(x_i-\bar{x})^2 = 13549, \sum(y_i-\bar{y})^2 = 7763, \bar{x}=233.7, \bar{y}=185.3, m=n=6$を代入すると下記のような計算結果が得られる。
$$
\large
\begin{align}
t &= \frac{\bar{x}-\bar{y}}{\displaystyle \sqrt{ \left( \frac{1}{m}+\frac{1}{n} \right) \frac{\sum(x_i-\bar{x})^2 + \sum(y_i-\bar{y})^2}{m+n-2}}} \\
&= \frac{233.7-185.3}{\displaystyle \sqrt{ \left( \frac{1}{6}+\frac{1}{6} \right) \frac{13549 + 7763}{6+6-2}}} \\
&= 1.815 \cdots
\end{align}
$$

上記より正解は④である。

Q.7

No. $1$$2$$3$$4$$5$$6$$7$$8$$9$$10$平均
$130$$118$$128$$135$$126$$120$$126$$140$$127$$130$$128.0$
$135$$120$$132$$135$$129$$128$$135$$139$$135$$132$$132.0$

「対応のある場合」なので、前後の差を$X$と起き、$X$の母平均を$\mu$、母分散を$\sigma^2$と考え、$H_{0}: \, \mu=0$と$H_{1}: \, \mu>0$の片側検定を行う。よって自由度は$9$、$t_{\alpha=0.05}(9)=1.833$であるので①が正解である。

Q.8

標本の不良品の比率を$\hat{p}_A, \hat{p}_B$、母集団の不良品の比率を$p_A, p_B$、標本の抽出数を$n_A, n_B$とおく。このとき二項分布の正規近似より下記が成立する。
$$
\large
\begin{align}
\hat{p}_A-\hat{p}_B \sim \mathcal{N} \left( p_A-p_B, \frac{\hat{p}_A(1-\hat{p}_A)}{n_A}+\frac{\hat{p}_B(1-\hat{p}_B)}{n_B} \right)
\end{align}
$$

ここで帰無仮説$H_0: \, d = p_A-p_B = 0$に対する検定統計量の実現値を$z$とおくと、$z$は下記のように計算できる。
$$
\large
\begin{align}
z &= \frac{\hat{p}_A-\hat{p}_B}{\displaystyle \sqrt{\frac{\hat{p}_A(1-\hat{p}_A)}{n_A}+\frac{\hat{p}_B(1-\hat{p}_B)}{n_B}}} \\
&= -0.181 \cdots
\end{align}
$$

上記の計算にあたっては$\displaystyle \hat{p}_A=\frac{16}{200}, \hat{p}_B=\frac{17}{200}, n_A=n_B=200$を代入し、計算を行なった。ここで$P$値は$P(|Z| \geq |z|) = P(|Z| \geq 0.18)$に対応するので下記のように計算できる。
$$
\large
\begin{align}
P(|Z| \geq |z|) &= P(|Z| \geq 0.18) \\
&= 2 P(Z \geq 0.18) \\
& \simeq 2 \times 0.4286 = 0.8572
\end{align}
$$

以上より、正解は⑤である。

Q.9

$F$値は下記のように計算できる。
$$
\large
\begin{align}
F &= \frac{19.5^2}{14.5^2} \\
&= 1.808 \cdots
\end{align}
$$

ここで、$F_{\alpha=0.025}(20,40)=2.068$であり、$\displaystyle \frac{1}{F_{\alpha=0.025}(40,20)}=\frac{1}{2.287}$であるので下記が成立する。
$$
\large
\begin{align}
\frac{1}{F_{\alpha=0.025}(40,20)} = \frac{1}{2.287} < F < 2.068 = F_{\alpha=0.025}(20,40)
\end{align}
$$

よって帰無仮説の「クラス間の分散が等しい」は$5$%で棄却できない。

上記より、②が正解である。

Q.10

$\alpha$と$\beta$が閾値$x_0$の定め方によりトレードオフであることから①か②に絞られる。

ここで$\alpha$は上図の青の面積、$\beta$が上図の緑の面積に対応する。上図より$\alpha+\beta$が閾値$x_0$の取り方により一定ではないことが確認できるので、②は不適切であり①が正解である。

・参考
有意水準や検出力に関しては抽象的で難しいので、下記で図を元に取りまとめました。

参考

・【統計検定$2$級対応】統計学入門まとめ
https://www.hello-statisticians.com/stat_basic

統計検定2級 公式問題集 CBT対応版 解答例まとめ 〜2. 2変数記述統計〜

「統計検定$2$級 公式問題集 CBT対応版」の解答例を取りまとめるにあたって、当記事では「PART.$2$ 分野・項目別 問題・解説」のCategory.$2$「$2$変数記述統計」の解答例を作成しました。解答例は「統計の森」オリジナルのコンテンツであり、統計検定の公式とは一切関係ないことにご注意ください。

解答例

Q.1

$8$〜$10$にサンプルがあることから、①か③に絞られ、$10$〜$12$に多数サンプルがあることから③が正しいことが確認できる。

Q.2

散布図の目盛りを確認することで④が正しいことが確認できる。

Q.3

相関係数$r$は下記のように計算できる。
$$
\large
\begin{align}
r &= \frac{133.1}{\sqrt{236.6 \times 170.1}} \\
&= 0.66 \cdots
\end{align}
$$

相関係数$r=0.66$に対応する図を選べば良いので①が正解である。

Q.4

Ⅰ 真ん中のグラフより正しいことが確認できる
Ⅱ 右側のグラフより正しいことが確認できる
Ⅲ 左側のグラフより正の相関があることが確認できるので正しくない

よって、正解は④である。

Q.5

国語の得点を$X$、数学の得点を$Y$、国語の標準偏差を$\sigma_X$、数学の標準偏差を$\sigma_Y$、共分散を$\sigma_{XY}$、相関係数を$\rho_{XY}$とおく。このとき、下記より$\sigma_{XY}$の計算を行える。
$$
\large
\begin{align}
\rho_{XY} &= \frac{\sigma_{XY}}{\sqrt{\sigma_X^2 \sigma_Y^2}} \\
\sigma_{XY} &= \rho_{XY} \sigma_{X} \sigma_{Y} \\
&= 0.72 \times 12.5 \times 16.4 = 147.6
\end{align}
$$

よって②が正解である。

Q.6

⑤が正しい。④は「強い負の相関」ではないので正しくない。この問題は「切断効果」の事例であると考えることができる。

参考

・【統計検定$2$級対応】統計学入門まとめ
https://www.hello-statisticians.com/stat_basic

統計検定2級 公式問題集 CBT対応版 解答例まとめ 〜1. 1変数記述統計〜

「統計検定$2$級 公式問題集 CBT対応版」の解答例を取りまとめるにあたって、当記事では「PART.$2$ 分野・項目別 問題・解説」のCategory.$1$「$1$変数記述統計」の解答例を作成しました。解答例は「統計の森」オリジナルのコンテンツであり、統計検定の公式とは一切関係ないことにご注意ください。

解答例

Q.1

相対度数表の定義より、それぞれ下記のように計算できる。
ア)
$$
\large
\begin{align}
100 – (85.1+2.1) = 12.8
\end{align}
$$

イ)
$$
\large
\begin{align}
100 – (76.6+17.0+2.1) = 4.3
\end{align}
$$

よって、正解は⑤である。

Q.2

累積相対度数を考えればよい。

階級 相対度数(%)累積相対度数(%)
〜$100$ $13.2$$13.2$
$100$〜$200$ $7.2$$20.4$
$200$〜$300$ $7.0$$27.4$
$300$〜$400$ $6.1$$33.5$
$400$〜$500$ $5.6$$39.1$
$500$〜$600$ $5.5$$44.6$
$600$〜$700$ $4.5$$49.1$
$700$〜$800$ $4.2$$53.3$

上記より、正解は①である。

Q.3

東京の箱ひげ図には$16$〜$18$度のサンプルが$2$つあるが、$(A)$のみが対応する。よって正解は①である。

Q.4

① 最高得点は$90$点であるので×
② 最低得点は$40$点であるので×
③ 正しい
④ 上位$20$%の最低得点は$78$点であるので×
⑤ 最頻値は$58$点であるので×

上記より正解は③である。

Q.5

Ⅰ 傾向変動は長期の動きであるが、常に直線であるとは限らないので×
Ⅱ 正しい
Ⅲ 不規則変動は傾向変動と季節変動以外の変動を指すので、予測が困難な偶然運動も含むので×

上記より正解は②である。

Q.6

平均変化率$r$に関して下記が成立する。
$$
\large
\begin{align}
102.6 \left( 1+\frac{r}{100} \right)^3 &= 105.6 \\
1+\frac{r}{100} &= \left( \frac{105.6}{102.6} \right)^{\frac{1}{3}} \\
r &= 100 \left[ \left( \frac{105.6}{102.6} \right)^{\frac{1}{3}} – 1 \right]
\end{align}
$$

上記より正解は④である。

Q.7

$\overline{F}$は下記のように計算できる。
$$
\large
\begin{align}
\overline{F} &= 1.8 \overline{C} + 32 \\
&= 1.8 \times 2.4 + 32 \\
&= 36.32
\end{align}
$$

また、$s_F$は下記のように計算できる。
$$
\large
\begin{align}
s_F &= \sqrt{\frac{1}{16} \sum_{i=1}^{17}((1.8C_i+32)-(1.8\overline{C}-32))^2} \\
&= \sqrt{\frac{1.8^2}{16} \sum_{i=1}^{17}(C_i-\overline{C})^2} \\
&= \sqrt{1.8^2 \times 7^2} \\
&= 1.8 \times 7 \\
&= 12.6
\end{align}
$$

上記より正解は④である。

Q.8

累積相対度数は下記を実行することで作成できる。

import numpy as np

x = np.array([[5.4, 10.7, 16.3, 24.1, 43.5], [5.1, 10.3, 15.4, 22.7, 46.4], [8.7, 14.3, 17.8, 23.0, 36.2], [5.2, 9.8, 14.9, 22.3, 47.9], [8.4, 13.1, 17.2, 22.7, 38.6]])
print(np.cumsum(x,axis=1))

・実行結果

array([[   5.4,   16.1,   32.4,   56.5,  100. ],
       [   5.1,   15.4,   30.8,   53.5,   99.9],
       [   8.7,   23. ,   40.8,   63.8,  100. ],
       [   5.2,   15. ,   29.9,   52.2,  100.1],
       [   8.4,   21.5,   38.7,   61.4,  100. ]])

また、ローレンツ曲線は下記を実行することで得られる。

import numpy as np
import matplotlib.pyplot as plt

x = np.array([[5.4, 10.7, 16.3, 24.1, 43.5], [5.1, 10.3, 15.4, 22.7, 46.4], [8.7, 14.3, 17.8, 23.0, 36.2], [5.2, 9.8, 14.9, 22.3, 47.9], [8.4, 13.1, 17.2, 22.7, 38.6]])
x_cum = np.zeros([x.shape[0],x.shape[0]+1])
x_cum[:,1:] = np.cumsum(x,axis=1)

nation_label = ["JPN", "USA", "SWE", "CHN", "DEU"]
for i in range(x_cum.shape[0]):
    plt.plot(np.arange(6),x_cum[i,:],label=nation_label[i])

plt.legend(loc="upper left")
plt.show()

・実行結果

上記より、下記のように考えることができる。
Ⅰ 完全平等線は$(0,0)$と$(5,100)$を通る直線なので、いずれの国のローレンツ曲線も完全平等線の下に弧を描く。よって正しい。
Ⅱ ジニ係数は完全平等線とローレンツ曲線の間の面積に対応するので、アメリカ>日本>ドイツである。よって正しくない。
Ⅲ 中国のローレンツ曲線はスウェーデンのローレンツ曲線の下を通る。よって正しい。

したがって、正解は⑤である。

Q.9

$12n$か月ごとに正の相関と$12n+6$か月ごとに負の相関があることから正解は②である。ACFはAuto Correlatino Functionの略であり、自己相関係数に対応することは抑えておくと良い。

Q.10

基準年の第$i$財の価格を$p_{0i}$、購入数量を$q_{0i}$、対象年の第$i$財の価格を$p_{ti}$、購入数量を$q_{ti}$とおく。このとき「対象年に基準年と同じ購入量を購入した場合の総購入金額の比率」を表すラスパイレス価格指数$L_{t}$は下記のように定義される。
$$
\large
\begin{align}
L_{t} = \frac{\displaystyle \sum_{i=1}^{n} p_{ti} q_{0i}}{\displaystyle \sum_{i=1}^{n} p_{0i} q_{0i}} \times 100
\end{align}
$$

上記の定義に対応するのが②であるので、正解は②である。また、計算結果は$107.6$であり、平均価格が上昇したと考えることができる。

・考察
ラスパイレス指数は「価格の調査は標本抽出を元に行うことができコストがそれほどかからないが、数量調査は全数調査が必要でありコストがかかる」ことから、広く用いられることが多いと抑えておくと良いです。

参考

・【統計検定$2$級対応】統計学入門まとめ
https://www.hello-statisticians.com/stat_basic

統計検定2級 公式問題集 CBT対応版 解答例まとめ 〜4. 確率〜

「統計検定$2$級 公式問題集 CBT対応版」の解答例を取りまとめるにあたって、当記事では「PART.$2$ 分野・項目別 問題・解説」のCategory.$4$「確率」の解答例を作成しました。解答例は「統計の森」オリジナルのコンテンツであり、統計検定の公式とは一切関係ないことにご注意ください。

解答例

Q.1

受講する事象を$X$、合格する事象を$Y$で定める。このとき$P(X \cap Y)$は下記のように計算できる。
$$
\large
\begin{align}
P(X \cap Y) &= P(Y|X)P(X) \\
&= 0.7 \times 0.2 \\
&= 0.14
\end{align}
$$

上記より、正解は①の$0.14$である。

Q.2

クッキーが工場$A, B$で生成されたという事象をそれぞれ$A, B$、カモノハシの絵がプリントされている事象を$C$とおく。このとき$P(A|C)$はベイズの定理に基づいて下記のように計算できる。
$$
\large
\begin{align}
P(A|C) &= \frac{P(C|A)P(A)}{P(C)} \\
&= \frac{P(C|A)P(A)}{P(C|A)P(A) + P(C|B)P(B)} \\
&= \frac{0.02 \times 0.7}{0.02 \times 0.7 + 0.08 \times 0.3} \\
&= \frac{7}{19} \\
&= 0.368 \cdots
\end{align}
$$

上記より、正解は②である。

Q.3

無作為復元抽出であるので、$1$回ごとの確率は一定の$1/10$である。よってくじを引く回数の期待値は$10$回であるので正解は②である。

・別解
幾何分布に基づいて考えても良い。くじを引く回数を$X$、$p=1/10$とおくと、$X \sim \mathrm{Geo}(p)$であるので、$P(X=k)$は下記のように表せる。
$$
\large
\begin{align}
P(X=k) = p(1-p)^{k-1}
\end{align}
$$

また、$P(X=5+k|X>5)$は下記のように計算できる。
$$
\large
\begin{align}
P(X=5+k|X>5) &= \frac{P(X=5+k)}{P(X>5)} \\
&= \frac{p(1-p)^{5+k-1}}{(1-p)^{5}} \\
&= p(1-p)^{k-1} = P(X=k)
\end{align}
$$

上記より$P(X=5+k|X>5)=P(X=k)$が成立するので、すでに外れだった分はリセットし$X$を考えれば良い。幾何分布の期待値は$\displaystyle E[X] = \frac{1}{p}$より、$E[X]$は下記のように計算できる。
$$
\large
\begin{align}
E[X] &= \frac{1}{p} \\
&= \frac{1}{1/10} = 10
\end{align}
$$

Q.4

$P(A)=0.4, P(B)=0.35, P(A \cup B)=0.61$より、$P(A \cap B)$は下記のように計算できる。
$$
\large
\begin{align}
P(A \cap B) &= P(A) + P(B) – P(A \cup B) \\
&= 0.35 + 0.4 – 0.61 \\
&= 0.14
\end{align}
$$

上記より、$P(A \cap B) \neq 0$であるので、$A$と$B$が排反ではないことが確認できる。また、$P(A)P(B)$は下記のように計算できる。
$$
\large
\begin{align}
P(A)P(B) &= 0.4 \times 0.35 \\
&= 0.14 = P(A \cap B) \\
\end{align}
$$

上記より$P(A \cap B)=P(A)P(B)$であるので$A$と$B$が独立であることが確認できる。よって正解は②である。

Q.5

下記のように$X$の期待値$E[X]$を計算できる。
$$
\large
\begin{align}
E[X] &= \frac{1}{3} \times 2 \times \frac{2}{5} + \frac{2}{3} \times 2 \times \frac{1}{5} \\
&= \frac{8}{15}
\end{align}
$$

よって正解は⑤である。

Q.6

参考

・【統計検定$2$級対応】統計学入門まとめ
https://www.hello-statisticians.com/stat_basic

統計検定2級 公式問題集 CBT対応版 解答例まとめ 〜6. 標本分布〜

「統計検定$2$級 公式問題集 CBT対応版」の解答例を取りまとめるにあたって、当記事では「PART.$2$ 分野・項目別 問題・解説」のCategory.$6$「標本分布」の解答例を作成しました。解答例は「統計の森」オリジナルのコンテンツであり、統計検定の公式とは一切関係ないことにご注意ください。

解答例

Q.1

標本比率の確率変数$\hat{p}$に関して$\displaystyle \hat{p} \sim \mathcal{N} \left( p, \frac{p(1-p)}{n} \right)$が成立することから、確率変数$Z$は下記のように表せる。
$$
\large
\begin{align}
Z = \frac{\hat{p}-p}{\sqrt{p(1-p)/n}} \quad (1)
\end{align}
$$

よって、$p$の$95$%区間に関して下記が成立する。
$$
\large
\begin{align}
z_{\alpha=0.975} \leq & Z \leq z_{\alpha=0.025} \\
-1.96 \leq & \frac{\hat{p}-p}{\sqrt{p(1-p)/n}} \leq 1.96 \\
-1.96 \sqrt{\frac{p(1-p)}{n}} \leq & \hat{p}-p \leq 1.96 \sqrt{\frac{p(1-p)}{n}} \\
-1.96 \sqrt{\frac{p(1-p)}{n}} \leq & p-\hat{p} \leq 1.96 \sqrt{\frac{p(1-p)}{n}} \\
\hat{p} – 1.96 \sqrt{\frac{p(1-p)}{n}} \leq & p \leq \hat{p} + 1.96 \sqrt{\frac{p(1-p)}{n}} \quad (2)
\end{align}
$$

$(1), (2)$より③が正解である。

Q.2

標本$(X_1, X_2)$の実現値、$\overline{X}$の値、それぞれの確率は下記のように表せる。

$(X_1,X_2)$の実現値$(2,2)$$(2,4)$$(4,2)$$(2,6)$$(4,4)$$(6,2)$$(2,8)$$(4,6)$$(6,4)$$(8,2)$$(4,8)$$(6,6)$$(8,4)$$(8,6)$$(6,8)$$(8,8)$
$\overline{X}$の値 $2.0$$3.0$$4.0$$5.0$$6.0$$7.0$$8.0$
確率 $\displaystyle \frac{1}{16}$$\displaystyle \frac{2}{16}$$\displaystyle \frac{3}{16}$$\displaystyle \frac{4}{16}$$\displaystyle \frac{3}{16}$$\displaystyle \frac{2}{16}$$\displaystyle \frac{1}{16}$

上記より中央値$5.0$、最頻値$5.0$であるので③が正しい。

Q.3

$B$の重さの推定量を$\hat{b}$とおくと、$\hat{b}$は下記のように表せる。
$$
\large
\begin{align}
\hat{b} &= \frac{X-Y}{2} \\
&= b + \frac{\varepsilon_{1} – \varepsilon_{2}}{2}
\end{align}
$$

ここで$\varepsilon_{1}, \varepsilon_{2}$がそれぞれ独立であることから$V[\hat{b}]$は下記のように考えることができる。
$$
\large
\begin{align}
V[\hat{b}] &= V \left[ b + \frac{\varepsilon_{1} – \varepsilon_{2}}{2} \right] \\
&= \frac{1}{4} (V[\varepsilon_{1}] + V[\varepsilon_{2}]) \\
&= \frac{1}{4} (\sigma^2 + \sigma^2) = \frac{\sigma^2}{2}
\end{align}
$$

よって正解は③である。

Q.4

Ⅰ. $X \sim \mathcal{N}(0,\sigma_1^2), Y \sim \mathcal{N}(0,\sigma_2^2)$より下記が成立する。
$$
\large
\begin{align}
E[U] &= E[X+Y] = E[X]+E[Y] = 0 \\
E[V] &= E[X-Y] = E[X]-E[Y] = 0
\end{align}
$$

よって、$U$と$V$の平均は等しい。

Ⅱ. 共分散$\mathrm{Cov}(U,V)$は下記のように式変形できる。
$$
\large
\begin{align}
\mathrm{Cov}(U,V) &= E[UV] – E[U]E[V] \\
&= E[(X+Y)(X-Y)] \\
&= E[X^2] – E[Y^2] = \sigma_1^2 – \sigma_2^2
\end{align}
$$

上記が$0$の時のみ$U,V$は互いに独立であるので、$U,V$が独立なのは$\sigma_1^2 = \sigma_2^2$の時に限る。

Ⅲ. $E[U]=E[V]=0, V[U]=V[V]=\sigma_1^2+\sigma_2^2$より、$\sigma_1^2, \sigma_2^2$の値によらず$U$と$V$は同じ分布に従う。

上記より⑤が正解である。

Q.5

母分散未知の場合の母平均の取り扱いであるので、$\displaystyle T = \frac{\overline{X}-\mu}{\sqrt{S^2/9}}$は自由度$8$の$t$分布に従う。また、$P(T \geq 1.86)$に対応する確率は$t$分布の表より$0.05$であることが確認できる。よって③が正解である。

Q.6

$X_1, X_2, X_3$が標準化されていることから、$E[X_1]=E[X_2]=E[X_3]=0, V[X_1]=V[X_2]=V[X_3]=1$が成立する。このとき$X_1$と$Y$の相関係数を$r_{X_1,Y}$とおくと、$r_{X_1,Y}$は下記のように表せる。
$$
\large
\begin{align}
r_{X_1,Y} &= \frac{\mathrm{Cov}(X_1,Y)}{\sqrt{V[X_1]V[Y]}} \\
&= \frac{E[X_1Y]-E[X_1]E[Y]}{\sqrt{V[Y]}} \\
&= \frac{E[X_1Y]}{\sqrt{V[Y]}} \\
&= \frac{E[X_1^2 + X_1X_2 + X_1X_3]}{3 \sqrt{V[Y]}} \\
&= \frac{E[X_1^2] + E[X_1X_2] + E[X_1X_3]}{3 \sqrt{V[Y]}}
\end{align}
$$

ここで$E[X_1]=E[X_2]=E[X_3]=0, V[X_1]=V[X_2]=V[X_3]=1, r_{X_1,X_2}=r_{X_1,X_3}=0.5$より、下記が成立する。
$$
\large
\begin{align}
E[X_1^2] &= V[X_1]+E[X_1]^2 = 1 \\
E[X_1X_2] &= 0.5 \sqrt{V[X_1]V[X_2]} + E[X_1]E[X_2] \\
&= 0.5 \\
E[X_1X_2] &= 0.5 \sqrt{V[X_1]V[X_2]} + E[X_1]E[X_2] \\
&= 0.5 \\
V[Y] &= V \left[ \frac{1}{3}(X_1+X_2+X_3) \right] \\
&= \frac{1}{9} V[X_1+X_2+X_3] \\
&= \frac{1}{9} (3V[X_1] + 6 \mathrm{Cov}(X_1,X_2)) \\
&= \frac{1}{9} (3 + 6 (E[X_1X_2] – E[X_1]E[X_2])) \\
&= \frac{3 + 6 \times 0.5}{9} \\
&= \frac{2}{3}
\end{align}
$$

よって$r_{X_1,Y}$は下記のように計算できる。
$$
\large
\begin{align}
r_{X_1,Y} &= \frac{E[X_1^2] + E[X_1X_2] + E[X_1X_3]}{3 \sqrt{V[Y]}} \\
&= \frac{1+0.5+0.5}{3 \sqrt{2/3}} \\
&= \sqrt{\frac{2}{3}} = 0.816 \cdots
\end{align}
$$

よって⑤が正解である。

Q.7

$E[X]=\mu, V[X]=\sigma^2$のとき、$\sigma^2=V[X]=E[(X-E[X])^2]$に基づいて下記が成立する。
$$
\large
\begin{align}
\sigma^2 &= V[X] = E[(X-E[X])^2] \\
&= E[(X^2 – 2XE[X] + E[X]^2)] \\
&= E[X^2] – E[X]^2 = E[X^2] – \mu^2
\end{align}
$$

上記より、$E[X^2] = \mu^2 + \sigma^2$が成立するので③が正解である。

Q.8

ア)
自由度$5$の$t$分布に従う。

イ)
自由度$(5,1)$の$F$分布に従う。

ウ)
$\displaystyle \frac{1}{\sqrt{\alpha}}=2.571$を解いて$\alpha=0.151 \cdots$が得られる。

上記より⑤が正しい。

参考

・【統計検定$2$級対応】統計学入門まとめ
https://www.hello-statisticians.com/stat_basic

【統計の森 独自評価】統計学・数学などの参考書のレビュー 〜チャート式 大学教養 線形代数〜

当記事では「チャート式シリーズ 大学教養 線形代数(数研出版)」のレビューに関して取りまとめを行いました。

・レビュー一覧
https://www.hello-statisticians.com/textbook_review1

レビューまとめ

Bestレビュー

「統計の森」運営レビュー

全体評価: $4.8$
大学の教養レベルの線形代数対応のチャート式であり、「微分積分」と同じシリーズである。分量的に豊富であり、手元に置いておくと良い。

読み進める際の参考事項まとめ

統計検定2級 公式問題集 CBT対応版 解答例まとめ 〜5. 確率分布〜

「統計検定$2$級 公式問題集 CBT対応版」の解答例を取りまとめるにあたって、当記事では「PART.$2$ 分野・項目別 問題・解説」のCategory.$5$「確率分布」の解答例を作成しました。解答例は「統計の森」オリジナルのコンテンツであり、統計検定の公式とは一切関係ないことにご注意ください。

解答例

Q.1

$$
\large
\begin{align}
f(x) &= a \left( 1 – \frac{x}{20} \right) \quad (0 \leq x \leq 20) \\
&= 0 \qquad (\mathrm{Otherwise})
\end{align}
$$

上記の$f(x)$が確率密度関数であるので、$\displaystyle \int_{-\infty}^{\infty} f(x) dx = 1$が成立しなくてはならない。よって、下記のように考えることができる。
$$
\large
\begin{align}
\int_{-\infty}^{\infty} f(x) dx &= \int_{0}^{20} a \left( 1 – \frac{x}{20} \right) dx \\
&= a \left[ x – \frac{x^2}{40} \right]_{0}^{20} \\
&= a \left( 20 – \frac{20^2}{40} \right) \\
&= a (20 – 10) \\
&= 10a = 1 \\
a &= \frac{1}{10}
\end{align}
$$

上記より$\displaystyle a = \frac{1}{10}$の④が正しい。

Q.2

$X \sim \mathcal{N}(2,3^2)$より、$P(-1 < X \geq 4)$は$Z \sim \mathcal{N}(0,1)$である$Z$を用いて下記のように表すことができる。
$$
\large
\begin{align}
P(-1 < X \geq 4) &= P \left( \frac{-1-2}{3} < \frac{X-2}{3} \geq \frac{4-2}{3} \right) \\
&= P \left( -1 < Z \geq \frac{2}{3} \right) \\
&= 1 – 0.1587 – \left( \frac{1}{3} \cdot 0.2546 + \frac{2}{3} \cdot 0.2514 \right) \\
&= 1 – 0.1587 – 0.252 \\
&= 0.589
\end{align}
$$

上記より$0.59$の⑤が正しい。

Q.3

確率密度関数$f(x)$は上記のように図示できる。ここで水道料金は$0 \leq x \leq 10$で$1,000$円、$10 \leq x \leq 15$で$1,120$円、$15 \leq x \leq 20$で$1,280$円であるので、期待値$E[X]$は下記のように計算できる。
$$
\large
\begin{align}
E[X] &= \int_{0}^{10} 1000 f(x) dx + \int_{0}^{10} 1120 f(x) dx + \int_{0}^{10} 1280 f(x) dx \\
&= 1000 \left( \frac{20 \cdot 0.1}{2} – \frac{10 \cdot 0.05}{2} \right) + 1120 \left( \frac{10 \cdot 0.05}{2}-\frac{5 \cdot 0.025}{2} \right) + 1280 \cdot \frac{5 \cdot 0.025}{2} \\
&= 1000 \times \frac{3}{4} + 1120 \times \frac{3}{16} + 1280 \times \frac{1}{16} \\
&= 750 + 70 \times 3 + 80 \\
&= 1040
\end{align}
$$

上記より②が正解である。

・考察
確率密度関数に基づく三角形の面積が$\displaystyle 1:\frac{1}{4}:\frac{1}{16}$であることに着目すると計算しやすい。

Q.4

標本比率$\hat{p}$に関して下記が成立する。
$$
\large
\begin{align}
\hat{p} \sim \mathcal{N} \left( p,\frac{\hat{p}(1-\hat{p})}{n} \right)
\end{align}
$$

よって$Z \sim \mathcal{N}(0,1)$である確率変数$Z$を用いて$P(|\hat{p}-p| \leq 0.1)$は下記のように計算できる。
$$
\large
\begin{align}
P(|\hat{p}-p| \leq 0.1) &= P(-0.1 \leq \hat{p}-p \leq 0.1) \\
&= P \left( -\frac{0.1}{\sqrt{\hat{p}(1-\hat{p})/n}} \leq \frac{\hat{p}-p}{\sqrt{\hat{p}(1-\hat{p})/n}} \leq \frac{0.1}{\sqrt{\hat{p}(1-\hat{p})/n}} \right) \\
&= P \left( -\frac{0.1}{\sqrt{0.54(1-0.54)/100}} \leq Z \leq \frac{0.1}{\sqrt{0.54(1-0.54)/100}} \right) \\
& \simeq P( -2.01 \leq Z \leq 2.01) \\
& \simeq 1 – 2 \times 0.0222 = 0.9556
\end{align}
$$

上記より正解は⑤である。

Q.5

$2$以下の目が出る確率を$p$とおくと、$X \sim \mathrm{Bin}(7,p)$より下記が成立する。
$$
\large
\begin{align}
P(X=x) &= {}_{7} C_{x} p^{x} (1-p)^{7-x} \\
P(X=x+1) &= {}_{7} C_{x} p^{x+1} (1-p)^{6-x}
\end{align}
$$

このとき$\displaystyle \frac{P(X=x+1)}{P(X=x)}$は下記のように計算できる。
$$
\large
\begin{align}
\frac{P(X=x+1)}{P(X=x)} &= \frac{{}_{7} C_{x} p^{x+1} (1-p)^{6-x}}{{}_{7} C_{x} p^{x} (1-p)^{7-x}} \\
&= \frac{7!}{(x+1)!(6-x)!} \times \frac{x!(7-x)!}{7!} \times \frac{p}{1-p} \\
&= \frac{7-x}{x+1} \times \frac{p}{1-p}
\end{align}
$$

上記に$\displaystyle p = \frac{1}{3}$を代入すると下記が得られる。
$$
\large
\begin{align}
\frac{P(X=x+1)}{P(X=x)} &= \frac{7-x}{x+1} \times \frac{p}{1-p} \\
&= \frac{7-x}{x+1} \times \frac{1}{3} \times \frac{3}{2} \\
&= \frac{-x+7}{2x+2}
\end{align}
$$

上記より②が正解である。

Q.6

Ⅰ 右に裾の長い分布では歪度は正の値であり、左に裾が長い分布では歪度は負の値であるので×

Ⅱ 尖度は中心部の尖り具合の指標であるので×

Ⅲ 自由度が大きいほど尖度の絶対値は小さくなり、$n \to \infty$で正規分布に収束するので×

上記より正解は⑤である。

Q.7

$X \sim \mathcal{N}(4000,500^2), Y \sim \mathcal{N}(4000,500^2)$のとき、$X-Y \sim \mathcal{N}(0,2 \cdot 500^2)$が成立する。よって確率$P(X-Y \geq 800)$は下記のように計算できる。
$$
\large
\begin{align}
P(X-Y \geq 800) &= P \left( Z \geq \frac{800}{500 \sqrt{2}} \right) \\
&= P( Z \geq 1.13 \cdots ) \\
&= 0.1292
\end{align}
$$

よって正解は③である。

Q.8

$$
\large
\begin{align}
E[X] &= 2.0, \, E[Y] = 3.0, \, E[XY] = 6.3, \, V[X] = 1.0, \, V[Y] = 1.0 \\
U &= 3X-2, \, V = -2Y-4
\end{align}
$$

上記に基づいて$E[U], E[V], E[UV]$は下記のように計算できる。
$$
\large
\begin{align}
E[U] &= E[3X-2] \\
&= 3E[X]-2 = 4 \\
E[V] &= E[-2Y-4] \\
&= -2E[Y]-4 = -10 \\
E[UV] &= E[(3X-2)(-2Y-4)] \\
&= – 6E[XY] – 12E[X] + 4E[Y] + 8 \\
&= -41.8
\end{align}
$$

よって共分散$\mathrm{Cov}[U,V]$は下記のように計算できる。
$$
\large
\begin{align}
\mathrm{Cov}[U,V] &= E[UV] – E[U]E[V] \\
&= -41.8 – 4 \times (-10) \\
&= -1.8
\end{align}
$$

また、$V[U], V[V]$は下記のように計算できる。
$$
\large
\begin{align}
V[U] &= V[3X-2] \\
&= 3^2 V[X] \\
&= 9 \\
V[V] &= V[-2Y-4] \\
&= (-2)^2 V[Y] \\
&= 4
\end{align}
$$

したがって相関係数$r[U,V]$は下記のように計算できる。
$$
\large
\begin{align}
r[U,V] &= \frac{\mathrm{Cov}[U,V]}{\sqrt{V[U]V[V]}} \\
&= \frac{-1.8}{3 \times 2} \\
&= -0.3
\end{align}
$$

以上より正解は④である。

参考

・【統計検定$2$級対応】統計学入門まとめ
https://www.hello-statisticians.com/stat_basic

2.9.1 同時分布と周辺分布 〜統計検定2級対応・統計学入門まとめ〜

当まとめでは統計検定$2$級の公式テキストの副教材に用いることができるように、統計学入門に関して取り扱います。当記事では「統計検定$2$級対応 統計学基礎」の$2.9.1$節「同時分布と周辺分布」の内容を元に同時分布と周辺分布の定義に関して取りまとめました。
統計検定$2$級のテキストとの対応がわかりやすいように、目次を「統計検定$2$級対応 統計学基礎」と対応させました。学びやすさの観点からあえて目次を対応させましたが、当まとめは「統計の森」オリジナルのコンテンツであり、統計検定の公式とは一切関係ないことにご注意ください。

・統計検定$2$級対応・統計学入門まとめ
https://www.hello-statisticians.com/stat_basic

「同時分布と周辺分布」の概要

概要

前記事までは確率変数は「$1$つのサイコロの出目$X$」のように$1$変数のみを取り扱う場合についてのみ取り扱いましたが、$2$つのサイコロの出目をそれぞれ$X, Y$とおき、$2$変数の確率分布を取り扱うこともあります。

$2$変数の確率分布を同時確率分布といい、どちらかの確率変数に関して和や積分を考えることで消去した場合の確率分布を周辺分布といいます。当記事では以下、同時確率分布や周辺分布に関して詳しく取り扱います。

必要な数学

周辺分布の導出にあたっては$\displaystyle \sum$や「積分」を元に計算されるので、$\displaystyle \sum$の定義や「積分」の概念の理解が必要です。積分は定義のみを取り扱うので、数Ⅱレベルの積分を抑えておけば十分です。

同時分布と周辺分布

離散型

離散型の確率変数$X, Y$に関して同時確率分布(joint probability distribution)を考えるにあたっては、下記のように同時確率関数(joint probability function)の$p(x_i,y_i)$を定義します。
$$
\large
\begin{align}
p(x_i,y_i) = P(X=x_i, Y=y_i)
\end{align}
$$

このとき、確率変数$X$に関する周辺確率関数(marginal probability function)を$p_{x}(x_i)$、確率変数$Y$に関する周辺確率関数を$p_{y}(y_i)$とおくと、それぞれ下記のように定義されます。
$$
\large
\begin{align}
p_{x}(x_i) &= \sum_{j} p(x_i,y_j) = P(X=x_i) \\
p_{y}(y_j) &= \sum_{i} p(x_i,y_j) = P(Y=y_j)
\end{align}
$$

連続型

確率変数の$X, Y$が連続値をとる場合、同時確率分布を考えるにあたっては、下記のように同時確率密度関数(joint probability density function)の$f(x,y)$を定義します。
$$
\large
\begin{align}
P(x \leq X \leq x + \Delta x, y \leq Y \leq y + \Delta y) \simeq f(x,y) \Delta x \Delta y
\end{align}
$$

上記のように$f(x,y)$を考えると、周辺確率密度関数(marginal probability density function)の$f(x), f(y)$はそれぞれ下記のように定義されます。
$$
\large
\begin{align}
f(x) &= \int_{-\infty}^{\infty} f(x,y) dy \\
f(y) &= \int_{-\infty}^{\infty} f(x,y) dx
\end{align}
$$

また、確率密度関数は確率分布に対応することから$f(x,y)$に関して下記が成立する必要があります。
$$
\large
\begin{align}
0 \leq & f(x,y) \leq 1 \\
\int_{-\infty}^{\infty} \int_{-\infty}^{\infty} & f(x,y) dx dy = 1
\end{align}
$$