Ch.8 「大数の法則と中心極限定理」の章末問題の解答例 〜基礎統計学Ⅰ (東京大学出版会)〜

当記事は「基礎統計学Ⅰ 統計学入門(東京大学出版会)」の読解サポートにあたってChapter.8の「大数の法則と中心極限定理」の章末問題の解説について行います。
※ 基本的には書籍の購入者向けの解説なので、まだ入手されていない方は下記より入手をご検討いただけたらと思います。また、解説はあくまでサイト運営者が独自に作成したものであり、書籍の公式ページではないことにご注意ください。(そのため著者の意図とは異なる解説となる可能性はあります)
https://www.amazon.co.jp/dp/4130420658

章末の演習問題について

問題8.1の解答例

$$
\begin{align}
& P(L \leq X_1+X_2+…+X_n \leq U) = 0.05 \\
& P\left(\frac{L-np}{\sqrt{np(1-p)}} \leq \frac{X_1+X_2+…+X_n-np}{\sqrt{np(1-p)}} \leq \frac{U-np}{\sqrt{np(1-p)}}\right) = 0.05
\end{align}
$$
問題文の式を上記のように変形する。このとき、$\displaystyle z = \frac{X_1+X_2+…+X_n-np}{\sqrt{np(1-p)}}$は標準正規分布$N(0,1)$に従う。よって、下記が成立する。
$$
\begin{align}
\frac{L-np}{\sqrt{np(1-p)}} &= z_{\alpha=0.025} = -1.96 \\
\frac{U-np}{\sqrt{np(1-p)}} &= z_{\alpha=0.975} = 1.96
\end{align}
$$
上記の式を$L$と$U$について整理すると下記のようになる。
$$
\begin{align}
L = np – 1.96\sqrt{np(1-p)} \\
U = np + 1.96\sqrt{np(1-p)}
\end{align}
$$
このとき上記に$n=700$、$p=0.4$を代入する。
$$
\begin{align}
L &= 700\times0.4 – 1.96\sqrt{700\times0.4(1-0.4)} \\
&= 280 – 1.96\sqrt{700\times0.24} \\
&= 254.595… \\
U &= 700\times0.4 + 1.96\sqrt{700\times0.4(1-0.4)} \\
&= 280 + 1.96\sqrt{700\times0.24} \\
&= 305.404…
\end{align}
$$
求める$L$と$U$は上記のようになる。

また、開票結果によって$X_1+X_2+…+X_n$と$n$がわかるとした際に、$\displaystyle z = \frac{X_1+X_2+…+X_n-np}{\sqrt{np(1-p)}}$が標準正規分布$N(0,1)$に従うことに基づいて母集団の確率$p$の区間推定を行うことで、全体の得票率の95%信頼区間などを求めることができる。これを選挙の議席予測などに用いることができる。

問題8.2の解答例

i)
$P(X_i=1)=p$、$P(X_i=-1)=1-p=q$より、期待値$E[X_i]$と分散$V[X_i]$は下記のように計算できる。
$$
\begin{align}
E[X_i] &= 1 \times P(X_i=1) + (-1) \times P(X_i=-1) \\
&= 1 \times p + (-1) \times (1-p) \\
&= p – (1-p) \\
&= 2p-1 \\
V[X_i] &= (1-E[X_i])^2 \times P(X_i=1) + (-1-E[X_i])^2 \times P(X_i=-1) \\
&= (1-(2p-1))^2 \times P(X_i=1) + (-1-(2p-1))^2 \times P(X_i=-1) \\
&= (-2p+2)^2 \times p + (-2p)^2 \times (1-p) \\
&= 4(1-p)^2p + 4p^2(1-p) \\
&= 4p(1-p)(p+(1-p)) \\
&= 4p(1-p)
\end{align}
$$
$n$が大きいときは中心極限定理により、$N(nE[X_i], nV[X_i])=N(n(2p-1), 4np(1-p))$に従う。(中心極限定理を取り扱うにあたっては総和を考えるときは$N(n\mu,n\sigma^2)$、平均を考えるときは$\displaystyle N\left(\mu,\frac{\sigma^2}{n}\right)$に従うと考えることができる。)

ⅱ)
$S_{10}$は正規分布$N(10 \times (2\times0.4-1), 4 \times 10 \times 0.4 \times (1-0.4)) = N(-2,9.6)$に従う。
$S_{20}$は正規分布$N(10 \times (2\times0.4-1), 4 \times 10 \times 0.4 \times (1-0.4)) = N(-4,19.2)$に従う。

問題8.3の解答例

打数$1$回あたりの安打数の期待値を$E[X_i]$、分散を$V[X_i]$とすると、それぞれ下記のように計算できる。
$$
\begin{align}
E[X_i] &= 1 \times P(X_i=1) + 0 \times P(X_i=0) \\
&= 1 \times p + 0 \times (1-p) \\
&= p \\
V[X_i] &= (1-E[X_i])^2 \times P(X_i=1) + (0-E[X_i])^2 \times P(X_i=0) \\
&= (1-p)^2 \times p + (0-p)^2 \times (1-p) \\
&= p(1-p)^2 + (-p)^2(1-p) \\
&= p(1-p)^2 + p^2(1-p) \\
&= p(1-p)(1-p+p) \\
&= p(1-p)
\end{align}
$$

$450$打数時における安打数を$\displaystyle S_n=\sum_{i=1}^{450}X_i$とすると、中心極限定理により、$S_n$は正規分布$N(np,np(1-p))$に従う。問題文より、$n=450$、$p=0.28$を代入すると、$N(np,np(1-p))$は下記のように計算できる。
$$
\begin{align}
N(np,np(1-p)) &= N(450 \times 0.28, 450 \times 0.28 \times (1-0.28)) \\
&= N(126, 90.72)
\end{align}
$$

このとき$3$割バッターになるためには、$0.3 \times 450 = 135$安打以上打つ必要があるため($S_n \geq 135$)、求める確率は下記のようになる。
$$
\begin{align}
P(S_n \geq 135) &= P(S_n-126 \geq 135-126) \\
&= P\left(\frac{S_n-126}{\sqrt{90.72}} \geq \frac{135-126}{\sqrt{90.72}}\right) \\
&= P\left(\frac{S_n-np}{\sigma} \geq 0.9449…\right) \\
&= 0.17361
\end{align}
$$

また、確率$0.2$で$3$割バッターになるには$\displaystyle P\left(\frac{S_n-np}{\sqrt{p(1-p)}} \geq \frac{0.3n-np}{\sqrt{p(1-p)}}\right)=0.2$を満たす$n$を考えれば良い(このとき$p=0.28$であると考える)。正規分布の分布表より、$\displaystyle \frac{0.3n-0.28n}{\sqrt{p(1-p)}} = z_{\alpha=0.8}=0.84$なので、このときの$n$は以下のように求めることができる。
$$
\begin{align}
\frac{0.3n-0.28n}{\sqrt{np(1-p)}} &= 0.84 \\
\frac{0.3n-0.28n}{\sqrt{n}} &= 0.84\sqrt{p(1-p)} \\
0.02\sqrt{n} &= 0.84\sqrt{p(1-p)} \\
n &= 0.84^2 \times 50^2 \times 0.28 \times 0.72 \\
&= 355.6224
\end{align}
$$

よって、$355$打数ほどである必要がある。
(書籍の解答だと$n<339$とされていますが、途中計算が定かでなく再現できなかったのでこちらを記載することといたしました。)

まとめ

中心極限定理関連の問題は基本的な統計学の範囲ではやや難しいので、何度か繰り返して慣れておくと良いのではと思います。