当記事は基礎統計学Ⅰ 統計学入門(東京大学出版会)」の読解サポートにあたってChapter.9の標本分布(Sampling Distribution)の章末問題の解説について行います。
※ 基本的には書籍の購入者向けの解説なので、まだ入手されていない方は下記より入手をご検討いただけたらと思います。また、解説はあくまでサイト運営者が独自に作成したものであり、書籍の公式ページではないことにご注意ください。(そのため著者の意図とは異なる解説となる可能性はあります)
https://www.amazon.co.jp/dp/4130420658
Contents
章末の演習問題について
問題9.1の解答例
$$
\begin{align}
E[\bar{X}] = \mu
\end{align}
$$
上記のように標本平均(sample mean)は母平均の近似的な値と考えることができる。
$$
\begin{align}
& s^2 = \frac{1}{n-1}((X_1-\bar{X})^2 + (X_2-\bar{X})^2) + … + (X_n-\bar{X})^2 \\
& E[s^2] = \sigma^2
\end{align}
$$
また標本分散は上記のように設定すると母分散との間に不偏性を満たし、これを不偏分散という。
問題9.2の解答例
・標本平均
$$
\begin{align}
\bar{X} &= \frac{1}{6}(1.22+1.24+1.25+1.19+1.17+1.18) \\
&= 1.2083… \\
& \simeq 1.21
\end{align}
$$
・標本分散
$$
\begin{align}
s^2 &= \frac{1}{6-1}((1.22-1.208)^2+(1.24-1.208)^2+(1.25-1.208)^2+(1.19-1.208)^2+(1.17-1.208)^2+(1.18-1.208)^2) \\
&= 0.001096…
\end{align}
$$
問題9.3の解答例
問題9.4の解答例
$$
\begin{align}
s^2 &= \frac{1}{n-1} \sum_{i=1}^{n}(X_i-\bar{X})^2 \\
&= \frac{1}{n-1} \sum_{i=1}^{n}((X_i-\mu)-(\bar{X}-\mu))^2 \\
&= \frac{1}{n-1} \left( \sum_{i=1}^{n}(X_i-\mu)^2 + n(\bar{X}-\mu)^2 – 2(\bar{X}-\mu)\sum_{i=1}^{n}(X_i-\mu) \right) \\
&= \frac{1}{n-1} \left( \sum_{i=1}^{n}(X_i-\mu)^2 + n(\bar{X}-\mu)^2 – 2n(\bar{X}-\mu))^2 \right) \\
&= \frac{1}{n-1} \left( \sum_{i=1}^{n}(X_i-\mu)^2 – n(\bar{X}-\mu)^2 \right)
\end{align}
$$
$s^2$は上記のように計算できる。この期待値を計算する。
$$
\begin{align}
E[s^2] &= \frac{1}{n-1} E \left[ \sum_{i=1}^{n} (X_i-\mu)^2 – n(\bar{X}-\mu)^2 \right] \\
&= \frac{1}{n-1} \left( \sum_{i=1}^{n}E([(X_i-\mu)^2] – nE[(\bar{X}-\mu)^2] \right) \\
&= \frac{1}{n-1} \left( n\sigma^2 – n\frac{\sigma^2}{n} \right) \\
&= \frac{(n-1)\sigma^2}{n-1} \\
&= \sigma^2
\end{align}
$$
上記より、$E[s^2]=\sigma^2$を示すことができる。
問題9.5の解答例
$n=3$,$n=5$のそれぞれのケースにおいて正しく伝達される確率を$p$とおいた時に多数決が正しい確率は下記のように表せる。
・$n=3$の場合
$$
\begin{align}
{}_3 C_3 p^3 + {}_3 C_2 p^2(1-p)^1
\end{align}
$$
・$n=5$の場合
$$
\begin{align}
{}_5 C_5 p^5 + {}_5 C_4 p^4(1-p)^1 + {}_5 C_3 p^3(1-p)^2
\end{align}
$$
上記に$p=0.9$を代入し、求める確率は$n=3$の時$0.972$、$n=5$の時$0.99144$となる。
問題9.6の解答例
$3$時間の来客数は$\lambda=4.5$のポアソン分布に従うことにより、来客数を$x$とした時の来客数を表す確率$P(x|\lambda=4.5)$は下記のようになる。
$$
\begin{align}
P(x|\lambda=4.5) = \frac{4.5^x e^{-4.5}}{x!}
\end{align}
$$
来客数が$5$以上になる確率は$4$以下にならない確率と一致するので下記のように表せる。
$$
\begin{align}
1-&(P(x=0|\lambda=4.5)+P(x=1|\lambda=4.5)+P(x=2|\lambda=4.5)+P(x=3|\lambda=4.5)+P(x=4|\lambda=4.5)) \\
&= 1 – \left(\frac{4.5^0 e^{-4.5}}{0!} + \frac{4.5^1 e^{-4.5}}{1!} + \frac{4.5^2 e^{-4.5}}{2!} + \frac{4.5^3 e^{-4.5}}{3!} + \frac{4.5^4 e^{-4.5}}{4!}\right) \\
&= 1 – \left(\frac{4.5^0}{0!} + \frac{4.5^1}{1!} + \frac{4.5^2}{2!} + \frac{4.5^3}{3!} + \frac{4.5^4}{4!}\right)e^{-4.5} \\
&= 1 – \frac{(24\times4.5^0 + 24\times4.5^1 + 12\times4.5^2 + 4\times4.5^3 + 4.5^4) e^{-4.5}}{24} \\
&= 0.4678…
\end{align}
$$
問題9.7の解答例
i)
下記を実行することで結果を計算することができる。
import math
lambs = [9.7, 4.0, 5.7, 7.8]
probs = [0, 0, 0, 0]
for i in range(4):
for j in range(10):
probs[i] += (lambs[i]**j * math.e**(-lambs[i]))/math.factorial(j)
print("Hokkaido: {}".format(probs[0]))
print("Tokyo: {}".format(probs[1]))
print("Osaka: {}".format(probs[2]))
print("Fukuoka: {}".format(probs[3]))
・実行結果
> print("Hokkaido: {}".format(probs[0]))
Hokkaido: 0.49597884175
> print("Tokyo: {}".format(probs[1]))
Tokyo: 0.991867757203
> print("Osaka: {}".format(probs[2]))
Osaka: 0.935182528029
> print("Fukuoka: {}".format(probs[3]))
Fukuoka: 0.74110891657
ⅱ)
下記を実行することで結果を計算することができる。
import math
import numpy as np
lambs = np.array([526.6, 508.7, 703.8, 867.2])/365.
probs = [0, 0, 0, 0]
for i in range(4):
for j in range(5):
probs[i] += (lambs[i]**j * math.e**(-lambs[i]))/math.factorial(j)
print("Hokkaido: {}".format(probs[0]))
print("Tokyo: {}".format(probs[1]))
print("Osaka: {}".format(probs[2]))
print("Fukuoka: {}".format(probs[3]))
・実行結果
> print("Hokkaido: {}".format(probs[0]))
Hokkaido: 0.983992018679
> print("Tokyo: {}".format(probs[1]))
Tokyo: 0.985993977993
> print("Osaka: {}".format(probs[2]))
Osaka: 0.953590963991
> print("Fukuoka: {}".format(probs[3]))
Fukuoka: 0.907130585883
問題9.8の解答例
問題9.9の解答例
まとめ
Ch.9で取り扱った標本分布は標本平均などの分布を考えるトピックです。推測統計はなかなかややこしいですが、演習を数取り組むことでイメージをつかむのが良いと思います。