Ch.1 「統計学とデータ」の章末問題の解答例 〜基礎統計学Ⅱ 人文・社会科学の統計学〜

当記事は「基礎統計学Ⅱ 人文・社会科学の統計学(東京大学出版会)」の読解サポートにあたってChapter.1の「統計学とデータ」の章末問題の解説について行います。
※ 基本的には書籍の購入者向けの解説なので、まだ入手されていない方は下記より入手をご検討ください。また、解説はあくまでサイト運営者が独自に作成したものであり、書籍の公式ページではないことにご注意ください。(そのため著者の意図とは異なる解説となる可能性はあります)

・解答まとめ
https://www.hello-statisticians.com/answer_textbook_stat_basic_1-3#green

章末の演習問題について

問題1.1の解答例

問題1.2の解答例

該当グループ以外か、ランダムサンプリングによって標本を作成し、仮説が正しいかを検証する必要がある。

問題1.3の解答例

中庸な回答が選ばれやすいことや、直前に確認した概況などによって回答が異なる場合があることに注意が必要である。また、賛否を調査する必要があるかも予め検討する必要がある。

問題1.4の解答例

問題1.5の解答例

i)
それぞれ下記のように計算できる。
a)
$$
\large
\begin{align}
\frac{{}_7 C_3}{{}_{10} C_3} &= \frac{7 \cdot 6 \cdot 5}{3 \cdot 2 \cdot 1} \times \frac{3 \cdot 2 \cdot 1}{10 \cdot 9 \cdot 8} \\
&= \frac{7}{24}
\end{align}
$$

b)
$$
\large
\begin{align}
\frac{{}_7 C_2 \times {}_3 C_1}{{}_{10} C_3} &= \frac{7 \cdot 6}{2 \cdot 1} \times \frac{3}{1} \times \frac{3 \cdot 2 \cdot 1}{10 \cdot 9 \cdot 8} \\
&= \frac{21}{40}
\end{align}
$$

c)
$$
\large
\begin{align}
\frac{{}_7 C_1 \times {}_3 C_2}{{}_{10} C_3} &= \frac{7}{1} \times \frac{3 \cdot 2}{2 \cdot 1} \times \frac{3 \cdot 2 \cdot 1}{10 \cdot 9 \cdot 8} \\
&= \frac{7}{40}
\end{align}
$$

d)
$$
\large
\begin{align}
\frac{{}_3 C_3}{{}_{10} C_3} &= \frac{3 \cdot 2 \cdot 1}{10 \cdot 9 \cdot 8} \\
&= \frac{7}{40}
\end{align}
$$

ⅱ)
期待値は下記のように計算できる。
$$
\large
\begin{align}
1 \times \frac{21}{40} + 2 \times \frac{7}{40} + 3 \times \frac{1}{120} &= \frac{21 + 14 + 1}{40} \\
&= \frac{36}{40} = \frac{9}{10}
\end{align}
$$

問題1.6の解答例

図$1.9$の議論より、偏りのないコインを$100$回投げる場合、期待値$100 \times 0.5 = 50$、標準偏差$\sqrt{100 \times 0.5 \times (1-0.5)} = 5$が計算される。

これより標準化を行うと$z=3$が得られるが、これに対応する$P$値は$0.00135$であり、$1,000$回に$1$〜$2$回ほど起こる希少な事象であることが確認できる。

問題1.7の解答例

i)
標本平均$\bar{x}$と不偏標本分散$s^2$は下記を実行することで得られる。

import numpy as np

x = np.array([24.2, 25.3, 26.2, 25.7, 24.4, 25.1, 25.6])
mean_x = np.mean(x)
s2 = np.sum((x-mean_x)**2)/(x.shape[0]-1)

print("Mean x: {:.2f}".format(mean_x))
print("Variance: {:.2f}".format(s2))

・実行結果

> print("Mean x: {:.2f}".format(mean_x))
Mean x: 25.21
> print("Variance: {:.2f}".format(s2))
Variance: 0.51

ⅱ)
$t$統計量は下記を実行することで得られる。

mu = 25. 

t = (mean_x-mu)/(np.sqrt(s2/x.shape[0]))

print("t_statistic: {:.3f}".format(t))

・実行結果

> print("t_statistic: {:.3f}".format(t))
t_statistic: 0.793

ⅲ)
下記を実行することで有意確率を計算することができる。

from scipy import stats

alpha = 1 - stats.t.cdf(t, x.shape[0]-1)

print("Significance probability: {:.2f}".format(alpha))

・実行結果

> print("Significance probability: {:.2f}".format(alpha))
Significance probability: 0.23

iv)
ⅲ)より$P$値が$0.05$より大きいので帰無仮説$H_0: \mu=25$は棄却されない。

問題1.8の解答例

i)
下記を実行することで期待件数や$\chi^2$値を計算することができる。

import numpy as np

x = np.array([435., 293., 106.])
y = np.array([41., 23., 15.])

p = x/np.sum(x)
y_expected = np.sum(y)*p

chi2 = np.sum((y-y_expected)**2/y_expected)

print("Expected y: ({:.2f}, {:.2f}, {:.2f})".format(y_expected[0], y_expected[1], y_expected[2]))
print("chi^2: {:.2f}".format(chi2))

・実行件数

> print("Expected y: ({:.2f}, {:.2f}, {:.2f})".format(y_expected[0], y_expected[1], y_expected[2]))
Expected y: (41.21, 27.75, 10.04)
> print("chi^2: {:.2f}".format(chi2))
chi^2: 3.26

ⅱ)
i)で計算した$\chi^2$値の有意確率は、scipy.stats.chi2.cdfを用いて下記のように計算できる。

from scipy import stats

alpha = 1 - stats.chi2.cdf(chi2,x.shape[0]-1)

print("Significance probability: {:.5f}".format(alpha))

・実行結果

> print("Significance probability: {:.5f}".format(alpha))
Significance probability: 0.19546

ⅲ)
帰無仮説$H_0$に「xの確率に沿ってyが生じる」をおくと、$P$値が$0.05$より大きいことより、帰無仮説は棄却されないことがわかる。

まとめ