「統計学実践ワークブック」 演習問題etc Ch.10 「検定の基礎と検定法の導出」

当記事は「統計学実践ワークブック(学術図書出版社)」の読解サポートにあたってChapter.$10$の「検定の基礎と検定法の導出」に関して演習問題を中心に解説を行います。第$1$種の過誤・有意水準や第$2$種の過誤・検出力など、抑えておくと良いトピックが多いので演習を通して習得すると良いと思います。

本章のまとめ

有意水準

下記で詳しく取り扱った。
有意水準$\alpha$と検出力$1-\beta$の値に基づくサンプルサイズ設計: 有意水準$\alpha$

検出力

下記で詳しく取り扱った。
有意水準$\alpha$と検出力$1-\beta$の値に基づくサンプルサイズ設計: 検出力$1-\beta$

サンプルサイズ設計

下記で詳しく取り扱った。
有意水準$\alpha$と検出力$1-\beta$の値に基づくサンプルサイズ設計: サンプルサイズ設計

問10.1

版によっては解答に誤植があるので、正確には正誤表の解答を確認すると良いです。

$1)$
検定に用いる統計量を$\hat{p}$とおくとき、有意水準$\alpha$と検出力$1-\beta$に関連して下記のような等式が成立する。
$$
\large
\begin{align}
z_{\alpha/2=0.025} &= \frac{\hat{p}-p_0}{\sqrt{p_0(1-p_0)/n}} \\
z_{\alpha/2=0.025} \sqrt{\frac{p_0(1-p_0)}{n}} &= \hat{p}-p_0 \quad (1) \\
z_{1-\beta} = -z_{\beta} &= \frac{\hat{p}-p_1}{\sqrt{p_1(1-p_1)/n}} \\
z_{\beta} &= \frac{p_1-\hat{p}}{\sqrt{p_1(1-p_1)/n}} \\
z_{\beta} \sqrt{\frac{p_1(1-p_1)}{n}} &= p_1-\hat{p} \quad (2)
\end{align}
$$

ここで$(1)+(2)$より下記が成立する。
$$
\large
\begin{align}
z_{\alpha/2=0.025}\sqrt{\frac{p_0(1-p_0)}{n}} + z_{\beta}\sqrt{\frac{p_1(1-p_1)}{n}} &= (\cancel{\hat{p}}-p_0) + (p_1-\cancel{\hat{p}}) \\
&= p_1 – p_0 \\
1.96 \times \sqrt{\frac{0.45 \cdot 0.55}{600}} + z_{\beta}\sqrt{\frac{0.5^2}{600}} &= 0.05
\end{align}
$$

上記を元に下記を実行することで検出力を計算することができる。

import numpy as np
from scipy import stats

alpha = 0.05
p_0, p_1 = 0.45, 0.5 
n = 600.

z_beta = (p_1 - p_0 - 1.96*np.sqrt(p_0*(1-p_0)/n))/(np.sqrt(p_1**2/n))
power = 1.-stats.norm.cdf(-z_beta)

print("power: {:.4f}".format(power))

・実行結果

> print("power: {:.4f}".format(power))
power: 0.6912

$2)$
$$
\large
\begin{align}
z_{\alpha/2=0.025}\sqrt{\frac{p_0(1-p_0)}{n}} + z_{\beta=0.2}\sqrt{\frac{p_1(1-p_1)}{n}} &= (\cancel{\hat{p}}-p_0) + (p_1-\cancel{\hat{p}}) \\
&= p_1 – p_0 \\
1.96 \times \sqrt{\frac{0.45 \cdot 0.55}{n}} + 0.84 \times \sqrt{\frac{0.5^2}{n}} &= 0.05
\end{align}
$$


下記を実行することでサンプルサイズを計算することができる。

import numpy as np
from scipy import stats

alpha = 0.05
beta = 0.2
p_0, p_1 = 0.45, 0.5

z_alpha, z_beta = stats.norm.ppf(1.-alpha/2), stats.norm.ppf(1.-beta)
n = (z_alpha*np.sqrt(p_0*(1.-p_0)) + z_beta*np.sqrt(p_1*(1.-p_1)) )**2 / (p_1-p_0)**2

print("n: {:.0f}".format(n))

・実行結果

> print("n: {:.0f}".format(n))
n: 779

問10.2

$1)$
$$
\large
\begin{align}
\frac{T^2}{\chi^2_{\alpha=0.025}(n-1)} \leq \sigma^2 \leq \frac{T^2}{\chi^2_{\alpha=0.975}(n-1)}
\end{align}
$$

サンプル数を$n$、$\chi^2$分布の上側確率を$\chi^2_{\alpha}$のようにおくとき、$95$%区間は上記のように計算できる。これに基づいて下記を実行することで、$95$%区間を得ることができる。

import numpy as np
from scipy import stats

T2 = 100.
n = 16

lower_sigma2 = T2/stats.chi2.ppf(1.-0.025,n-1)
upper_sigma2 = T2/stats.chi2.ppf(1.-0.975,n-1)

print("Estimated 95% Interval: [{:.2f}, {:.2f}]".format(lower_sigma2,upper_sigma2))

・実行結果

> print("Estimated 95% Interval: [{:.2f}, {:.2f}]".format(lower_sigma2,upper_sigma2))
Estimated 95% Interval: [3.64, 15.97]

$2)$
自由度は$15$で$F(15,15)$に従う。また、上側$5$%点$F_{\alpha=0.05}(15,15)=2.403$であることから、帰無仮説は棄却できる。

問10.3

$1)$
ア: $(1-0.3)^5 \simeq 0.17$
イ: ${}_{5} C_{1} \times 0.3^{1} (1-0.3)^{4} \simeq 0.36$
ウ: ${}_{5} C_{2} \times 0.3^{2} (1-0.3)^{3} \simeq 0.31$

$2)$
生産者危険: $0.07+0.01=0.08$
消費者危険: $0.33+0.41=0.74$

参考

・準$1$級関連まとめ
https://www.hello-statisticians.com/toukeikentei-semi1

「「統計学実践ワークブック」 演習問題etc Ch.10 「検定の基礎と検定法の導出」」への2件のフィードバック

コメントは受け付けていません。