10章「仮説検定の方法(2)」の練習問題解答例〜例題で学ぶ初歩からの統計学[第2版]〜

当記事は「白砂, 例題で学ぶ初歩からの統計学 第2版 (日本評論社)」の読解サポートにあたって10章「仮説検定の方法(2):母比率・母平均の差・母比率の差の検定」の練習問題を解説します。
基本的には書籍の購入者向けの解説なので、まだ入手されていない方は下記より入手をご検討ください。また、解説はあくまでサイト運営者が独自に作成したものであり、書籍の公式ページではないことにご注意ください。(そのため著者の意図とは異なる解説となる可能性はあります)

執筆:@kakusan96

演習問題 解答例

10-1.(母比率の検定[右片側検定])

帰無仮説を本日の製造工程において不良率が従来と変わらなかった($p=0.05$)、対立仮説を本日の製造工程において不良率が上昇した($p >0.05$)として、有意水準の1%の右片側検定を行う。

問題文より、

  • 標本数$n=1900$
  • 母比率$p=0.05$
  • 標本比率$\hat{p}=0.07$

であり、帰無仮説が正しいとき標本比率$\hat{p}$の分布は正規分布N(p, $\frac{p(1-p)}{n}$)に従う。
標本平均の分布が正規分布に従うためz検定を行う。

検定統計量$z=\frac{\hat{p}-p}{\sqrt{\frac{p(1-p)}{n}}}$を計算すると

$$
\begin{align}
z&=\frac{0.07-0.05}{\sqrt{\frac{0.05(1-0.05)}{1900}}} \\
z&=\frac{0.02}{0.005} \\
z&=4
\end{align}
$$

$z>2.326$より有意水準の1%の右方側検定において帰無仮説は棄却され、対立仮説が採択されるため、本日の製造工程において、不良率が上昇したといえる。

10-2.(母比率の検定[右片側検定])

帰無仮説を候補者Cの得票率は$50%$である($p=0.5$)、対立仮説を候補者Cの得票率は$50%$より大きい($p >0.5$)として、有意水準の$1%$の右片側検定を行う。

問題文より、

  • 標本数n=1600
  • 母比率$p=0.5$
  • 標本比率$\hat{p}=0.54$

であり、帰無仮説が正しいとき標本比率$\hat{p}$の分布は正規分布$N(p, \frac{p(1-p)}{n})$に従う。標本平均の分布が正規分布に従うためz検定を行う。

検定統計量$z=\frac{\hat{p}-p}{\sqrt{\frac{p(1-p)}{n}}}$を計算すると

$$
\begin{align}
z&=\frac{0.54-0.5}{\sqrt{\frac{0.5(1-0.5)}{1600}}} \\
z&=\frac{0.02}{0.005} \\
z&=3.2
\end{align}
$$

$z>2.326$より有意水準の$1%$の右片側検定において帰無仮説は棄却され、対立仮説が採択されるため、候補者Cは当選確実といえる。

10-3.(母比率の検定[右片側検定])

帰無仮説を商品の知名度は、テレビCMの増加によって従来と変わらなかった($p=0.18$)、対立仮説を商品の知名度は、テレビCMの増加によって従来より向上した($p >0.18$)として、有意水準の$5%$の右片側検定を行う。

問題文より

  • 標本数n=4100
  • 母比率$p=0.18$
  • 標本比率$\hat{p}=0.2$

であり、帰無仮説が正しいとき標本比率$\hat{p}$の分布は正規分布$N(p, \frac{p(1-p)}{n})$に従う。標本平均の分布が正規分布に従うためz検定を行う。

検定統計量$z=\frac{\hat{p}-p}{\sqrt{\frac{p(1-p)}{n}}}$を計算すると

$$
\begin{align}
z&=\frac{0.2-0.18}{\sqrt{\frac{0.18(1-0.18)}{4100}}} \\
z&=\frac{0.02}{0.006} \\
z&=3.333…
\end{align}
$$

$z>1.645$より有意水準の$5%$の右片側検定において帰無仮説は棄却され、対立仮説が採択されるため、この商品の知名度は、テレビCMの増加によって従来より向上したといえる。

10-4.(母比率の検定[左片側検定])

帰無仮説をA市の50代で高血圧の人の割合は、県内の割合と同じである($p=0.24$)、対立仮説をA市の50代で高血圧の人の割合は、県内の割合より小さい($p <0.24$)として、有意水準の$5%$の左片側検定を行う。

問題文より

  • 標本数n=2850
  • 母比率$p=0.24$
  • 標本比率$\hat{p}=0.22$

であり、帰無仮説が正しいとき標本比率$\hat{p}$の分布は正規分布$N(p, \frac{p(1-p)}{n})$に従う。標本平均の分布が正規分布に従うためz検定を行う。

検定統計量$z=\frac{\hat{p}-p}{\sqrt{\frac{p(1-p)}{n}}}$を計算すると

$$
\begin{align}
z&=\frac{0.22-0.24}{\sqrt{\frac{0.24(1-0.24)}{2850}}} \\
z&=\frac{-0.02}{0.008} \\
z&=-2.5
\end{align}
$$

$z<-1.645$より有意水準の$5%$の右片側検定において帰無仮説は棄却され、対立仮説が採択されるため、A市の50代で高血圧の人の割合は、県内の割合より小さいといえる。

10-5.(母平均の差の検定[両側検定])

帰無仮説をA国とB国の工場で製造されたタイヤの平均寿命に差がない($\mu_1=\mu_2$)、対立仮説をA国とB国の工場で製造されたタイヤの平均寿命に差がある($\mu_1\neq\mu_2$)として、有意水準の$1%$の両側検定を行う。
問題文より、

  • 標本数 $n_1=400$
  • 標本数 $n_2=400$
  • 標本平均 $\bar{X_1}=27500$
  • 標本平均 $\bar{X_2}=26800$
  • 標本標準偏差 $s_1=2400$
  • 標本標準偏差 $s_2=3200$

であり、帰無仮説が正しいとき標本平均の差$\mu_1-\mu_2$の分布は正規分布$N(\mu_1-\mu_2, \frac{s_1^2}{n_1}+\frac{s_2^2}{n_2})$に従う。標本平均の分布が正規分布に従うためz検定を行う。

標本平均が同じだとすると$\mu_1=\mu_2$であり、検定統計量

$z=\frac{(\bar{X_1}-\bar{X_2})-(\mu_1-\mu_2)}{\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}}=\frac{\bar{X_1}-\bar{X_2}}{\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}}$

を計算すると

$$
\begin{align}
z &=\frac{27500-26800}{\sqrt{\frac{2400^2}{400}+\frac{3200^2}{400}}} \\
z &=\frac{700}{200}\\
z &=3.5
\end{align}
$$

今回は両側検定であるため$z_{\frac{0.01}{2}}=\pm 2.576$より、有意水準$5%$の両側検定における臨界値は$z=\pm 2.576$である。
$z>2.576$より有意水準$5%$の両側検定において帰無仮説は棄却され、対立仮説が採択されるため、A国とB国の工場で製造されたタイヤの平均寿命に差があるといえる。

10-6.(母平均の差の検定[右片側検定])

帰無仮説を前回と今回の試験結果に差がない($\mu_1=\mu_2$)、対立仮説を前回よりも今回の試験結果の方が良い($\mu_1<\mu_2$)として、有意水準の$1%$の右片側検定を行う。

問題文より、

  • 標本数$n_1=625$
  • 標本数$n_2=625$
  • 標本平均$\bar{X_1}=64.1$
  • 標本平均$\bar{X_2}=62.4$
  • 標本標準偏差$s_1=9.0$
  • 標本標準偏差$s_2=12.0$

であり、帰無仮説が正しいとき標本平均の差$\mu_1-\mu_2$の分布は正規分布$N(\mu_1-\mu_2, \frac{s_1^2}{n_1}+\frac{s_2^2}{n_2})$に従う。標本平均の分布が正規分布に従うためz検定を行う。

標本平均が同じだとすると$\mu_1=\mu_2$であり、検定統計量

$$z=\frac{(\bar{X_1}-\bar{X_2})-(\mu_1-\mu_2)}{\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}}=\frac{\bar{X_1}-\bar{X_2}}{\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}}$$

を計算すると

$$
\begin{align}
z&=\frac{64.1-62.4}{\sqrt{\frac{9.0^2}{625}+\frac{12.0^2}{625}}} \\
z&=\frac{1.7}{0.6} \\
z&=2.833
\end{align}
$$

$z>2.326$より有意水準の$1%$の右片側検定において帰無仮説は棄却され、対立仮説が採択されるため、前回よりも今回の試験結果の方が良いといえる。

10-7.(母比率の差の検定[両側検定])

帰無仮説をカップ麺に対する評価は関東と関西で差がない($p_1=p_2$)、対立仮説をカップ麺に対する評価は関東と関西で差がある($p_1\neq p_2$)として、有意水準$5%$の両側検定を行う。

問題文より、

  • 関東の試食における標本数$n_1=800$
  • 関西の試食における標本数$n_2=800$
  • 関東の試食にて「おいしい」と答えた標本比率$\hat{p_1}=0.67$
  • 関西の試食にて「おいしい」と答えた標本比率$\hat{p_2}=0.61$

帰無仮説が正しいとき標本比率の差$\hat{p_1}-\hat{p_2}$の分布は正規分布$N(p_1-p_2, \frac{p_1(1-p_1)}{n_1}+\frac{p_2(1-p_2)}{n_2})$に従う。

二つの母比率に差がないとき、$p_1=p_2$であり、$p_1=p_2=p$とすると、$p_1-p_2=0$, $\frac{p_1(1-p_1)}{n_1}+\frac{p_2(1-p_2)}{n_2}=\frac{p(1-p)}{n_1}+\frac{p(1-p)}{n_2}$である。

従って、帰無仮説が正しいとき標本比率の差$\hat{p_1}-\hat{p_2}$の分布は正規分布N(0, $p(1-p)(\frac{1}{n_1}+\frac{1}{n_2})$)に従う。
母比率pは未知であり、二つの標本を合わせた比率$\hat{p}$を母比率pの推定値とする。関東の試食にて「おいしい」と答えた人数を$x_1$,関西の試食にて「おいしい」と答えた人数を$x_2$とすると$\hat{p}=\frac{x_1+x_2}{n_1+n_2}$である。
標本平均の分布が正規分布に従うためz検定を行う。

検定統計量

$$
z=\frac{(\hat{p_1}-\hat{p_2})-(p_1-p_2)}{\sqrt{\frac{p_1(1-p_1)}{n_1}+\frac{p_2(1-p_2)}{n_2}}}=\frac{\hat{p_1}-\hat{p_2}}{\sqrt{\hat{p}(1-\hat{p})(\frac{1}{n_1}+\frac{1}{n_2})}}
$$

を計算すると

$$
\begin{align}
z&=\frac{0.67-0.61}{\sqrt{{0.64(1-0.64)(\frac{1}{800}+\frac{1}{800})}}} \\
z&=\frac{0.06}{0.024}\\
z&=2.5
\end{align}
$$

今回は両側検定であるため$z_{\frac{0.05}{2}}=\pm 1.96$より、有意水準5%の両側検定における臨界値は$z=\pm 1.96$である。
$z>1.96$より有意水準の5%の両側検定において帰無仮説は棄却され、対立仮説が採択されるため、カップ麺に対する評価は関東と関西で差があるといえる。

10-8.(母比率の差の検定[左片側検定])

帰無仮説をこの10年間で、この大都市の男子大学生の喫煙率は変わらなかった($p_1=p_2$)、対立仮説をこの10年間で、この大都市の男子大学生の喫煙率は低下した($p_1<p_2$)として、有意水準の$1%$の左片側検定を行う。

問題文より

  • 現在の男子大学生の喫煙者率の標本数$n_1=4200$
  • 10年前の男子大学生の喫煙者率の標本数$n_2=4200$
  • 現在の男子大学生の喫煙者率の標本比率$\hat{p_1}=0.285$
  • 10年前の男子大学生の喫煙者率の標本比率$\hat{p_2}=0.315$

帰無仮説が正しいとき標本比率の差$\hat{p_1}-\hat{p_2}$の分布は正規分布$N(p_1-p_2, \frac{p_1(1-p_1)}{n_1}+\frac{p_2(1-p_2)}{n_2})$に従う。

二つの母比率に差がないとき、$p_1=p_2$であり、$p_1=p_2=p$とすると、$p_1-p_2=0$, $\frac{p_1(1-p_1)}{n_1}+\frac{p_2(1-p_2)}{n_2}=\frac{p(1-p)}{n_1}+\frac{p(1-p)}{n_2}$である。

従って、帰無仮説が正しいとき標本比率の差$\hat{p_1}-\hat{p_2}$の分布は正規分布$N(0, p(1-p)(\frac{1}{n_1}+\frac{1}{n_2}))$に従う。
母比率$p$は未知であり、二つの標本を合わせた比率$\hat{p}$を母比率$p$の推定値とする。現在のこの大都市の男子大学生の喫煙者数を$x_1$,10年前のこの大都市の男子大学生の喫煙者数を$x_2$とすると$\hat{p}=\frac{x_1+x_2}{n_1+n_2}$である。
標本平均の分布が正規分布に従うためz検定を行う。

検定統計量

$$
z=\frac{(\hat{p_1}-\hat{p_2})-(p_1-p_2)}{\sqrt{\frac{p_1(1-p_1)}{n_1}+\frac{p_2(1-p_2)}{n_2}}}=\frac{\hat{p_1}-\hat{p_2}}{\sqrt{\hat{p}(1-\hat{p})(\frac{1}{n_1}+\frac{1}{n_2})}}
$$

を計算すると

$$
\begin{align}
z&=\frac{0.285ー0.315}{\sqrt{{0.3(1-0.3)(\frac{1}{4200}+\frac{1}{4200})}}} \\
z&=\frac{-0.03}{0.01}\\
z&=-3
\end{align}
$$

$z<-2.36$より有意水準$1%$の左片側検定において帰無仮説は棄却され、対立仮説が採択されるため、この10年間で、この大都市の男子大学生の喫煙率は低下したといえる。