仮説検定の基本と様々な検定の手法に関して|基本演習で理解する統計学【3】

基本問題

母平均の検定① 母分散既知の場合

・問題
同一の確率分布から独立に標本$x_1, x_2, …, x_n$が得られたとする。このとき下記の問題に答えよ。
i) 標本平均$\bar{x}$を標本$x_1, x_2, …, x_n$の式で表せ。
ⅱ) 標本$x_i$の母分散$\sigma^2$を既知とするとき、中心極限定理より$\bar{x}$の母平均を$\mu$とすると$N(\mu, \sigma^2/n)$に従うと考えることができる。
このとき$\bar{x}$の標準化を行い、標準正規分布$N(0,1)$に従う指標を求めよ。
ⅲ) $\bar{x}=20, \mu=19.5, \sigma=1, n=9$のとき、有意水準95%で帰無仮説$H_0: \mu=19.5$の検定を行え。
iv) $\bar{x}=20, \sigma=1, n=9$のとき、$\mu$の95%区間を求めよ。
v) iv)で求めた区間を0.2以下にする最小のサンプル数$n$の値を求めよ。

・解答
i)
標本平均$\bar{x}$は下記のように表すことができる。
$$
\large
\begin{align}
\bar{x} &= \frac{1}{n} (x_1 + x_2 + … + x_n) \\
&= \frac{1}{n} \sum_{i=1}^{n} x_i
\end{align}
$$

ⅱ)
$\bar{x}$の標準化は下記のように行うことができる。
$$
\large
\begin{align}
z = \frac{\bar{x}-\mu}{\sigma/\sqrt{n}}
\end{align}
$$

ⅲ)
ⅱ)で求めた式に$\bar{x}=20, \mu=19.5, \sigma=1, n=9$を代入すると下記のようになる。
$$
\large
\begin{align}
z &= \frac{\bar{x}-\mu}{\sigma/\sqrt{n}} \\
&= \frac{20-19.5}{1/\sqrt{9}} \\
&= 0.5 \times 3 \\
&= 1.5
\end{align}
$$
$z=1.5<1.96=z_{\alpha=0.025}$より、帰無仮説$H_0: \mu=19.5$は棄却できない。

iv)
母平均$\mu$の95%区間は下記のように計算できる。
$$
\large
\begin{align}
z_{\alpha=0.975} \leq &\frac{\bar{x}-\mu}{\sigma/\sqrt{n}} \leq z_{\alpha=0.025} \\
-1.96 \leq &\frac{20-\mu}{1/\sqrt{9}} \leq 1.96 \\
-\frac{1.96}{3} \leq &20-\mu \leq \frac{1.96}{3} \\
-\frac{1.96}{3} \leq &\mu-20 \leq \frac{1.96}{3} \\
20 – \frac{1.96}{3} \leq &\mu \leq 20 + \frac{1.96}{3} \\
19.3… \leq &\mu \leq 20.6…
\end{align}
$$

v)
$\displaystyle z_{\alpha=0.025} \frac{\sigma^2}{\sqrt{n}} = \frac{1.96}{\sqrt{n}} \leq 0.1$となる$n$を求めれば良い。
$$
\large
\begin{align}
\frac{1.96}{\sqrt{n}} &\leq 0.1 \\
1.96 &\leq 0.1\sqrt{n} \\
19.6 &\leq \sqrt{n} \\
19.6^2 &\leq n \\
384.1… &\leq n
\end{align}
$$
上記より、95%区間を0.2以下にする最小のサンプル数$n$は385である。

母平均の検定② 母分散未知の場合

・問題
同一の確率分布から独立に標本$x_1, x_2, …, x_n$が得られたとする。このとき下記の問題に答えよ。
i) 不偏標本分散$s^2$を標本$x_1, x_2, …, x_n$の式で表せ。
ⅱ) 標本$x_i$の母分散が未知のとき、$\displaystyle t = \frac{\bar{x}-\mu}{s/\sqrt{n}}$はどのような分布に従うか。また、ここで取り扱う分布と標準正規分布の違いを述べよ。
ⅲ) $\bar{x}=20, s=1, n=9$のとき、有意水準95%で帰無仮説$H_0: \mu=19$の検定を行え。
iv) $\bar{x}=20, s=1, n=9$のとき、$\mu$の95%区間を求めよ。
v) 概ね同じような値に基づいて区間推定や検定を行う場合、母分散既知の場合と母分散未知の場合の結果はどのように異なるか簡単に説明せよ。

・解答
i)
不偏標本分散$s^2$は下記のように表すことができる。
$$
\large
\begin{align}
s^2 &= \frac{1}{n-1} ((x_1-\bar{x})^2 + (x_2-\bar{x})^2 + … + (x_n-\bar{x})^2) \\
&= \frac{1}{n-1} \sum_{i=1}^{n} (x_i-\bar{x})^2
\end{align}
$$

ⅱ)
$\displaystyle t = \frac{\bar{x}-\mu}{s/\sqrt{n}}$は自由度$n-1$の$t$分布$t(n-1)$に従う。

ⅲ)
ⅱ)で求めた式に$\bar{x}=20, \mu=19, s=1, n=9$を代入すると下記のようになる。
$$
\large
\begin{align}
t &= \frac{\bar{x}-\mu}{\sigma/\sqrt{n}} \\
&= \frac{20-19}{1/\sqrt{9}} \\
&= 1 \times 3 \\
&= 3
\end{align}
$$
$t=3<2.306=t_{\alpha=0.025}(8)=t_{\alpha=0.025}(9-1)$より、帰無仮説$H_0: \mu=19$は棄却できる。

iv)
母平均$\mu$の95%区間は下記のように計算できる。
$$
\large
\begin{align}
t_{\alpha=0.975}(8) \leq &\frac{\bar{x}-\mu}{s/\sqrt{n}} \leq t_{\alpha=0.025}(8) \\
-2.306 \leq &\frac{20-\mu}{1/\sqrt{9}} \leq 2.306 \\
-\frac{2.306}{3} \leq &20-\mu \leq \frac{2.306}{3} \\
-\frac{2.306}{3} \leq &\mu-20 \leq \frac{2.306}{3} \\
20 – \frac{2.306}{3} \leq &\mu \leq 20 + \frac{2.306}{3} \\
19.23… \leq &\mu \leq 20.76…
\end{align}
$$

v)
不偏標本分散$s^2$が母分散$\sigma^2$と概ね等しいと考えられる場合、$t$分布の方が標準正規分布よりばらつきの大きい分布となる。よって、iv)の結果は標準正規分布を用いた際よりもやや範囲が広い結果となった。
一方で、サンプル数が増えるに伴い自由度が増えるにつれて、$t$分布は正規分布に近づく。ⅲ)、iv)で用いた自由度8の場合は$t_{\alpha=0.025}(8)=2.306$であるのに対して、自由度120の場合は$t_{\alpha=0.025}(120)=1.98$であり、標準正規分布の$z_{\alpha=0.025}=1.96$に近い値となる。

・解説
$t$分布の式は複雑ですが、v)で取り扱ったように、$t$分布は標準正規分布との対応で抑えておくと理解しやすいと思います。

両側検定と片側検定

・問題
標準正規分布の上側確率を$p$とする点を$z_{\alpha=p}$のように表すと考える。以下の問題に答えよ。
i) $z_{\alpha=0.005}, z_{\alpha=0.01}, z_{\alpha=0.025}, z_{\alpha=0.05}, z_{\alpha=0.1}, z_{\alpha=0.2}$の値を標準正規分布の確率分布表からそれぞれ読み取れ。
ⅱ) $z_{\alpha=0.995}, z_{\alpha=0.99}, z_{\alpha=0.975}, z_{\alpha=0.95}, z_{\alpha=0.9}, z_{\alpha=0.8}$はi)で求めた値とどのような関係があるか答えよ。
ⅲ) 95%の両側検定を行う場合に用いる$z_{\alpha=p}$を2つ答えよ。
iv) 定数$c$を用いて対立仮説を$H_1:\mu<c$と表せるかを考える場合に用いる$z_{\alpha=p}$を答えよ。有意水準はⅲ)と同じく95%で考えるものとする。
v) $\bar{x}=14, c=15, \sigma^2=1, n=9$のとき、iv)の検定の結果を述べよ。

・解答
i)
標準正規分布の表から、下記のように読み取ることができる。
$$
\large
\begin{align}
z_{\alpha=0.005} &= 2.58 \\
z_{\alpha=0.01} &= 2.33 \\
z_{\alpha=0.025} &= 1.96 \\
z_{\alpha=0.05} &= 1.64 \\
z_{\alpha=0.1} &= 1.28 \\
z_{\alpha=0.2} &= 0.84
\end{align}
$$

ⅱ)
下記のように考えればよい。
$$
\large
\begin{align}
z_{\alpha=0.995} &= -z_{\alpha=0.005} = -2.58 \\
z_{\alpha=0.99} &= -z_{\alpha=0.01} = -2.33 \\
z_{\alpha=0.975} &= -z_{\alpha=0.025} = -1.96 \\
z_{\alpha=0.95} &= -z_{\alpha=0.05} = -1.64 \\
z_{\alpha=0.9} &= -z_{\alpha=0.1} = -1.28 \\
z_{\alpha=0.8} &= -z_{\alpha=0.2} = -0.84
\end{align}
$$

ⅲ)
95%の両側検定では、$z_{\alpha=0.975}$と$z_{\alpha=0.025}$の間に標準化した値の$z$が含まれるかどうかで検定を行う。含まれない場合は帰無仮説$H_0:\mu=c$を棄却し、対立仮説$H_1:\mu \neq c$を採択する。

iv)
95%の片側検定かつ、対立仮説$H_1$が$\mu<c$のため、$z_{\alpha=0.95}$よりも$z$が大きいか小さいかを考える。$z<z_{\alpha=0.95}=-1.64$の場合は帰無仮説$H_0:\mu=c$を棄却し、対立仮説の$H_1:\mu<c$を採択する。

v)
標準化を考えるにあたって、下記のように$z$を計算する。
$$
\large
\begin{align}
z &= \frac{\bar{x}-\mu}{\sigma/\sqrt{n}} \\
&= \frac{14-15}{1/\sqrt{9}} \\
&= -3 < -1.64 = z_{\alpha=0.95}
\end{align}
$$
上記より、帰無仮説$H_0:\mu=15$は棄却され、対立仮説の$H_1:\mu<15$が採択される。

・解説
両側検定と片側検定については基本的な事項であるため流されやすいが、特に片側検定はわからなくなりやすいので注意しておくと良いです。基本事項を抑えつついくつか演習問題を解くことで、なるべく慣れておくのが良いと思います。

発展問題

$\chi^2$検定

適合度の検定

$F検定$

参考書籍

・基礎統計学Ⅰ 統計学入門(東京大学出版会)

・第12章解答
https://www.hello-statisticians.com/explain-books-cat/toukeigakunyuumon-akahon/ch12_practice.html

「仮説検定の基本と様々な検定の手法に関して|基本演習で理解する統計学【3】」への1件の返信

  1. […] https://www.hello-statisticians.com/practice/stat_practice6.html上記などで確認を行なった一般的な仮説検定は正規分布などの母集団分布(population distribution)を仮定して検定統計量の$T$を計算し、$T$が従う分布を用いて仮説検定を行う。このような手法をパラメトリック法(parametric method)という。一方で当記事で取り扱うノンパラメトリック法(non-parametric method)は母集団分布の仮定を設定することなく仮説検定を行う手法である。ノンパラメトリック法の基本的な考え方は観測値を大きさの順に並べ替えて統計量を作ることであり、母集団分布が分かっている場合であってもサンプルサイズが小さいときにはノンパラメトリック法が有効となる場合も多い。内容の作成にあたっては「統計学実践ワークブック」などを元に作成を行なった。 […]

コメントは受け付けていません。