検定論と一様最強力検定・不偏検定・尤度比検定|統計学演習 発展【5】

「基礎統計学Ⅰ(赤本)」の$12$章などで取り扱う「仮説検定」など、基礎的な統計学では「検定の手順」を中心に解説が行われることが多い。一方で、その「手順」がどういった考え方に基づいて行われているかを取り扱うのが「数理統計学」における「検定論」であり、当記事ではその演習について取り扱う。

・現代数理統計学 Ch.$8$ 「検定論」の章末演習の解答例
https://www.hello-statisticians.com/explain-books-cat/math_stat_practice_ch8.html

・発展演習$100$選
https://www.hello-statisticians.com/practice_100_advanced

基本問題

検定論の基本トピック①

・問題
以下では「現代数理統計学」の$8.1$節を元に、「検定論」の基本トピックについて取り扱う。下記の問いにそれぞれ答えよ。
i) 母数$\theta$の空間を$\Theta$とおき、これを互いに排反な$2$つの部分集合$\Theta_0$と$\Theta_1$に分けられると考える。この際に$\Theta_0 \cup \Theta_1$と$\Theta_0 \cap \Theta_1$をそれぞれ求めよ。
ⅱ) i)で設定を行った$\Theta_0$と$\Theta_1$に対して、帰無仮説$H_0: \theta \in \Theta_0$と、対立仮説$H_1: \theta \in \Theta_1$を考える。
ここで製品の不良率を$\theta = p$と考える際に、帰無仮説と対立仮説を考える。$\Theta_0 = [0, 0.02]$、$\Theta_1 = (0.02, 1]$のように母数空間を設定するとき、$p = 0.01, 0.05, 0.1$はそれぞれ帰無仮説と対立仮説のどちらが成立するか。
ⅲ) 両側検定が帰無仮説$H_0: \theta = \theta_0$と、対立仮説$H_1: \theta \neq \theta_0$のように設定されるとき、片側検定はどのように設定されるか。ただし、薬の効果があるかどうかの検証のように、帰無仮説が当てはまる場合に$\theta_0$より小さいことを暗黙裡に仮定できるものとする。
iv) 帰無仮説を受容する場合を$d=0$、帰無仮説を棄却する場合を$d=1$で表す場合、決定空間$D$はどのようになるかを表せ。
v) 下記のような損失関数は$0$-$1$損失関数とされるが、その意味合いについて説明せよ。
$$
\begin{align}
L(\theta,0) &= 0, \quad if \quad \theta \in \Theta_0 \\
&= 1, \quad if \quad \theta \in \Theta_1 \\
L(\theta,1) &= 1 – L(\theta,1)
\end{align}
$$
vi) 偽陽性(false positive)と偽陰性(false negative)はそれぞれ第$1$種の過誤と第$2$種の過誤のどちらに対応するか答えよ。また、偽陽性と偽陰性の名称について解釈せよ。
vⅱ) 新薬の効果を検証するにあたっては、「効果がない」という帰無仮説を棄却するかどうかを考える。この際の偽陰性と偽陽性は何に対応するかを答えよ。

・解答
i)
$\Theta_0 \cup \Theta_1$と$\Theta_0 \cap \Theta_1$は定義より、それぞれ下記を表す。
$$
\large
\begin{align}
\Theta_0 \cup \Theta_1 &= \Theta \\
\Theta_0 \cap \Theta_1 &= \emptyset
\end{align}
$$

ⅱ)
$$
\large
\begin{align}
0.01 &\in [0, 0.02] = \Theta_0 \\
0.05 &\in (0.02, 1] = \Theta_1 \\
0.1 &\in (0.02, 1] = \Theta_1
\end{align}
$$
上記より、$p=0.01$は帰無仮説$H_0$、$p=0.05$は対立仮説$H_1$、$p=0.1$は対立仮説$H_1$にそれぞれ含まれる。

ⅲ)
片側検定は下記のように設定できる。
$$
\large
\begin{align}
H_0: \theta \leq \theta_0 \\
H_1: \theta > \theta_0
\end{align}
$$

iv)
決定空間は$D = \{ 0, 1 \}$のように表される。

v)
$0$-$1$損失関数$L(\theta,0)$は、$\theta$が$\Theta_0$に含まれる場合の損失は$0$、含まれない場合の損失は$1$と考える。反対に$1-L(\theta,0)$で表される$L(\theta,1)$は$\theta$が$\Theta_0$に含まれる場合の損失は$1$、含まれない場合の損失は$0$と考える。

vi)
偽陽性は第$1$種の過誤、偽陰性は第$2$種の過誤にそれぞれ対応する。偽陽性は帰無仮説を間違って棄却すること、偽陰性は間違った帰無仮説を棄却しないことをそれぞれ意味するので、「間違えて陽性と決定する」、「間違えて陰性と決定する」のようにそれぞれ解釈すると良いと思われる。

vⅱ)
「新薬には効果がない」を帰無仮説にするため、「偽陽性」は「効果がないのに効果があると主張する」、「偽陰性」は「効果があるのにないと主張する」にそれぞれ対応する。

・解説
「検定論」関連の表記に慣れるというのを主目的に、作成を行いました。ここで確認を行った内容は検定論を考える上での前提となるので、抑えておくと良いと思います。
vi)で取り扱った「偽陽性」と「偽陰性」に関しては、実際の標本空間から決定空間への決定関数$\delta: \mathscr{X} \to D$を考えて、$D$が正しくない場合に「偽(False)」とされ、$D$が帰無仮説の棄却の場合は「陽性(positive)」、帰無仮説の採択の場合は「陰性(negative)」と考えるということを元に理解するとわかりやすいと思います。また、vⅱ)で取り扱ったように、帰無仮説の設定にあたっては「背理法」、「異常の検知」、「統計的モデルの診断」の主に$3$つのパターンがあることも抑えておくと良いです。$3$つのパターンに関しては「現代数理統計学」$8.1$節が詳しいです。

検定論の基本トピック②

・問題
i) 前問で取り扱った第$1$種の過誤と第$2$種の過誤はトレードオフの関係にあるが、これに対して伝統的な検定論では第$1$種の過誤が生じる確率を$\alpha$以下に抑えた上で、第$2$種の過誤の確率をできるだけ小さくしようと考える。このときの$\alpha$の名称を英語表記もセットで答えよ。
ⅱ) i)の$\alpha$を$5$%に設定するときと$1$%に設定するときでは、第$1$種の過誤と第$2$種の過誤が起きる確率はそれぞれどのようになるか答えよ。
ⅲ) 標本空間から決定空間への検定関数$\delta: \mathscr{X} \to D$を考える。標本$X=x$に対して、検定関数$\delta$は決定空間$D=\{0,1\}$を対応させる。
$$
\begin{align}
L(\theta,0) &= 0, \quad if \quad \theta \in \Theta_0 \\
&= 1, \quad if \quad \theta \in \Theta_1 \\
L(\theta,1) &= 1 – L(\theta,1)
\end{align}
$$
ここで、決定関数$\delta$に関してリスク関数$R(\theta,\delta) = E[L(\theta,\delta(X))]$を考えるとき、$R(\theta,\delta)$を求めよ。
iv) 下記のように定義する検出力関数(power function)$\beta(\theta)$を用いてリスク関数$R(\theta,\delta)$を表せ。
$$
\begin{align}
\beta(\theta) = E[\delta(X)]
\end{align}
$$
v) 標本空間$\mathscr{X}$を検定関数$\delta(x)$の値によって分割することを考える。
$$
\begin{align}
A &= \{ x|\delta(x)=0 \} \\
R &= \{ x|\delta(x)=1 \} = A^{c}
\end{align}
$$
上記のように考えるとき、$A, R$はそれぞれ受用域(acceptance region)と棄却域(rejection region)のどちらを表すかを答えよ。
vi) v)における$\delta(x)=0, \delta(x)=1$がそれぞれ$T(x) \leq c, T(x) > c$に対応するとき、$T(x)$と$c$に基づいて$A, R$を定義せよ。また、このときの$T(x)$と$c$の名称を答えよ。
vⅱ) vi)で設定した$T(X)$が「有意(significant)である」ことは何を表すか。

・解答
i)
有意水準(level of significance)

ⅱ)
有意水準$\alpha$を$5$%に設定するときは$1$%に設定するときに比べて帰無仮説を棄却しやすく、それに基づいて第$1$種の過誤が生じやすい一方で第$2$種の過誤が生じにくい。反対に$1$%に設定するときは第$2$種の過誤が生じやすい一方で第$1$種の過誤が生じにくい。

ⅲ)
$R(\theta,\delta)$は下記のように計算できる。
$$
\large
\begin{align}
R(\theta,\delta) &= E[L(\theta,\delta(X))] \\
&= 0 \times P(L(\theta,\delta(X))=0) + 1 \times P(L(\theta,\delta(X))=1) \\
&= P(L(\theta,\delta(X))=1)
\end{align}
$$
ここで、$\theta \in \Theta_0$のとき$L(\theta,1)=1$、$\theta \in \Theta_1$のとき$L(\theta,0)=1$であるので、$\theta \in \Theta_0$のときのリスク関数は第$1$種の過誤の確率に一致し、$\theta \in \Theta_1$のときのリスク関数は第$2$種の過誤の確率に一致する。

iv)
$\beta(\theta) = E[\delta(X)] = P(\delta(X)=1)$とⅲ)の結果より、リスク関数は下記のように表すことができる。
$$
\large
\begin{align}
R(\theta,\delta) &= \beta(\theta), \qquad if \quad \theta \in \Theta_0 \\
&= 1 – \beta(\theta), \quad if \quad \theta \in \Theta_1
\end{align}
$$

v)
$A$が帰無仮説を受用し、$R$が帰無仮説を棄却するので、$A$が受用域、$R$が棄却域をそれぞれ表す。

vi)
$A, R$は下記のように定義できる。
$$
\large
\begin{align}
A &= \{ x|T(x) \leq c \} \\
R &= \{ x|T(x) > c \}
\end{align}
$$
また、このとき$T(x)$を検定統計量、$c$を棄却点と呼ばれる。

vⅱ)
「$T(X)$が有意(significant)である」は帰無仮説が確率的には間違いであり、背理法と同様に対立仮説が正しいと考えるということを意味する。

・解説
ⅲ)とiv)で取り扱った検出力関数の定義が複雑ですが、検定では決定空間が受用を表す$d=0$と棄却を表す$d=1$の$2$値のみで表されることを元に考えることで理解できるのではないかと思います。

発展問題