ノンパラメトリック法(non-parametric method)による仮説検定について

https://www.hello-statisticians.com/practice/stat_practice6.html
上記などで確認を行なった一般的な仮説検定は正規分布などの母集団分布(population distribution)を仮定して検定統計量の$T$を計算し、$T$が従う分布を用いて仮説検定を行う。このような手法をパラメトリック法(parametric method)という。
一方で当記事で取り扱うノンパラメトリック法(non-parametric method)は母集団分布の仮定を設定することなく仮説検定を行う手法である。ノンパラメトリック法の基本的な考え方は観測値を大きさの順に並べ替えて統計量を作ることであり、母集団分布が分かっている場合であってもサンプルサイズが小さいときにはノンパラメトリック法が有効となる場合も多い。内容の作成にあたっては「統計学実践ワークブック」などを元に作成を行なった。

前提の確認

P-値

ノンパラメトリックの手法ではP-値を計算するので、先にP-値について確認する。以下、下記のWikipediaの記載を参照する。
https://ja.wikipedia.org/wiki/有意#P値

帰無仮説の下で実際にデータから計算された統計量よりも極端な(仮説に反する)統計量が観測される確率を、P値という。P値の利用に伴う諸問題を考慮した社会心理学系のジャーナル、Basic and Applied Social Psychology(BASP)は、帰無仮説有意性検定およびそれに類する統計学的処理を禁止すると発表した。」

上記がWikipediaの記載である。正規分布などを考える際の$\alpha$に近いイメージで理解しておくと良いと思われる。

ノンパラメトリック法の手法

ノンパラメトリックの手法に関してまとめると下記のようになる。

・2群の差の検定
-> ウィルコクソンの順位和検定、並べ替え検定

・対応がある場合の差の検定
-> ウィルコクソンの符号付き順位検定、符号検定

・3群以上の差の検定
-> クラスカル・ウォリス検定

以下、それぞれについて詳しく確認を行う。

ウィルコクソンの順位和検定

ウィルコクソンの順位和検定(Wilcoxon rank sum test)は、「2つの群に差があるかどうか」について取り扱う検定である。具体的に考える方がわかりやすいため、以下の例に基づいて考える。
$$
\large
\begin{array}{|c|*3{c|}}\hline A & 25 & 20 & 45 \\
\hline B & 35 & 39 & 27 \\
\hline
\end{array}
$$

上記の検定を行うにあたって、帰無仮説$H_0$と対立仮説$H_1$を下記のように設定する。
$$
\large
\begin{align}
H_0 &: \quad 2つの群の分布は同じ \\
H_1 &: \quad 群Aの分布の形は群Bと同じだが、悪い方にずれている
\end{align}
$$
この仮説の検定を行うにあたって、群Aと群Bを合わせて小さい値から順位を与え、それぞれの順位和の$W_A, W_B$を検定統計量とすることを考える。冒頭の具体例に順位を割り振り、順位和$W_A, W_B$を計算すると下記のようになる。
$$
\large
\begin{array}{|c|*4{c|}}\hline A & 2 & 6 & 6 & W_A=9 \\
\hline B & 4 & 5 & 3 & W_B=12 \\
\hline
\end{array}
$$

ここで帰無仮説の「2つの群の分布は同じ」が正しいと考えると、6人の順位はランダムに割り振られると考えられる。
6人に与えられる順位の組み合わせは${}_6 C_3$であることを活用し、群Aの順位和が9以下となる確率の$P(W_A \leq 9)$を求め、これをウィルコクソンの順位和検定の片側P-値と考える。
以下、$W_A$の値とその個数について確認する。
$$
\large
\begin{array}{|c|*11{c|}}\hline W_A & 6 & 7 & 8 & 9 & 10 & 11 & 12 & 13 & 14 & 15 & 計 \\
\hline 個数 & 1 & 1 & 2 & 3 & 3 & 3 & 3 & 2 & 1 & 1 & 20 \\
\hline
\end{array}
$$
上記を解釈するにあたっては、$6=1+2+3, 7=1+2+4, 15=4+5+6$のように1通りに定まるのに対し、$9=1+2+6=1+3+5=2+3+4, 10=1+3+6=1+4+5=2+3+5$のように3通り存在する場合があることを対比で確認すると良い。
これは整数論の問題と考えることもでき、順位和$W_A$が与えられた際に最小値を$max(W_A-11,1)$と最大値を$min(W_A-3,6)$のように計算できることを利用して、ある程度考える組み合わせを減らすことができることも抑えておくと良い。

同じ値が観測された場合は順位を分配すればよく、5位と6位が同じ値であれば双方の順位を5.5とすることで計算することができる。

各群の人数が大きくなるにつれてP-値の計算が複雑になるが、各群のサンプルサイズの$m, n$が大きくタイがない場合は下記のように平均と分散を計算して正規分布近似を行えばよい。
$$
\large
\begin{align}
平均 &= \frac{m(m+n+1)}{2} \\
分散 &= \frac{mn(m+n+1)}{12}
\end{align}
$$

並べ替え検定

並べ替え検定(permutation test)の帰無仮説と対立仮説は順位和検定と同じく下記を使用する。
$$
\large
\begin{align}
H_0 &: \quad 2つの群の分布は同じ \\
H_1 &: \quad 群Aの分布の形は群Bと同じだが、悪い方にずれている
\end{align}
$$
並べ替え検定が順位和検定と異なる点は群の平均を小さい順から並べることで検定統計量を求めることである。

順位和検定と並べ替え検定の結果は異なることが多いが、これは「どちらが良い」という話ではないことに注意が必要である。

符号付き順位検定

符号付き順位検定(Wilcoxon signed rank test)は、「何らかの事象の前と後で全体に変化が生じたか」を取り扱う検定である。以下では具体的に考えるにあたって5人の学生に補修を行い、点数の差が下記のようになったことを例に考える。
$$
\large
\begin{align}
D: \quad -3, 9, 3, 7, -1
\end{align}
$$
上記からは平均3点の上昇があることが確認できるが、この例に対し、それぞれの符号付き順位を考える。
$$
\large
\begin{align}
\tilde{D}: \quad -1, 5, 3, 4, -2
\end{align}
$$
上記のうち正値の合計の$T_{+}=5+3+4=12$を検定統計量と考える。

ここで下記のように帰無仮説と対立仮説を設定し、片側検定を考える。
$$
\large
\begin{align}
H_0 &: \quad 分布Dの中央値 = 0 \\
H_1 &: \quad 分布Dの中央値 > 0
\end{align}
$$
組み合わせ$2^5=32$通りに対し、$T_{+} \geq 12$となるのは下記の場合が考えられる。
$$
\large
\begin{align}
-1, -2, 3, 4, 5 \\
1, 2, -3, 4, 5 \\
1, -2, 3, 4, 5 \\
-1, 2, 3, 4, 5 \\
1, 2, 3, 4, 5
\end{align}
$$
よって符号付き順位検定の片側P-値は$5/32=0.15625$となる。

また、サンプルサイズ$n$が大きくタイがない場合は下記のように平均と分散を計算して正規分布近似を行えばよい。
$$
\large
\begin{align}
平均 &= \frac{n(n+1)}{4} \\
分散 &= \frac{n(n+1)(2n+1)}{24}
\end{align}
$$

符号検定

符号検定(sign test)は符号付き順位検定と同様に、「何らかの事象の前と後で全体に変化が生じたか」に関して取り扱う手法である。
帰無仮説、対立仮説も符号付き順位検定と同様に下記のようになる。
$$
\large
\begin{align}
H_0 &: \quad 分布Dの中央値 = 0 \\
H_1 &: \quad 分布Dの中央値 > 0
\end{align}
$$
上記について考えるにあたって、符号付き順位検定では符号付きの順位を考えたが、符号検定では単に個数$T_{+}$を検定統計量とする。帰無仮説が正しいとき、$T_{+}$は二項分布$Bin(n,0.5)$に従うと考えることができる。

以下、下記の符号付き順位検定と同様な例について考える。
$$
\large
\begin{align}
D: \quad -3, 9, 3, 7, -1
\end{align}
$$
上記の例においては$T_{+}=3$であるので、これより符号検定片側P-値は下記のように計算できる。
$$
\large
\begin{align}
P(T_{+} \geq 3) &= ({}_5 C_3 + {}_5 C_4 + {}_5 C_5) \times 0.5^5 \\
&= 16 \times 0.5^5 \\
&= 0.5
\end{align}
$$
上記の解釈にあたっては符号付き順位検定よりも「差がない」という結論が導出されるが、これは負の値の標本の絶対値が小さい一方で、正の値の標本の絶対値が大きいことに起因することは抑えておくと良い。

クラスカル・ウォリス検定

クラスカル・ウォリス検定(Kruskal-Walis test)は、「複数の群に差があるか」について考える手法である。

順位相関係数

2次元の標本$(x_i, y_i) \quad (i=1,2,…,n)$がともに順位を表す場合の相関係数が順位相関係数(rank coefficient of correlation)である。

スピアマンの順位相関係数(Spearman correlation coefficient)の$r_s$は2次元の標本の$(x_i, y_i)$がともに連続変数である場合のピアソンの積率相関係数と同じ計算を行う。順位であることを考慮すると次のように表現できる。
$$
\large
\begin{align}
r_s = 1 – \frac{6 \sum_{i=1}^{n}(x_i-y_i)^2}{n(n^2-1)}
\end{align}
$$

まとめ

「ノンパラメトリック法(non-parametric method)による仮説検定について」への1件の返信

コメントは受け付けていません。