統計検定準1級問題解説 ~2019年6月実施 選択問題及び部分記述問題 問5~

過去問題

過去問題は統計検定公式問題集が問題と解答例を公開しています。こちらを参照してください。


解答

$\boxed{ \ \mathsf{8}\ }$

本問題における調査は、喫煙歴が心筋梗塞の罹患率に影響があるのかを調べるための調査である。
喫煙の有無を$X$(喫煙なし$:X=0$,喫煙あり$:X=1$)、心筋梗塞の有無を$Y$(心筋梗塞患者でない者$:Y=0$,心筋梗塞患者$:Y=1$)とすると、喫煙歴がある場合とない場合のそれぞれに対する心筋梗塞の罹患率の比(相対リスク)は$P(Y=1|X=1)/P(Y=1|X=0)$で表されるので、本来求めたいのは$P(Y|X)$である。そのためには、心筋梗塞の罹患率が小さい値と知られているので、喫煙ありの人数と喫煙なしの人数を十分大きくとり、それぞれの心筋梗塞の罹患率を求めるほうが、相対リスクをより正確に推定することができる。

このとき、心筋梗塞患者に関する喫煙ありのオッズと心筋梗塞患者でない者に関する喫煙ありのオッズのオッズ比は$$
\begin{align*}
\frac{P(X=1|Y=1)/P(X=0|Y=1)}{P(X=1|Y=0)/P(X=0|Y=0)}&=\frac{P(X=1|Y=1)P(X=0|Y=0)}{P(X=0|Y=1)P(X=1|Y=0)}\\
&=\frac{P(X=1\cap Y=1)/P(Y=1)\cdot P(X=0\cap Y=0)/P(Y=0)}{P(X=0\cap Y=1)/P(Y=1)\cdot P(X=1\cap Y=0)/P(Y=0)}\\
&=\frac{P(X=1\cap Y=1)/P(X=1)\cdot P(X=0\cap Y=0)/P(X=0)}{P(X=0\cap Y=1)/P(X=0)\cdot P(X=1\cap Y=0)/P(X=1)}\\
&=\frac{P(Y=1|X=1)P(Y=0|X=0)}{P(Y=1|X=0)P(Y=0|X=1)}\\
\end{align*}
$$
と変形できる。そもそも、心筋梗塞の罹患率が小さい値であるから、喫煙あり、喫煙なしの人数を十分大きくとることができれば、$P(Y=0|X=0)/P(Y=0|X=1)$は限りなく$1$に近くなり、
$$
\frac{P(X=1|Y=1)/P(X=0|Y=1)}{P(X=1|Y=0)/P(X=0|Y=0)}\simeq\frac{P(Y=1|X=1)}{P(Y=1|X=0)}
$$
となる。このことから、オッズ比が相対リスクの近似値となりうる。

実際には本問題の調査のように、心筋梗塞患者とそうでない者を一定数用意し、過去の喫煙歴を調べている。この調査で推定できるのは$P(X|Y)$であるため、オッズ比は求められるが、この調査結果から直接喫煙者の心筋梗塞の罹患率や相対リスクを求めることは、標本数が心筋梗塞患者に対して十分大きくないため、正確に推計することはできない。

以上より、選択肢①が正しい。選択肢②は罹患者群とコントロール群の比率が相対リスクに影響しないので間違いである。選択肢③と④は調査結果から直接求めた罹患率を求めて分析しているので間違いである。選択肢①が正しいので選択肢⑤は「この調査から読み取れるものない」ということにならないので間違い。


解説

前向き研究と後向き研究、オッズ比

本問題の調査のように、喫煙の有無が心筋梗塞の罹患率に影響を与えるかを調査するために、心筋梗塞患者と心筋梗塞に罹患していない患者(コントロール群)を抽出して、過去の喫煙の有無を調べる手法を後向き研究という。一方、心筋梗塞に罹患する前の喫煙者と非喫煙者を無作為に抽出して、一定期間後、心筋梗塞に罹患した人数を調べる調査方法を前向き研究という。

一般的に心筋梗塞の罹患率のような全体に占める割合が小さい事象に対しては、前向き研究は、標本サイズを十分に大きくすれば現実に即したものが得られやすいが、調査に時間がかかる。後向き研究は、前向き研究に比べ標本の抽出は容易で、結果に対して原因を調査するため調査に時間がかからない。しかし、大抵は標本が現実の割合を反映していないため、リスクの比較が行えない。

後向き研究は、前向き研究が実施困難な場合に原因(喫煙の有無)が結果(心筋梗塞の罹患率)に影響を与えるかを推計するための調査で、解答にある考え方により、後向き研究におけるオッズ比から相対リスクを推計することができる。