当記事は「統計学実践ワークブック(学術図書出版社)」の読解サポートにあたってChapter.17の「回帰診断法」に関して演習問題を中心に解説を行います。回帰診断法は回帰を用いる際に抑えておくとよいトピックなので、演習を通して抑えておくと良いと思われました。
本章のまとめ
回帰を行う場合に外れ値(outlier)がある場合など、最小二乗法の結果が必ずしも適切ではないときがある。このような状況を防ぐにあたって、回帰診断(regression diagnostics)に関連する手法を用いることで結果が適切かを判断することができる。
主な回帰診断法には、「残差プロット」、「正規$Q-Q$プロット」、「標準化偏差の絶対値の平方根プロット」、「leverageに対する標準化残差プロットとCookの距離」などがあるので抑えておくと良い。
演習問題解説
例17.1
ア)
予測値が小さな値の$3$つのサンプルの残差が他のサンプルに比べて小さいので、当分散性の仮定が疑われる。分散が予測値に比例する場合もあるので、この辺は注意が必要である。
イ)
ほぼ直線に並ぶことから概ね正規性が成立すると考えられる。
ウ)
「標準化偏差の絶対値の平方根プロット」は「残差プロット」と同様な結果が解釈できる。
エ)
$3$つのサンプルのleverageが大きく、外れ値の可能性があるが、最もleverageが大きいサンプルのCookの距離は$0.5$よりも小さい。
問17.1
「残差プロット」や「標準化偏差の絶対値の平方根プロット」は残差の散らばりに規則性がなくなったことから、当分散性が成立することが確認できる。正規$Q-Q$プロットに関してはそれほど変化がない。
leverageは大きな値を持つ観測値がなくなっただけで、Cook’s distanceの値も全て$0.5$以下であり、外れ値があるとはいえない。
参考
・準1級関連まとめ
https://www.hello-statisticians.com/toukeikentei-semi1