「統計学実践ワークブック」 演習問題etc Ch.16 「重回帰分析」

当記事は「統計学実践ワークブック(学術図書出版社)」の読解サポートにあたってChapter.16の「重回帰分析」に関して演習問題を中心に解説を行います。重回帰分析は回帰を行うにあたっての基本トピックなので、演習を通して抑えておくと良いと思われました。

演習問題解説

問16.1

$[1]$
Adjusted R-squaredが自由度調整済み決定係数を表しているので、この値が最も大きい値の$0.8202$を示すモデル$3$を選ぶとよい。

$[2]$
Pr(>|t|)の列の値を確認し、$0.05$よりも小さいものを選べばよく、ここではGENとAMTが該当する。

問16.2

$[1]$
係数$\hat{\beta}_5$の推定量はEstimateの値より、$0.27388$が読み取れる。また、$t$統計量は下記のように計算できる。
$$
\large
\begin{align}
\frac{0.27388}{0.22967} &= 1.1924… \\
& \simeq 1.19
\end{align}
$$

ここで自由度$111-5-1$の$t$分布の両側確率を確認すると、$t=1.19$は有意水準$\alpha=0.1$でも有意であるとはいえないことが確認できる。

$[2]$
予測誤差の観点からは$AIC$を比べるのが適切であり、モデル$1$が最も小さいのでモデル$1$を選べば良い。

問16.3

$[1]$
予測誤差は$\lambda$が小さくなるに従って小さくなるが、交差検証スコアを確認すると小さくし過ぎると過学習が生じることが確認できる。よって、$\lambda=1$が適切であると考えられる。

$[2]$
それぞれ下記が対応する。

a) $\lambda=e^{-2}, \alpha=0$
b) $\lambda=0$
c) $\lambda=e^{-2}, \alpha=1$
d) $\lambda=e^{-2}, \alpha=0.5$

$[3]$
それぞれ下記が対応する。

a) $\alpha=0$
b) $\alpha=1$
c) $\alpha=0.5$

参考

・準1級関連まとめ
https://www.hello-statisticians.com/toukeikentei-semi1