統計検定準1級 問題解説 ~2021年6月実施 問7 AIC・BIC・交差検証~

問題

過去問題は統計検定公式が問題と解答例を公開しています。こちらを参照してください。

解答

[1-1] 解答

$\boxed{ \ \mathsf{12}\ }$ : ④

実測値$y_t$が正規分布$N(\beta_{0} + \beta_{1} x_{i1} + \beta_{2} x_{i2} + \beta_{3} x_{i3}, \sigma^2)$に従って生成されたと考えることができるので、標準正規分布を考えるにあたってはこの標準化を行うことを考えれば良い。

よって、④が正しい。

[1-2] 解答

$\boxed{ \ \mathsf{13}\ }$ : ①
$AIC$は$AIC = -2 \log{L(\theta)} + 2k$で定義され、$AIC$を最小にするパラメータ$\theta$が最適であると考える。表よりモデル$1$とモデル$3$だけを考えれば十分であることがわかるので、以下それぞれに関して$AIC_{1}, AIC_{3}$を計算する。
$$
\large
\begin{align}
AIC_{1} &= -2 \times (−842.9193) + 2 \times 5 = 1695.8386 \\
AIC_{3} &= -2 \times (−845.3840) + 2 \times 4 = 1698.768
\end{align}
$$

$AIC_{1} < AIC_{3}$より①のモデル$1$が最適であると考えることができる。

[3] 解答

$\boxed{ \ \mathsf{15}\ }$ : ③
$AIC$と$BIC$はそれぞれ$AIC = -2 \log{L(\theta)} + 2k$、$BIC = k \log{n}$のように計算できるが、計算式が同様であるので計算処理時間は同じであると考えられる。よって手法$(A), (B)$が$AIC, BIC$に対応し、手法$(C)$が$CV$に対応すると考えることができる。

また、$BIC$を用いると$n \to \infty$のとき、正しいモデルを選択する確率が$1$に近づくことから$(A)$が$BIC$、$(B)$が$AIC$に対応することがわかる。以上より③が正しいと考えることができる。

解説

$AIC$・$BIC$・交差検証に関するオーソドックスな問題だと思います。基本的な問題なので取り組みやすい内容であると思われました。

参考

準1級関連まとめ
https://www.hello-statisticians.com/toukeikentei-semi1

「統計学実践ワークブック」 演習問題 Ch.30 「モデル選択」
https://www.hello-statisticians.com/explain-books-cat/stat_workbook/stat_workbook_ch30.html