統計検定準1級 問題解説 ~2017年6月実施 選択問題及び部分記述問題 問3~

過去問題

過去問題は統計検定公式が問題と解答例を公開しています。こちらを参照してください。

解答

[1] 解答

$\boxed{ \ \mathsf{記述6}\ }$ : クロスバリデーション,交差検証法

問題文の、『このように』が指している記述は「データの一部を用いて回帰パラメータの推定を行い、推定されたモデルで残りのデータに対する予測誤差を評価する」のことであるから、この手法の名称を答えれば良い。

[2] 解答

$\boxed{ \ \mathsf{記述7}\ }$ : $L_1$正則化にはスパース性があるが、$L_2$正則化にはスパース性がない。

正則化項$\displaystyle \lambda \sum_{j=1}^{227}|\beta_j|^q $において、$q=1$としたものが$L_1$正則化項、$q=2$としたものが$L_2$正則化項である。$L_2$ノルムと比べて$L_1$ノルムの方が値が小さい($0$に近い)パラメータに対する罰則が大きくなるため(正則化項が大きくなるため採用されにくい。$L_2$ノルムでは小さい値は$2$乗されるため影響が小さくなる。)、$L_1$正則化を行った場合に採用されたパラメータには$0$が多くなる傾向がある。このようにして得られたモデルをスパースモデルという。

参考

・準$1$級関連まとめ
https://www.hello-statisticians.com/toukeikentei-semi1