【Udemy】Pythonで実践する統計モデリング入門

機械学習や統計解析の理論的な背景には「統計モデル」という考え方があります。

統計モデルを通して機械学習や統計分析を見ることで、様々な手法を俯瞰して理解することができます。例えば、最尤法とベイズ法の差異については、ベイズ法は「正則化」であるという見方を得ることができます。

この統計モデルについて、「統計の森」管理者の一人である時田が、Python実装を通して理解する入門コースをUdemyで公開しました。

コースリンク

以下のリンクよりUdemyのページにアクセスできます。いまなら下記のリンクからアクセスで2,700円で購入できます(12/19まで)。

https://www.udemy.com/course/python-stats-modeling/?couponCode=651E987D3D1940522E42

コース概要

「統計モデリングは機械学習やデータ分析全般における基礎」

多くの機械学習や統計解析手法の理論的背景には「統計モデル」という考え方があります。この統計モデルを通すことで、さまざまな手法を俯瞰して眺めることができます。そうなることで、様々な機械学習モデルなどを個別に暗記する必要がなくなり、一段上から手法の選定やモデルの設計ができるようになります。

また、複雑なモデルやより高度な分析手法に対して見通しが効き、手法の選定やモデルの理解に役立ちます。

「機械学習の基礎でもある「統計モデリング」の理論面の基礎を理解する」

このコースでは、統計モデルの理論面の基礎を解説します。簡単な線形モデルをベースに議論を展開していきます。

また、Pythonを使った実装例を添付しています(jupyter notebookで提供)。実装と合わせて解説をするので、理解が深まるのではないかと思います。

「機械学習/統計分析ツールのツールボックス的な利用を脱する」

様々な手法を俯瞰してみることができるため、多くの機械学習モデルを暗記する必要がなくなります。ライブラリを使ってブラックボックスのようにモデルを利用していた立場を脱却して、手法の選択や組み合わせ、また、問題に合わせたカスタマイズができるようになります。

コースの構成

本コースでは統計モデルについて、大きく二つに分けて解説をしています。

2章から3章までで、統計モデルで用いられる「モデル構造」について解説します。
本コースでは、統計モデルの基礎として確率分布、線形モデル、一般化線形モデルについて解説します。一般化線形モデルまで理解できれば、現場で遭遇する多くの問題にある程度対応できるのではないかと考えます。

次に、4章から6章までで、統計モデルのデータに合わせた最適化法について解説します。
最尤法の解説で確率モデルを利用して最適化について解説した後、より複雑なモデルの数値的な最適化法として勾配法の最も単純な形式を解説します。最後に、ベイズ的なアプローチについて解説します。6章では、ベイズ的なアプローチと最尤法との関係についても解説しています。