【統計の森ちゃんねる】「実装して学ぶ機械学習」シリーズのまとめ

統計の森では、YouTubeチャンネル「統計の森ちゃんねる」を運営しています。

統計の森ちゃんねるでは、機械学習の理論解説ではなく、まず実装して動作を確認することを目的とした解説をする動画シリーズを公開しています。

理論を抑えることは重要ですが、実際の動きを確認してから実感をもって理論の習得を目指すと学習効率が高いのではと考えています。そこで、「まず動かしてみる」ための方法を解説しています。

#01 Pythonサンプルコードで真似できる決定木分析

「決定木分析」のscikit-learnを利用した実装と、学習済みの決定木を可視化して説明変数と目的変数の関係性を解釈する方法について解説。

  • 分析対象データをpandas.DataFrameで用意
    • irisデータセットを利用
  • scikit-learnを利用して決定木を学習
  • dtreevizを利用して決定木を可視化
    • 説明変数の重要度を確認できる

以下参照

#02 【Python実装して遊ぶ # 01】本当は初学者にこそおすすめしたい開発環境【3ステップ】

開発環境の構築についての一つの提案を解説。

3ステップでPythonとJupytarLabの真っ新な開発環境を構築する。真っ新な環境を構築できるので、初学者にこそおすすめしたい(Dockerを利用するので注意)。

  • 提案構成
    • IDE: Visual Studio Code
      • Dockerコンテナ含めたリモート開発にとても便利なextentionがある
    • 仮想環境: Docker(docker-compose)
      • 別のlinuxマシンを用意する感覚
      • ライブラリ等の基本構成なども設定ファイルで書いておくことができる
    • 環境テンプレート: Github(tok41/basic-dev-env)
      • dockerの構成はテキストファイルで作成するため、Githubで管理できる

以下参照