【目的・目標別】統計学の理解にあたって知っておきたい数学の理解と学習にあたってのロードマップ

昨今統計学の必要性が一般的に言われている中で、ほとんど必ず出てくる質問に「統計学の理解にあたって数学はどのくらい知っておくと良いか」というのがあります。当記事では目的別の到達目標を明示した上でそれぞれの目標達成にあたってのロードマップとなるように内容をまとめました。

目的別の到達目標

統計学を大まかに把握したい

「統計学を大まかに把握したい方」は、「統計検定2級のトピックに関して、問題が解ける」を目指すと良いです。統計検定2級は正答率6割が合格ラインとされますが、問題が7割ほど解けるようになれば大まかに把握したと考えて良いと思います。
統計検定2級レベルの主なトピックは、記述統計、確率論、推測統計が主ですが、記述統計について理解し、確率論、推測統計については簡単に手順を抑えれば大まかに把握することができると思います。

ここまでの内容であれば一般向けのわかりやすい解説も多いので高度な数学の理解は不要ですが、数式の表記には慣れておく方が望ましいです。そのため中学レベル〜高校2年生レベルの数学の基本事項は同時に抑える方が良いと思います。
基本的には数学は必須ではないが、数学検定2級レベルは同時に身につけるのが望ましいというのを当記事の見解とします。

統計学を使って専門的に考察したい

「統計学を使って専門的に考察したい方」は、「統計検定の2級のトピックの問題が解けるだけでなく、内容を理解し関連の発展項目についても簡単に把握している」を目指すと良いです。
統計検定の準1級、1級の問題は少々マニアックな問題も出題されるので、必ずしも点数を目安にしなくても良いと思いますが、問題のいくつかはだいたいわかるレベルまで到達できると望ましいのではないかと思います。どちらかというと2級の問題をしっかり理解した上で解けるまで到達できる方が重要度が高いと思います。

このレベルにまで到達するにあたっては通称「赤本」とされる東京大学出版会の「基礎統計学Ⅰ 統計学入門」が非常におすすめです。統計検定2級レベルの解説を行う書籍や解説コンテンツなどは流れの解説が中心で背景の解説が少ないものも多いので、手堅い理解ができない場合があります。よって赤本を1冊読み切ることで、統計検定2級レベルのトピックに対し、単に問題が解けるだけでなく、全体的な背景も同時に理解できるようになると良いと思います。
必要な数学についてはこの赤本を読むことができるレベルは必須なので、数学検定2級相当の高校数学の数ⅡBまでは必ず抑えると良いと思います。また、専門的に統計学を利用するにあたって、数ⅢCも軽くは抑えておく方が応用時にプラスになりやすいので、数ⅢCも並行で進めておくと良いと思います。

統計学のプロフェッショナルになりたい

「統計学のプロフェッショナルになりたい方」は、「統計検定準1級と1級の合格」を一つの目標にすると良いのではないかと思います。どちらもそれほど簡単な試験ではない一方で、難しい本を何冊も読破するよりは具体的に問題が作成されている分、目標設定がしやすいと思います。

さて、統計検定の準1級と1級の合格にあたっての学習ですが、これらに取り掛かる前に2級の内容を固めることが前提となります。よって、「2級には合格したけれど、内容の理解が十分でない方」は前項でもご紹介した赤本を先に読み切った上で準1級以降に取り掛かると良いです。

さて、上記の赤本を読み切った上で準1級、1級に取り組むわけですが、統計検定の公式から出されている準1級のワークブックは比較的確認しやすいのでおすすめです。

ここで上記のワークブックに取り組む際の注意事項は、「比較的」読みやすい一方で、幅広いトピックを取り扱ったことでトピックによっては記載だけではわからない場合もあることです。7章、8章で取り扱われる漸近論などや、フィッシャーの線形判別などは本来もう少し説明がある方が望ましいのではという印象を受けました。反対に、確率母関数やモーメント母関数の説明はわかりやすいなど、トピックごとに読みやすさが大きく異なる印象です。
とはいえ、準1級以上の内容については全てのトピックをわかりやすく記述されるケースはほぼないので、何冊かを入手し、手元で見比べながら学習を進めると良いと思います。

辞書的に用いるにあたって一番おすすめなのが上記の「パターン認識と機械学習」です。この本は全体を通して高度な内容が概ね同じ難易度で記載されるので、「だいたい把握したけれどもう少し詳しく理解したい」などの際に非常に有用です。
よって、「パターン認識と機械学習」を所々参照が可能な数学力を身につけると良いと思います。高校数学の全トピックに加えて、線形代数を抑えておけば基本的な数学の理解は十分だと思います。
統計学で利用する数学は「高校数学レベル+線形代数」を抑えるだけでは一見難しい場合もあるのですが、トリッキーに見える数式展開はだいたい決まっており、数式展開のパターンを抑えておくことで対処可能です。
・ラグランジュの未定乗数法
・二次形式をベクトルで微分する
概ね上記のトピックなどを抑えておくことで対処が可能であり、上記の理解にあたっては「高校数学+線形代数」の理解があれば概ね可能なので、「高校数学+線形代数」さえ身につければあとはいくつかパターンを抑えるだけになります。

特に二次形式のベクトルでの微分はよく出てくるのですが、下記で取り扱いましたので詳しくは下記をご確認ください。
https://www.hello-statisticians.com/explain-terms-cat/pca1.html

習得するにあたってのロードマップ

高校2年生レベル(数学検定2級)

数学検定の2級は高校2年生で取り扱う数ⅡBに概ね対応するように問題が作成されます。よって、数学検定の2級を目安に学習を進めると良いと思います。
数学検定2級では答えだけを記載する1次試験と論述を記載する2次試験の二段階の試験ですが、基本問題について取り扱われた1次試験の問題が解ければ十分だと思います。「数学はどのくらい必要か」という話の際にやたら難しい内容が必要と考える方が多くおられるようですが、基本問題がわかれば十分なので学生時に取り組んだよりも簡単なレベルで十分であることについては知るべきです。具体的にそれぞれのトピックについてはたとえば下記のレベルでわかれば十分だと思います。
・$\displaystyle \sum$は$\displaystyle \sum_{i=1}^{n} i = 1+2+3+…+n$のように和を表す記号である。
・微分とは関数の傾きを意味する。
・指数関数は$y=a^x$、対数関数は$y=log_{a} x$のように表す。
基本問題を解くうちに上記は自然と身に付く内容ですが、難しいと感じる方もおられるようです。学生時のようにテストで点を取れる必要もないので、基本的な問題を参考書を見ながら解くうちに理解できればそれで十分です。

学習の進め方は問題演習を多めに取り組むのが良いのではと思います。チャート式の白チャートなどの基本問題がわかるまで取り組むと力がつくのではと思います。また、問題演習にあたって最初は解き方がわからないかもしれませんが、解答を見ながら理解して解き方を覚えるという形で進めても大丈夫です。
基本問題のパターンはそれほど多くないので、パターンを覚えることで理解につなげるという形式で学習を進めるで十分だと思います。

高校卒業レベル_理系(数学検定準1級)

数学検定準1級は理系の高校卒業レベルを取り扱うとされます。が、少々問題が難しい印象も受けます。
よって、前項と同様な形式で参考書を選び、基本問題だけ取り組む形で十分だと思います。

大学教養課程レベル(高校数学+線形代数 etc)

高校数学は大学受験用の参考書が揃っているので学習が進めやすいですが、大学の内容は記述がわかりやすい書籍は非常に少ない印象です。とはいえ行列の積、固有値・固有ベクトル、逆行列がわかればそれほど困らないというのも事実です。
よって、高校数学の範囲で取り扱われることもある行列を中心に取り組んで、線形代数は必要に応じて取り組むでも十分だと思います。特に行列の積、固有値・固有ベクトル、逆行列は至る所で出てくるので必ず抑えておくようにしましょう。
また、チャート式の線形代数も出版されているようなので、そちらも取り組むと良いかもしれません。

まとめ

当記事では「統計学の理解にあたって知っておきたい数学の理解と学習にあたってのロードマップ」についてまとめました。大学の数学のテキストは記載が不必要に難しいものが多いので、なるべく高校までの参考書を中心に理解を試みるのが良いと思います。
また、キャンパスゼミなども薦められる場合も見かけますが、キャンパスゼミは所々ミスリードもある印象のためあまりお薦めしません。なるべく高校の参考書を中心に学習を進めて、必要に応じて専門書やWebの情報を探すと良いのではと思います。