当まとめでは統計検定$2$級の公式テキストの副教材に用いることができるように、統計学入門に関して取り扱います。当記事では「統計検定$2$級対応 統計学基礎」の$3.1$節「母集団と標本」の内容を元に推測統計を考える際に前提となる枠組みについて確認を行います。
統計検定$2$級のテキストとの対応がわかりやすいように、目次を「統計検定$2$級対応 統計学基礎」と対応させました。学びやすさの観点からあえて目次を対応させましたが、当まとめは「統計の森」オリジナルのコンテンツであり、統計検定の公式とは一切関係ないことにご注意ください。
・統計検定$2$級対応・統計学入門まとめ
https://www.hello-statisticians.com/stat_basic
「母集団と標本」の概要
概要
「母集団と標本」は推測統計を学ぶにあたっての基盤となる重要な概念です。「標本」は記述統計で出てくる観測値と同様ですが、推測統計では「標本」から「母集団」の推測を考えます。
たとえば「新製品の企画/マーケティング」を行うにあたって、対象層全員に調査を行うと数百万人の単位になり費用対効果の面で現実的ではありません。このような場合は対象層からランダムに数十人選び出し調査を行い、その結果から全体の結果を推測するということがよく行われます。
このときに数百万人単位の全体を「母集団(population)」、選び出した数十人を「標本(sample)」、「標本」から「母集団」の傾向を推測することを「統計的推測」といいます。「統計的推測」の際に母集団のパラメータの値を計算する場合がありますが、このことを「推定」と表すことも合わせて抑えておくと良いです。「推定」は「区間推定」と「点推定」に分けられ、区間推定では確率分布の%点を元にパラメータの区間を推定し、「点推定」では「最尤推定」のように何らかの基準に沿ってパラメータの値を推定します。
発展事項①
パラメータの点推定で用いられるのが「最尤法」です。最尤法に関しては下記などで詳しく取り扱いました。
必要な数学
推測統計の基盤の「概念の理解」であるので、数学の理解は必要ありませんが、議論が抽象的なので定期的に復習を行うと良いと思います。
用語の整理
標本調査と全数調査
前節では「新製品の企画/マーケティング」を例に標本に基づく統計的推測に関して確認を行いましたが、このような調査を標本調査(sample survey)といいます。一方で国勢調査のように全国民を対象とする調査を行う場合がありますが、このような調査を全数調査(complete survey)といいます。基本的には全数調査はコストがかかることが多いので、標本調査に基づいて統計的推測を行うことが多いと考えておくと良いと思います。
調査と母集団の対応付け
調査にあたって何らかの指標に関して母集団の平均などを知りたい場合があります。このような母集団の平均のような値を母数(パラメータ)といいます。母数は「確率分布のパラメータ」と対応させて考える場合がほとんどであるので、基本的には平均や分散を表す母平均や母分散を取り扱うケースが多いです。
母集団のパラメータに母平均や母分散を考える一方で、母平均や母分散は標本の関数である「統計量」から「推測」を行います。「統計量」の例は「標本平均」や「標本分散」が挙げられ、これらは母平均や母分散と対応します。
発展事項②
数理統計学を学ぶ際に「母数の推定に十分な統計量」を「十分統計量」と定めます。「統計量」が「標本の関数であり、母数の推定に用いる」と理解しておくことで数理統計学も学びやすくなるので、用語の定義を大まかに抑えておくと良いと思います。