仮定された理論上の確率分布に対して標本から求めた度数が適合するかどうかを確認するのが適合度検定(test of goodness of fit)である。当記事では「基礎統計学Ⅰ 統計学入門(東京大学出版会)」や「自然科学…
Hello Statisticians!
統計に関する用語、また、それと合わせて各種公式を解説します
仮定された理論上の確率分布に対して標本から求めた度数が適合するかどうかを確認するのが適合度検定(test of goodness of fit)である。当記事では「基礎統計学Ⅰ 統計学入門(東京大学出版会)」や「自然科学…
最小二乗法に基づく線形回帰は多くのケースで用いられるため、全てのケースで用いることが適切だと考えがちだが、最尤法の仮定を前提にするなどのように、ある程度大元の前提が成立しているかは確認する必要がある。当記事では線形回帰が…
マルコフ連鎖(Markov Chain)は時系列の取り扱いなどで主に用いられる手法で、言語・音声処理や強化学習においても用いられることがある。また、乱数を用いて近似解を求める手法であるMCMC(Markov Chain …
ヘッセ行列は多変数で表された二次形式(quadratic form)の二階微分を考える際に主に用いられる。凸最適化問題などを取り扱うにあたって時折出てくるので抑えておくと良い。 当稿ではWikipediaなどを参考に、ヘ…
「推測統計」を考えるにあたっては「区間推定・点推定」と「検定」の二つが主に取り上げられがちであるので、母集団分布・標本分布・統計量についてはいまいちわからない方も多いかもしれません。そこで当記事では母集団分布・標本分布・…
当記事では記述統計の基本事項を取りまとめる。記述統計は書籍などにわかりやすい記載が多いため、なるべく簡潔な記載となるようにまとめるようにした。まとめるにあたっては「基礎統計学Ⅰ 統計学入門(東京大学出版会)」の1〜3章を…
確率分布について考えるにあたって、モーメントを把握しておくと理解しやすい。当稿では、平均、分散、歪度、尖度の直感的なイメージがつかめるように、具体的な例を元にそれぞれの値を確認する。作成にあたっては、「基礎統計学Ⅰ 統計…
多次元正規分布の直感的な理解については下記で取り扱いましたが、当記事ではその多次元分布において条件付き確率分布を考えます。https://www.hello-statisticians.com/explain-terms…
この記事では偏相関係数の定義とその導出方法について解説します. 偏相関係数とは $X,Y,Z$の確率変数があり,互いに影響を及ぼしているとします.$X$の影響を除いた$Y$と$Z$の編相関係数$\rho_{YZ,X}$と…
この記事では時系列データ解析の文脈で出てくる偏自己相関の概念について解説します.偏自己相関とは,時系列データ${ y_t }$のラグ$h$時点 $t-h$と時点$t$の間に存在する$h-1$個の観測値$y_{t-h+1}…