ブログ

3.4.3 母分散の区間推定 〜統計検定2級対応・統計学入門まとめ〜

当まとめでは統計検定$2$級の公式テキストの副教材に用いることができるように、統計学入門に関して取り扱います。当記事では「統計検定$2$級対応 統計学基礎」の$3.4.3$節「母分散の区間推定」の内容を元に$\chi^2$分布を用いた母分散の区間推定について取りまとめを行いました。
統計検定$2$級のテキストとの対応がわかりやすいように、目次を「統計検定$2$級対応 統計学基礎」と対応させました。学びやすさの観点からあえて目次を対応させましたが、当まとめは「統計の森」オリジナルのコンテンツであり、統計検定の公式とは一切関係ないことにご注意ください。

・統計検定$2$級対応・統計学入門まとめ
https://www.hello-statisticians.com/stat_basic

「母分散の区間推定」の概要

概要

当記事では「標本」の「実測値」に基づいて「母分散の区間推定」を行います。区間推定にあたっては自由度$n-1$の$\chi^2$分布を用いて計算を行います。

必要な数学

「区間推定」の結果の導出にあたっては不等号に関する計算がよく出てくるので、抑えておく必要があります。
$$
\large
\begin{align}
\chi^2_{\alpha=0.975}(n-1) \leq \frac{(n-1)s^2}{\sigma^2} \leq \chi^2_{\alpha=0.025}(n-1)
\end{align}
$$

上記のような数式を$\sigma^2$に関して解く必要があるので、特に$1/x<1/y$が$x>y$に対応することは必須です。

母分散の区間推定

母分散が未知の場合の母平均の推定

「標本」の確率変数を$X_i \sim \mathcal{N}(\mu,\sigma^2)$と考えるとき、検定統計量$\chi^2$を下記のように考えることができます。
$$
\large
\begin{align}
\chi^2 &= \frac{\sum(X_i-\overline{X})}{\sigma^2} = \frac{(n-1)s^2}{\sigma^2} \sim \chi^2(n-1) \\
\overline{X} &= \frac{1}{n} \sum_{i=1}^{n} X_i \\
s^2 &= \frac{1}{n-1} \sum_{i=1}^{n} (X_i-\overline{X})^2
\end{align}
$$

上記の$\chi^2(n-1)$は自由度$n-1$の$\chi^2$分布を表します。ここで標本平均の実現値を$\overline{x}$、不偏標本分散の実現値を$\hat{s}^2$、自由度$n-1$の$\chi^2$分布$\chi^2(n-1)$の上側$\alpha’$点を$\chi^2_{\alpha=\alpha’}(n-1)$のようにおくと、$\displaystyle \chi^2 = \frac{(n-1)s^2}{\sigma^2} \sim \chi^2(n-1)$より$\sigma^2$の$95$%区間に関して下記が成立します。
$$
\large
\begin{align}
\chi^2_{\alpha=0.975}(n-1) \leq \frac{(n-1)s^2}{\sigma^2} \leq \chi^2_{\alpha=0.025}(n-1) \quad (1)
\end{align}
$$

上記の$(1)$式は下記のように変形できます。
$$
\large
\begin{align}
\chi^2_{\alpha=0.975}(n-1) \leq & \frac{(n-1)\hat{s}^2}{\sigma^2} \leq \chi^2_{\alpha=0.025}(n-1) \quad (1) \\
\frac{1}{\chi^2_{\alpha=0.025}(n-1)} \leq & \frac{\sigma^2}{(n-1)\hat{s}^2} \leq \frac{1}{\chi^2_{\alpha=0.975}(n-1)} \\
\frac{(n-1)\hat{s}^2}{\chi^2_{\alpha=0.025}(n-1)} \leq & \sigma^2 \leq \frac{(n-1)\hat{s}^2}{\chi^2_{\alpha=0.975}(n-1)}
\end{align}
$$

上記の$\sigma^2$が得られた観測値に基づく母分散$\sigma^2$の$95$%区間であると考えることができます。

$\chi^2$分布の上側%点と自由度

下記の値は概ね抑えておくと良いと思います。

自由度 $10$$20$$60$$120$$240$
上側$1.0$%点 $23.21$$37.57$$88.38$$158.95$$293.89$
上側$2.5$%点$20.48$$34.17$$83.30$$152.21$$284.80$
上側$5.0$%点 $18.31$$31.41$$79.08$$146.57$$277.14$
上側$97.5$%点 $3.25$$9.59$$40.48$$91.57$$198.98$
上側$99.0$%点 $2.56$$8.26$$37.48$$86.92$$191.99$

発展事項

$\chi^2$分布の確率密度関数の導出は下記で詳しく取り扱いました。

ベイズ統計学の用語まとめ 〜ベイズ統計学、ベイズ法、ベイズ推定、ベイズ推定量、ベイズの定理〜

ベイズ統計学(Bayes statistics)にはベイズ法、ベイズ推論、ベイズ推定など様々な用語が用いられる一方で、教科書・参考書などではそれぞれの定義がない場合が多いです。そこで当記事ではベイズ統計学に関連する用語に関して取りまとめを行いました。

前提の確認

概要

ベイズ統計学(Bayes statistics)では様々な用語が用いられる一方で、用語の定義が厳密になされる場合は少ない。

・ベイズ統計学(Bayes statistics)
・ベイズ推論
・ベイズ法
・ベイズ推定
・ベイズ推定量(Bayes estimator)
・ベイズの定理(Bayes theorem)

具体的には上記のような用語が「ベイズ統計学」を学ぶ上でよく出てくるが、「ベイズの定理(Bayes theorem)」以外では上記の使い分けは難しい。そこで当記事ではベイズ統計学の用語について取りまとめの作成を行なった。

参考書籍

「統計学準$1$級対応 ワークブック(学術図書出版社)」、「現代数理統計学(学術図書出版社)」、「数理統計学(共立出版)」などを用いた。

上記の書籍では定義が確認できない点が多く見受けられたので、そもそもの用語の意味やWikipediaの内容に加えて筆者の仮説なども交えながら取りまとめを行なった。確定版ではないので適切な参考文献が見つかり次第アップデートを行う予定である。

必要な事前知識

「ベイズ統計学」に関して一通り学んだことを前提としており、「事前確率」、「事後確率」、「尤度」、「最尤推定」、「MAP推定」、「推定量」、「推定値」、「予測分布」などについては解説なくそのまま用語を用いる。

用語の定義

定義が明示的になされており、確実であるものから順に以下取り扱う。

ベイズの定理

事象$A$の原因に互いに排反な$n$個の事象$H_1, H_2, \cdots , H_n$を考える。このとき条件付き確率$P(H_i|A)$は下記のように表せる。
$$
\large
\begin{align}
P(H_i|A) &= \frac{P(H_i)P(A|H_i)}{P(A)} \\
&= \frac{\displaystyle P(H_i)P(A|H_i)}{\displaystyle \sum_{i=1}^{n} P(A \cap H_i)}
\end{align}
$$

上記をベイズの定理(Bayes theorem)という。ベイズの定理は「条件付き確率の定義」や「確率の情報定理」に基づく数式であり、基本的に全ての文献で定義が一致する。

ベイズ推定量

ベイズ推定量(Bayes estimator)はパラメータ$\theta$の事後分布$P(\theta|x)$の期待値を元にパラメータ推定を行う際に用いる推定量である。「数理統計学(共立出版)」のようにEAP推定量(Expected a Posterior Estimator)と表されることもある。

「ベイズ推定量」と表すと「最大事後確率推定量(MAP推定量)」は「ベイズ的な推定量ではない」と見えなくもないので、「統計の森」では「期待事後推定量(EAP推定量)」と表す場合が多い。

ベイズ統計学

ベイズ統計学:Wikipedia」では「ベイズ統計学」は「確率のベイズ的解釈に基づく統計学」であるとされます。基本的には「ベイズの定理」を統計学に適用したと考えておけば良いと思われる。

ベイズ法

「現代数理統計学」では「ベイズ統計学の手法」が「ベイズ法」とされる。よって、前項の「ベイズ統計学」における手法であると解釈できる。

ベイズ推定

ベイズ推定:Wikipedia」では「ベイズ推定」は「ベイズ確率の考え方に基づき、観測事象から、推定したい事柄を、確率的な意味で推論すること」や、「ベイズ確率に基づいて推定量を計算すること」などの記載がある。

上記はあまり明確な定義ではないが、「推定」という用語は「母集団のパラメータを標本から推定する際に用いる」ことも合わせて考慮することで「ベイズ推定」は「事後分布に基づいて母集団のパラメータを推定することを指す」のではないかというのが筆者の仮説である。

「ベイズ推定:事後分布に基づいて行う母集団のパラメータの推定」であれば、「EAP推定量」や「MAP推定量」と同様に考えると良い。

ベイズ推論

「推定」と「推論」は基本的に同様の意味であるように思われるが、機械学習では「推論」が「未知サンプルの予測」という意味で用いられる。よって、「ベイズ推論」は「母集団のパラメータ推定」ではなく「予測分布」を指すのではないかというのが筆者の仮説である。

4.2 基本的な仮説検定の構造 〜統計検定2級対応・統計学入門まとめ〜

当まとめでは統計検定$2$級の公式テキストの副教材に用いることができるように、統計学入門に関して取り扱います。当記事では「統計検定$2$級対応 統計学基礎」の$4.2$節「基本的な仮説検定の構造」の内容を元に仮説検定におけるいくつかの重要な観点について確認を行います。
統計検定$2$級のテキストとの対応がわかりやすいように、目次を「統計検定$2$級対応 統計学基礎」と対応させました。学びやすさの観点からあえて目次を対応させましたが、当まとめは「統計の森」オリジナルのコンテンツであり、統計検定の公式とは一切関係ないことにご注意ください。

・統計検定$2$級対応・統計学入門まとめ
https://www.hello-statisticians.com/stat_basic

「基本的な仮説検定の構造」の概要

概要

上記で取り扱った「仮説検定」の基本的な考え方を元に、当記事では「仮説検定」における重要な観点に関して取りまとめを行いました。

必要な数学

推測統計の基盤の「概念の理解」であるので、数学の理解は必要ありませんが、議論が抽象的なので定期的に復習を行うと良いと思います。

仮説検定における重要事項

帰無仮説・対立仮説

「仮説検定」では「母数(パラメータ)」の値を仮定した際に標本の「実測値」が「珍しいかどうか」に基づいて考察を行う考え方です。この際に仮定する「母数」の値を「帰無仮説(null hypothesis)」といいます。

「帰無仮説を元に考えると実測値が有意水準$\alpha$を超えて珍しい結果である」場合に「帰無仮説」を棄却しますが、この際に採択されるのが「対立仮説(alternative hypothesis)」です。

帰無仮説と対立仮説はそれぞれ$H_0$、$H_1$のように表されますが、「仮説検定」の手順では「帰無仮説が正しくない」には統計的な裏付けがある一方で、「帰無仮説が正しい」には統計的な裏付けがありません。よって、実用的に「仮説検定」を行う際には「帰無仮説が正しくない」を「主張」できるように論理展開を行うことが多いです。たとえば「新薬の効果があるか」については「効果がない」を帰無仮説$H_0$に設定し、仮説検定を行うなどがこの例にあげられます。

片側対立仮説と両側対立仮説

前項で確認した「対立仮説」の設定にあたっては、主に$2$つの設定方法があります。たとえばテストの点数を元に評価を行う場合、「上回る場合」と「下回る場合」の両側について考慮する必要があります。この際は帰無仮説$H_0 \, \mu=80$に対し、対立仮説$H_1 \, \mu \neq 80$を考えます。

一方で、「新薬の効果」のように「現状の改善」が前提にある場合は「片側」への数値の移動のみを考慮します。この際は帰無仮説$H_0 \, \mu=0$に対し、対立仮説を$H_1 \, \mu > 0$のように設定します。

このように対立仮説$H_1$は「片側」のみを考える「片側対立仮説」と「両側」を考える「両側対立仮説」の$2$つの設定方法があります。片側と両側の使い分けに関しては厳密には難しいので、ある程度慣用的に判断するのが良いと思います。

検定統計量と棄却域

「仮説検定」では「母集団」から得られる「標本」に基づいて計算される「統計量」の値に基づいて考察を行います。
$$
\large
\begin{align}
\overline{X} &= \frac{1}{n} \sum_{i=1}^{n} X_i \\
\hat{p} &= \frac{X}{n}
\end{align}
$$

上記のように定義される標本平均$\overline{X}$や標本比率$\hat{p}$のように、「仮説検定」に用いられる「統計量」を「検定統計量(test statistic)」といいます。「仮説検定」では「母数(パラメータ)」の値を仮定した際に「検定統計量」の値が「珍しいかどうか」を元に考察を行います。

観測された標本の「実測値」を元に「検定統計量」を計算した際に「有意水準$\alpha$を超えて珍しい結果である」場合は帰無仮説が棄却されます。ここで「帰無仮説」が棄却される範囲を仮説検定の棄却域(rejection region)といいます。

棄却と受容、2種の過誤

母集団の平均に関する仮説

4.1 仮説検定の考え方 〜統計検定2級対応・統計学入門まとめ〜

当まとめでは統計検定$2$級の公式テキストの副教材に用いることができるように、統計学入門に関して取り扱います。当記事では「統計検定$2$級対応 統計学基礎」の$4.1$節「仮説検定の考え方」の内容を元に仮説検定の概要と基本的な考え方について確認を行います。
統計検定$2$級のテキストとの対応がわかりやすいように、目次を「統計検定$2$級対応 統計学基礎」と対応させました。学びやすさの観点からあえて目次を対応させましたが、当まとめは「統計の森」オリジナルのコンテンツであり、統計検定の公式とは一切関係ないことにご注意ください。

・統計検定$2$級対応・統計学入門まとめ
https://www.hello-statisticians.com/stat_basic

「仮説検定の考え方」の概要

概要

「推測統計」では得られた「観測値」を元に「母集団」についてなんらかの推測を行います。「区間推定」では「母平均」のような母集団のパラメータの値を区間での予測を行いますが、「仮説検定」では「パラメータの値を特定の値に定めて良いか」を確率的に検証します。

必要な数学

「統計検定2級対応 統計学基礎」では$2$項分布の例が出てくるので当記事でも同様の例を取り扱います。よって、「順列・組み合わせ」の理解が必要になります。

仮説検定

基本的な考え方

「仮説検定」では母集団に対して「母平均」や「母比率」のようなパラメータの値を定めた際に、「手元に得られた観測値が確率的に珍しいかどうか」を元に考察を行います。たとえば「同様に確からしい」サイコロのが$3$回中$3$回が$1$である確率は下記のように計算できます。
$$
\large
\begin{align}
\left( \frac{1}{6} \right)^{3} &= \frac{1}{216} \\
&= 0.00462 \cdots
\end{align}
$$

上記のようにサイコロを$3$回投げた際に$3$回とも$1$が出る確率は約$0.46$%であり、低い確率であると考えられます。状況によりますがこのような場合は「サイコロに仕掛けがあるのではないか」と考える場合があると思います。

同様に「統計検定2級対応 統計学基礎」では「タコが$20$試合中$14$試合の結果を予測した場合、珍しいと言えるか」について取り扱われています。的中させる確率を$1/2$と考えるとき、「$20$試合中$14$試合の結果を予測する確率」は下記のように計算できます。
$$
\large
\begin{align}
{}_{20} C_{14} \left( \frac{1}{2} \right)^{14} \left( \frac{1}{2} \right)^{6} = 0.0369 \cdots
\end{align}
$$

上記のように約$3.7$%が得られますが、「この結果が珍しいか」を判断するにあたっては、$15$試合以上的中させた場合と$6$試合以下のみの的中の場合を加えて珍しいかを判断する必要があります。この確率が約$11.5$%なので$14$試合の的中はそれほど珍しくないと考えることができます。

下記を実行することで具体的な計算を行いました。

import math

prob1 = math.factorial(20)/(math.factorial(14)*math.factorial(6)*2.**20)

prob2 = 0.
for i in range(14,21):
    prob2 += math.factorial(20)/(math.factorial(i)*math.factorial(20-i)*2.**20)

print(prob1)
print(prob2*2)

上記では「珍しくないか」を確認するにあたって、サイコロでは$1/6$、タコの予測では$1/2$のように「一様な確率」を母集団の確率の「母比率」に仮定しました。ここで設定した確率を「帰無仮説」といい、珍しい結果が得られた場合に「帰無仮説を棄却する」というのが仮説検定の考え方です。

このとき、帰無仮説を棄却する基準が必要になりますが、ここで設定する確率を統計学では「有意水準(level of significance)」といい、$\alpha$で表します。

また、サイコロの例では「片側確率」、タコの例では「両側確率」を取り扱いましたが、これらの取り扱いは問題によって使い分ける必要があります。詳しくは「基本的な仮説検定の構造」で取り扱いました。

3.4.2 母分散が未知の場合の母平均の推定 〜統計検定2級対応・統計学入門まとめ〜

当まとめでは統計検定$2$級の公式テキストの副教材に用いることができるように、統計学入門に関して取り扱います。当記事では「統計検定$2$級対応 統計学基礎」の$3.4.2$節「母分散が未知の場合の母平均の推定」の内容を元に母分散未知の際の母平均の推定について取りまとめを行いました。
統計検定$2$級のテキストとの対応がわかりやすいように、目次を「統計検定$2$級対応 統計学基礎」と対応させました。学びやすさの観点からあえて目次を対応させましたが、当まとめは「統計の森」オリジナルのコンテンツであり、統計検定の公式とは一切関係ないことにご注意ください。

・統計検定$2$級対応・統計学入門まとめ
https://www.hello-statisticians.com/stat_basic

母分散が未知の場合の母平均の推定の概要

概要

上記で取り扱った「正規分布の母平均の推定」に際して、母分散が未知の場合を当記事では取り扱います。

必要な数学

「区間推定」の結果の導出にあたっては不等号に関する計算がよく出てくるので、抑えておく必要があります。
$$
\large
\begin{align}
-1.96 \frac{\sigma}{\sqrt{n}} \leq \bar{x}-\mu \leq 1.96 \frac{\sigma}{\sqrt{n}}
\end{align}
$$

正規分布の母平均の推定

母分散が未知の場合の母平均の推定

母分散$\sigma^2$が未知の場合は不偏標本分散$s^2$を用います。このとき標本平均$\overline{X}$に関して下記が成立します。
$$
\large
\begin{align}
\frac{\overline{X}-\mu}{s/\sqrt{n}} & \sim t(n-1) \\
\overline{X} &= \frac{1}{n} \sum_{i=1}^{n} X_i \\
s^2 &= \frac{1}{n-1} \sum_{i=1}^{n} (X-\overline{X})^2
\end{align}
$$

上記の$t(n-1)$は自由度$n-1$の$t$分布を表します。ここで標本平均の実現値を$\overline{x}$、不偏標本分散の実現値を$\hat{s}^2$、自由度$n-1$の$t$分布$t(n-1)$の上側$\alpha’$点を$t_{\alpha=\alpha’}(n-1)$のようにおくと、$\displaystyle \frac{\overline{X}-\mu}{s/\sqrt{n}} \sim t(n-1)$より$\mu$の$95$%区間に関して下記が成立します。
$$
\large
\begin{align}
t_{\alpha=0.975}(n-1) \leq \frac{\bar{x}-\mu}{\hat{s}/\sqrt{n}} \leq t_{\alpha=0.025}(n-1) \quad (1)
\end{align}
$$

$t_{\alpha=0.975}(n-1)=-t_{\alpha=0.025}(n-1)$上記の$(1)$式は下記のように変形できます。
$$
\large
\begin{align}
t_{\alpha=0.975}(n-1) \leq & \frac{\bar{x}-\mu}{\hat{s}/\sqrt{n}} \leq t_{\alpha=0.025}(n-1) \quad (1) \\
-t_{\alpha=0.025}(n-1) \leq & \frac{\bar{x}-\mu}{\hat{s}/\sqrt{n}} \leq t_{\alpha=0.025}(n-1) \\
-t_{\alpha=0.025}(n-1) \frac{\hat{s}}{\sqrt{n}} \leq & \bar{x}-\mu \leq t_{\alpha=0.025}(n-1) \frac{\hat{s}}{\sqrt{n}} \\
-t_{\alpha=0.025}(n-1) \frac{\hat{s}}{\sqrt{n}} \leq & \mu-\bar{x} \leq t_{\alpha=0.025}(n-1) \frac{\hat{s}}{\sqrt{n}} \\
\bar{x} – t_{\alpha=0.025}(n-1) \frac{\hat{s}}{\sqrt{n}} \leq & \mu \leq \bar{x} + t_{\alpha=0.025}(n-1) \frac{\hat{s}}{\sqrt{n}}
\end{align}
$$

上記の$\mu$が得られた観測値に基づく母平均$\mu$の$95$%区間であると考えることができます。

$t$分布の上側%点と自由度

下記の値は概ね抑えておくと良いと思います。

自由度 $10$$20$$30$$60$$120$$240$正規分布
$0.5$%点 $3.169$$2.845$$2.750$$2.660$$2.617$$2.596$$2.576$
$2.5$%点 $2.228$$2.086$$2.042$$2.000$$1.980$$1.970$$1.960$
$5.0$%点 $1.812$$1.725$$1.697$$1.671$$1.658$$1.651$$1.645$
「統計検定2級対応 統計学基礎」表$3.1$

発展事項

$t$分布の確率密度関数の導出は下記で詳しく取り扱いました。

3.4.1 正規分布の母平均の推定 〜統計検定2級対応・統計学入門まとめ〜

当まとめでは統計検定$2$級の公式テキストの副教材に用いることができるように、統計学入門に関して取り扱います。当記事では「統計検定$2$級対応 統計学基礎」の$3.4.1$節「正規分布の母平均の推定」の内容を元に母分散既知の際の母平均の推定について取りまとめを行いました。
統計検定$2$級のテキストとの対応がわかりやすいように、目次を「統計検定$2$級対応 統計学基礎」と対応させました。学びやすさの観点からあえて目次を対応させましたが、当まとめは「統計の森」オリジナルのコンテンツであり、統計検定の公式とは一切関係ないことにご注意ください。

・統計検定$2$級対応・統計学入門まとめ
https://www.hello-statisticians.com/stat_basic

正規分布の母平均の推定の概要

概要

「区間推定」で取り扱った例に関して当記事では詳しく取り扱います。

必要な数学

「区間推定」の結果の導出にあたっては不等号に関する計算がよく出てくるので、抑えておく必要があります。

$$
\large
\begin{align}
-1.96 \frac{\sigma}{\sqrt{n}} \leq \bar{x}-\mu \leq 1.96 \frac{\sigma}{\sqrt{n}}
\end{align}
$$

上記のような数式を$\mu$に関して解く必要があるので、特に$-x<-y$が$x>y$に対応することは必須です。

正規分布の母平均の推定

母分散が既知のとき

母平均$\mu$の$95$%区間は下記を計算することで得られます。
$$
\large
\begin{align}
\bar{x}-1.96 \frac{\sigma}{\sqrt{n}} \leq & \mu \leq \bar{x} + 1.96 \frac{\sigma}{\sqrt{n}} \quad (1)
\end{align}
$$

上記の導出に関しては下記で詳しく取り扱いました。

また、母平均$\mu$の$99$%区間は$z_{\alpha=0.01}=2.58$より、下記を計算することで得られます。
$$
\large
\begin{align}
\bar{x} – 2.58 \frac{\sigma}{\sqrt{n}} \leq & \mu \leq \bar{x} + 2.58 \frac{\sigma}{\sqrt{n}} \quad (2)
\end{align}
$$

母分散未知だがサンプル数が大きいとき

サンプル数が大きい際は一致性に基づき、観測値から計算された標準偏差$\hat{\sigma}$を$(1)$式$(2)$式の$\sigma$の代わりに用いて計算を行えば良いです。

母分散未知かつサンプル数がそれほど大きくないとき

「母分散が未知の場合の母平均の推定:分布の利用」で詳しく取り扱います。

3.3.2 区間推定 〜統計検定2級対応・統計学入門まとめ〜

当まとめでは統計検定$2$級の公式テキストの副教材に用いることができるように、統計学入門に関して取り扱います。当記事では「統計検定$2$級対応 統計学基礎」の$3.3.2$節「区間推定」の内容を元に区間推定の基本的な考え方について取りまとめを行いました。
統計検定$2$級のテキストとの対応がわかりやすいように、目次を「統計検定$2$級対応 統計学基礎」と対応させました。学びやすさの観点からあえて目次を対応させましたが、当まとめは「統計の森」オリジナルのコンテンツであり、統計検定の公式とは一切関係ないことにご注意ください。

・統計検定$2$級対応・統計学入門まとめ
https://www.hello-statisticians.com/stat_basic

区間推定の概要

概要

「推測統計」では観測された「標本」から母平均などの「母集団」のパラメータの「推定」を行いますが、$1$点でパラメータを推定する「点推定」に対して「区間推定」は「上限」と「下限」に基づく区間を用いて推定を行います。

たとえば全国模試のクラス平均が$75$点だった際に、全国平均も$75$点と推定するのが「点推定」、概ね$70$点〜$80$点の間であると推定するのが「区間推定」に対応すると大まかに考えておくと良いです。

必要な数学

「区間推定」の結果の導出にあたっては不等号に関する計算がよく出てくるので、抑えておく必要があります。
$$
\large
\begin{align}
– 1.96 \frac{\sigma}{\sqrt{n}} \leq \bar{x}-\mu \leq 1.96 \frac{\sigma}{\sqrt{n}}
\end{align}
$$

上記のような数式を$\mu$に関して解く必要があるので、特に$-x<-y$が$x>y$に対応することは必須です。

区間推定

区間推定の基本的な考え方

区間推定(interval estimation)は「確率変数の関数である統計量が特定の確率分布に従う」ことに基づいて区間の推定を行う考え方です。たとえば標本平均$\overline{X}$に関して中心極限定理より下記が成立します。
$$
\large
\begin{align}
T(X_1, \cdots , X_n) &= \overline{X} \sim \mathcal{N} \left( \mu,\frac{\sigma^2}{n} \right) \\
\overline{X} &= \frac{1}{n} \sum_{i=1}^{n} X_i
\end{align}
$$

ここで標本平均の実現値を$\overline{x}$、母分散を定数$\sigma^2$、標準正規分布$\mathcal{N}(0,1)$の上側$\alpha’$点を$z_{\alpha=\alpha’}$のようにおくと、$\displaystyle \overline{X} \sim \mathcal{N} \left( \mu,\frac{\sigma^2}{n} \right)$より$\mu$の$95$%区間に関して下記が成立します。
$$
\large
\begin{align}
z_{\alpha=0.975} \leq \frac{\bar{x}-\mu}{\sigma/\sqrt{n}} \leq z_{\alpha=0.025} \quad (1)
\end{align}
$$

標準正規分布$\mathcal{N}(0,1)$に関して$z_{\alpha=0.025}=1.96, z_{\alpha=0.975}=-z_{\alpha=0.025}=-1.96$より、$(1)$式は下記のように変形できます。
$$
\large
\begin{align}
z_{\alpha=0.975} \leq & \frac{\bar{x}-\mu}{\sigma/\sqrt{n}} \leq z_{\alpha=0.025} \quad (1) \\
-1.96 \leq & \frac{\bar{x}-\mu}{\sigma/\sqrt{n}} \leq 1.96 \\
-1.96 \frac{\sigma}{\sqrt{n}} \leq & \bar{x}-\mu \leq 1.96 \frac{\sigma}{\sqrt{n}} \\
-1.96 \frac{\sigma}{\sqrt{n}} \leq & \mu-\bar{x} \leq 1.96 \frac{\sigma}{\sqrt{n}} \\
\bar{x}-1.96 \frac{\sigma}{\sqrt{n}} \leq & \mu \leq \bar{x} + 1.96 \frac{\sigma}{\sqrt{n}}
\end{align}
$$

上記の$\mu$が得られた観測値に基づく母平均$\mu$の$95$%区間であると考えることができます。

発展事項

基本的には「統計量は標本の関数である」と定義されますが、標本が「確率変数」を指すのか「観測値」を指すのかは文脈次第であることが多いように思います。見分け方に関しては確率変数の場合は大文字を用いて$X_i$、観測値の場合は小文字を用いて$x_i$と定義されることが多いです。

同様に統計量が$T(X_1, \cdots , X_n)$と表記されれば確率変数です。また、統計量$T(X_1, \cdots , X_n)$を用いて定義する$\hat{\theta}=T(X_1, \cdots , X_n)$を「推定量」、推定量に具体的な観測値を代入した値を「推定値」という場合が多いです。

本文では統計量$T(X_1, \cdots , X_n)$に関し、$T(X_1, \cdots , X_n) = \overline{X} \sim \mathcal{N}(\mu, \sigma^2)$のような表現を用いるにあたって統計量は確率変数の関数であると定義しました。

具体例:光速の測定値

統計検定準1級 問題解説 ~2017年6月実施 選択問題及び部分記述問題 問14~

過去問題

過去問題は統計検定公式が問題と解答例を公開しています。こちらを参照してください。

解答

[1] 解答

(1) $\boxed{ \ \mathsf{23}\ }$ : ③

(ア)の予測値に対する残差のプロットから、$29$(USA)の予測値はおよそ$84$、残差はおよそ$-5.5$であるとわかる。これに一番近い選択肢は$3$である。

(2) $\boxed{ \ \mathsf{24}\ }$ : ⑤

てこ値が大きい観測値の方がモデルへの影響力は大きいため、誤りである。
(統計学実践ワークブック第$17$章等を参照)

[2] 解答

(1) $\boxed{ 記述\ 8 }$

(ア)を見ると,残差が$-4$より小さい(絶対値が大きい)点の個数がモデル$1$よりもモデル$2$の方が少なく、モデル$2$の方が推定が良くなっていることが読み取れる。
従って、決定係数が大きいのはモデル$2$である。

(2) $\boxed{ 記述\ 9 }$

問の表から、日本の平均寿命は$83.4$である。つまり、残差を$y$、予測値を$x$とすると、$y+x=83.4$の関係式を満たす。

したがって$y=-x+83.4$と変形できることから、点$(83.4,0)$を通り、傾き$-1$の直線上の点がJPNである。(図は省略)

(3) $\boxed{ 記述\ 10 }$

箱髭図は下記の通りとなる。

3.1 母集団と標本 〜統計検定2級対応・統計学入門まとめ〜

当まとめでは統計検定$2$級の公式テキストの副教材に用いることができるように、統計学入門に関して取り扱います。当記事では「統計検定$2$級対応 統計学基礎」の$3.1$節「母集団と標本」の内容を元に推測統計を考える際に前提となる枠組みについて確認を行います。
統計検定$2$級のテキストとの対応がわかりやすいように、目次を「統計検定$2$級対応 統計学基礎」と対応させました。学びやすさの観点からあえて目次を対応させましたが、当まとめは「統計の森」オリジナルのコンテンツであり、統計検定の公式とは一切関係ないことにご注意ください。

・統計検定$2$級対応・統計学入門まとめ
https://www.hello-statisticians.com/stat_basic

「母集団と標本」の概要

概要

「母集団と標本」は推測統計を学ぶにあたっての基盤となる重要な概念です。「標本」は記述統計で出てくる観測値と同様ですが、推測統計では「標本」から「母集団」の推測を考えます。

たとえば「新製品の企画/マーケティング」を行うにあたって、対象層全員に調査を行うと数百万人の単位になり費用対効果の面で現実的ではありません。このような場合は対象層からランダムに数十人選び出し調査を行い、その結果から全体の結果を推測するということがよく行われます。

このときに数百万人単位の全体を「母集団(population)」、選び出した数十人を「標本(sample)」、「標本」から「母集団」の傾向を推測することを「統計的推測」といいます。「統計的推測」の際に母集団のパラメータの値を計算する場合がありますが、このことを「推定」と表すことも合わせて抑えておくと良いです。「推定」は「区間推定」と「点推定」に分けられ、区間推定では確率分布の%点を元にパラメータの区間を推定し、「点推定」では「最尤推定」のように何らかの基準に沿ってパラメータの値を推定します。

発展事項①

パラメータの点推定で用いられるのが「最尤法」です。最尤法に関しては下記などで詳しく取り扱いました。

必要な数学

推測統計の基盤の「概念の理解」であるので、数学の理解は必要ありませんが、議論が抽象的なので定期的に復習を行うと良いと思います。

用語の整理

標本調査と全数調査

前節では「新製品の企画/マーケティング」を例に標本に基づく統計的推測に関して確認を行いましたが、このような調査を標本調査(sample survey)といいます。一方で国勢調査のように全国民を対象とする調査を行う場合がありますが、このような調査を全数調査(complete survey)といいます。基本的には全数調査はコストがかかることが多いので、標本調査に基づいて統計的推測を行うことが多いと考えておくと良いと思います。

調査と母集団の対応付け

調査にあたって何らかの指標に関して母集団の平均などを知りたい場合があります。このような母集団の平均のような値を母数(パラメータ)といいます。母数は「確率分布のパラメータ」と対応させて考える場合がほとんどであるので、基本的には平均や分散を表す母平均や母分散を取り扱うケースが多いです。

母集団のパラメータに母平均や母分散を考える一方で、母平均や母分散は標本の関数である「統計量」から「推測」を行います。「統計量」の例は「標本平均」や「標本分散」が挙げられ、これらは母平均や母分散と対応します。

発展事項②

数理統計学を学ぶ際に「母数の推定に十分な統計量」を「十分統計量」と定めます。「統計量」が「標本の関数であり、母数の推定に用いる」と理解しておくことで数理統計学も学びやすくなるので、用語の定義を大まかに抑えておくと良いと思います。

2.5 期待値と分散 〜統計検定2級対応・統計学入門まとめ〜

当まとめでは統計検定$2$級の公式テキストの副教材に用いることができるように、統計学入門に関して取り扱います。当記事では「統計検定$2$級対応 統計学基礎」の$2.5$節「期待値と分散」の内容を元に期待値と分散の概要と式表記に関して取りまとめました。
統計検定$2$級のテキストとの対応がわかりやすいように、目次を「統計検定$2$級対応 統計学基礎」と対応させました。学びやすさの観点からあえて目次を対応させましたが、当まとめは「統計の森」オリジナルのコンテンツであり、統計検定の公式とは一切関係ないことにご注意ください。

・統計検定$2$級対応・統計学入門まとめ
https://www.hello-statisticians.com/stat_basic

期待値・分散の概要

概要

「確率変数の各値の確率」に対応する「確率分布」が得られたとき、「確率分布に基づいて大体このような値が得られるだろう」や「大体このような範囲の値が得られるだろう」と推測できると様々な場面で役に立ちます。

「大まかな値」に対応するのが「期待値」で、「期待値の周囲の大まかな範囲」に対応するのが「分散」です。当記事では以下、確率分布に対応する「期待値」と「分散」を「確率関数」や「確率密度関数」を用いて定義し、「確率分布」と「期待値・分散」の対応について確認します。

必要な数学

「連続型確率分布」の期待値や分散は「積分」を元に定義されるので、「積分」の概念の理解が必要です。当記事では期待値・分散の定義を中心に取り扱っているので、数Ⅱレベルの積分を抑えておけば十分です。

期待値・分散

期待値

直感的理解

期待値は「確率変数がどのような値を取ると期待されるか」に基づいて定められる値です。たとえば宝くじを$1$万円購入した際の還元される額を確率変数$X$で表すとき、おおよその還元率を$3$割と仮定するなら$X$の期待値は$3000$円となります。

離散型確率分布

離散型確率変数$X$が$X=x_i$を取るときの確率を確率関数$f(x_i)$で表すと、確率変数$X$の期待値$E[X]$は下記のように定義されます。
$$
\large
\begin{align}
E[X] = \sum_{i} x_i f(x_i) = \mu
\end{align}
$$

上記では$E[X]=\mu$のように表しましたが、$\mu$は平均を表すmeanの頭文字のmに対応するギリシア文字であることも合わせて抑えておくと良いです。

連続型確率分布

連続型確率変数$X$に対応する確率密度関数を$f(x)$とおくと、確率変数$X$の期待値$E[X]$は下記のように定義されます。
$$
\large
\begin{align}
E[X] = \int_{-\infty}^{\infty} xf(x) dx = \mu
\end{align}
$$

分散

直感的理解

分散は「確率変数の散らばり度合い」に関して定められる値です。たとえば$2$つのテストの平均が双方$60$点だった場合でも、「予め問題が通知される場合」は散らばりが小さく、「抜き打ちテストの場合」は散らばりが大きいと考えられます。

このように単に平均だけを計算して標本を要約することを考えるのではなく、散らばり度合いも合わせて確認することでより質の高い考察を行えるようになります。

離散型確率分布

離散型確率変数$X$が$X=x_i$を取るときの確率を確率関数$f(x_i)$で表すと、確率変数$X$の分散$V[X]$は下記のように定義されます。
$$
\large
\begin{align}
V[X] = \sum_{i} (x_i-\mu)^2 f(x_i) = \sigma^2
\end{align}
$$

分散は「確率変数$X$の母平均$\mu$からの差分の二乗の期待値」と解釈できるので$V[X]=E[(X-\mu)^2]=E[(X-E[X])^2]$のように表せることも合わせて抑えておくと良いです。

連続型確率分布

連続型確率変数$X$に対応する確率密度関数を$f(x)$とおくと、確率変数$X$の分散$V[X]$は下記のように定義されます。
$$
\large
\begin{align}
V[X] = \int_{-\infty}^{\infty} (x-\mu)^2 f(x) dx = \sigma^2
\end{align}
$$

期待値・分散に関して成立する公式

下記で詳しく取り扱いを行いました。