Ch.6 「確率分布」の章末問題の解答例 〜基礎統計学Ⅰ 統計学入門(東京大学出版会)〜

当記事は基礎統計学Ⅰ 統計学入門(東京大学出版会)の読解サポートにあたってChapter.6の確率分布」の章末問題の解答例のご紹介を行います。
※ 基本的には書籍の購入者向けの解答例・解説なので、まだ入手されていない方は下記より入手をご検討いただけたらと思います。また、解説はあくまでサイト運営者が独自に作成したものであり、書籍の公式ページではないことにご注意ください。(そのため著者の意図とは異なる解説となる可能性はあります)
https://www.amazon.co.jp/dp/4130420658

章末の演習問題について

問題6.1の解答例

問題には「分散を証明せよ」とあるが、期待値も同時に抑えておく方が望ましいので、期待値も計算するものとする。
・二項分布に関して
二項分布はベルヌーイ試行を独立に繰り返した時の分布と考えることができるので、期待値$E[X]$と分散$V[X]$を求めるにあたってはベルヌーイ分布に対して$E[X_i]$、$V[X_i]$を求め、それをそれぞれ$n$倍すれば良い。
$$
\begin{align}
E[X_i] &= 0 \times (1-p) + 1 \times p \\
&= p \\
V[X_i] &= (0-E[X_i])^2 \times (1-p) + (1-E[X_i])^2 \times p \\
&= p^2(1-p) + (1-p)^2p \\
&= p(1-p)(p+(1-p)) \\
&= p(1-p)
\end{align}
$$
上記より$E[X]=nE[X_i]=np$、$V[X]=nV[X_i]=np(1-p)$が成立する。

・ポアソン分布に関して
ポアソン分布は二項分布の式において$np=\lambda$とした上で、$p$が限りなく小さい事象について取り扱うため$\lambda$が一定の状況で$n \to \infty$を考える($n \to \infty$のとき$p \to 0$)。期待値を$E[X]$、分散を$V[X]$とし、それぞれを二項分布の期待値と分散の$n \to \infty$の時の極限から求める。
$$
\begin{align}
E[X] &= \lim_{n \to \infty} np \\
&= \lim_{n \to \infty} \lambda \\
&= \lambda \\
V[X_i] &= \lim_{n \to \infty} np(1-p) \\
&= \lim_{n \to \infty} \lambda\left(1-\frac{\lambda}{n}\right) \\
&= \lambda(1-0) \\
&= \lambda
\end{align}
$$
よって$E[X] = \lambda$、$V[X] = \lambda$が導出できる。

問題6.2の解答例

$X=k$のときの確率を$P(X=k|\lambda)$とすると、$X$が$\lambda=2.5$のポアソン分布に従うことから下記が成立する。
$$
\begin{align}
P(X=k|\lambda) &= \frac{\lambda^ke^{-\lambda}}{k!} \\
&=\frac{2.5^ke^{-2.5}}{k!}
\end{align}
$$
求める確率は$X > 5$となる確率$P(X>5|\lambda=2.5)$であるが、極限的な取り扱いが必要になり大変なので$P(X \leq 4|\lambda=2.5)$の確率を$1$から引くことで求める。
$$
\begin{align}
P(X>5|\lambda) &= 1 – P(X \leq 4|\lambda) \\
&= 1 – (P(X=0|\lambda)+P(X=1|\lambda)+P(X=2|\lambda)+P(X=3|\lambda)+P(X=4|\lambda)) \\
&= 1 – \left(\frac{2.5^0e^{-2.5}}{0!}+\frac{2.5^1e^{-2.5}}{1!}+\frac{2.5^2e^{-2.5}}{2!}+\frac{2.5^3e^{-2.5}}{3!}+\frac{2.5^4e^{-2.5}}{4!}\right) \\
&= 1 – \left(\frac{2.5^0}{0!}+\frac{2.5^1}{1!}+\frac{2.5^2}{2!}+\frac{2.5^3}{3!}+\frac{2.5^4}{4!}\right)e^{-2.5} \\
&= 1 – \left(\frac{1}{1}+\frac{2.5}{1}+\frac{2.5^2}{2}+\frac{2.5^3}{6}+\frac{2.5^4}{24}\right)e^{-2.5} \\
&= 0.1088…
\end{align}
$$
上記が求める確率となる。

問題6.3の解答例

負の二項分布は$k$回目の成功を得るまでの失敗回数を$x$とした際に、確率を以下のように表す。
$$
\begin{align}
f(x) = {}_{k+x-1} C_{x} p^k (1-p)^x
\end{align}
$$
上記は幾何分布の一般化と考えることもできる。

問題6.4の解答例

i)
求める確率は下記のようになる。
$$
\begin{align}
{}_n C_{1} p^1 (1-p)^{n-1} + {}_n C_{n-1} p^{n-1} (1-p)^1 &= np(1-p)^{n-1}+np^{n-1} (1-p) \\
&= n(p^{n-1} (1-p) + p(1-p)^{n-1})
\end{align}
$$

ⅱ)
1回の試行がi)で確認した確率の幾何分布に従うので、求める期待値は$\displaystyle \frac{1}{n(p^{n-1} (1-p) + p(1-p)^{n-1})}$となる。

問題6.5の解答例

確率分布の定義より、確率密度関数の$0$以外の全区間に対して積分した結果は$1$に等しくなることを利用する。
$$
\begin{align}
\int_{-1}^{1} c(1-x^2) dx &= 2c\int_{0}^{1} c(1-x^2) dx (1-x^2がy軸に対して線対称であることを利用)\\
&= 2c\left[ x-\frac{1}{3}x^3 \right]_{0}^{1} \\
&= 2c\left( 1-\frac{1}{3} \right) \\
&= \frac{4}{3}c = 1 \\
c &= \frac{3}{4}
\end{align}
$$
上記より、$\displaystyle c=\frac{3}{4}$が得られる。また、この確率分布の期待値は下記のように計算できる。
$$
\begin{align}
E[X] &= \int_{-1}^{1} x \times \frac{3}{4}(1-x^2) dx \\
&= \frac{3}{4} \int_{-1}^{1} (x-x^3) dx \\
&= 0 (x-x^3は原点を中心に点対称であることを利用する)
\end{align}
$$
上記より、$E[X]=0$となり、分散$V[X]$、歪度$\alpha_3$、尖度$\beta_4=\alpha_4-3$はそれぞれ下記のように求めることができる。
$$
\begin{align}
V[X] &= \int_{-1}^{1} (x-0)^2 \times \frac{3}{4}(1-x^2) dx \\
&= \frac{3}{4} \int_{-1}^{1} (x^2-x^4) dx \\
&= \frac{3}{2} \int_{0}^{1} (x^2-x^4) dx (x^2-x^4がy軸に対して線対称であることを利用) \\
&= \frac{3}{2} \left[ \frac{1}{3}x^3 – \frac{1}{5}x^5 \right]_{0}^{1} \\
&= \frac{3}{2} \left( \frac{1}{3}-\frac{1}{5} \right) \\
&= \frac{3}{2} \times \frac{2}{15} \\
&= \frac{1}{5} \\ \\
\alpha_3 &= \frac{1}{V[X]^{3/2}}\int_{-1}^{1} (x-0)^3 \times \frac{3}{4}(1-x^2) dx \\
&= \frac{3}{4V[X]^{3/2}}\int_{-1}^{1} (x^3-x^5) dx \\
&= 0 (x^3-x^5は原点を中心に点対称であることを利用する)\\ \\
\alpha_4 &= \frac{1}{V[X]^2}\int_{-1}^{1} (x-0)^4 \times \frac{3}{4}(1-x^2) dx \\
&= \frac{3}{4V[X]^2}\int_{-1}^{1} (x^4-x^6) dx \\
&= \frac{3}{2V[X]^2}\int_{0}^{1} (x^4-x^6) dx (x^4-x^6がy軸に対して線対称であることを利用) \\
&= \frac{3 \times 5^2}{2} \left[ \frac{1}{5}x^5 – \frac{1}{7}x^7 \right]_{0}^{1} \\
&= \frac{3 \times 5^2}{2} \left( \frac{1}{5} – \frac{1}{7} \right) \\
&= \frac{3 \times 5^2}{2} \frac{2}{35} \\
&= \frac{15}{7} \\
\beta_4 &= \alpha_4 – 3 \\
&= -\frac{6}{7}
\end{align}
$$

問題6.6の解答例

i)
指数分布の確率密度関数は$\displaystyle f(x) = \lambda e^{-\lambda x}$、累積分布関数は$F(x) = f(X \leq x) = 1 – e^{-\lambda x}$と表現することができる。また、$1-F(x)$も$1-F(x) = f(X \geq x) = e^{-\lambda x}$で求めることができる。
このとき、$P(X>a+b|X>a)$は下記のように計算できる。
$$
\begin{align}
P(X>a+b|X>a) &= \frac{P(X>a+b)}{P(X>a)} \\
&= \frac{e^{-\lambda (a+b)}}{e^{-\lambda a}} \\
&= e^{-\lambda b} = P(X>b)
\end{align}
$$
上記で$P(X>a+b|X>a)=P(X>b)$を示すことができた。また、これは指数分布の無記憶性を意味しており、指数分布はどの状態からでも同様の確率で事象が観測されることを想定している。

ⅱ)
i)で行なった文字の定義より、$\lambda(x)$は下記のように計算できる。
$$
\begin{align}
\lambda(x) &= \frac{f(x)}{1-F(x)} \\
&= \frac{\lambda e^{-\lambda x}}{e^{-\lambda x}} \\
&= \lambda
\end{align}
$$
上記が$x$によらないので、事象が起こる瞬間的な確率が常に一定であることが確認できる。

問題6.7の解答例

$P(|Z|>c)=P(Zc)=2P(cc)=0.01,…0.1$に対応する$c$については$z_{\alpha=0.005}$、$z_{\alpha=0.01}$、$z_{\alpha=0.025}$、$z_{\alpha=0.05}$を求めればよくそれぞれ下記のようになる。
$$
\begin{align}
z_{\alpha=0.005} &= 2.57 \\
z_{\alpha=0.01} &= 2.33 \\
z_{\alpha=0.025} &= 1.96 \\
z_{\alpha=0.05} &= 1.64
\end{align}
$$
また、$P(Z>c)=0.01,…0.1$に対応する$c$については$z_{\alpha=0.01}$、$z_{\alpha=0.02}$、$z_{\alpha=0.05}$、$z_{\alpha=0.1}$を求めればよくそれぞれ下記のようになる。
$$
\begin{align}
z_{\alpha=0.01} &= 2.33 \\
z_{\alpha=0.02} &= 2.05 \\
z_{\alpha=0.05} &= 1.64 \\
z_{\alpha=0.1} &= 1.28 \\
\end{align}
$$
$z_{\alpha=0.025} = 1.96$が両側を考える際の95%区間でよく使われるが、他の値も大まかに把握しておきたい。

問題6.8の解答例

ベータ分布$Beta(a,b)$の確率密度関数はベータ関数$B(a,b)$を用いて$f(x)=x^{a-1}(1-x)^{b-1}/B(a,b)$のように表すことができるが、$B(a,b)$は規格化のために用いているので$x$について考える際は定数とみなすことができる。よって$f(x)$は下記のようにおくことができる。
$$
\begin{align}
f(x) = cx^{a-1}(1-x)^{b-1}
\end{align}
$$
ここでモードは確率密度関数が最大となる$x$に一致するので、$f(x)$が最大となるときの$x$を求めるにあたって$f'(X)$を計算する。
$$
\begin{align}
f'(x) &= (cx^{a-1}(1-x)^{b-1})’ \\
&= c(a-1)x^{a-2}(1-x)^{b-1}-c(b-1)x^{a-1}(1-x)^{b-2} \\
&= cx^{a-2}(1-x)^{b-2}((a-1)(1-x)-(b-1)x) \\
&= cx^{a-2}(1-x)^{b-2}((a-1)-(a-1)x-(b-1)x) \\
&= cx^{a-2}(1-x)^{b-2}((a-1)-(a+b-2)x)
\end{align}
$$
ベータ分布は$0<x<1$以外では確率密度関数が$0$であるので、この$f'(x)$の$0<x<1$の区間での正負の変化を考える。このとき、$cx^{a-2}(1-x)^{b-2}$は常に正であるので、$D(x)=(a-1)-(a+b-2)x$の符号の変化を考える。
$f(x)$が$0<x<1$でモードを持つためには$D(x)$に対し切片の$D(0)>0$と傾きの$-(a+b-2)<0$が成立しなければならない(必要条件)。これより$a>1$、$b>1$が$f(x)$が$0<x<1$でモードを持つための必要条件となる。このとき$D(1)=(a-1)-(a+b-2)=1-b<0$も満たすので、十分条件でもあり、「$a>1$、$b>1$が$f(x)$が$0<x<1$でモードを持つための必要十分条件」となる。
以下、$a>1$、$b>1$とした上で、$f'(x)=0$となる$x$を求める。
$$
\begin{align}
f'(x) &= 0 \\
cx^{a-2}(1-x)^{b-2}&((a-1)-(a+b-2)x) = 0 \\
(a-1)-(a+&b-2)x = 0 \\
(a+b-2)&x = a-1 \\
x &= \frac{a-1}{a+b-2}
\end{align}
$$
よってベータ分布のモードは$a>1$、$b>1$のとき、$\displaystyle x = \frac{a-1}{a+b-2}$となる。

問題6.9の解答例

問題6.10の解答例

・正規分布
確率変数を$X$とした際に正規分布のモーメント母関数は$\displaystyle m_{X}(t) = exp \left( \mu t + \frac{\sigma^2t^2}{2} \right)$で表すことができる。これをそのまま使うと複雑なので、標準正規分布のモーメント母関数の$\displaystyle m_{X}(t) = exp \left( \frac{t^2}{2} \right)$で考えることとする。
$$
\begin{align}
exp \left( \frac{t^2}{2} \right) &= 1 + \frac{t^2/2}{1!} + \frac{(t^2/2)^2}{2!} + … \\
&= 1 + \frac{t^2}{2} + \frac{t^4}{8} + …
\end{align}
$$
$\displaystyle m_{X}(t) = exp \left( \frac{t^2}{2} \right)$のマクローリン展開を考えると上記のように変形することができる。
$$
\begin{align}
m_{X}(t) = 1 + \frac{t \mu_1}{1!} + \frac{t^2 \mu_2}{2!} + \frac{t^3 \mu_3}{3!} + …
\end{align}
$$
https://www.hello-statisticians.com/explain-terms-cat/prob_generating.html
ここで、モーメント母関数が上記を満たすので、係数を比較することでモーメントを計算する。
$$
\begin{align}
\mu_1 &= 0 \\
\frac{\mu_2}{2!} &= \frac{1}{2} \\
\frac{\mu_3}{3!} &= 0 \\
\frac{\mu_4}{4!} &= \frac{1}{8}
\end{align}
$$
上記よりモーメントは下記のように計算できる。
$$
\begin{align}
\mu_1 &= 0 \\
\mu_2 &= 1 \\
\mu_3 &= 0 \\
\mu_4 &= 3
\end{align}
$$
これより標準正規分布は平均0、分散1、歪度0、尖度$3-3=0$となることが確認できる。

まとめ

Chapter.6の「確率分布」は統計学を考える上で多くの内容に関連し、様々な視点から確率分布の取り扱いがなされるなど非常に重要なトピックです。とはいえ、数が多いので、最初はベルヌーイ分布、二項分布、正規分布を中心に抑え、徐々に幾何分布、ポアソン分布、指数分布などに広げていくのが良いと思います。

「Ch.6 「確率分布」の章末問題の解答例 〜基礎統計学Ⅰ 統計学入門(東京大学出版会)〜」への1件の返信

  1. […] サンプル数$n$、母比率$p$の二項分布$Binom(n,p)$に従う確率変数$X$の母平均は$np$、母分散は$np(1-p)$と表すことができる。https://www.hello-statisticians.com/explain-books-cat/toukeigakunyuumon-akahon/ch6_practice.html#61$$begin{align}z = frac{X-np}{sqrt{np(1-p)}}end{align}$$このとき中心極限定理に基づいて、上記が従う分布は標準正規分布で近似できる。よって、$z$値を標準正規分布と見比べることで区間推定を行うことができる。母比率$p$の95%区間を考えるにあたって、対応する標準正規分布の区間が$z_{alpha=0.025} leq z leq z_{alpha=0.975}$のように表せるとする。ここで正規分布表より、$z_{alpha=0.025}=-1.96$、$z_{alpha=0.975}=1.96$を満たすことが読み取れる。このとき、下記の式変形によって$p$の95%区間を求めることができる。$$begin{align}z_{alpha=0.025} leq &z leq z_{alpha=0.975} \z_{alpha=0.025} leq &frac{X-np}{sqrt{np(1-p)}} leq z_{alpha=0.975} \-z_{alpha=0.975} leq &frac{p-X/n}{sqrt{p(1-p)/n}} leq -z_{alpha=0.025} \-z_{alpha=0.975} leq &frac{p-hat{p}}{sqrt{p(1-p)/n}} leq -z_{alpha=0.025} \-z_{alpha=0.975}sqrt{p(1-p)/n} leq &p-hat{p} leq -z_{alpha=0.025}sqrt{p(1-p)/n} \hat{p}-z_{alpha=0.975}sqrt{p(1-p)/n} leq &p leq hat{p}-z_{alpha=0.025}sqrt{p(1-p)/n} \hat{p}-1.96sqrt{p(1-p)/n} leq &p leq hat{p}+1.96sqrt{p(1-p)/n}end{align}$$「基礎統計学Ⅰ 統計学入門」の11.5.3の議論により、「$n$が大きい場合大数の法則に基づいて、不等号の一番左と右の式における$p$は$hat{p}$で近似できる」と考えることができる。よって、95%区間は下記のように近似することができる。$$begin{align}hat{p}-1.96sqrt{hat{p}(1-hat{p})/n} leq p leq hat{p}+1.96sqrt{hat{p}(1-hat{p})/n}end{align}$$ […]

コメントは受け付けていません。