Ch.5 「確率変数」の章末問題の解答例 〜基礎統計学Ⅰ 統計学入門(東京大学出版会)〜

当記事は基礎統計学Ⅰ 統計学入門(東京大学出版会)」の読解サポートにあたってChapter.5の「確率変数」の章末問題の解説について行います。
※ 基本的には書籍の購入者向けの解説なので、まだ入手されていない方は下記より入手をご検討いただけたらと思います。また、解説はあくまでサイト運営者が独自に作成したものであり、書籍の公式ページではないことにご注意ください。(そのため著者の意図とは異なる解説となる可能性はあります)
https://www.amazon.co.jp/dp/4130420658

章末の演習問題について

問題5.1の解答例

i)
$[0,6]$の一様分布なので、密度関数は$0 \leq x \leq 6$で$\displaystyle f(x) = \frac{1}{6}$、それ以外の区間で$f(x)=0$となる。また、期待値$E[X]$と分散$V[X]$は下記のように計算できる。
$$
\begin{align}
E[X] &= \int_{0}^{6} xf(x) dx \\
&= \int_{0}^{6} \frac{1}{6}x dx \\
&= \left[ \frac{1}{12}x^2 \right]_{0}^{6} \\
&= \left( \frac{6^2}{12} – \frac{0^2}{12} \right) \\
&= 3 \\
V[X] &= E[X^2] – (E[X])^2 \\
&= \int_{0}^{6} x^2f(x) dx – 3^2 \\
&= \left[ \frac{1}{18}x^3 \right]_{0}^{6} – 9 \\
&= 12-9 \\
&= 3
\end{align}
$$

ⅱ)
$$
\begin{align}
P\left(|X-E[X]| \geq k\sqrt{V[X]}\right) &\leq \frac{1}{k^2} \\
P\left(\frac{|X-E[X]|}{\sqrt{V[X]}} \geq k\right) &\leq \frac{1}{k^2} \\
P\left(\frac{|X-3|}{\sqrt{3}} \geq k\right) &\leq \frac{1}{k^2}
\end{align}
$$
チェビシェフの不等式が成立することを示すには、上記が$k>0$すべての$k$に対して成立することを示せば良い。まず、$\sqrt{3} \leq k$の際はここでの確率密度関数の定義より$\displaystyle P(|X-3| \geq \sqrt{3}k) = 0 \leq \frac{1}{k^2}$となるためチェビシェフの不等式は成立する。
また、$0<k<\sqrt{3}$のときは$\displaystyle P(|X-3| \geq \sqrt{3}k) = 1-\frac{k}{\sqrt{3}}$となり、これの$\displaystyle \frac{1}{k^2}$との大小関係を比較し、チェビシェフの不等式が成立することがわかる。(区間$0<k<\sqrt{3}$における$k$に関する3次関数の最小値問題を考えることで示すことができる。)

ⅲ)
$[0,1]$上の一様分布なので密度関数は$0 \leq x \leq 1$で$\displaystyle f(x) = 1$、それ以外の区間で$f(x)=0$となる。
このとき、期待値$E[X]$と分散$V[X]$は下記のように計算できる。
$$
\begin{align}
E[X] &= \int_{0}^{1} xf(x) dx \\
&= \int_{0}^{1} x dx \\
&= \left[ \frac{1}{2}x^2 \right]_{0}^{1} \\
&= \frac{1}{2} \\
V[X] &= \int_{0}^{1} (x-E[X])^2f(x) dx \\
&= \int_{0}^{1} \left( x-\frac{1}{2} \right)^2 dx \\
&= \left[ \frac{1}{3}\left( x-\frac{1}{2} \right)^3 \right]_{0}^{1} \\
&= \frac{1}{3} \left( \left( \frac{1}{2} \right)^3 – \left( -\frac{1}{2} \right)^3 \right) \\
&= \frac{1}{12}
\end{align}
$$
よって、歪度$\alpha_3$、尖度$\beta_4=\alpha_4-3$は下記のように計算できる。
$$
\begin{align}
\alpha_3 &= \frac{1}{V[X]^{3/2}} \int_{0}^{1} (x-E[X])^3f(x) dx \\
&= \frac{1}{V[X]^{3/2}} \int_{0}^{1} \left( x-\frac{1}{2} \right)^3 dx \\
&= \frac{1}{V[X]^{3/2}} \left[ \frac{1}{4}\left( x-\frac{1}{2} \right)^4 \right]_{0}^{1} \\
&= \frac{1}{V[X]^{3/2}} \frac{1}{4} \left( \left(\frac{1}{2}\right)^4 – \left(-\frac{1}{2}\right)^4 \right) \\
&= 0 \\
\alpha_4 &= \frac{1}{V[X]^{2}} \int_{0}^{1} (x-E[X])^4f(x) dx \\
&= \frac{1}{V[X]^{2}} \int_{0}^{1} \left( x-\frac{1}{2} \right)^4 dx \\
&= \frac{1}{V[X]^{2}} \left[ \frac{1}{5}\left( x-\frac{1}{2} \right)^5 \right]_{0}^{1} \\
&= \frac{1}{V[X]^{2}} \frac{1}{5} \left( \left(\frac{1}{2}\right)^5 – \left(-\frac{1}{2}\right)^5 \right) \\
&= \frac{12^2}{5} \frac{2}{32} \\
&= \frac{9}{5} \\
\beta_4 &= \alpha_4-3 \\
&= \frac{9}{5}-3 \\
&= -\frac{6}{5}
\end{align}
$$

問題5.2の解答例

求める期待値を$E[X]$とすると、$E[X]$は下記のように求めることができる。
$$
\begin{align}
E[X] &= \frac{1}{13000000}(40000000 \times 7 + 10000000 \times 14 + 200000 \times 903 \\
&+ 10000000 \times 5 + 100000 \times 645 + 1000000 \times 130 + 140000 \times 130 + 10000 \times 1300 \\
&+ 1000 \times 26000 + 200 \times 1300000) \\
&= 89.40769…
\end{align}
$$

問題5.3の解答例

i)
$$
\begin{align}
P(X=2^k) = \frac{1}{2^k} (k=1, 2, 3, …)
\end{align}
$$
得られる額$X$の確率分布は上記のようになる。

ⅱ)
i)で求めた全ての$k$に対して、それぞれの期待値は$1$である。これにより、$E[X]=1+1+….1+…$となり、$\infty$に発散する。

問題5.4の解答例

$E[X-a]^2$は下記のように変形できる。
$$
\begin{align}
E[X-a]^2 = (E[X]-a)^2
\end{align}
$$
上記の値が最小になるのは$a=E[X]$のときであり、最小値は$E[X-E[X]]^2$となる。

問題5.5の解答例

正$n$面体から発生させた乱数の期待値$E[X]$と分散$V[X]=E[X^2]-E[X]^2$を求めるにあたっては、$E[X]$と$E[X^2]$がわかれば良い。以下それぞれについて計算する。
$$
\begin{align}
E[X] &= \frac{1}{n}(1+2+3+…) \\
&= \sum_{x=1} \frac{1}{n} x \\
&= \frac{n+1}{2} \\
E\left[X^2\right] &= \frac{1}{n} \left( 1^2 + 2^2 + 3^2 + … \right) \\
&= \frac{1}{n} \sum_{x=1} \frac{1}{n} x^2 \\
&= \frac{1}{6}(n+1)(2n+1) \\
V[X] &= E\left[X^2\right] – E[X]^2 \\
&= \frac{1}{6}(n+1)(2n+1) – \frac{1}{2^2}(n+1)^2 \\
&= \frac{1}{6}(2n^2+3n+1) – \frac{1}{4}(n^2+2n+1) \\
&= \frac{1}{12}(4n^2+6n+2) – \frac{1}{12}(3n^2+6n+3) \\
&= \frac{1}{12}(n^2-1)
\end{align}
$$
上記より、$\displaystyle E[X] = \frac{n+1}{2}$、$\displaystyle V[X] = \frac{1}{12}(n^2-1)$となる。

問題5.6の解答例

確率変数を$Y=X^2$のようにおくと、$Y$の累積分布関数$F_{Y}(y)$は下記のように表すことができる。
$$
\begin{align}
F_{Y}(y) &= P(Y \leq y) \\
&= P(X^2 \leq y) \\
&= P(0 \leq X \leq \sqrt{y}) \\
&= \sqrt{y}
\end{align}
$$
確率密度関数$f_{Y}(y)$は$f_{Y}(y)=F’_{Y}(y)$のように表せるので、下記のように計算できる。
$$
\begin{align}
f_{Y}(y) &= F’_{Y}(y) \\
&= \left( \sqrt{y} \right)’ \\
&= \frac{1}{2 \sqrt{y}}
\end{align}
$$
また、期待値$E[X^2]=E[Y]$と分散$V[X^2]=V[Y]$は下記のように計算できる。
$$
\begin{align}
E[X^2] &= \int_{0}^{1} x^2 dx \\
&= \left[ \frac{1}{3}x^3 \right]_{0}^{1} \\
&= \frac{1}{3} \\
V[X^2] &= E\left[ (X^2)^2 \right] – (E[X^2])^2 \\
&= \int_{0}^{1} x^4 dx – (E[X^2])^2 \\
&= \frac{1}{5} – \frac{1}{3^2} \\
&= \frac{4}{45}
\end{align}
$$

問題5.7の解答例

確率変数を$Y=X^2$のようにおくと、$Y$の累積分布関数$F_{Y}(y)$は下記のように表すことができる。
$$
\begin{align}
F_{Y}(y) &= P(Y \leq y) \\
&= P(X^2 \leq y) \\
&= P(-\sqrt{y} \leq X \leq \sqrt{y}) \\
&= 2P(0 \leq X \leq \sqrt{y}) \\
&= 2\left( \Phi(\sqrt{y})-\frac{1}{2} \right)
\end{align}
$$
上記では正規分布が左右対称であることから、$P(-\sqrt{y} \leq X \leq \sqrt{y})=2P(0 \leq X \leq \sqrt{y})$が成立することを用いている。また、$\Phi(z)$は標準正規分布の累積分布関数を表すとすると、$\displaystyle \Phi(z) = \int_{-\infty}^{z} \frac{1}{\sqrt{2 \pi}}e^{-x^2/2} dx$を満たす(121ページの(6.22)式の周辺を参照)。
また、$\displaystyle \Phi(0)=\frac{1}{2}$より$\displaystyle P(0 \leq X \leq \sqrt{y})=\Phi(\sqrt{y})-\frac{1}{2}$を導出することができる。

確率密度関数は$f_{Y}(y)=F’_{Y}(y)$のため下記のように計算できる。
$$
\begin{align}
f_{Y}(y) &= F’_{Y}(y) \\
&= 2\left( \Phi(\sqrt{y})-\frac{1}{2} \right)’ \\
&= 2\Phi'(\sqrt{y})(\sqrt{y})’ \\
&= 2 \times \frac{1}{\sqrt{2 \pi}}e^{-y/2} \frac{1}{2 \sqrt{y}} \\
&= \frac{1}{\sqrt{2 \pi y}}e^{-y/2}
\end{align}
$$

また、期待値$E[X^2]=E[Y]$と分散$V[X^2]=V[Y]$は下記のように計算できる。
$$
\begin{align}
E[X^2] &= \int_{-\infty}^{\infty} x^2 \times \frac{1}{\sqrt{2 \pi}}e^(-x^2/2) dx \\
&= \frac{1}{\sqrt{2 \pi}}\int_{-\infty}^{\infty} x^2 \times e^(-x^2/2) dx \\
&= 1 \\
V[X^2] &= E\left[ (X^2)^2 \right] – (E[X^2])^2 \\
&= E[X^4] – (E[X^2])^2 \\
&= 3 – 1 \\
&= 2
\end{align}
$$

問題5.8の解答例

二項分布を含む離散型の確率分布では累積分布関数が94ページの図5.9のような階段状となるが、$<$を用いるか$\leq$を用いるかで左連続か右連続かが変わる。$\leq$を用いる場合は右から連続(右連続)であり、$<$を用いる場合は左から連続(左連続)である。

まとめ

Ch.5で取り扱った確率変数は推測統計などを考えるにあたっての重要なトピックである一方で、なかなか具体的なイメージがつかみにくい概念だと思います。基本的なトピックが少々抽象的であるのに加え、モーメント母関数、チェビシェフの不等式、確率変数の変換など高度なトピックも含まれており、他の章と比較しても難易度が高い章であるという印象でした。