統計検定1級 統計数理 問題解説 ~2019年11月実施 問1~

統計検定1級の2019年11月の「統計数理」の問1の解答例と解説について取り扱いました。他の問題の解答に関しては下記よりご確認ください。
https://www.hello-statisticians.com/stat_certifi_1_math

問題

詳しくは統計検定公式よりご確認ください。

解答

[1]
$G_{X}(t)$を$t$に関して$1$階微分、$2$階微分を行うと下記が得られる。
$$
\large
\begin{align}
\frac{d}{dt} G_{X}(t) &= \frac{d}{dt} E[t^X] \\
&= E \left[ \frac{d}{dt} t^X \right] \\
&= E[Xt^{X-1}] \\
\frac{d^2}{dt^2} G_{X}(t) &= \frac{d}{dt} E[Xt^{X-1}] \\
&= E \left[ \frac{d}{dt} Xt^{X-1} \right] \\
&= E[X(X-1)t^{X-2}]
\end{align}
$$

上記に対し、$t=1$を代入することで下記が得られる。
$$
\large
\begin{align}
\frac{d}{dt} G_{X}(t) \Bigr|_{t=1} &= E[X 1^{X-1}] \\
&= E[X] = G{X}'(1) \\
\frac{d^2}{dt^2} G_{X}(t) \Bigr|_{t=1} &= E[X(X-1) 1^{X-2}] \\
&= E[X(X-1)] = G{X}^{”}(1)
\end{align}
$$

ここで$V[X]=E[X^2]-E[X]^2$より確率変数$X$の期待値と分散は下記のように確率母関数を用いて表すことができる。
$$
\large
\begin{align}
E[X] &= G_{X}'(1) \\
V[X] &= E[X^2]-E[X]^2 \\
&= E[X(X-1+1)]-E[X]^2 \\
&= E[X(X-1)+X]-E[X]^2 \\
&= E[X(X-1)]+E[X]-E[X]^2 \\
&= G_{X}^{”}(1) + G_{X}'(1) – G_{X}'(1)^2
\end{align}
$$

[2]
二項分布の確率変数$X$に対し、$i$回目のベルヌーイ試行の確率変数を$X_i \in {0,1}$とおく。このとき$X_i$に関して$E[t^{X_i}]$は下記のように計算できる。
$$
\large
\begin{align}
E[t^{X_i}] &= p t^{1} + (1-p) t^{0} \\
&= pt + 1 – p
\end{align}
$$

ここで$\displaystyle X = \sum_{i=1}^{n} X_i$のように表せることから、二項分布に関する確率母関数$G_{X}(t)=E[t^X]$は下記のように求めることができる。
$$
\large
\begin{align}
G_{X}(t) &= E[t^{X}] \\
&= E[t^{\sum_{i=1}^{n} X_i}] \\
&= E[t^{X_1}] \times E[t^{X_2}] \times … \times E[t^{X_n}] \\
&= (pt + 1 – p) \times … \times (pt + 1 – p) \\
&= (pt + 1 – p)^n
\end{align}
$$

また、$G_{X}'(t), G_{X}^{”}(t)$は下記のように計算できる。
$$
\large
\begin{align}
G_{X}'(t) &= \frac{d}{dt} (pt + 1 – p)^n \\
&= np(pt + 1 – p)^{n-1} \\
G_{X}^{”}(t) &= \frac{d}{dt} G_{X}'(t) \\
&= \frac{d}{dt} (np(pt + 1 – p)^{n-1}) \\
&= n(n-1)p^2 (pt + 1 – p)^{n-2}
\end{align}
$$

よって、$G_{X}'(1), G_{X}^{”}(1)$に関して下記が得られる。
$$
\large
\begin{align}
G_{X}'(1) &= np(p \cdot 1 + 1 – p)^{n-1} \\
&= np \times 1^{n-1} \\
&= np \\
G_{X}^{”}(1) &= n(n-1)p^2 (p \cdot 1 + 1 – p)^{n-2} \\
&= n(n-1)p^2 \times 1^{n-1} \\
&= n(n-1)p^2
\end{align}
$$

上記と[1]の結果を元に、二項分布$Bin(n,p)$の期待値$E[X]$と分散$V[X]$は下記のように導出することができる。
$$
\large
\begin{align}
E[X] &= G_{X}'(1) \\
&= np \\
V[X] &= G_{X}^{”}(1) + G_{X}'(1) – G_{X}'(1)^2 \\
&= n(n-1)p^2 + np – (np)^2 \\
&= n^2p^2 – np^2 + np – n^2p^2 \\
&= np – np^2 \\
&= np(1-p)
\end{align}
$$

・別解
公式の書籍での解答のように定義に沿って計算し、二項定理を用いて導出を行うこともできる。が、少々式が複雑なので、ここではベルヌーイ分布の確率変数$X_i$を考え、その和を元に二項分布の確率変数$X$を考えた。

[3]
$$
\large
\begin{align}
G_{X}(t) = E[t^X] = \sum_{k} t^k P(X=k) \quad (-1 \leq t \leq 1) \qquad (1)
\end{align}
$$
問題文では上記の$(1)$式が与えられるが、右辺の$\displaystyle \sum_{k}$に対し、$\displaystyle \sum_{k} = \sum_{k \leq r} + \sum_{k > r}$を考えると下記が得られる。
$$
\large
\begin{align}
\sum_{k} t^k P(X=k) = \sum_{k \leq r} t^k P(X=k) + \sum_{k > r} t^k P(X=k)
\end{align}
$$

ここで$\displaystyle \sum_{k \leq r} t^k P(X=k) \leq 0, \sum_{k > r} t^k P(X=k) \leq 0$より$G_{X}(t)$に関して下記が得られる。
$$
\large
\begin{align}
G_{X}(t) &= \sum_{k} t^k P(X=k) \\
& \geq \sum_{k \leq r} t^k P(X=k)
\end{align}
$$

上記の両辺に$t^{-r}$をかけることを考える。ここで$0 < t \leq 1$より$t^{-r}>0$であり、不等号は入れ替わらない。
$$
\large
\begin{align}
t^{-r} G_{X}(t) & \geq t^{-r} \sum_{k \leq r} t^k P(X=k) \\
&= \sum_{k \leq r} t^{k-r} P(X=k)
\end{align}
$$
上記に対し、$k-r \leq 0$より、$0 < t \leq 1$から$t^{k-r} \geq 1$が成立する。
$$
\large
\begin{align}
\sum_{k \leq r} t^{k-r} P(X=k) & \geq \sum_{k \leq r} P(X=k) \\
&= P(X \leq r)
\end{align}
$$

ここまでの議論により、$P(X \leq r) \leq t^{-r} G_{X}(t)$を示すことができる。

[4]
[3]の結果に対して$r=an$を代入し、下記を得る。
$$
\large
\begin{align}
P(X \leq an) \leq t^{-an} G_{X}(t)
\end{align}
$$

ここで右辺の$t^{-an} G_{X}(t) = t^{-an} (pt+1-p)^n$を$f(t)$とおき、$0 < t \leq 1$における最小値を求めることを考える。$t$に関する$f'(t)$を計算する。
$$
\large
\begin{align}
f'(t) &= \frac{d}{dt} (t^{-an} (pt+1-p)^n) \\
&= -an t^{-an-1} \times (pt+1-p)^n + t^{-an} \times np(pt+1-p)^{n-1} \\
&= n t^{-an-1} (pt+1-p)^{n-1} \times -a(pt+1-p) + n t^{-an-1} (pt+1-p)^{n-1} \times pt \\
&= n t^{-an-1} (pt+1-p)^{n-1} \left(-a(pt+1-p) + pt \right) \\
&= n t^{-an-1} np(pt+1-p)^{n-1} \left( pt(1-a) – a(1-p) \right) \\
&= n t^{-an-1} np(pt+1-p)^{n-1} \left( p(1-a)t – a(1-p) \right)
\end{align}
$$

上記に対して$f'(t)=0$となる$t$を考える。
$$
\large
\begin{align}
f'(t) &= 0 \\
p(1-a)t – a(1-p) &= 0 \\
t &= \frac{a(1-p)}{p(1-a)}
\end{align}
$$
ここで$a0, t^{-an-1}>0, pt+1-p>0, p>0, 1-a>0$より、$f'(t)$は$t$に関する単調増加関数である。

よって、$f(t)$は$\displaystyle t=\frac{a(1-p)}{p(1-a)}$の時、最小値をとる。これを$t^{-an} G_{X}(t)$に代入を行うことで下記が導出できる。
$$
\large
\begin{align}
P(X \leq an) & \leq \min ( t^{-an} G_{X}(t) ) \\
&= \min ( t^{-an} (pt+1-p)^{n} ) \\
&= \left( \frac{a(1-p)}{p(1-a)} \right)^{-an} \left( p \cdot \frac{a(1-p)}{p(1-a)} + 1 – p \right)^{n} \\
&= \left( \frac{a(1-p)}{p(1-a)} \right)^{-an} \left( \frac{a(1-p)}{1-a} + 1 – p \right)^{n} \\
&= \left( \frac{a(1-p)}{p(1-a)} \right)^{-an} \left( \frac{a(1-p)+(1-a)(1-p)}{1-a} \right)^{n} \\
&= \left( \frac{a(1-p)}{p(1-a)} \right)^{-an} \left( \frac{(1-p)}{1-a} \right)^{n} \\
&= \left( \frac{a}{p} \right)^{-an} \left( \frac{(1-p)}{1-a} \right)^{(1-a)n}
\end{align}
$$

解説

[2]までは教科書などでも出てくる導出であるので、ここまでは必ず解けるようにしておくと良いと思います。確率母関数やモーメント母関数を用いる際は確率変数の和を考えると計算が簡単になる場合が多いので、このような解法も抑えておくと良いです。
20点配分なら[1]が3点、[2]が7点、[3]が2点、[4]が8点くらいが良い印象で、[4]の計算は少々複雑なので[3]まで解いて[4]は部分点狙いでも十分だと思います。
また、[4]の公式の解答に、$f'(t)$が単調増加であることが書かれていないですが、$f'(t)=0$は最小値の必要条件でしかないので、単調増加も議論しておく方が良いと思います。