統計検定準1級問題解説 ~2021年6月実施 選択問題及び部分記述問題 問2~

過去問題

過去問題は統計検定公式問題集が問題と解答例を公開しています。こちらを参照してください。


解答

$\boxed{ \ \mathsf{記述4}\ }$ : $\lambda^2$
$\boxed{ \ \mathsf{記述5}\ }$ : $\displaystyle\left(\frac1n\sum_{i=1}^n X_i\right)^2$
$\boxed{ \ \mathsf{記述6}\ }$ : $4\lambda^4$

[1]

指数分布の分散は、平均(期待値)の二乗なので、$V(X_i)=\lambda^2$

(分散の導出)分散を$V(X)=E(X^2)-E(X)^2$より求める。$$
\begin{align}
\theta=V(X_i)&=E(X_i ^2)-E(X_i )^2\\
&=\int_0^\infty x^2f(x)dx-\left(\int_0^\infty xf(x)dx\right)^2\\
&=\int_0^\infty x^2\frac1{\lambda}e^{-x/\lambda}dx-\left(\int_0^\infty x\frac{1}{\lambda} e^{-x/\lambda}dx\right)^2\\
&=\frac1{\lambda}\int_0^\infty x^2e^{-x/\lambda}dx-\frac{1}{\lambda^2}\left(\int_0^\infty xe^{-x/\lambda}dx\right)^2\\
\end{align}$$
ここで、積分の計算で部分積分の公式$$\int f(x)g'(x)dx=f(x)g(x)-\int f'(x)g(x)dx$$を使う。$$
\begin{align}
\int_0^\infty xe^{-x/\lambda}dx&=\int_0^\infty x\left(-\lambda e^{-x/\lambda}\right)’dx\\
&=\left[x\left(-\lambda e^{-x/\lambda}\right)\right]_0^\infty-\int_0^\infty 1\cdot-\lambda e^{-x/\lambda}dx\\
&=0-\left[\lambda^2e^{-x/\lambda}\right]_0^\infty=-(0-\lambda^2)=\lambda^2\\
\int_0^\infty x^2e^{-x/\lambda}dx&=\int_0^\infty x^2\left(-\lambda e^{-x/\lambda}\right)’dx\\
&=\left[x^2\left(-\lambda e^{-x/\lambda}\right)\right]_0^\infty-\int_0^\infty 2x\cdot-\lambda e^{-x/\lambda}dx\\
&=0+2\lambda\int_0^\infty xe^{-x/\lambda}dx=2\lambda^3\\
\end{align}$$
よって、分散$\theta$は、
$$
\theta=\frac1{\lambda}\cdot 2\lambda^3-\frac{1}{\lambda^2}(\lambda^2)^2=\lambda^2
$$

[2]

分散$\theta$は$\lambda^2$なので、 $\lambda$の最尤推定量$\hat\lambda$を求める。
$\lambda$の尤度関数は、$$
L(X_1、X_2, \cdots, X_n | \lambda)=f(X_1)f(X_2)\cdots f(X_n)=\lambda^{-n}e^{-(X_1+X_2+\cdots+X_n)/\lambda}$$
よって、$$
\log L=-n\log\lambda-(X_1+X_2+\cdots+X_n)/\lambda$$
ここで、尤度関数$L$を最大にするには$\log L$を最大にすればよいので、$\frac{\partial\log L}{\partial\lambda}=0$を解けばよい。$$
\begin{align}
0&=\frac{\partial\log L}{\partial\lambda}\\
0&=\frac{\partial}{\partial\lambda}(-n\log\lambda-(X_1+X_2+\cdots+X_n)/\lambda)\\
0&=-\frac{n}{\lambda}+\frac1{\lambda^2}(X_1+X_2+\cdots+X_n)\\
\lambda n&=X_1+X_2+\cdots+X_n\\
\end{align}$$
よって、最尤推定量$\hat\lambda$は、$$
\hat\lambda=\frac1n(X_1+X_2+\cdots+X_n)=\frac1n\sum_{i=1}^nX_i$$
これを用いて、分散の最尤推定量$\hat\theta$は、$$
\hat\theta=\hat\lambda^2=\left(\frac1n\sum_{i=1}^nX_i\right)^2$$

[3]

$\theta=\lambda^2$であるから$X_i$の確率密度関数$f(x)$は、$$f(x;\theta)=\frac1{\sqrt{\theta}} e^{-x/\sqrt{\theta}}$$となる。
最尤推定量$\hat\theta$の漸近正規性から、$\sqrt{n}(\hat\theta-\theta)$は正規分布$N(0,J_1(\theta)^{-1})$に分布収束する。ここで、$J_1(\theta)$は$1$このデータのフィッシャー情報量である。したがって、
$$\lim_{n \to \infty}V(\sqrt{n}(\hat\theta-\theta))=J_1(\theta)^{-1}$$
となる。フィッシャー情報量$J_1(\theta)$は、$$J_1(\theta)=E\left[-\frac{\partial^2}{\partial\theta^2}\log f(X_i;\theta)\right]$$なので、まず、$E[\ ]$の中を計算する。$$\begin{align}-\frac{\partial^2}{\partial\theta^2}\log f(X_i;\theta)=&-\frac{\partial^2}{\partial\theta^2}\log\left(\frac1{\sqrt{\theta}} e^{-X_i/\sqrt{\theta}}\right)\\=&-\frac{\partial^2}{\partial\theta^2}\left(-\frac12\log{\theta}-\frac{X_i}{\sqrt{\theta}}\right)\\=&-\frac{\partial}{\partial\theta}\left(-\frac1{2\theta}+\frac{X_i}{2\theta^{3/2}}\right)\\=&-\left(\frac1{2\theta^2}-\frac{3X_i}{4\theta^{5/2}}\right)\end{align}$$$E[X_i]=\lambda=\theta^{1/2}$なので、$$\begin{align}\therefore J_1(\theta)^{-1}=&E\left[-\frac1{2\theta^2}+\frac{3X_i}{4\theta^{5/2}}\right]^{-1}\\=&\left(-\frac1{2\theta^2}+\frac{3E[X_i]}{4\theta^{5/2}}\right)^{-1}\\=&\left(-\frac1{2\theta^2}+\frac{3\theta^{1/2}}{4\theta^{5/2}}\right)^{-1}\\=&\left(-\frac1{2\theta^2}+\frac{3}{4\theta^2}\right)^{-1}\\=&\left(\frac1{4\theta^2}\right)^{-1}=4\theta^2=4\lambda^4\end{align}$$


解説

指数分布

$\lambda\gt0$に対し、確率密度関数$$f(x)=\lambda e^{-\lambda x},\quad x\gt0$$を持つ分布を指数分布という。指数分布の累積分布関数は$$F(x)=P(X\le x)=\int_{-\infty}^xf(x)dx=\int_0^x\lambda e^{-\lambda x}dx=1-e^{-\lambda x},\quad x\gt0$$となる。指数分布はランダムに発生する事象の発生間隔を表す分布といえる。(離散型確率分布である幾何分布の連続型が指数分布といえる。)
指数分布の期待値、分散は以下のとおりである。
$$\begin{align}
E(X)=&\int_0^{\infty}xf(x)dx\\
=&\int_0^{\infty}x\lambda e^{-\lambda x}dx\\
=&\int_0^{\infty}x\lambda \left(-\frac1\lambda e^{-\lambda x}\right)’dx\\
=&\left[x\lambda\left(-\frac1\lambda e^{-\lambda x}\right)\right]_0^{\infty}-\int_0^{\infty}\lambda \left(-\frac1\lambda e^{-\lambda x}\right)dx\\
=&(0-0)-\left[\frac1\lambda e^{-\lambda x}\right]_0^{\infty}\\
=&-\left(0-\frac1\lambda\right)=\frac1\lambda\\
E(X^2)=&\int_0^{\infty}x^2f(x)dx\\
=&\int_0^{\infty}x^2\lambda e^{-\lambda x}dx\\
=&\int_0^{\infty}x^2\lambda \left(-\frac1\lambda e^{-\lambda x}\right)’dx\\
=&\left[x^2\lambda\left(-\frac1\lambda e^{-\lambda x}\right)\right]_0^{\infty}-\int_0^{\infty}2x\lambda \left(-\frac1\lambda e^{-\lambda x}\right)dx\\
=&(0-0)+\frac2\lambda\int_0^{\infty}x\lambda e^{-\lambda x}dx\\
=&\frac2\lambda\times\frac1\lambda=\frac2{\lambda^2}\\
V(X)=&E(X^2)-E(X)^2=\frac2{\lambda^2}-\left(\frac1\lambda\right)^2=\frac1{\lambda^2}
\end{align}$$
$X$が指数分布に従うとき$$P(X\ge t_1+t_2|X\ge t_1)=P(X\ge t_2),\quad t_1,t_2\ge0$$が成り立つ。これを指数関数の無記憶性という。「$t_1$ の期間成功しなかったうえでさらに $t_2$ の期間成功しない確率は、最初から$t_2$ の期間成功しない確率に等しい」

最尤推定量

ある確率分布の確率密度関数(離散型の場合は確率関数)を$f(x;\theta)$とする。この確率分布に従う母集団から抽出した標本の実現値を$x_1,x_2,\dots x_n$としたとき、標本の独立同一性から同時確率密度関数は$$L(\theta)=\prod_{i=1}^n f(x_i;\theta)$$となる。これを母数$\theta$の関数として扱うとき、$\theta$の尤度関数(尤度)という。この尤度関数$L(theta)$が標本実現値の下で最大となるような$\theta=\hat\theta$の値を最尤推定量という。最大推定量は母数$\theta$の推定値として用いることができる。尤度関数の最大を求めるにあたっては、尤度関数の対数をとると計算しやすく、これを対数尤度という。$$\log L(\theta)=\sum_{i=1}^n \log f(x_i;\theta)$$(尤度関数のパラメータが最尤推定量になれば、標本実現値$x_1,x_2,\dots x_n$が出る確率が最大となることから、最も尤もらしい推定値といえる。)

最尤推定量の一致性、漸近正規性

サイズ$n$の標本に基づいた$\theta$の推定量$\hat\theta_n$としたとき、真のパラメータ$\theta$は未定であるが、どのような推定量であってもその値が真のパラメータに確率収束するとき、すなわち、任意の$\varepsilon\gt0$に対して、
$$\lim_{ n \to \infty }P(|\hat\theta_n-\theta|\lt\varepsilon)=1$$
が成り立つとき、その推定量は一致性を持つという。
また、一致推定量の分散が漸近的にクラーメル・ラオの不等式の下限を達成するとき、すなわち、任意の$\theta$に対して、
$$\lim_{ n \to \infty }nV_\theta[\hat\theta]=J_1(\theta)^{-1}=E\left[-\frac{\partial^2}{\partial\theta^2}\log f(X_i;\theta)\right]^{-1}$$
となるとき、この推定量が漸近有効性を持つという。
適当な正則条件が成り立つような確率分布に関して、パラメータの最尤推定量は一致性及び漸近有効性をもつことが知られている。
さらに、$\theta$の最尤推定値$\hat\theta$について、$\sqrt{n}(\hat\theta_n-\theta)$は正規分布$N(0,J_1(\theta)^{-1})$に分布収束する。すなわち、$\sqrt{n}(\hat\theta_n-\theta)$の累積分布関数は、$N(0,J_1(\theta)^{-1})$の累積分布関数に各点で収束する。これを最尤推定量の漸近正規性という。