ブログ

統計検定2級問題解説 ~2018年6月実施~ (問9~問16)

過去問題

過去問題は統計検定公式問題集が問題と解答例を公開しています。こちらを参照してください。


問9 解答

(期待値,分散,共分散,相関)

[1]

$\boxed{ \ \mathsf{18}\ }$ ④

$$
\begin{align}
E[X^2]&=V[X]+E[X]^2=1.0+(2.0)^2=5.0\\E
[Y^2]&=V[Y]+E[Y]^2=1.0+(3.0)^2=10.0\\
\mathrm{Cov}[X,Y]&=E[XY]-E[X]E[Y]=6.3-2.0\times3.0=0.3
\end{align}
$$
※ $V[X]=E[X^2]-E[X]^2, \mathrm{Cov}[X,Y]=E[XY]-E[X]E[Y]$ は重要な式

[2]

$\boxed{ \ \mathsf{19}\ }$ ④

$$
\begin{align}
E[U]&=E[3X-2]=3E[X]-2=3\times2.0-2=4.0\\
E[V]&=E[-2Y-4]=-2E[Y]-4=-2\times3.0-4=-10.0\\
E[UV]&=E[(3X-2)(-2Y-4)]=E[-6XY-12X+4Y+8]\\
&=-6E[XY]-12E[X]+4E[Y]+8\\
&=-6\times6.3-12\times2.0+4\times3.0+8=-41.8\\
\mathrm{Cov}[U,V]&=E[UV]-E[U]E[V]=-41.8-4.0\times(-10.0)=-1.8\\
V[U]&=V[3X-2]=3^2V[X]=3^2\times1.0=9.0\\
V[V]&=V[-2Y-4]=(-2)^2V[Y]=(-2)^2\times1.0=4.0\\
r[U,V]&=\frac{\mathrm{Cov}[U,V]}{\sqrt{V[U]}\sqrt{V[V]}}=\frac{-1.8}{\sqrt{9.0}\sqrt{4.0}}=-0.3
\end{align}
$$
※ 共分散と相関係数は符号が同じになる。


問10 解答

(標準正規分布,母平均の区間推定,t分布)

[1]

$\boxed{ \ \mathsf{20}\ }$ ④

$\bar{X}\sim N(\mu,\sigma^2/n)$なので,$\begin{align}\frac{\bar{X}-\mu}{\sqrt{\sigma^2/n}}\end{align}$は標準正規分布に従う。よって
$\displaystyle P\left(z_{-0.025}\le\frac{\bar{X}-\mu}{\sqrt{\sigma^2/n}}\le z_{0.025}\right)\ge0.95\ \ \Rightarrow\ \ P\left(|\bar{X}-\mu|\le1.96{\sqrt{1/n}}\right)\ge0.95$
$\displaystyle \therefore\ \ 1.96\sqrt{1/n}=0.5\ \ \Rightarrow\ \ n=\left(\frac{1.96}{0.5}\right)^2=15.4$

[2]

$\boxed{ \ \mathsf{21}\ }$ ①

母分散$\sigma^2$を不偏分散$S^2$に置き換えた$\begin{align}\frac{\bar{X}-\mu}{\sqrt{S^2/n}}\end{align}$は自由度$n-1$の$t$分布に従う。
自由度$n-1$の上側$\alpha/2$点を$t_{\alpha/2}(n-1)$とすると
$\displaystyle \left|\frac{\bar{X}-\mu}{\sqrt{S^2/n}}\right|\le t_{\alpha/2}(n-1)\ \ \Rightarrow\ \ \ \bar{X}-t_{\alpha/2}(n-1)\sqrt{\frac{S^2}{n}}\le\mu\le\bar{X}+t_{\alpha/2}(n-1)\sqrt{\frac{S^2}{n}}$
$n=20, \bar{X}=10.50,S^2=5.41$,自由度$19$の上側$0.05/2$点 $t_{0.025}(19)=2.093$を代入すると
$\displaystyle 10.50-2.093\times\sqrt{\frac{5.41}{20}}\le\mu\le10.50+2.093\times\sqrt{\frac{5.41}{20}}$


問11 解答

(母比率の区間推定)

[1]

$\boxed{ \ \mathsf{22}\ }$ ③

成功確率$p$の試行を$n$回行うときに成功する回数$X$は二項分布$B(n,p)$に従う。$$\therefore\ \ E(X)=np,\ V(X)=np(1-p)$$このとき,$n$がある程度大きいときは,中心極限定理によって,$B(n,p)$は正規分布$N(np,np(1-p))$に近似できる。よって,$X$を標準化すると標準正規分布$N(0,1)$に従う。$$Z=\frac{X-np}{\sqrt{np(1-p)}}=\frac{X/n-p}{\sqrt{\frac{p(1-p)}n}}\sim N(0,1)$$ここで,標本平均 $\hat p=x/n$は$p$の一致推定量なので,$n$が十分大きいとき$p$は$\hat p$に置き換えられる。
したがって,母比率の$100(1-\alpha)\%$信頼区間は,標準正規分布の上側 $100\alpha/2\%$ 点を $z_{\alpha/2}$とすると,$$P\left(\hat p-z_{\alpha/2}\sqrt{\frac{\hat p(1-\hat p)}n}\le p\le\hat p+z_{\alpha/2}\sqrt{\frac{\hat p(1-\hat p)}n}\right)=1-\alpha$$
北海道における野球の行動者の母比率の$95\%$信頼区間は,$n=4633$,$\hat p=0.071$,$\alpha=0.05$として$$\hat p\pm z_{\alpha/2}\sqrt{\frac{\hat p(1-\hat p)}n}=0.071\pm1.96\times\sqrt{\frac{0.071\times(1-0.071)}{4633}}=0.0074$$

[2]

$\boxed{ \ \mathsf{23}\ }$ ②

2つの道県の母比率を$p_1,p_2$とすると,2つの道県合せた母比率は,2つの母比率の加重平均をとって,$$p=\frac{N_1p_1+N_2p_2}{N_1+N_2}$$であるから,その推定値(ア)は$$\hat p=\frac{N_1\hat p_1+N_2\hat p_2}{N_1+N_2}$$この$\hat p$の分散は,$$\begin{align}V(\hat p)&=V\left(\frac{N_1\hat p_1+N_2\hat p_2}{N_1+N_2}\right)=\left(\frac{N_1}{N_1+N_2}\right)^2V(\hat p_1)+\left(\frac{N_2}{N_1+N_2}\right)^2V(\hat p_2)\\
&=\left(\frac{N_1}{N_1+N_2}\right)^2\frac{\hat p_1(1-\hat p_1)}{n_1}+\left(\frac{N_2}{N_1+N_2}\right)^2\frac{\hat p_2(1-\hat p_2)}{n_2}\end{align}$$
$\hat p$の標準偏差(イ)は,$$\sqrt{\left(\frac{N_1}{N_1+N_2}\right)^2\frac{\hat p_1(1-\hat p_1)}{n_1}+\left(\frac{N_2}{N_1+N_2}\right)^2\frac{\hat p_2(1-\hat p_2)}{n_2}}$$


問12 解答

(母平均の差の検定(母分散未知で等分散),一元配置分散分析)

[1]

$\boxed{ \ \mathsf{24}\ }$ ④

標本$x_1,\dots,x_{n_1},\ y_1,\dots,y_{n_2}$が母分散の等しい正規分布$N(\mu_1,\sigma^2),N(\mu_2,\sigma^2)$に従うとき,標本平均の差$$d=\bar x-\bar y,\ \ \bar x=\sum_{i=1}^nx_i\sim N(\mu_1,\sigma^2/n_1),\ \ \bar y=\sum_{i=1}^ny_i\sim N(\mu_2,\sigma^2/n_2)$$も正規分布に従う(正規分布の再生性)。このとき,$\bar x,\bar y$は独立なので$$E[d]=\delta=\mu_1-\mu_2,\ \ V[d]=\sigma^2/n_1+\sigma^2/n_2=\sigma^2(1/n_1+1/n_2)$$
ここで,帰無仮説$H_0:\delta=0$の下では,$d$の分布は$$d\sim N\left(0,\left(\frac1{n_1}+\frac1{n_2}\right)\sigma^2\right)$$となり,有意水準$100\alpha\%$の棄却域は次の式で与えられる。
両側対立仮説($H_1:\delta\ne0$)の場合  $\begin{align}|d|\ge z_{\alpha/2}\sqrt{\frac1{n_1}+\frac1{n_2}}\sigma\end{align}$
以上は母分散$\sigma^2$が既知の場合であるが,母分散が未知の場合は$\sigma^2$の代わりに推定量$\hat\sigma^2$を使い,$$Z=\frac{\bar x-\bar y}{\sqrt{\frac1{n_1}+\frac1{n_2}}\sigma}\sim N(0,1)\ \leftrightarrow\ t=\frac{\bar x-\bar y}{\sqrt{\frac1{n_1}+\frac1{n_2}}\hat\sigma}\sim t(n_1+n_2-2)$$共通の分散の推定値$\hat\sigma$は,$x,y$の不偏分散をそれぞれの自由度で加重平均したものを用いる。$$\hat\sigma^2=\frac{(n_1-1)\hat\sigma_1^2+(n_2-1)\hat\sigma_2^2}{(n_1-1)+(n_2-1)}=\frac{\sum(x_i-\bar x)^2+\sum(y_i-\bar y)^2}{n_1+n_2-2}$$
 ここで,$\bar x=233.7,\ \bar y=185.3,\ n_1=n_2=6,\ \sum(x_i-\bar x)^2=13549,\ \sum(y_i-\bar y)^2=7763$を代入して$$t=\frac{\bar x-\bar y}{\sqrt{\left(\frac1{n_1}+\frac1{n_2}\right)\frac{\sum(x_i-\bar x)^2+\sum(y_i-\bar y)^2}{n_1+n_2-2}}}=\frac{233.7-185.3}{\sqrt{\left(\frac16+\frac16\right)\frac{13549+7763}{6+6-2}}}=1.816$$

[2]

$\boxed{ \ \mathsf{25}\ }$ ④

総平均 $(218+303+198+296+201+186+209+177+167+145+161+253)/12=209.5$
総平方和 $\begin{align}(218-209.5)^2&+(303-209.5)^2+(198-209.5)^2+(296-209.5)^2+(201-209.5)^2\\+(186-209.5)^2&+(209-209.5)^2+(177-209.5)^2+(167-209.5)^2+(145-209.5)^2\\+(161-209.5)^2&+(253-209.5)^2=28321\end{align}$
残差平方和 $13549+7763=21312$(自由度 $12-2=10$)
水準間平方和 $28321-21312=7009$(自由度 $2-1=1$)
$F$値 $\displaystyle F=\frac{7009/1}{21312/10}=3.29$

※ 水準数が$2$の分散分析表の結果$F$値と,[1]の”分散が未知で等しい場合の2つの母平均の差の検定”の$t$値の間には$F=t^2$の関係がある(証明省略)。
よって,[1]の結果から $F=1.816^2=3.298$で求められる。


問13 解答

(第一種の過誤,第二種の過誤,検出力)

真実
帰無仮説が正しい対立仮説が正しい
検定の結果帰無仮説を棄却しない
(対立仮説が正しいとは言えない)
正しい第二種の過誤(β)
帰無仮説を棄却する
(対立仮説が正しい)
第一種の過誤(α)
有意水準
正しい
検出力(1-β)

[1]

$\boxed{ \ \mathsf{26}\ }$ ④

[2]

$\boxed{ \ \mathsf{27}\ }$ ②

上の表をもとに,検定Ⅰ,検定Ⅱ,検定Ⅲの第一種の過誤,第二種の過誤,検出力を求めれば明らか。
 第一種の過誤:$H_0$の下での$X$の分布($P_0$)における棄却域を満たす確率の計
 第二種の過誤:$H_1$の下での$X$の分布($P_1$)における棄却域を満たさない確率の計

検定 第一種の過誤 第二種の過誤 検出力
検定Ⅰ 0.1+0.1+0.1=0.3 0.05+0.05+0=0.1 1-0.1=0.9
検定Ⅱ 0.1+0.1=0.2 0.2+0.05+0.05+0=0.3 1-0.3=0.7
検定Ⅲ 0.3 0.4+0.3+0.2+0.05+0.05+0=1 1-1=0

問14 解答

(重回帰モデル,統計ソフトウェアの活用)

※重回帰モデルの統計ソフトウェアによる出力結果の主な項目
$\mathtt{Estimate}$:回帰係数($\alpha,\beta_1,\beta_2,\beta_3$)の推定値
$\mathtt{Std.Error}$:回帰係数の推定値の標準誤差
$\mathtt{t\ value}$:$t$値,$\mathtt{Pr(\gt|t|)}$:$P_-$値・・・回帰係数の検定で使う
$\mathtt{Rasidual\ standard\ error}$:誤差項の標準偏差の推定値
$\mathtt{degrees\ of\ freedom}$:自由度
$\mathtt{Multiple\ R-squared}$:決定係数($R^2$)
$\mathtt{Adjusted\ R-squared}$:自由度調整済み決定係数($R^{*2}$)
$\mathtt{F-statistic}$:$F$検定統計量,$\mathtt{p-value}$:$P_-$値・・・回帰の有意性の検定で使う

[1]

$\boxed{ \ \mathsf{28}\ }$ ⑤

推定された回帰係数の値は$\mathtt{Estimate}$から読み取る。よって,回帰式は
$\mathrm{log}($犯罪発生率$)=-7.08851+0.09408\times$失業率$+2.41815\times\mathrm{log}($賃金$)-0.06498\times\mathrm{log}($警察官数$)$
これに,失業率=$2.8$,$\mathrm{log}$(賃金)=$5.6$,$\mathrm{log}$(警察官数)=$5.3$を代入して,
$$-7.08851+0.09408\times2.8+2.41815\times5.6-0.06498\times5.3=6.372$$

[2]

$\boxed{ \ \mathsf{29}\ }$ ④

帰無仮説$\beta_3=-0.5$,対立仮説$\beta_3\ne-0.5$の有意水準$100\alpha\%$の棄却域は次の式で与えられる。  $$\left|\frac{\hat\beta_3-\beta_3}{\mathrm{se}(\hat\beta_3)}\right|<t_{\alpha/2}(n-p-1)$$ここで,$\hat\beta_3$は$\beta_3$の推定値,$\mathrm{se}(\hat\beta_3)$は標準誤差,$n$はデータ数,$p$は説明変数の数である。$$t=\frac{-0.06498-(-0.5)}{0.22718}=1.914869$$となり,自由度$47-4=43$なので,自由度$40$と自由度$60$の$t$分布のパーセント点の値を見ると,
 自由度$=40$のとき、$t_{0.05}=1.684, t_{0.025}=2.021$
 自由度$=60$のとき、$t_{0.05}=1.671, t_{0.025}=2.000$
どちらの自由度の値を見ても、先に求めた$t$値は$t_{0.05}\lt t \lt t_{0.025}$。よって,両側$10\%$を有意水準とすると仮説は棄却され,両側$5\%$を有意水準とすると仮説は棄却されない。

[3]

$\boxed{ \ \mathsf{30}\ }$ ④

Ⅰ.$P_-$値(Pr(>|t|))が$1\%=0.01$より小さい回帰係数は定数項と$\mathrm{log}$(賃金)の2つである。正しい。
Ⅱ.$\mathrm{log}$(賃金)の回帰係数が正なので,賃金が高くなると,予測値である犯罪発生率は高くなる。誤り。
Ⅲ.出力結果の$\mathtt{Adjusted\ R-squared}$の値が$0.5787$なので正しい。


問15 解答

(独立性の検定)

独立性の検定は,2つの属性$A,B$が独立かどうかの検定。
属性$A$のカテゴリが$A_i$,属性$B$のカテゴリが$B_j$の観測度数を$f_{ij}=O_{ij}$とし,
 $f_{i\cdot}=\sum_jf{ij}$を$i$行の度数合計(行和),
 $f_{\cdot j}=\sum_if{ij}$を$j$列の度数合計(列和),
 $f_{\cdot\cdot}=\sum_i\sum_jf_{ij}=\sum_if_{i\cdot}=\sum_jf_{\cdot j}=n$を全度数合計という。
属性$A,B$が独立という帰無仮説は,$H_0:P(A\cap B)=P(A)P(B)$が成り立つことである。
ここで,カテゴリ$A_i,B_j$の出現確率はそれぞれ$f_{i\cdot}/n,f_{\cdot j}/n$であるので,$H_0$のもとで,属性$A$のカテゴリが$A_i$,属性$B$のカテゴリが$B_j$の期待度数は$$E_{ij}=n(f_{i\cdot}/n)(f_{\cdot j}/n)=f_{i\cdot}f_{\cdot j}/n$$となる。
帰無仮説$H_0$の下で,次検定の統計量$\chi^2$は度数が大きいときに近似的に$\chi^2$分布に従う。行和と列和が固定されていることから自由度は$(r$(行の数)$-1)\times(c$(列の数)$-1)$となる。$$\chi^2=\sum_{i=1}^r\sum_{j=1}^c\frac{(O_{ij}-E_{ij})^2}{E_{ij}}\sim\chi^2((r-1)(c-1))$$有意水準$100\alpha\%$で帰無仮説が棄却されるには,$\chi^2$分布の上側$\alpha$点より上で求めた$\chi^2$統計量が大きくなればよい。

$\boxed{ \ \mathsf{31}\ }$ ③

求める期待度数は$$\frac{(105+15)\times(105+102)}{105+15+102+143}=68.0548$$

[2]

$\boxed{ \ \mathsf{32}\ }$ ②

$\chi^2$検定量は$\begin{align}\frac{(O_{ij}-E_{ij})^2}{E_{ij}}\end{align}$をすべてのセルで合計したものである。

[3]

$\boxed{ \ \mathsf{33}\ }$ ⑤

$\chi^2$統計量の値は$69.04$で,自由度$1$の$\chi^2$分布の上側$5\%$点より大きいので,有意水準$5\%$で帰無仮説は棄却される。よって,風向と季節は独立でない→関連があるといえる。


問16 解答

(母分散の比の検定)

$\boxed{ \ \mathsf{34}\ }$ ②

2つの母集団からの標本$\{x_1,\dots,x_m\}\sim N(\mu_x,\sigma^2_x),\ \{y_1,\dots,y_n\}\sim N(\mu_y,\sigma^2_y)$に従うとき,母分散が等しいという帰無仮説$\ H_0:\sigma^2_x=\sigma^2_y\ \Leftrightarrow\ \sigma^2_y/\sigma^2_x=1.0\ $,対立仮説$\ H_1:\sigma^2_x\ne\sigma^2_y\ $で,両側検定を行う。
帰無仮説の下で,以下の検定統計量($F$検定量)は自由度$(m-1,n-1)$の$F$分布に従う。$$F=\frac{\hat\sigma_x^2}{\sigma_x^2}\cdot\frac{\sigma_y^2}{\hat\sigma_y^2}=\frac{\hat\sigma_x^2}{\hat\sigma_y^2}\sim F(m−1,n−1)$$有意水準$100\%$の両側検定の場合,この検定統計量を$F$分布の上側$\alpha/2$点と下側$\alpha/2$点(=上側$(1-\alpha/2)$点)と比較して,$$F_{1-\alpha/2}(m−1,n−1)\le\frac{\hat\sigma_x^2}{\hat\sigma_y^2}\le F_{\alpha/2}(m−1,n−1)$$を満たせば,帰無仮説を受け入れ,そうでないときは帰無仮説を棄却する。
問題の場合,$F$統計量は$$F=\frac{19.5^2}{14.5^2}=1.809$$となり,自由度($20,40$)の$F$分布の上側$2.5%$点は$2.068$,下側$2.5%$点は自由度($40,20$)の$F$分布の上側$2.5%$点の逆数から$1/2.287=0.437$なので,$F$統計量は上側$2.5%$点と下側$2.5%$点の間となり,帰無仮説は棄却しない。


統計検定2級問題解説 ~2018年6月実施~ (問1~問8)

過去問題

過去問題は統計検定公式問題集が問題と解答例を公開しています。こちらを参照してください。


問1 解答

(箱ひげ図)

[1]

$\boxed{ \ \mathsf{1}\ }$ ⑤

縦軸の目盛を見れば,Ⅲが総得点とすぐわかる。
偏差は“得点ー平均”,標準化得点は“偏差/標準偏差”なので,縦軸のスケールから判断し,Ⅰが標準化得点,Ⅱが偏差

[2]

$\boxed{ \ \mathsf{2}\ }$ ②

平均を$\mu$,標準偏差を$\sigma$として,
 $[\mu-2\sigma, \mu+2\sigma]=[54.45-2\times11.77, 54.45+2\times11.77]=[30.91, 77.99]$
この範囲外にあるのは名古屋の85点のみである。


問2 解答

(散布図,相関係数,擬相関)

[1]

$\boxed{ \ \mathsf{3}\ }$ ①

Ⅰ.散布図を見ると正の相関関係が見受けられるので,正しい。
Ⅱ.東京都の値は他の値から大きく外れているので,相関係数に大きく影響を与えるので,正しい。
Ⅲ.Ⅰが正しい(相関がみられる)ので,誤り。

[2]

$\boxed{ \ \mathsf{4}\ }$ ⑤

Ⅰ.北海道は人口がどう程度の都府県と比べ病床数が大きい(図で上の方にある)ので,誤り。
Ⅱ.人口と病床数の間には強い相関がみられるので,個々の病床数/人口の値は大きな差が出ないので,変動係数は小さくなる。正しい。
Ⅲ.人口が多い=散布図の右側にあるデータについてみると,概ね正の相関がみられるので,誤り。

[3]

$\boxed{ \ \mathsf{5}\ }$ ①

Ⅰ.人口と相関させたときの残差は人口の影響のを除去した値となる。したがってそれらの相関係数は偏相関係数といわれるものとなるので,正しい。
Ⅱ.人口と映画館数,人口と病床数の相関が強いので,人口が増えれば,映画館数も病床数も増える傾向となり,その結果,映画館数が増えると病床数も増えるように見える。しかしこのような関係は見かけ上の相関(擬相関)といわれ,両者間に本当に相関があるかどうかは,人口の影響を取り除いて評価されるべきである。正しい。
(統計の考え方では,たまたま相関が強いからといって,全く関係が見いだされない指標同士の関係性が良いという判断は一般的に行わない。)
Ⅲ.今回の分析において,病院に併設されている映画館の大小は全く読み取れないので,誤り。


問3 解答

(ローレンツ曲線とジニ係数)

問題にある表は,五分位範囲別の所得の相対度数分布表である。ローレンツ曲線とジニ係数を求めるにあたって便利なように,人口の累積相対度数と所得の累積相対度数を求めておく。

人口の累積相対度数20406080100
所得

累積
相対
度数
日本 5.416.132.456.5100.0
アメリカ 5.115.430.853.599.9
スウェーデン 8.723.040.863.8100.0
中国 5.215.029.952.2100.1
ドイツ 8.421.538.761.4100.0

[1]

$\boxed{ \ \mathsf{6}\ }$ ⑤

グラフから読み取れる値と上の表を比較すれば,ドイツ。(人口が$40$の時,所得は$20$を超え,人口が$60$の時所得は$40$を切っている)

[2]

$\boxed{ \ \mathsf{7}\ }$ ②

ジニ係数は完全平等線(人口の累積相対度数=所得の累積相対度数となる線)とローレンツ曲線で囲まれた面積の2倍で求める。
ローレンツ曲線より下の面積(%値で計算)
  $(0+2\times8.4+2\times21.5+2\times38.7+2\times61.4+100.0)\times20\div2=3600$
完全平等線とx軸の間の面積(%値で計算)
 $100\times100\div2=5000$
ジニ係数
 $(5000-3600)\div100^2\times2=0.28$

[3]

$\boxed{ \ \mathsf{8}\ }$ ⑤

Ⅰ.人口と所得の累積相対度数を比較すると,すべての国で所得の相対度数が人口の累積相対度数以下となっているので,ローレンツ曲線は完全平等線の下に弧を描く。正しい。
Ⅱ.3か国の所得の累積相対度数を比較すると,すべての階級でアメリカが最も小さい。したがって,完全平等線から最も遠くなり,ジニ係数は大きくなる。誤り。(ただし,ジニ係数が大きいほうが不平等といえる。)
Ⅲ.中国とスウェーデンの所得の累積相対度数を比較すると,すべての階級で中国が小さい。したがって,中国のほうが完全平等線から遠くなり,不平等といえる。正しい。

「ローレンツ曲線が完全平等線より遠い(下に膨らむ)⇔ジニ係数が大きい⇔不平等」


問4 解答

(時系列データの成長率)

[1]

$\boxed{ \ \mathsf{9}\ }$ ③

時点(年,月など) $t$の観測値を$y_t$としたとき,
変化率 $(y_{t+1}-y_t)/y_t$ または $y_{t+1}/y_t-1$

[2]

$\boxed{ \ \mathsf{10}\ }$ ②

$t$年$(2010\le{t}\le2015)$の観測値を$y_t$,変化率を$r$としたとき,【条件】は
$$
\begin{align} 
r&=y_{2015}/y_{2014}-1=y_{2014}/y_{2013}-1=y_{2013}/y_{2012}-1\\
&=y_{2012}/y_{2011}-1=y_{2011}/y_{2010}-1\\
r+1&=y_{2015}/y_{2014}=y_{2014}/y_{2013}=y_{2013}/y_{2012}=y_{2012}/y_{2011}=y_{2011}/y_{2010}\\ 
y_{2015}/y_{2010}&=y_{2015}/y_{2014}\times y_{2014}/y_{2013}\times y_{2013}/y_{2012}\times y_{2012}/y_{2011}\times y_{2011}/y_{2010}\\ 
&=(r+1)^5\\
\therefore r&=(y_{2015}/y_{2010})^{1/5}-1
\end{align}
$$
上式から明らかなことは,各年の変化率の幾何平均は
最初年の値を$y_0$,最後年の値を$y_t$,期間を$t$とすると $\left({y_t}/{y_0}\right)^{1/t}$ で求められる。


問5 解答

(実験計画,フィッシャーの3原則)

$\boxed{ \ \mathsf{11}\ }$ ②

実験:条件の設定を観測者が自ら設定できる試験
フィッシャーの3原則:無作為化,繰り返し,局所管理
無作為化:対象の抽出,処理の順番など,均一にできない条件については無作為に割り付ける。
繰り返し:ばらつきや個体差の影響を見積もるために実験を繰り返しを行う。
局所管理:処理効果以外のばらつきを小さくするため,条件が均一になるようブロック化する。


問6 解答

(標本抽出法)

$\boxed{ \ \mathsf{12}\ }$ ⑤

① 単純無作為抽出法
 全部で$N$個の個体からなる母集団から$n$個の標本を得るとき,各個体が選択される確率は等しく$N/n$,どの個体の組も選択される確率が等しく${}_NC_n$
② 系統抽出法
 通し番号をつけた名簿を作成し,1番目の調査対象を無作為に選び、2番目以降の調査対象を一定の間隔で抽出する方法。
③ 多段抽出法
 母集団をいくつかのグループ(第1段抽出単位)に分け,そこから無作為抽出でいくつかグループを選び,さらにその中から無作為抽出でいくつかのグループ(第2段抽出単位)を選び・・を何段か繰り返してそこから標本を無作為に抽出する。
④ 集落(クラスター)抽出法
 母集団を小集団であるクラスター(集落)に分け,その中からいくつかのクラスターを無作為に抽出し,それぞれのクラスターにおいて全数調査を行う。
⑤ 層化無作為抽出法
 母集団をあらかじめいくつかの層(グループ)に分けておき、各層の中から必要な数の調査対象を無作為に抽出する方法
 (通常,層の大きさに比例させて調査対象を抽出する大きさを決める。(比例配分法))


問7 解答

(事象と確率)

[1]

$\boxed{ \ \mathsf{13}\ }$ ⑤

S君がお菓子を獲得するためには
 「T君に勝ち+U君に勝ち」 と 「T君に負け+U君に勝ち+T君に勝ち」
となればよい。よって,この確率は
$p\times q+(1-p)\times q\times p=pq+(1-p)qp$

[2]

$\boxed{ \ \mathsf{14}\ }$ ①

①② 「U君―T君―U君」の時にS君がお菓子を獲得できる確率は,$qp+(1-q)pq<pq+(1-p)qp\ (\because p<q)$
よって,①は正しく,②は誤り。
③ $p<q$という条件なので,具体的な値によってどちらの選択でも確率の大小は変わらない。誤り。
④ お菓子獲得の確率は,明らかに違うので,誤り。
⑤ お菓子獲得の確率は,対戦順序や対戦回数によるので,誤り。


問8 解答

(標準正規分布,確率変数の和と差)

[1]

$\boxed{ \ \mathsf{15}\ }$ ②

6月の電気料金を$X$とすると,$Z=(X-4000)/500$は標準正規分布に従う。
$\begin{align}P(X\ge4800)=P\left(Z\ge\frac{4800-4000}{500}\right)=P(Z\ge1.6)=0.0548\end{align}$

[2]

$\boxed{ \ \mathsf{16}\ }$ ③

今年の6月の電気料金を$X_1$,前年の6月の電気料金を$X_2$とすると
$X_1\sim X_2\sim N(4000,500^2)$,$X_1, X_2$は独立だから
$E(X_1-X_2)=E(X_1)-E(X_2)=0, \ \ V(X_1-X_2)=V(X_1)+V(X_2)=2\times500^2$
正規分布の和(差)は正規分布なので$X_1-X_2\sim N(0,2\times500^2)$ (正規分布の再生性)
$\begin{align}P(X_1-X_2\ge800)=P\left(Z\ge\frac{800-0}{\sqrt2\times500}\right)=P(Z\ge1.13)=0.1292\end{align}$

[3]

$\boxed{ \ \mathsf{17}\ }$ ②

今年の6月の電気料金を$X_1$,前年の6月の電気料金を$X_2$,前々年の6月の電気料金を$X_3$とする。
正規分布は連続分布なので,$X_1,X_2,X_3$のうち少なくとも2つが等しいという事象が生じる確率は0である。
$X_1,X_2,X_3$は互いに独立なので,$X_1,X_2,X_3$のうち1つが他の2つより大きくなる確率は,同様に確からしく,また互いに排反なので,
$P(\mathrm{max}(X_1,X_2,X_3)=X_1)+P(\mathrm{max}(X_1,X_2,X_3)=X_2)+P(\mathrm{max}(X_1,X_2,X_3)=X_3)=1$
$\therefore\ P(\mathrm{max}(X_1,X_2,X_3)=X_1)=P(\mathrm{max}(X_1,X_2,X_3)=X_2)=P(\mathrm{max}(X_1,X_2,X_3)=X_3)=1/3$


統計検定2級問題解説 ~2019年11月実施~ (問11~問18)

過去問題

過去問題は統計検定公式問題集が問題と解答例を公開しています。こちらを参照してください。


問11 解答

(歪度)

$\boxed{ \ \mathsf{20}\ }$

・歪度は分布の非対称性を表す指標で、平均$\mu$、分散$\sigma^2$の確率変数$X$に対して、
$$a=E(X-\mu)^3/\sigma^3$$
で定義される。
・定義から明らかに、歪度の正負は平均の正負に関係がない。
・$E(X-\mu)$の符号を考えれば、歪度は分布が左に裾が長い場合は負になり、右に裾が長い場合は正になる。
・歪度が0となるのは平均を中心に線対称な分布になっている場合であり、峰の数とは関係がない。


問12 解答

(推定量の不偏性・一致性)

$\boxed{ \ \mathsf{21}\ }$ ⑤

・推定量$\hat\theta_n$(推定量の標本分布が標本数$n$によって変化するものとする)が母数$\theta$に確率収束している場合、$\hat\theta$を一致推定量という。
  任意の実数$\varepsilon$に対して、$\displaystyle \lim_{n\to\infty}P(|\hat\theta_n-\theta|\lt\varepsilon)=1$
・推定量$\hat\theta$の期待値が常に母数$\theta$に等しくなる場合、$\hat\theta$を不偏推定量という。
  $E(\hat\theta)=\theta$

Ⅰ.
$$E(\hat\mu_1)=E\left[\frac12(X_1+X_n)\right]=\frac12(E[X_1]+E[X_n])=\frac12(\mu+\mu)=\mu$$
よって、$\hat\mu_1$は$\mu$の不偏推定量である。

Ⅱ.
$$V(\hat\mu_1) =V\left[\frac12(X_1+X_n)\right]=\frac14(V[X_1]+V[X_n])=\frac14(\sigma^2+\sigma^2)=\frac12\sigma^2$$
となり、Ⅰ.とあわせて$\hat\mu_1$は正規分布$\displaystyle N\left(\mu, \frac12\sigma^2\right)$に従う。
であるから、例えば
$$P\left(\left|\frac{\hat\mu_1-\mu}{\sigma/\sqrt{2}}\right|\lt1.645\right)=0.90$$
が成り立つ。これより
$$\lim_{n\to\infty}P\left(|\hat\mu_1-\mu|\lt\frac{1.645\sigma}{\sqrt{2}}\right)=0.90$$
となるから、任意の$\varepsilon>0$に対して、$\displaystyle \lim_{n\to\infty}P(|\hat\mu_1-\mu|\lt\varepsilon)=1$が成り立たない。
よって、$\hat\mu_1$は$\mu$の一致推定量ではない。

Ⅲ.
$$E(\hat\mu_2)=E\left[\frac1{n-2}\sum_{t=2}^{n-1}X_t\right]=\frac1{n-2}\sum_{t=2}^{n-1}E[X_t]=\frac1{n-2}\sum_{t=2}^{n-1}\mu=\mu$$
よって、$\hat\mu_2$は$\mu$の不偏推定量である。

Ⅳ.
$$V(\hat\mu_2) =V\left[\frac1{n-2}\sum_{t=2}^{n-1}X_t\right]=\frac1{(n-2)^2}\sum_{t=2}^{n-1}V[X_t]=\frac1{(n-2)^2}\sum_{t=2}^{n-1}\sigma^2=\frac1{n-2}\sigma^2$$
となり、Ⅲ.とあわせてチェビシェフの不等式より任意の$\varepsilon>0$に対して
$$P(|\hat\mu_2-\mu|<\varepsilon)\ge1-\frac{\sigma^2}{(n-2)\varepsilon^2}$$
となる。これより、
$$\lim_{n\to\infty}P(|\hat\mu_2-\mu|<\varepsilon)=1$$
よって、$\hat\mu_2$は$\mu$の一致推定量である。


問13 解答

(母比率の区間推定)

$\boxed{ \ \mathsf{22}\ }$ ⑤

成功確率$p$の試行を$n$回行うときに成功する回数$X$は二項分布$B(n,p)$に従う$$\therefore\ \ E(X)=np,\ V(X)=np(1-p)$$このとき,$n$がある程度大きいときは,中心極限定理によって,$B(n,p)$は正規分布$N(np,np(1-p))$に近似できる。よって,$X$を標準化すると標準正規分布$N(0,1)$に従う。$$Z=\frac{X-np}{\sqrt{np(1-p)}}=\frac{X/n-p}{\sqrt{\frac{p(1-p)}n}}\sim N(0,1)$$ここで,標本平均 $\hat p=x/n$は$p$の一致推定量なので,$n$が十分大きいとき$p$は$\hat p$に置き換えられる。
したがって,母比率の$100(1-\alpha)\%$信頼区間は,標準正規分布の上側 $100\alpha/2\%$ 点を $z_{\alpha/2}$とすると,$$P\left(\hat p-z_{\alpha/2}\sqrt{\frac{\hat p(1-\hat p)}n}\le p\le\hat p+z_{\alpha/2}\sqrt{\frac{\hat p(1-\hat p)}n}\right)=1-\alpha$$
$A$候補の得票率の$95\%$信頼区間は,$n=100$,$\hat p=54/100=0.54$,$\alpha=0.05$として$$\hat p\pm z_{\alpha/2}\sqrt{\frac{\hat p(1-\hat p)}n}=0.54\pm1.96\times\sqrt{\frac{0.54\times(1-0.54)}{100}}=0.54\pm0.0977$$


問14 解答

(中心極限定理)

[1]

$\boxed{ \ \mathsf{23}\ }$ ③

$400$万円未満の相対度数は$6.2+13.4+13.7+13.2=46.5\%$、$500$万円未満の相対度数は$46.5+10.4=56.9\%$であるから、中央値が含まれる階級は$400$万円以上$500$万円未満の階級となる。したがって、中央値の半分は$200$万円以上$250$万円未満となる。
相対度数分布表から解ることは$200$万円未満の相対度数が$6.2+13.4=19.6\%$、$300$万円未満の相対度数が$19.6+13.7=33.3\%$であるので、中央値の半分に満たない所得の世帯の割合は$19.6\%$以上$33.3\%$以下となる。

[2]

$\boxed{ \ \mathsf{24}\ }$ ③

母集団の分布が正規分布でない場合でも、標本の大きさ$n$が十分大きいとき、統計量$\displaystyle Z=\frac{\bar X-\mu}{\sqrt{S^2/n}}$は中心極限定理より標準正規分布で近似できる。したがって、標準正規分布のパーセント点を用いて信頼区間を作成することが妥当である。


問15 解答

(母比率の区間推定とサンプルサイズ)

[1]

$\boxed{ \ \mathsf{25}\ }$ ④

母比率の$100(1-\alpha)\%$信頼区間は,標準正規分布の上側 $100\alpha/2\%$ 点を $z_{\alpha/2}$とすると,$$P\left(\hat p-z_{\alpha/2}\sqrt{\frac{\hat p(1-\hat p)}n}\le p\le\hat p+z_{\alpha/2}\sqrt{\frac{\hat p(1-\hat p)}n}\right)=1-\alpha$$
ここで、政党の支持率について事前の情報が全くないとき、母比率の信頼区間の幅が最も大きくなるのは$\hat p=0.5$となるので、$95\%$信頼区間が$6\%$以下となるようにするには、
$$2\times1.96\times\sqrt{\frac{0.5(1-0.5)}n}\le 0.06\quad\Rightarrow\quad n\ge\left(\frac{2\times1.96}{0.06}\right)^2\times0.5(1-0.5) \fallingdotseq 1067$$

[2]

$\boxed{ \ \mathsf{26}\ }$ ②

政党の支持率がおよそ80%とわかっているので、$\hat p=0.8$となり、$95\%$信頼区間が$6\%$以下となるようにするには、
$$2\times1.96\times\sqrt{\frac{0.8(1-0.8)}n}\le 0.06\quad\Rightarrow\quad n\ge\left(\frac{2\times1.96}{0.06}\right)^2\times0.8(1-0.8) \fallingdotseq 683$$


問16 解答

(正規分布の母平均に関する検定)

[1]

$\boxed{ \ \mathsf{27}\ }$ ⑤

正規母集団の母分散が既知の時、統計量$\displaystyle Z=\frac{\bar X-\mu}{\sqrt{\sigma^2/n}}$は標準正規分布$N(0,1)$に従うが、母分散が未知の時、母分散の代わりに標本不偏分散$\displaystyle S^2=\frac1{n-1}\sum_{i=1}^n(X_i-\bar{X})^2$を用いた統計量$\displaystyle T=\frac{\bar X-\mu}{\sqrt{S^2/n}}$は、自由度$n-1$の$t$分布に従う。

[2]

$\boxed{ \ \mathsf{28}\ }$ ④

体重が減少したこと$(\mu>0)$を検証するため、帰無仮説は「体重に差がない$(\mu=0)$」とする。対立仮説は$\mu>0$であるため、片側検定を行う。

[3]

$\boxed{ \ \mathsf{29}\ }$ ⑤

帰無仮説は$\mu=0$で、”前$-$後”のデータに関して$\bar{X}=0.5, S=1.5$であるから、
$$t=\frac{\bar X-\mu}{\sqrt{S^2/n}}=\frac{0.5-0}{\sqrt{1.5^2/16}}=1.333$$
$t$分布のパーセント点の表の自由度$15$、$\alpha=0.05$の値を見ると、
$$t_{0.05}(15)=1.753>t$$
よって、帰無仮説は棄却されない。この場合、帰無仮説が正しいとは言い切れず、第2種の過誤の確率で対立仮説が正しいといえることがあるので、体重に変化があると判断はできない


問17 解答

(一元配置分散分析)

[1]

$\boxed{ \ \mathsf{30}\ }$ ①

月を変動要因とした一元配置分散分析を行うので、この問題では月が水準となる。
水準間平方和は「各水準の平均値と全データの平均値との差の平方和」となるので、
$$S_A=\sum_{i=1}^{12}11(\bar{y}_{i\cdot}-\bar{y}_{\cdot\cdot})^2$$
残差平方和は「個々のデータと該当する水準の平均値との差の平方和」となるので、
$$S_e=\sum_{i=1}^{12}\sum_{j=2008}^{2018}(y_{ij}-\bar{y}{i\cdot})^2$$
となる。

[2]

$\boxed{ \ \mathsf{31}\ }$ ③

水準間平方和の自由度は水準の数$-1$なので、$12-1=11$。
残差平方和の自由度は総データ数$-$水準の数なので、$12\times11-12=120$。

[3]

$\boxed{ \ \mathsf{32}\ }$ ③

一元配置分散分析では、帰無仮説$H_o:$「各水準の母平均は同じである。」,対立仮説$H_1:$「水準の母平均は少なくとも1つ他と異なるものがある。」としたときの$F$検定を行う。
分散分析表から$F_-$値は$3.0471$であり、これは$F$分布のパーセント表から読み取れる$$F_{0.05}(11,120)\lt F_{0.05}(10,120)=1.910$$ $$F_{0.025}(11,120)\lt F_{0.025}(10,120)=2.157$$よりも大きいことから、有意水準$5\%, 2.5\%$いずれにおいても帰無仮説は棄却される(このとき、$P_-$値は有意水準より小さくなる)。


問18 解答

(重回帰モデル,統計ソフトウェアの活用)

※重回帰モデルの統計ソフトウェアによる出力結果の主な項目
$\mathtt{Estimate}$:回帰係数($\alpha_0,\alpha_1,\alpha_2$)の推定値
$\mathtt{Std.Error}$:回帰係数の推定値の標準誤差
$\mathtt{t\ value}$:$t$値,$\mathtt{Pr(\gt|t|)}$:$P_-$値・・・回帰係数の検定で使う
$\mathtt{Rasidual\ standard\ error}$:誤差項の標準偏差の推定値
$\mathtt{degrees\ of\ freedom}$:自由度
$\mathtt{Multiple\ R-squared}$:決定係数($R^2$)
$\mathtt{Adjusted\ R-squared}$:自由度調整済み決定係数($R^{*2}$)
$\mathtt{F-statistic}$:$F$検定統計量,$\mathtt{p-value}$:$P_-$値・・・回帰の有意性の検定で使う

[1]

$\boxed{ \ \mathsf{33}\ }$ ①

重回帰モデルの出力結果から、定期収入$(\mathtt{income})$の偏回帰係数は$\alpha_1=0.39461$、賞与$(\mathtt{bonus})$の偏回帰係数は$\alpha_2=0.47247$となり、この係数は、定期収入や賞与が$1$増加したときに消費支出が増加する数量を表している。このことから、選択肢のうち正しいのは①である。

②は賞与と定期収入が同時に1万円増えるので、消費支出は$0.39461+0.47247$万円増えることになるので誤りである。③、④、⑤では偏回帰係数が、定期収入や賞与が増加する割合で消費支出が増加する割合を示すものではないので誤りである。

[2]

$\boxed{ \ \mathsf{34}\ }$ ⑤

最小二乗法で推定した予測値と実データの差である残差$e_i=y_i-\hat{y}_i$の平均は$0$であるので、
$$\bar{\hat{y}}=\frac1n\sum_{i=1}^n\hat{y}_i=\frac1n\sum_{i=1}^n(y_i-e_i)=\frac1n\sum_{i=1}^ny_i-\frac1n\sum_{i=1}^ne_i=\bar{y}-0=\bar{y}$$
また、消費支出の各データにおける予測値は$\hat{y}_i=\hat\beta_0+\hat\beta_1x_i$であるので、
$$\bar{\hat{y}}=\frac1n\sum_{i=1}^n\hat{y}_i=\frac1n\sum{i=1}^n(\hat\beta_0+\hat\beta_1x_i)=\hat\beta_0+\frac1n\sum_{i=1}^n\hat\beta_1x_i=\hat\beta_0+\hat\beta_1\bar{x}$$
よって、世帯主収入合計の平均は、$(31.3-14.3931)/0.4121\fallingdotseq41.0$
以上からⅠ~Ⅲはすべて正しい。

[3]

$\boxed{ \ \mathsf{35}\ }$ ③

Ⅰ.「消費支出$=\alpha_0+\alpha_1\times$定期収入$+\alpha_2\times$賞与$+u$」において、$\alpha_1=\alpha_2=\alpha$とすると、「消費支出$=\alpha_0+\alpha\times($定期収入$+$賞与$)+u$」となり、これは単回帰モデルである。正しい。
Ⅱ.自由度調整済み決定係数は重回帰モデルで$0.5161$,単回帰モデルで$0.5261$となっており、単回帰モデルのほうが大きく、単回帰モデルを選択すべきである。誤り。
Ⅲ.重回帰モデルでは賞与の値を固定すれば定期収入と消費支出の関係を、定期収入の値を固定すれば賞与と消費支出の関係をそれぞれ分析できる。単回帰モデルでは説明変数が定期収入と賞与の合計であるため、これと消費支出の関係しか分析できない。正しい。


統計検定2級問題解説 ~2019年11月実施~ (問1~問10)

過去問題

過去問題は統計検定公式問題集が問題と解答例を公開しています。こちらを参照してください。


問1 解答

(箱ひげ図)

[1]

$\boxed{ \ \mathsf{1}\ }$

東京の箱ひげ図を見ると、$16$~$18$℃の範囲に外れ値が$2$つあり、その次に大きい値が$12$~$14$℃の範囲に含まれている。このことから、
・$14$℃以上$16$℃未満の度数$=0$
・$16$℃以上$18$℃未満の度数$=2$
・$18$℃以上$20$℃未満の度数$=0$
となるので、度数分布は$\mathrm{(A)}$となる。
なお、ほかの都市の箱ひげ図は外れ値がないので、ひげの最大値最小値がどこの範囲に含まれているかを見れば、
 名古屋$=\mathrm{(E)}$、大阪$=\mathrm{(D)}$、広島$=\mathrm{(B)}$、福岡$=\mathrm{(C)}$
であることがわかる。

[2]

$\boxed{ \ \mathsf{2}\ }$

範囲$=$最大値$-$最小値、四分位範囲$=$第3四分位数$-$第1四分位数で、箱ひげ図では箱の高さが四分位範囲、範囲は外れ値を含んで最大値と最小値の間の高さ、箱の中の線が中央値になるので、
・範囲が最も大きいのは福岡
・四分位範囲が最も小さいのは東京
・第1四分位数が最も大きいのは福岡
・中央値が最も小さいのは名古屋
・最大値が最も小さいのは名古屋
となる。


問2 解答

(散布図、相関係数、ヒストグラム)

[1]

$\boxed{ \ \mathsf{3}\ }$

・$1990$年の散布図から、 女性の$50$歳時未婚率が$8\%$を超えている件数は$1$件あり、男性の$50$歳時未婚率が$10\%$を超えている件数は$2$件あるので、①と②は誤り。
・男性の$50$歳時未婚率は$1990$年の最大値($12\%$程度)より$2015$年の最小値($18\%$程度)が上回っているので、③は誤り。
・$2015$年の散布図から、 女性の$50$歳時未婚率が最も低い都道府県は、男性の$50$歳時未婚率は下から$3$番目であるので、⑤は誤り。
・$2015$年の散布図から、すべての都道府県は女性の$50$歳時未婚率$=$男性の$50$歳時未婚率となる直線(散布図左上の$(18,18)$の点から右上方に$45^{\circ}$に引いた直線)より下側にあることから、 女性の$50$歳時未婚率は男性の$50$歳時未婚率よりも低くなっている。④は正しい。

[2]

$\boxed{ \ \mathsf{4}\ }$

$1990$年の散布図と$2015$年の散布図を比較すると、どちらも正の相関で、$1990$年のほうが相関が強く(より直線状に分布している)なっているので、相関係数は$r_{1990}\gt r_{2015}$となる。よって、該当するのは①か④となるが、$1990$年の相関の強さを表しているのは④のほうである。

[3]

$\boxed{ \ \mathsf{5}\ }$

$2015$年の散布図から、$(10\%$~$12\%$の件数$)\gt 5$であることがわかるので、この条件を満たすヒストグラムは③のみである。


問3 解答

(変化率,指数化,幾何平均)

[1]

$\boxed{ \ \mathsf{6}\ }$

$($平成$31$年$1$月の賃金指数$)\div($平成$30$年$1$月の賃金指数$)=1+(-0.97\%)$
 $\Rightarrow ($平成$31$年$1$月の賃金指数$)=102.6\times(1-0.0097)$
$\therefore ($平成$31$年$1$月の賃金指数の平成$30$年$12$月からの変化率$)$
 $\displaystyle=\left\{\frac{102.6\times(1-0.0097)}{104.1}-1\right\}\times 100$

※)値$a$から値$b$への変化率$\displaystyle=\frac{b-a}{a}=\frac{b}{a}-1$

[2]

$\boxed{ \ \mathsf{7}\ }$

$1$か月あたりの平均変化率を$r$とすると、【条件】から
$($平成$30$年$1$月の賃金指数$)\times (1+r/100)^3=($平成$30$年$4$月の賃金指数$)$
 $\displaystyle\Rightarrow (1+r/100)^3=\frac{105.6}{102.6}$
 $\displaystyle\Rightarrow r=\left\{\left(\frac{105.6}{102.6}\right)^{1/3}-1\right\}\times100$


問4 解答

(時系列データ)

$\boxed{ \ \mathsf{8}\ }$

・傾向変動は長期にわたる動きを表す変動ではあるが、必ずしも直線で表される変動となるとは限らない。(例えば、複数年にわたる循環変動とか)。
・季節変動は1年を周期として循環を繰り返す変動を指す。
・不規則変動は傾向変動と季節変動以外の変動で、規則性のない変動を指し、これには偶然変動も含まれる。
よって、Ⅱのみ正しい。


問5 解答

(コレログラム)

$\boxed{ \ \mathsf{9}\ }$

グラフは、$12$か月周期のグラフになっているので、自己相関係数はラグ$12,24$で強い正の相関となる。また、ピークの$6$か月後付近は小さい値で変動していることから、自己相関係数はラグ$6,18$前後では負の相関となる。

以上のことから、横軸にラグ、縦軸に自己相関係数をとったグラフであるコレログラムは、②となる。
①、⑤はラグ$12$で負の値となっており、③、④はラグ$6$で負の相関になっていない。


問6 解答

(標本抽出法)

$\boxed{ \ \mathsf{10}\ }$

Ⅰは母集団から無作為に抽出しているので単純無作為抽出法。
Ⅱは母集団をグループに分け、それぞれのグループから無作為に抽出しているので層化抽出法。
Ⅲは母集団を便単位に分け(クラスター)、いくつかの便を選択し、その便において全数調査しているから集落抽出法。

標本調査の抽出方法

単純無作為抽出法・・・母集団の中から無作為に標本を抽出する方法。
層化抽出法・・・母集団をあらかじめいくつかの層(グループ)に分けておき、各層の中から必要な数の調査対象を無作為に抽出する方法。
(通常,層の大きさに比例させて調査対象を抽出する大きさを決める。(比例配分法))
集落(クラスター)抽出法・・・母集団を小集団であるクラスター(集落)に分け,その中からいくつかのクラスターを無作為に抽出し,それぞれのクラスターにおいて全数調査を行う。
二段抽出法・・・母集団をいくつかのグループに分け,その中からいくつかのグループを無作為に抽出し(第1段抽出),さらにそこから標本を無作為に抽出(第2段抽出)する。
系統抽出法・・・通し番号をつけた名簿を作成し,1番目の調査対象を無作為に選び、2番目以降の調査対象を一定の間隔で抽出する方法。


問7 解答

(標本誤差)

$\boxed{ \ \mathsf{11}\ }$

標本平均の分散は、$$V(\bar X)=V\left(\frac{X_1+X_2+\cdots+X_n}n\right)=\frac{V(X_1+X_2+\cdots+X_n)}{n^2}=\frac{n\sigma^2}{n^2}=\frac{\sigma^2}{n}$$
標準誤差は推定量の標準偏差であり、標本平均の標準偏差は、$$SE=\sqrt{\frac{\sigma^2}{n}}=\frac{\sigma}{\sqrt{n}}$$
ここで、標本平均の場合、母分散$\sigma^2$の推定量である不偏分散$\hat\sigma^2$に置き換えて$$SE=\sqrt{\frac{\hat\sigma^2}{n}}=\sqrt{\frac{16}{100}}=0.40$$


問8 解答

(確率の乗法定理、ベイズの定理)

[1]

$\boxed{ \ \mathsf{12}\ }$

対策講座を受講したという事象を$A$、検定試験に合格したという事象を$B$とすると、
$$P(A)=20\%=0.2,\ P(B|A)=70\%=0.7$$
対策講座を受講した合格者を選ぶ確率$P(A\cap B)$は乗法定理より、
$$P(A\cap B)=P(A)\cdot P(B|A)=0.2\times0.7=0.14$$

[2]

$\boxed{ \ \mathsf{13}\ }$

無作為に選んだ人が合格者だった場合にその人が対策講座を受講した確率$P(A|B)$はベイズの定理より
$$P(A|B)=\frac{P(A)P(B|A)}{P(B)}=\frac{P(A)P(B|A)}{P(A)P(B|A)+P(A^C)P(B|A^C)}$$
ここで、[1]より$P(A)P(B|A)=0.14$
また、$P(B|A^C)=30\%=0.3,\ P(A^C)=1-P(A)=1-20\%=80\%=0.8$
$$\therefore\ P(A|B)=\frac{0.14}{0.14+0.8\times0.3}=\frac{0.14}{0.38}\fallingdotseq0.37$$


問9 解答

(連続型確率変数)

[1]

$\boxed{ \ \mathsf{14}\ }$

確率の公理より、確率密度関数$f(x)$は、$\displaystyle\int_{-\infty}^\infty f(x)dx=1$を満たさなければならない。よって、
$$\begin{align}
\int_{-\infty}^\infty f(x)dx&=\int_{-\infty}^0 f(x)dx+\int_0^{20} f(x)dx+\int_{20}^\infty f(x)dx\\
&=0+\int_0^{20} a\left(1-\frac{x}{20}\right)dx+0\\
&=a\left[x-\frac{x^2}{2\times20}\right]_0^{20}\\
&=a\left(20-\frac{20^2}{2\times20}\right)=10a=1\\
\therefore\ a&=\frac{1}{10}
\end{align}$$

[2]

$\boxed{ \ \mathsf{15}\ }$

1か月の水道使用量の期待値は
$$\begin{align}
E(X)&=\int_0^{20} xf(x)dx\\
&=\int_0^{20} \frac{x}{10}\left(1-\frac{x}{20}\right)dx\\
&=\frac{1}{10}\left[\frac{x^2}{2}-\frac{x^3}{3\times20}\right]_0^{20}\\
&=\frac{1}{10}\left(\frac{20^2}{2}-\frac{20^3}{3\times20}\right)\\
&=\frac{20}{3}
\end{align}$$

[3]

$\boxed{ \ \mathsf{16}\ }$

1か月の水道使用料金の期待値は水道使用量の確率に単価をかけて求める。
$$\begin{align}
&1000\times\int_0^{10}\frac{1}{10}\left(1-\frac{x}{20}\right)dx+1120\times\int_{10}^{15}\frac{1}{10}\left(1-\frac{x}{20}\right)dx+1280\times\int_{15}^{20}\frac{1}{10}\left(1-\frac{x}{20}\right)dx\\
=&\frac{1000}{10}\left[x-\frac{x^2}{2\times20}\right]_0^{10}+\frac{1120}{10}\left[x-\frac{x^2}{2\times20}\right]_{10}^{15}+\frac{1280}{10}\left[x-\frac{x^2}{2\times20}\right]_{15}^{20}\\
=&100\times\left(10-\frac{10^2}{40}\right)+112\times\left(15-\frac{15^2}{40}-10+\frac{10^2}{40}\right)+128\times\left(20-\frac{20^2}{40}-15+\frac{15^2}{40}\right)\\
=&750+210+80=1040
\end{align}$$

※水道料金のパターンが$1000$円、$1120$円、$1280$円となっているので、水道使用量の確率から考えて、期待値は$1000$~$1280$の範囲に収まることがわかる。さらに、水道使用量が$0\le x\lt10$となる確率は$$\int_0^{10}\frac{1}{10}\left(1-\frac{x}{20}\right)dx=\frac{1}{10}\times\left(10-\frac{10^2}{40}\right)=\frac{3}{4}$$となることから、期待値は$1000$円に近いほうと考えられる。このことから②が正解だとわかる。


問10 解答

(分布関数、期待値)

[1]

$\boxed{ \ \mathsf{17}\ }$

$Z$は正値確率変数確率で、分布関数$F_Z$は単調増加の関数なので、$F_Z(0)=0$
また、$F_Z(100)=P(Z\le100)=0.96$から、$P(Z\gt100)=1-0.96=0.04$
一方、確率変数$X$の定義から$X$の取りうる範囲は$0\le x\le100$
ここで、$F_X(0)=P(X=0)=P(Z=0)+P(Z\gt100)=0.04$となり、$0\lt x\lt100$の場合は$$\begin{align}
F_X(x)&=P(X\le x)\\
&=P(X=0)+P(0\lt X\le x)\\
&=0.04+P(0\lt Z\le x)\\
&=0.04+F_Z(x)
\end{align}$$

[2]

$\boxed{ \ \mathsf{18}\ }$

$X$の下側$95\%$点を$a$とすると、
$$\begin{align}
P(X\le a)=F_X(a)&=0.95\\
F_Z(a)+0.04&=0.95\\
F_Z(a)&=0.91
\end{align}$$
よって、$a=5$となる。

[3]

$\boxed{ \ \mathsf{19}\ }$

確率変数が連続型である場合、分布関数は確率密度関数を積分することで求められる。したがって、分布関数が連続ならば分布関数を微分することで確率密度関数を求めることができる。
確率変数$X$の確率密度関数を$f_X(x)$とすると、$F_X(x)$は$0\lt x\lt100$では連続関数なので、
$$f_X(x)=\frac{d}{dx}F_X(x)=\frac{d}{dx}(F_Z(x)+0.04)=\frac{d}{dx}F_Z(x)=f_Z(x)$$
また$x\ge100$では、$X$の定義から$f_X(x)=0$
以上より確率変数$X$の期待値は、
$$E(X)=\int_0^\infty xf_X(x)dx=\int_0^{100} xf_X(x)dx+\int_{100}^\infty xf_X(x)dx==$$



Ch.8 「検定論」の章末問題の解答例 〜現代数理統計学(学術図書出版社)〜

当記事は「現代数理統計学(学術図書出版社)」の読解サポートにあたってChapter.8の「検定論」の章末問題の解説について行います。

基本的には書籍の購入者向けの解説なので、まだ入手されていない方は購入の上ご確認ください。また、解説はあくまでサイト運営者が独自に作成したものであり、書籍の公式ページではないことにご注意ください。(そのため著者の意図とは異なる解説となる可能性はあります)

↓下記が公式の解答なので、正確にはこちらを参照ください。
https://www.gakujutsu.co.jp/text/isbn978-4-7806-0860-1/

章末の演習問題について

問題8.1の解答例

$c$を大きくすると棄却域が小さくなることから、$\alpha(c,r)=E[\delta_{c,r}(X)]$は$c$の減少関数となる。また、(8.21)式において$r$を増加させると$\delta_{c,r}(X)$が尤度比$c$の地点で増加するから$\alpha(c,r)$は$r$の増加関数である。
$c=\infty, r=0$のときは常に受容であるので$\alpha(\infty,0)=0$、$c=0, r=1$の際は密度関数が0以上であることを鑑みると常に棄却であるので$\alpha(0,1)=1$であり、これより$\alpha(c,r)$の最小値が0、最大値が1であることがわかる。

問題8.2の解答例

問題8.3の解答例

(8.26)式は下記のように表される。
$$
\large
\begin{align}
\frac{f(x,p_1)}{f(x,p_0)} &= \frac{p_1^{x}(1-p_1)^{n-x}}{p_0^{x}(1-p_0)^{n-x}} \\
&= \left( \frac{p_1(1-p_0)}{p_0(1-p_1)} \right)^{x} \times \left( \frac{1-p_1}{1-p_0} \right)^{n} \quad (8.26)
\end{align}
$$

ここで$\fbox{$\displaystyle \frac{f(x,p_1)}{f(x,p_0)} > c \iff x > k \quad {}^{\exists} k \in \mathbb{Z}$}$であることを以下示す。(8.26)式を元に$\displaystyle \frac{f(x,p_1)}{f(x,p_0)} > c$は下記のように変形できる。
$$
\large
\begin{align}
\frac{f(x,p_1)}{f(x,p_0)} &> c \\
\left( \frac{p_1(1-p_0)}{p_0(1-p_1)} \right)^{x} \times & \left( \frac{1-p_1}{1-p_0} \right)^{n} > c \\
\left( \frac{p_1(1-p_0)}{p_0(1-p_1)} \right)^{x} &> \frac{c(1-p_1)^n}{(1-p_0)^n} \quad (1)
\end{align}
$$

上記の式の形は複雑であるので、簡易化にあたって下記のように$a, b$を設定する。
$$
\large
\begin{align}
a &= \frac{p_1(1-p_0)}{p_0(1-p_1)} \\
b &= \frac{c(1-p_1)^n}{(1-p_0)^n}
\end{align}
$$
このとき(1)式は下記のように変形できる。
$$
\large
\begin{align}
\left( \frac{p_1(1-p_0)}{p_0(1-p_1)} \right)^{x} &> \frac{c(1-p_1)^n}{(1-p_0)^n} \\
a^x &> b \\
\log{a^x} &> \log{b} \\
x \log{a} &> \log{b} \\
x &> \frac{\log{b}}{\log{a}} \\
x &> \frac{\log{b}}{\log{a}} > k \quad {}^{\exists}k \in \mathbb{Z}
\end{align}
$$

ここまでの議論により、$\fbox{$\displaystyle \frac{f(x,p_1)}{f(x,p_0)} > c \iff x > k \quad {}^{\exists} k \in \mathbb{Z}$}$を示すことができる。

問題8.4の解答例

問題8.5の解答例

$\sigma_1^2 < \sigma_2^2$を仮定した上で$X_1=x_1,…,X_n=x_n$に関する同時確率の$f(X_1=x_1,…,X_n=x_n,\sigma_1^2)$と$f(X_1=x_1,…,X_n=x_n,\sigma_2^2)$を考える。$X_1,…,X_n \sim N(0,\sigma^2)$より、$f(X_1=x_1,…,X_n=x_n,\sigma_1^2)$と$f(X_1=x_1,…,X_n=x_n,\sigma_2^2)$は、それぞれ下記のように表すことができる。
$$
\large
\begin{align}
f(X_1=x_1,…,X_n=x_n,\sigma_1^2) &= \prod_{i=1}^{n} \frac{1}{\sqrt{2 \pi \sigma_1^2}} \exp \left\{ – \frac{x_i^2}{2 \sigma_1^2} \right\} \\
f(X_1=x_1,…,X_n=x_n,\sigma_2^2) &=\prod_{i=1}^{n} \frac{1}{\sqrt{2 \pi \sigma_2^2}} \exp \left\{ – \frac{x_i^2}{2 \sigma_2^2} \right\}
\end{align}
$$

このとき、尤度比の$\displaystyle \frac{f(X_1=x_1,…,X_n=x_n,\sigma_2^2)}{f(X_1=x_1,…,X_n=x_n,\sigma_1^2)}$は下記のように表すことができる。
$$
\large
\begin{align}
\frac{f(X_1=x_1,…,X_n=x_n,\sigma_2^2)}{f(X_1=x_1,…,X_n=x_n,\sigma_1^2)} &= \prod_{i=1}^{n} \frac{1}{\sqrt{2 \pi \sigma_2^2}} \exp \left\{ – \frac{x_i^2}{2 \sigma_2^2} \right\} \times \frac{\sqrt{2 \pi \sigma_1^2}}{\exp \left\{ – \frac{x_i^2}{2 \sigma_1^2} \right\}} \\
&= \prod_{i=1}^{n} \sqrt{\frac{\sigma_1^2}{\sigma_2^2}} \exp \left\{ – \frac{x_i^2}{2 \sigma_2^2} + \frac{x_i^2}{2 \sigma_1^2} \right\} \\
&= \prod_{i=1}^{n} \sqrt{\frac{\sigma_1^2}{\sigma_2^2}} \exp \left\{ x_i^2 \left( \frac{1}{2 \sigma_1^2} – \frac{1}{2 \sigma_2^2} \right) \right\} \\
&= \left( \frac{\sigma_1^2}{\sigma_2^2} \right)^{n/2} \exp \left\{ \sum_{i=1}^{n} x_i^2 \left( \frac{1}{2 \sigma_1^2} – \frac{1}{2 \sigma_2^2} \right) \right\} \\
&= \left( \frac{\sigma_1^2}{\sigma_2^2} \right)^{n/2} \exp \left\{ \left( \frac{1}{2 \sigma_1^2} – \frac{1}{2 \sigma_2^2} \right) \sum_{i=1}^{n} x_i^2 \right\}
\end{align}
$$

ここで上記に対して、$\sigma_1^2 < \sigma_2^2$より$\displaystyle \frac{1}{2 \sigma_1^2} > \frac{1}{2 \sigma_2^2}$、$\displaystyle \frac{1}{2 \sigma_2^2} – \frac{1}{2 \sigma_1^2} > 0$が成立する。
これにより、尤度比の$\displaystyle \frac{f(X_1=x_1,…,X_n=x_n,\sigma_2^2)}{f(X_1=x_1,…,X_n=x_n,\sigma_1^2)}$は統計量$\displaystyle T(X_1,…,T_n) = \sum_{i=1}^{n} X_i^2$の単調増加関数であることがわかる。

ここまでの議論により、定理8.3のネイマン・ピアソンの補題の応用が適用でき、下記のような最強一様力検定が得られることがわかる。
$$
\large
\begin{align}
\sum_{i=1}^{n} X_i^2 > \chi^2_{\alpha}(n) \implies reject
\end{align}
$$

問題8.6の解答例

$\lambda_1 < \lambda_2$を仮定した上で$X_1=x_1,…,X_n=x_n$に関する同時確率の$p(X_1=x_1,…,X_n=x_n,\lambda_1)$と$p(X_1=x_1,…,X_n=x_n,\lambda_2)$を考える。$X_1,…,X_n \sim Po(\lambda)$より、$p(X_1=x_1,…,X_n=x_n,\lambda_1)$と$p(X_1=x_1,…,X_n=x_n,\lambda_2)$は、それぞれ下記のように表すことができる。
$$
\large
\begin{align}
p(X_1=x_1,…,X_n=x_n,\lambda_1) &= \prod_{i=1}^{n} \frac{\lambda_1^{x_i} e^{-\lambda_1}}{x_i!} \\
p(X_1=x_1,…,X_n=x_n,\lambda_2) &= \prod_{i=1}^{n} \frac{\lambda_2^{x_i} e^{-\lambda_2}}{x_i!}
\end{align}
$$

このとき、尤度比の$\displaystyle \frac{p(X_1=x_1,…,X_n=x_n,\lambda_2)}{p(X_1=x_1,…,X_n=x_n,\lambda_1)}$は下記のように表すことができる。
$$
\large
\begin{align}
\frac{p(X_1=x_1,…,X_n=x_n,\lambda_2)}{p(X_1=x_1,…,X_n=x_n,\lambda_1)} &= \prod_{i=1}^{n} \frac{\lambda_2^{x_i} e^{-\lambda_2}}{x_i!} \times \frac{x_i!}{\lambda_1^{x_i} e^{-\lambda_1}} \\
&= \prod_{i=1}^{n} \left( \frac{\lambda_2}{\lambda_1} \right)^{x_i} \exp(\lambda_1-\lambda_2) \\
&= \left( \frac{\lambda_2}{\lambda_1} \right)^{\sum_{i=1}^{n} x_i} \exp(n(\lambda_1-\lambda_2))
\end{align}
$$

ここで上記に対して、$\lambda_1 < \lambda_2$より$\displaystyle \frac{\lambda_2}{\lambda_1} > 1$が成立する。
これにより、尤度比の$\displaystyle \frac{p(X_1=x_1,…,X_n=x_n,\lambda_2)}{p(X_1=x_1,…,X_n=x_n,\lambda_1)}$は統計量$\displaystyle T(X_1,…,T_n) = \sum_{i=1}^{n} X_i$の単調増加関数であることがわかる。

ここまでの議論により、定理8.3のネイマン・ピアソンの補題の応用が適用でき、下記のような最強一様力検定が得られることがわかる。
$$
\large
\begin{align}
\sum_{i=1}^{n} X_i > c_{\alpha} \implies reject
\end{align}
$$
ここで$c_{\alpha}$はパラメータ$\lambda=n$のポアソン分布の上側$\alpha$点を定義した。$\lambda=n$に関しては各確率変数の$X_i$に関してパラメータ$1$を仮定したことに対して、ポアソン分布の再生性を用いて導出を行った。

また、ポアソン分布が離散確率分布であるので、境界の値が$\alpha$に一致しない場合は$r$を用いて確率化を行う。

問題8.7の解答例

問題8.8の解答例

図8.6を参考に、(8.55)式が点P$(-c,\exp(- c \mu))$と点Q$((c,\exp(c \mu))$で等式になる$\tilde{c}_1$と$\tilde{c}_2$を選べば良い。よって、下記の連立方程式を$\tilde{c}_1$と$\tilde{c}_2$に関して解けば良い。
$$
\large
\begin{align}
\tilde{c}_1 – c \tilde{c}_2 &= \exp(- c \mu) \quad (1) \\
\tilde{c}_1 + c \tilde{c}_2 &= \exp(c \mu) \quad (2)
\end{align}
$$

(1)+(2)を計算し、$\tilde{c}_1$に関して解くと下記が得られる。
$$
\large
\begin{align}
2 \tilde{c}_1 &= \exp(- c \mu) + \exp(c \mu) \\
\tilde{c}_1 &= \frac{\exp(- c \mu) + \exp(c \mu)}{2}
\end{align}
$$

上記を(2)式に代入し、$\tilde{c}_2$に関して解くと下記が得られる。
$$
\large
\begin{align}
\frac{\exp(- c \mu) + \exp(c \mu)}{2} + c \tilde{c}_2 &= \exp(c \mu) \\
c \tilde{c}_2 &= \exp(c \mu) – \frac{\exp(- c \mu) + \exp(c \mu)}{2} \\
c \tilde{c}_2 &= \frac{\exp(c \mu) – \exp(- c \mu)}{2} \\
\tilde{c}_2 &= \frac{\exp(c \mu) – \exp(- c \mu)}{2c}
\end{align}
$$

ここまでの議論により、下記が得られる。
$$
\large
\begin{align}
\tilde{c}_1 &= \frac{\exp(- c \mu) + \exp(c \mu)}{2} \\
\tilde{c}_2 &= \frac{\exp(c \mu) – \exp(- c \mu)}{2c}
\end{align}
$$

・考察
ここで導出を行った$\tilde{c}_1$と$\tilde{c}_2$を図8.6と見比べることで、下記が成立することがわかる。
$$
\large
\begin{align}
\exp(\mu x) > \tilde{c}_1 + \tilde{c}_2 x \iff |x| > c
\end{align}
$$

ここまでの議論により、正規分布の母平均に関して、下記の検定がUMPU(Uniformaly Most Powerful Unbiased test)であることを示すことができる。
$$
\large
\begin{align}
|X| > c \implies reject
\end{align}
$$

問題8.9の解答例

$n$回試行の二項分布の確率関数を$f(x,p)$と定義すると、$f(x,p)$は下記のように表すことができる。
$$
\large
\begin{align}
f(x,p) = {}_n C_x p^{x} (1-p)^{n-x}
\end{align}
$$

上記の$p$での微分を$f'(x,p)$と定義すると、$f'(x,p)$に関して下記が成立する。
$$
\large
\begin{align}
f'(x,p) &= \left( {}_n C_x p^{x} (1-p)^{n-x} \right)’ \\
&= {}_n C_x \left( p^{x} (1-p)^{n-x} \right)’ \\
&= {}_n C_x \left( x p^{x-1} (1-p)^{n-x} – (n-x)p^x(1-p)^{n-x-1} \right) \\
&= {}_n C_x p^{x} (1-p)^{n-x} \left( \frac{x}{p} – \frac{n-x}{1-p} \right) \\
&= \left( \frac{x}{p} – \frac{n-x}{1-p} \right) f(x,p)
\end{align}
$$

ここで、(8.60)式は$a>0, b<n$のとき、下記のように表すことができる。
$$
\large
\begin{align}
\alpha &= \sum_{x=0}^{a-1} f(x,p_0) + r_a f(a,p_0) + r_b f(b,p_0) + \sum_{x=b+1}^{n} f(x,p_0) \quad (1) \\
0 &= \sum_{x=0}^{a-1} f'(x,p_0) + r_a f'(a,p_0) + r_b f'(b,p_0) + \sum_{x=b+1}^{n} f'(x,p_0) \quad (2)
\end{align}
$$
上記の式は$a>0, b<n$が前提だが、$a=0$のとき$\displaystyle \sum_{x=0}^{a-1}f(x,p_0) = 0, \sum_{x=0}^{a-1}f'(x,p_0) = 0$、$b=n$のとき$\displaystyle \sum_{x=b+1}^{n}f(x,p_0) = 0, \sum_{x=b+1}^{n}f'(x,p_0) = 0$と考えることで$a=0, b=n$も同時に表すことができると考えられる。

ここで、(1)式、(2)式を$r_a, r_b$に関する連立方程式であると考え、下記のように変形する。
$$
\large
\begin{align}
r_a f(a,p_0) + r_b f(b,p_0) &= \alpha – \sum_{x=0}^{a-1} f(x,p_0) – \sum_{x=b+1}^{n} f(x,p_0) \quad (1)’ \\
r_a f'(a,p_0) + r_b f'(b,p_0) &= – \sum_{x=0}^{a-1} f'(x,p_0) – \sum_{x=b+1}^{n} f'(x,p_0) \quad (2)’
\end{align}
$$

$(1)’$式、$(2)’$式は下記のような行列表記で表すことができる。
$$
\large
\begin{align}
\left(\begin{array}{cc} f(a,p_0) & f(b,p_0) \\ f'(a,p_0) & f'(b,p_0) \end{array} \right) \left(\begin{array}{c} r_a \\ r_b \end{array} \right) = \left(\begin{array}{c} \alpha – \sum_{x=0}^{a-1} f(x,p_0) – \sum_{x=b+1}^{n} f(x,p_0) \\ – \sum_{x=0}^{a-1} f'(x,p_0) – \sum_{x=b+1}^{n} f'(x,p_0) \end{array} \right)
\end{align}
$$

(3)式より、$r_a, r_b$は下記のように求めることができる。
$$
\large
\begin{align}
\left(\begin{array}{c} r_a \\ r_b \end{array} \right) = \left(\begin{array}{cc} f(a,p_0) & f(b,p_0) \\ f'(a,p_0) & f'(b,p_0) \end{array} \right)^{-1} \left(\begin{array}{c} \alpha – \sum_{x=0}^{a-1} f(x,p_0) – \sum_{x=b+1}^{n} f(x,p_0) \\ – \sum_{x=0}^{a-1} f'(x,p_0) – \sum_{x=b+1}^{n} f'(x,p_0) \end{array} \right) \quad (3)’
\end{align}
$$
ここで、$a,b$はそれぞれ両端よりも外側の確率が$\displaystyle \frac{\alpha}{2}$になるように設定を行うので、$n, p_0, \alpha$が定まれば一意に定まる。また、$a, b$が一意に定まれば$(3)’$式より$r_a, r_b$も一意に定まる。

以下では、$\displaystyle n=4, \alpha=0.1, p_0=\frac{1}{3}$の場合に$a, b, r_a, r_b$を具体的に求める。まず、$\displaystyle n=4, \alpha=0.1, p_0=\frac{1}{3}$の場合の$a, b$を求める。
$$
\large
\begin{align}
f(x=0,p) &= {}_n C_0 \left( \frac{1}{3} \right)^{0} \left( 1 – \frac{1}{3} \right)^{4-0} \\
&= \left( \frac{2}{3} \right)^{4} > 0.05 = \frac{\alpha}{2} \\
f(x=4,p) &= {}_n C_4 \left( \frac{1}{3} \right)^{4} \left( 1 – \frac{1}{3} \right)^{4-4} \\
&= \left( \frac{1}{3} \right)^{4} < 0.05 = \frac{\alpha}{2} \\
f(x=3,p) &= {}_n C_3 \left( \frac{1}{3} \right)^{3} \left( 1 – \frac{1}{3} \right)^{4-3} \\
&= \frac{8}{3^4} \\
f(3,p)+f(4,p) &= \frac{9}{3^4} \\
&= \frac{1}{9} > 0.05 = \frac{\alpha}{2}
\end{align}
$$
上記より$a=0, b=3$がわかる。

次に$(3)’$式を用いて、$r_a, r_b$を計算することを考える。$f'(x=a,p_0), f'(x=b,p_0)$を計算すると下記が得られる。
$$
\large
\begin{align}
f'(x=a,p_0) &= f’ \left( x=0,\frac{1}{3} \right) \\
&= \left( \frac{x}{p} – \frac{n-x}{1-p} \right) f \left( x=0,\frac{1}{3} \right) \\
&= \left( \frac{0}{p} – \frac{4-0}{1-1/3} \right) f \left( x=0,\frac{1}{3} \right) \\
&= – \frac{4}{2/3} \times \frac{16}{81} \\
&= – \frac{6 \cdot 16}{81} \\
&= – \frac{32}{27} \\
f'(x=b,p_0) &= f’ \left( x=3,\frac{1}{3} \right) \\
&= \left( \frac{x}{p} – \frac{n-x}{1-p} \right) f \left( x=3,\frac{1}{3} \right) \\
&= \left( \frac{3}{1/3} – \frac{4-3}{1-1/3} \right) f \left( x=3,\frac{1}{3} \right) \\
&= (9-3/2) \times \frac{8}{81} \\
&= \frac{15}{2} \times \frac{8}{81} \\
&= \frac{20}{27}
\end{align}
$$

また、$a=0, b=3$より、$(3)’$式の右辺の各項に関しては下記が成立する。
$$
\large
\begin{align}
\sum_{x=0}^{a-1} f(x,p_0) &= 0 \\
\sum_{x=b+1}^{n} f(x,p_0) &= \sum_{x=3+1}^{4} f(x,p_0) \\
&= f(4,p_0) \\
&= \frac{1}{81} \\
\sum_{x=0}^{a-1} f'(x,p_0) &= 0 \\
\sum_{x=b+1}^{n} f'(x,p_0) &= \sum_{x=3+1}^{4} f'(x,p_0) \\
&= f'(x=4,p_0) \\
&= \left( \frac{x}{p} – \frac{n-x}{1-p} \right) f \left( x=4,\frac{1}{3} \right) \\
&= \left( \frac{4}{1/3} – \frac{4-4}{1-1/3} \right) \times \frac{1}{81} \\
&= \frac{12}{81} \\
&= \frac{4}{27}
\end{align}
$$

よって、$(3)’$式の右辺はそれぞれ下記のように計算できる。
$$
\large
\begin{align}
\alpha – \sum_{x=0}^{a-1} f(x,p_0) – \sum_{x=b+1}^{n} f(x,p_0) &= 0.1 – \frac{1}{81} \\
&= \frac{81-10}{810} \\
&= \frac{71}{810} \\
– \sum_{x=0}^{a-1} f'(x,p_0) – \sum_{x=b+1}^{n} f'(x,p_0) &= – \frac{4}{27}
\end{align}
$$

よって、$(3)’$式を用いて、$r_a, r_b$は下記のように計算することができる。
$$
\large
\begin{align}
\left(\begin{array}{c} r_a \\ r_b \end{array} \right) &= \left(\begin{array}{cc} f(a,p_0) & f(b,p_0) \\ f'(a,p_0) & f'(b,p_0) \end{array} \right)^{-1} \left(\begin{array}{c} \alpha – \sum_{x=0}^{a-1} f(x,p_0) – \sum_{x=b+1}^{n} f(x,p_0) \\ – \sum_{x=0}^{a-1} f'(x,p_0) – \sum_{x=b+1}^{n} f'(x,p_0) \end{array} \right) \\
&= \left(\begin{array}{cc} \frac{16}{81} & \frac{8}{81} \\ -\frac{32}{27} & \frac{20}{27} \end{array} \right)^{-1} \left(\begin{array}{c} \frac{71}{810} \\ -\frac{4}{81} \end{array} \right) \\
&= \left( \frac{16 \cdot 20}{81 \cdot 27} – \frac{8 \cdot (-32)}{81 \cdot 27} \right)^{-1} \left(\begin{array}{cc} \frac{20}{27} & -\frac{8}{81} \\ \frac{32}{27} & \frac{16}{81} \end{array} \right) \left(\begin{array}{c} \frac{71}{810} \\ -\frac{4}{81} \end{array} \right) \\
&= \frac{243}{64} \left(\begin{array}{cc} \frac{20}{27} & -\frac{8}{81} \\ \frac{32}{27} & \frac{16}{81} \end{array} \right) \left(\begin{array}{c} \frac{71}{810} \\ -\frac{4}{81} \end{array} \right) \\
&= \left(\begin{array}{c} 0.302 \\ 0.283 \end{array} \right) \\
\end{align}
$$

問題8.10の解答例

$\lambda_0=5, \alpha=0.1, n=1$のポアソン分布$Po(\lambda_0=5)$に対して、下記の式の$a,b,r_a,r_b$を求める。
$$
\large
\begin{align}
\delta(x) &= 1, \quad if \quad T(x)<a,b<T(x) \\
&= 0, \quad if \quad a<T(x)<b \\
&= r_a \quad if \quad T(x)=a \\
&= r_b \quad if \quad T(x)=b
\end{align}
$$

$a,b$はポアソン分布の$Po(\lambda_0=5)$の確率関数$P(X=k|\lambda_0=5)$について考えることで得ることができる。
$$
\large
\begin{align}
P(X=k|\lambda_0=5) &= \frac{\lambda_0^{k} e^{-\lambda_0}}{k!} \\
&= \frac{5^{k} e^{-5}}{k!}
\end{align}
$$
上記に基づいて、$P(X = 0|\lambda_0=5), P(X \leq 1|\lambda_0=5), P(X \leq 2|\lambda_0=5)$の計算を行う。
$$
\large
\begin{align}
P(X=0|\lambda_0=5) &= \frac{5^{0} e^{-5}}{0!} \\
&= e^{-5} \\
&= 0.0067379… \\
P(X \leq 1|\lambda_0=5) &= P(X = 0|\lambda_0=5) + P(X = 1|\lambda_0=5) \\
&= \frac{5^{0} e^{-5}}{0!} + \frac{5^{1} e^{-5}}{1!} \\
&= 6e^{-5} \\
&= 0.040427… \\
P(X \leq 2|\lambda_0=5) &= P(X = 0|\lambda_0=5) + P(X = 1|\lambda_0=5) + P(X = 2|\lambda_0=5) \\
&= \frac{5^{0} e^{-5}}{0!} + \frac{5^{1} e^{-5}}{1!} + \frac{5^{2} e^{-5}}{2!} \\
&= \frac{6 \cdot 2 + 25}{2} e^{-5} \\
&= \frac{37}{2} e^{-5} \\
&= 0.124652…
\end{align}
$$
ここで$\alpha=0.1$より、$0.05$より累積確率が大きくなる$a=2$が下側の閾値になる。

上側の閾値の$b$を計算するにあたってはポアソン分布の確率変数が0以上の整数を取る以上、$X=0$から順番に計算するしかない。よって、下記のようなPythonを実行することで計算を行う。

import math

res = math.e**(-5)
factorial = 1
for i in range(1,11):
    factorial *= i
    res += 5**(i)*math.e**(-5)/factorial
    print(res)

実行結果は下記のように得ることができる。

0.0404276819945
0.124652019483
0.265025915297
0.440493285065
0.615960654833
0.762183462973
0.86662832593
0.931906365278
0.968171942694
0.986304731402

上記がそれぞれ$X=1$から$X=10$に対応する累積確率である。累積確率が$0.95$より大きくなるのは$X=9$のときであるので、$b=9$を得ることができる。

ここまでで得た$a=2,b=9$に対して問題$8.9$の$(3)’$式を適用して$r_a,r_b$を計算することを考える。
$$
\large
\begin{align}
\left(\begin{array}{c} r_a \\ r_b \end{array} \right) = \left(\begin{array}{cc} f(a,\lambda_0) & f(b,\lambda_0) \\ f'(a,\lambda_0) & f'(b,\lambda_0) \end{array} \right)^{-1} \left(\begin{array}{c} \alpha – \sum_{x=0}^{a-1} f(x,\lambda_0) – \sum_{x=b+1}^{\infty} f(x,\lambda_0) \\ – \sum_{x=0}^{a-1} f'(x,\lambda_0) – \sum_{x=b+1}^{\infty} f'(x,\lambda_0) \end{array} \right) \quad (1)
\end{align}
$$

ここで$f(x,\lambda)=P(X=x|\lambda)$のようにおき、$\lambda$に関する微分の$f'(x,\lambda)$を考える。
$$
\large
\begin{align}
f'(x,\lambda) &= \frac{\partial}{\partial \lambda} \left( \frac{\lambda^{x} e^{-\lambda}}{x!} \right) \\
&= \frac{x\lambda^{x-1} e^{-\lambda}}{x!} – \frac{\lambda^{x} e^{-\lambda}}{x!} \\
&= \left( \frac{x}{\lambda} – 1 \right) f(x,\lambda)
\end{align}
$$

$(1)$式について考えるにあたって用いる$f(x=a,\lambda_0),f(x=b,\lambda_0),f'(x=a,\lambda_0),f'(x=b,\lambda_0)$は下記のように得ることができる。
$$
\large
\begin{align}
f(x=a,\lambda_0) &= f(x=2,\lambda_0=5) \\
&= 0.0842243374885 \\
f(x=b,\lambda_0) &= f(x=9,\lambda_0=5) \\
&= 0.03626557741600 \\
f'(x=a,\lambda_0) &= f'(x=2,\lambda_0=5) \\
&= \left( \frac{2}{5} – 1 \right) f(x=2,\lambda_0=5) \\
&= -0.0505346024931 \\
f'(x=b,\lambda_0) &= f'(x=9,\lambda_0=5) \\
&= \left( \frac{9}{5} – 1 \right) f(x=9,\lambda_0=5) \\
&= 0.029012461932800004
\end{align}
$$

また、$(1)$式の右辺の各項に関しては下記が成立する。
$$
\large
\begin{align}
\sum_{x=0}^{a-1} f(x,\lambda_0) &= \sum_{x=0}^{1} f(x,\lambda_0=5) \\
&= 0.0404276819945 \\
\sum_{x=b+1}^{\infty} f(x,\lambda_0) &= \sum_{x=10}^{\infty} f(x,\lambda_0=5) \\
&= 1 – 0.968171942694 \\
&= 0.0318280573060000 \\
\sum_{x=0}^{a-1} f'(x,p_0) &= \sum_{x=0}^{1} f'(x,p_0) \\
&= \left( \frac{0}{5} – 1 \right) f(x=0,\lambda_0=5) + \left( \frac{1}{5} – 1 \right) f(x=1,\lambda_0=5) \\
&= -0.033689734995427344 \\
\sum_{x=b+1}^{\infty} f'(x,p_0) &= \sum_{x=10}^{\infty} f'(x,p_0) \\
&= 0.0362655774156
\end{align}
$$

ここで上記の$\displaystyle \sum_{x=b+1}^{\infty} f'(x,p_0) = 0.0362655774156$に関しては下記を実行することで収束を確かめた。

import math

res = 0
factorial = 1
for i in range(1,51):
    factorial *= i
    if i>9:
        res += ((i/5.-1)*5**(i)*math.e**(-5))/factorial
        print(str(i)+":"+str(res))

ここまで得た値を$(1)$式に代入し、$r_a,r_b$を計算する。
$$
\large
\begin{align}
\left(\begin{array}{c} r_a \\ r_b \end{array} \right) &= \left(\begin{array}{cc} f(a,\lambda_0) & f(b,\lambda_0) \\ f'(a,\lambda_0) & f'(b,\lambda_0) \end{array} \right)^{-1} \left(\begin{array}{c} \alpha – \sum_{x=0}^{a-1} f(x,\lambda_0) – \sum_{x=b+1}^{\infty} f(x,\lambda_0) \\ – \sum_{x=0}^{a-1} f'(x,\lambda_0) – \sum_{x=b+1}^{\infty} f'(x,\lambda_0) \end{array} \right) \\
&= \left(\begin{array}{cc} 0.0842… & 0.0362… \\ -0.0505… & 0.0290… \end{array} \right)^{-1} \left(\begin{array}{c} 0.1 – 0.0404… – 0.0318… \\ 0.0337… – 0.0363… \end{array} \right) \\
&= \left(\begin{array}{c} 0.163 \\ 0.380 \end{array} \right)
\end{align}
$$

↑公式の解答が$r_a=0.210, r_b=0.277$であり合致しませんでしたが、途中計算がわからないので、一旦掲載を行いました。導出に間違いが見つかった際は修正を行う予定です。

問題8.11の解答例

問題8.12の解答例

標準正規分布$N(0,1)$の上側$\alpha$点を$z_{\alpha}$のように表す。このとき$H_0: \mu \leq \mu_0$の棄却域は下記のように表すことができる。
$$
\large
\begin{align}
\frac{\sqrt{n}(\bar{X} – \mu_0)}{\sigma_0} \geq z_{\alpha} \quad (1)
\end{align}
$$

また、標準正規分布$N(0,1)$の上側$\beta$点と上側$1-\beta$点をそれぞれ$z_{\beta}, z_{1-\beta}$のように定義する。ここで、標準正規分布が$y$軸を中心に対象であることから、$z_{1-\beta}=-z_{\beta}$が成り立つ。
ここで、対立仮説$H_1: \mu = \mu_1$の検出力が$1-\beta$以上であることに基づいて、下記のように表すことができる。
$$
\large
\begin{align}
\frac{\sqrt{n}(\bar{X} – \mu_1)}{\sigma_0} \leq z_{1-\beta} = -z_{\beta} \quad (2)
\end{align}
$$

$\bar{X}$に着目した際に(1)式と(2)式が同時に成立する$n$の条件を求め、それを元に$n$の最小値を考えればよい。(1)式と(2)式を$\bar{X}$に着目して解くとそれぞれ下記が得られる。
$$
\large
\begin{align}
\frac{\sqrt{n}(\bar{X} – \mu_0)}{\sigma_0} &\geq z_{\alpha} \quad (1) \\
\bar{X} – \mu_0 &\geq \frac{\sigma_0 z_{\alpha}}{\sqrt{n}} \\
\bar{X} &\geq \mu_0 + \frac{\sigma_0 z_{\alpha}}{\sqrt{n}} \quad (1)’
\end{align}
$$
$$
\large
\begin{align}
\frac{\sqrt{n}(\bar{X} – \mu_1)}{\sigma_0} &\leq z_{1-\beta} = -z_{\beta} \quad (2) \\
\bar{X} – \mu_1 &\leq -\frac{\sigma_0 z_{\beta}}{\sqrt{n}} \\
\bar{X} &\leq \mu_1 -\frac{\sigma_0 z_{\beta}}{\sqrt{n}} \quad (2)’
\end{align}
$$

$(1)’$式と$(2)’$式より、下記が成立する。
$$
\large
\begin{align}
\mu_0 + \frac{\sigma_0 z_{\alpha}}{\sqrt{n}} &\leq \mu_1 -\frac{\sigma_0 z_{\beta}}{\sqrt{n}}
\end{align}
$$

上記を$n$に関して解く。
$$
\large
\begin{align}
\mu_0 + \frac{\sigma_0 z_{\alpha}}{\sqrt{n}} &\leq \mu_1 -\frac{\sigma_0 z_{\beta}}{\sqrt{n}} \\
\frac{\sigma_0 z_{\alpha}}{\sqrt{n}} + \frac{\sigma_0 z_{\beta}}{\sqrt{n}} &\leq \mu_1 – \mu_0 \\
\frac{\sigma_0}{\sqrt{n}}(z_{\alpha} + z_{\beta}) &\leq \mu_1 – \mu_0 \\
\frac{\sigma_0}{\mu_1 – \mu_0}(z_{\alpha} + z_{\beta}) &\leq \sqrt{n} \\
\frac{\sigma_0^2 (z_{\alpha} + z_{\beta})^2}{(\mu_1 – \mu_0)^2} &\leq n \quad (3)
\end{align}
$$
上記の不等号に関連する計算にあたっては、$\mu_0 < \mu_1$より$\mu_1 – \mu_0 > 0$を前提に計算を行った。

(3)式より、検出力を$1-\beta$となる$n$の最小値が$\displaystyle \frac{\sigma_0^2 (z_{\alpha} + z_{\beta})^2}{(\mu_1 – \mu_0)^2}$となる。

問題8.13の解答例

2項分布の正規近似より、帰無仮説の$X$は正規分布$N(np_0,np_0(1-p_0)$、対立仮説の$X$は$N(np_1,np_1(1-p_1)$を元に考えることができる。ここで前問と同様に$z_{\alpha}, z_{1-\beta}, z_{\beta}$を考える。このとき棄却域に関して下記が成立する。
$$
\large
\begin{align}
\frac{X – np_0}{\sqrt{np_0(1-p_0)}} \geq z_{\alpha} \quad (1)
\end{align}
$$

また、検出力が$1-\beta$であることから下記が成立する。
$$
\large
\begin{align}
\frac{X – np_1}{\sqrt{np_1(1-p_1)}} \leq z_{1-\beta} = -z_{\beta} \quad (2)
\end{align}
$$

(1)式と(2)式が同じ$X$について成立すれば良い。(1)式と(2)式は下記のように$X$に関して解くことができる。
$$
\large
\begin{align}
\frac{X – np_0}{\sqrt{np_0(1-p_0)}} &\geq z_{\alpha} \quad (1) \\
X – np_0 &\geq z_{\alpha}\sqrt{np_0(1-p_0)} \\
X &\geq np_0 + z_{\alpha}\sqrt{np_0(1-p_0)} \quad (1)’
\end{align}
$$
$$
\large
\begin{align}
\frac{X – np_1}{\sqrt{np_1(1-p_1)}} \leq z_{1-\beta} = -z_{\beta} \quad (2) \\
X – np_1 \leq -z_{\beta} \sqrt{np_1(1-p_1)} \\
X \leq np_1 – z_{\beta} \sqrt{np_1(1-p_1)} \quad (2)’
\end{align}
$$

$(1)’$式と$(2)’$式より、下記が成立する。
$$
\large
\begin{align}
np_0 + z_{\alpha}\sqrt{np_0(1-p_0)} \leq np_1 – z_{\beta} \sqrt{np_1(1-p_1)}
\end{align}
$$

上記を$n$に関して解く。
$$
\large
\begin{align}
np_0 + z_{\alpha}\sqrt{np_0(1-p_0)} \leq np_1 – z_{\beta} \sqrt{np_1(1-p_1)} \\
z_{\alpha}\sqrt{np_0(1-p_0)} + z_{\beta} \sqrt{np_1(1-p_1)} \leq n(p_1-p_0) \\
z_{\alpha}\sqrt{p_0(1-p_0)} + z_{\beta} \sqrt{p_1(1-p_1)} \leq \sqrt{n}(p_1-p_0) \\
\frac{z_{\alpha}\sqrt{p_0(1-p_0)} + z_{\beta} \sqrt{p_1(1-p_1)}}{p_1-p_0} \leq \sqrt{n} \\
\frac{(z_{\alpha}\sqrt{p_0(1-p_0)} + z_{\beta} \sqrt{p_1(1-p_1)})^2}{(p_1-p_0)^2} \leq n \quad (3)
\end{align}
$$
上記の不等号に関連する計算にあたっては、$p_0 < p_1$を前提に計算を行った。

(3)式より、検出力を$1-\beta$となる$n$の最小値が$\displaystyle \frac{(z_{\alpha}\sqrt{p_0(1-p_0)} + z_{\beta} \sqrt{p_1(1-p_1)})^2}{(p_1-p_0)^2}$となる。

問題8.14の解答例

問題8.15の解答例

問題8.16の解答例

問題8.17の解答例

Ch.7 「推定論」の章末問題の解答例 〜現代数理統計学(学術図書出版社)〜

当記事は「現代数理統計学(学術図書出版社)」の読解サポートにあたってChapter.7の「推定論」の章末問題の解説について行います。

基本的には書籍の購入者向けの解説なので、まだ入手されていない方は購入の上ご確認ください。また、解説はあくまでサイト運営者が独自に作成したものであり、書籍の公式ページではないことにご注意ください。(そのため著者の意図とは異なる解説となる可能性はあります)

↓下記が公式の解答なので、正確にはこちらを参照ください。
https://www.gakujutsu.co.jp/text/isbn978-4-7806-0860-1/

章末の演習問題について

問題7.1の解答例

(2.77)式より、ガンマ分布$Ga(\nu, \alpha)$の期待値$E[X]$と分散$V[X]$は下記のように与えられる。
$$
\large
\begin{align}
E[X] &= \nu \alpha \\
V[X] &= \nu \alpha^2
\end{align}
$$
詳しくは下記で示した。
https://www.hello-statisticians.com/explain-terms-cat/gamma_distribution1.html#i-4

また、問4.1で示したように、自由度$k$の$\chi^2$分布$\chi^2(k)$はガンマ分布$Ga(k/2, 2)$に一致する。よって、$\chi^2(k)$の分散$V[X]$は下記のように計算できる。
$$
\large
\begin{align}
V[X] &= \nu \alpha^2 \\
&= \frac{k}{2} \cdot 2^2 \\
&= 2k
\end{align}
$$

ここで、$\displaystyle \frac{(n-1)s^2}{\sigma^2}$は自由度$n-1$の$\chi^2$分布$\chi^2(n-1)$に従うため、分散$V[s^2]$は下記のように示すことができる。
$$
\large
\begin{align}
V \left[ \frac{(n-1)s^2}{\sigma^2} \right] &= 2(n-1) \\
\left( \frac{n-1}{\sigma^2} \right)^2 V[s^2] &= 2(n-1) \\
V[s^2] &= 2(n-1) \left( \frac{\sigma^2}{n-1} \right)^2 \\
&= 2(n-1) \frac{\sigma^4}{(n-1)^2} \\
&= \frac{2 \sigma^4}{n-1}
\end{align}
$$

問題7.2の解答例

$$
\large
\begin{align}
f(x) &= \frac{\lambda^{x} e^{-\lambda}}{x!} \\
l(\lambda) &= \log{f(x)} \\
&= x \log{\lambda} – \lambda – \log{x!}
\end{align}
$$

ここでポアソン分布の確率関数$f(x)$、$n=1$の際の対数尤度関数$l(\lambda)$は上記のように記載できる。ポアソン分布の$n=1$の時のフィッシャー情報量を$\mathit{I}_{1}(\lambda)$とおくと、$\mathit{I}_{1}(\lambda)=E[-l^{”}(\lambda)]$であるので、$l^{”}(\lambda)$を求める。
$$
\large
\begin{align}
l'(\lambda) &= \frac{x}{\lambda} – 1 \\
l^{”}(\lambda) &= -\frac{x}{\lambda^2}
\end{align}
$$

上記より、フィッシャー情報量$\mathit{I}_{1}(\lambda)=E[-l^{”}(\lambda)]$は下記のように計算できる。
$$
\large
\begin{align}
\mathit{I}_{1}(\lambda) &= E[-l^{”}(\lambda)] \\
&= E \left[ -(-\frac{X}{\lambda^2}) \right] \\
&= E \left[ \frac{X}{\lambda^2} \right] \\
&= \frac{1}{\lambda^2} E[X] \\
&= \frac{\lambda}{\lambda^2} \\
&= \frac{1}{\lambda}
\end{align}
$$

一方で標本平均の$\bar{X}$の分散は$\displaystyle \frac{\lambda}{n}$であり、$\mathit{I}_{1}(\lambda)$を用いて下記のように表すことができる。
$$
\large
\begin{align}
\frac{\lambda}{n} = \frac{1}{\mathit{I}_{1}(\lambda)}
\end{align}
$$

上記はクラメル・ラオの不等式において等号が成立している場合なので、標本平均$\bar{X}$は$\lambda$の一様最小分散不偏推定量であることがわかる。

問題7.3の解答例

(7.27)式より、$\sigma^2$のフィッシャー情報量は$\displaystyle \mathit{I}_1(\sigma^2) = \frac{1}{2 \sigma^4}$である。よって、このときのクラメル・ラオの不等式による不偏推定量の分散の下限は下記のようになる。
$$
\large
\begin{align}
\frac{1}{n\mathit{I}_1(\sigma^2)} = \frac{2 \sigma^4}{n} \quad (1)
\end{align}
$$

一方で、$\mu$が既知の場合は、$\displaystyle S^2 = \frac{1}{n} \sum_{i=1}^{n} (X_i – \mu)^2$は$\sigma^2$の不偏推定量で、問7.1より分散$V[S^2]$は下記のように得ることができる。
$$
\large
\begin{align}
V[S^2] = \frac{2 \sigma^4}{n} \quad (2)
\end{align}
$$

(1)と(2)が一致することにより、クラメル・ラオの不等式より$S^2$がUMVUであることを示すことができる。

問題7.4の解答例

$\displaystyle \frac{(n+1)T}{n}$が$\theta$の不偏推定量であることを示すには、$\theta$に関して下記の(1)式が成立することを確認すればよい。
$$
\large
\begin{align}
\theta &= E \left[ \frac{(n+1)T}{n} \right] \quad (1) \\
E \left[ \frac{(n+1)T}{n} \right] &= \int \frac{(n+1)t}{n} \times p(t, \theta) dt \quad (2)
\end{align}
$$

ここで一様分布の同時確率密度関数$p(t, \theta)$は下記のように与えられる。
$$
\large
\begin{align}
p(t, \theta) = \frac{n t^{n-1}}{\theta^n} \quad (0<t<\theta) \quad (3)
\end{align}
$$

(3)式を(2)式に代入し、計算すると下記が導出できる。
$$
\large
\begin{align}
E \left[ \frac{(n+1)T}{n} \right] &= \int_{0}^{\theta} \frac{(n+1)t}{n} \times \frac{n t^{n-1}}{\theta^n} dt \\
&= (n+1)\int_{0}^{\theta} t \times \frac{t^{n-1}}{\theta^n} dt \\
&= (n+1)\int_{0}^{\theta} \frac{t^{n}}{\theta^n} dt \\
&= (n+1) \left[ \frac{t^{n+1}}{(n+1)\theta^n} \right]_{0}^{\theta} \\
&= (n+1) \frac{\theta^{n+1}}{(n+1) \theta^n} \\
&= \theta
\end{align}
$$
上記は(1)式が成立することを意味するので、これにより$\displaystyle \frac{(n+1)T}{n}$が$\theta$の不偏推定量であることを示すことができる。

(4)式と同様に考えることで、$E[T], E[T^2]$を求めることができる。
$$
\large
\begin{align}
E[T] &= \frac{n}{n+1} \theta \quad (5) \\
E[T^2] &= \int_{0}^{\theta} t^2 \times \frac{n t^{n-1}}{\theta^n} dt \\
&= \int_{0}^{\theta} \frac{n t^{n+1}}{\theta^n} dt \\
&= \left[ \frac{n t^{n+2}}{(n+2)\theta^n} \right]_{0}^{\theta} \\
&= \frac{n \theta^{n+2}}{(n+2)\theta^n} \\
&= \frac{n \theta^{2}}{(n+2)} \quad (6)
\end{align}
$$

また、$V[T] = E[T^2] – E[T]$より、(5)式(6)式を用いて$T$の分散$V[T]$は下記のように求めることができる。
$$
\large
\begin{align}
V[T] &= E[T^2] – E[T] \\
&= \frac{n \theta^{2}}{(n+2)} – \frac{n^2 \theta^2}{(n+1)^2} \\
&= \frac{n(n+1)^2 \theta^{2}}{(n+2)(n+1)^2} – \frac{n^2(n+2) \theta^2}{(n+2)(n+1)^2} \\
&= \frac{(n^3+2n^2+n) – (n^3+2n^2)}{(n+2)(n+1)^2} \theta^{2} \\
&= \frac{n}{(n+2)(n+1)^2} \theta^{2} \quad (7)
\end{align}
$$

(7)式を用いることで、$\displaystyle \frac{(n+1)T}{n}$の分散の$\displaystyle V \left[ \frac{(n+1)T}{n} \right]$は下記のように求めることができる。
$$
\large
\begin{align}
V \left[ \frac{(n+1)T}{n} \right] &= \frac{(n+1)^2}{n^2}V[T] \\
&= \frac{(n+1)^2}{n^2} \frac{n}{(n+2)(n+1)^2} \theta^{2} \\
&= \frac{\theta^{2}}{n(n+2)}
\end{align}
$$

問題7.5の解答例

$E[s]$は下記のように変形できる。
$$
\large
\begin{align}
E[s] = E[\sqrt{s^2}]
\end{align}
$$

ここで関数$f(x) = \sqrt{x}$を定義する。これは厳密に上に凸の関数となる。このときジェンセンの不等式より、下記が成立する。
$$
\large
\begin{align}
E[f(X)] < f(E[X])
\end{align}
$$

$E[s]$にジェンセンの不等式を適用すると下記のような導出が行える。
$$
\large
\begin{align}
E[s] &= E[\sqrt{s^2}] \\
&< \sqrt{E[s^2]} \\
&= \sqrt{\sigma^2} = \sigma
\end{align}
$$

ここまでの議論により、$E[s] < \sigma$を示すことができる。

問題7.6の解答例

$\displaystyle x = \frac{(n-1)s^2}{\sigma^2}$、$x$の確率密度関数を$f(x)$と考えると、$x$は$\displaystyle \chi^2(n-1) = Ga \left( \frac{n-1}{2},2 \right)$に従うことより$f(x)$は下記のように表すことができる。
$$
\large
\begin{align}
f(x) = \frac{1}{2^{\frac{n-1}{2}} \Gamma \left( \frac{n-1}{2} \right)} x^{\frac{n-1}{2}-1} e^{-\frac{x}{2}}
\end{align}
$$

ここで$\displaystyle s = \frac{\sigma}{\sqrt{n-1}} \sqrt{x}$より、$E[s]$は下記のように計算できる。
$$
\large
\begin{align}
E[s] &= E \left[ \frac{\sigma}{\sqrt{n-1}} \sqrt{x} \right] \\
&= \int_{0}^{\infty} \frac{\sigma}{\sqrt{n-1}} \sqrt{x} \times \frac{1}{2^{\frac{n-1}{2}} \Gamma \left( \frac{n-1}{2} \right)} x^{\frac{n-1}{2}-1} e^{-\frac{x}{2}} dx \\
&= \frac{\sigma}{\sqrt{n-1}} \int_{0}^{\infty} x^{\frac{1}{2}} \times \frac{1}{2^{\frac{n-1}{2}} \Gamma \left( \frac{n-1}{2} \right)} x^{\frac{n-1}{2}-1} e^{-\frac{x}{2}} dx \\
&= \frac{\sigma}{\sqrt{n-1}} \int_{0}^{\infty} \frac{1}{2^{\frac{n-1}{2}} \Gamma \left( \frac{n-1}{2} \right)} x^{\frac{n}{2}-1} e^{-\frac{x}{2}} dx \\
&= \frac{\sigma}{\sqrt{n-1}} \times \sqrt{2} \frac{\Gamma \left( \frac{n}{2} \right)}{\Gamma \left( \frac{n-1}{2} \right)} \int_{0}^{\infty} \frac{1}{2^{\frac{n}{2}} \Gamma \left( \frac{n}{2} \right)} x^{\frac{n}{2}-1} e^{-\frac{x}{2}} dx \\
&= \frac{\sigma}{\sqrt{n-1}} \times \sqrt{2} \frac{\Gamma \left( \frac{n}{2} \right)}{\Gamma \left( \frac{n-1}{2} \right)} \times 1 \\
&= \sigma \frac{\sqrt{2} \Gamma \left( \frac{n}{2} \right)}{\sqrt{n-1} \Gamma \left( \frac{n-1}{2} \right)}
\end{align}
$$
上記より、与式を示すことができた。

問題7.7の解答例

$V[\bar{X}] = E[\bar{X}^2] – E[\bar{X}]^2$より下記が成立する。
$$
\large
\begin{align}
E[\bar{X}^2] &= V[\bar{X}] + E[\bar{X}]^2 \\
&= \frac{\sigma^2}{n} + \mu^2 \\
\mu^2 &= E[\bar{X}^2] – \frac{\sigma^2}{n}
\end{align}
$$
上記を元に考えることで、$\mu^2$の不偏推定量$\hat{\mu}^2$は不偏分散$s^2$を用いて下記のように表すことができる。
$$
\large
\begin{align}
\hat{\mu}^2 &= \bar{X}^2 – \frac{s^2}{n} \\
&= \bar{X}^2 – \frac{\sum_{i=1}^{n}(X_i-\bar{X})^2}{n(n-1)} \quad (7.38)
\end{align}
$$

上記の導出において、$\displaystyle \hat{\mu}^2 = \bar{X}^2 – \frac{s^2}{n}$は(7.38)と同値であることがわかる。ここで$\bar{X}$と$s^2$がそれぞれ独立に動くことから$\hat{\mu}^2$が負となる確率は0ではないことが言える。

問題7.8の解答例

「$P(E[X|T]<0)>0 \implies P(X<0)>0$」を示すにあたって、対偶の「$P(X<0)=0 \implies P(E[X|T]<0)=0$」を示す。非負の確率変数に対しては条件付き期待値が$0$以下とならないことから、対偶を示すことができ、元の命題も成立することがわかる。

・直感的な考察
サイコロを考えた際に、サイコロの目が1〜6である場合は、どのような条件を考えてもサイコロの目が0より小さくなることは起こりえないことを考えると納得がいくと思われる。また、元々の命題に関しても、条件付き期待値が0より小さくなりうる場合は、0よりも小さい値を何かしら持つと解釈すると良い。

問題7.9の解答例

https://www.gakujutsu.co.jp/text/isbn978-4-7806-0860-1/
幾何分布の平均と分散を求めるにあたって上記の公式の解答では(2.62)式などで示された負の二項分布の結果を用いているが、大元の導出自体が大変なことからここでは確率母関数$G(s)$を用いた別解を記載する。$E[X], E[X(X-1)]$を求めて$E[X], V[X]$を求めることもできるが、$G'(1)=E[X], G^{”}(1)=E[X(X-1)]$が成立することを鑑みると、「確率母関数を用いる手法」と「$E[X], E[X(X-1)]$を定義に基づいて計算する手法」は同様であり、$E[X], E[X(X-1)]$を定義に基づいて計算するにはマクローリン展開を2度行う必要のあることからここでは確率母関数を用いる手法を選定した。

・確率母関数の導出
確率母関数$G(s)=E[s^X]$の定義に基づいて、確率母関数を計算する。
$$
\large
\begin{align}
G(s) &= E[s^X] \\
&= s^0 p(1-p)^0 + s^1 p(1-p)^1 + s^2 p(1-p)^2 + … \\
&= \sum_{n=0}^{\infty} s^n p(1-p)^n \\
&= p \sum_{n=0}^{\infty} (s(1-p))^n \\
&= p \frac{1}{1-s(1-p)} \\
&= \frac{p}{1-s(1-p)}
\end{align}
$$
上記において$\displaystyle \sum_{n=0}^{\infty} (s(1-p))^n = \frac{1}{1-s(1-p)}$は$\displaystyle \lim_{n \to \infty} (s(1-p))^n = 0$という前提に基づいて、等比級数の公式を用いて求めた。
等比級数の公比に関しては$G'(1), G^{”}(1)$を考えることから$s=1$の周辺だけ調べれば十分であり、$s=1$のとき$1-s(1-p)=p$であり、$0<p<1$を考慮すると収束するだろうと考えられる。

次に$G'(s), G^{”}(s)$を導出する。
$$
\large
\begin{align}
G'(s) &= \left( \frac{p}{1-s(1-p)} \right)’ \\
&= \frac{-p \times (-(1-p))}{(1-s(1-p))^2} \\
&= \frac{p(1-p)}{(1-s(1-p))^2} \\
G^{”}(s) &= \left( \frac{p(1-p)}{(1-s(1-p))^2} \right)’ \\
&= \frac{-2p(1-p) \times (-(1-p))}{(1-s(1-p))^3} \\
&= \frac{2p(1-p)^2}{(1-s(1-p))^3}
\end{align}
$$
このとき、$G'(1), G^{”}(1)$は$s$に$1$を代入することで下記のようになる。
$$
\large
\begin{align}
G'(1) &= \frac{p(1-p)}{(1 – 1 \cdot (1-p))^2} \\
&= \frac{p(1-p)}{(1 – 1 + p))^2} \\
&= \frac{p(1-p)}{p^2} \\
&= \frac{1-p}{p} \\
G^{”}(1) &= \frac{2p(1-p)^2}{(1 – 1 \cdot (1-p))^3} \\
&= \frac{2p(1-p)^2}{(1 – 1 + p))^3} \\
&= \frac{2p(1-p)^2}{p^3} \\
&= \frac{2(1-p)^2}{p^2}
\end{align}
$$

・平均$E[X]$、分散$V[X]$の導出
ここまでで求めた$G'(1), G^{”}(1)$に対し、$E[X]=G'(1), V[X]=G^{”}(1)+G'(1)-(G'(1))^2$を用いて$E[X], V[X]$の導出を行う。
$$
\large
\begin{align}
E[X] &= G'(1) \\
&= \frac{1-p}{p} \\
V[X] &= G^{”}(1)+G'(1)-(G'(1))^2 \\
&= \frac{2(1-p)^2}{p^2} + \frac{1-p}{p} – \frac{(1-p)^2}{p^2} \\
&= \frac{(1-p)^2}{p^2} + \frac{p(1-p)}{p^2} \\
&= \frac{(1-p)(1-p+p)}{p^2} \\
&= \frac{1-p}{p^2}
\end{align}
$$

・フィッシャー情報量の導出
幾何分布の対数尤度を$l(p)$とおくと、$l(p) = \log{p(x)}$より、$l(p)$は下記のように表すことができる。
$$
\large
\begin{align}
l(p) &= \log{p(x)} \\
&= \log{p(1-p)^x} \\
&= \log{p} + x \log{(1-p)}
\end{align}
$$
上記を下記のように$p$で2回微分を行う。
$$
\large
\begin{align}
l'(p) &= (x \log{(1-p)} + \log{p})’ \\
&= \frac{1}{p} – \frac{x}{1-p} \\
l^{”}(p) &= -\frac{1}{p^2} – \frac{x}{(1-p)^2}
\end{align}
$$
よって、フィッシャ情報量$\mathit{I}(p)=E[-l^{”}(p)]$は下記のように求めることができる。
$$
\large
\begin{align}
\mathit{I}(p) &= E[-l^{”}(p)] \\
&= E \left[ \frac{1}{p^2} + \frac{x}{(1-p)^2} \right] \\
&= \frac{1}{p^2} + \frac{E[X]}{(1-p)^2} \\
&= \frac{1}{p^2} + \frac{1}{(1-p)^2} \cdot \frac{1-p}{p} \\
&= \frac{1}{p^2} + \frac{1}{p(1-p)} \\
&= \frac{1}{p^2(1-p)}
\end{align}
$$

問題7.10の解答例

$y$個の球を$n-1$個の仕切りで分けることで、各非負の$x_i$に対応させることを考える。この組み合わせの数は${}_{y+n-1} C{y}={}_{n+y-1} C{y}$のように求めることができる。

問題7.11の解答例

下記のQ3.8の解答で取り扱ったように、負の二項分布に関して$NB(r_1,p)*NB(r_2,p) = NB(r_1+r_2,p)$が成立する。
https://www.hello-statisticians.com/explain-books-cat/math_stat_practice_ch3.html#38

幾何分布は負の二項分布$NB(r,p)$において$r=1$の場合であるので、上記と同様なたたみこみ演算を$n$回行うことで幾何分布から負の二項分布を導出することができる。

問題7.12の解答例

$X_1, X_2, …, X_n$の同時確率$P(X_1=x_1,…,X_n=x_n)$は下記のように表すことができる。
$$
\large
\begin{align}
P(X_1=x_1,…,X_n=x_n) &= \prod_{i=1}^{n} p(1-p) \\
&= p^{n} (1-p)^{\sum_{i=1}^{n}x_i}
\end{align}
$$

上記において分解定理を考えると、$p$の十分統計量が$\displaystyle Y = \sum_{i=1}^{n}X_i$で与えられることがわかる。また、問題6.7より完備性は示される。

ここで$Y=y$を与えた際の$X_1, X_2, …, X_n$の条件付き分布$P(X_1=x_1,…,X_n=x_n|Y=y)$は下記のように表すことができる。
$$
\large
\begin{align}
P(X_1=x_1,…,X_n=x_n|Y=y) &= \frac{P(X_1=x_1,…,X_n=x_n,Y=y)}{P(Y=y)} \\
&= \frac{P(X_1=x_1,…,X_n=x_n)}{P(Y=y)} \\
&= \frac{p^{n} (1-p)^{\sum_{i=1}^{n}x_i}}{{}_{n+y-1} C_{y} p^{n} (1-p)^{y}} \\
&= \frac{p^{n} (1-p)^{y}}{{}_{n+y-1} C_{y} p^{n} (1-p)^{y}} \\
&= \frac{1}{{}_{n+y-1} C_{y}}
\end{align}
$$

・考察
条件付き分布を考える際に$P(X_1=x_1,…,X_n=x_n,Y=y)=P(X_1=x_1,…,X_n=x_n)$のように考えたが、これは$\displaystyle Y = \sum_{i=1}^{n}X_i$のようにおいたことに基づく。

より詳細には下記のように考えると良いと思われる。
$$
\large
\begin{align}
P(X_1=x_1,…,X_n=x_n,Y=y) &= p^{n} (1-p)^{y} \\
&= p^{n} (1-p)^{\sum_{i=1}^{n}X_i} \\
&= P(X_1=x_1,…,X_n=x_n)
\end{align}
$$

問題7.13の解答例

$$
\large
\begin{align}
P(Y=y) = {}_{n+y-1} C_{y} p^{n} (1-p)^{y}
\end{align}
$$
$p$の尤度を$L(p)$とおくと、$L(p)=P(Y=y)$なので、対数尤度の$\log{L(p)}$は下記のように表すことができる。
$$
\large
\begin{align}
\log{L(p)} &= \log{( {}_{n+y-1} C_{y} p^{n} (1-p)^{y} )} \\
&= n \log{p} + y \log{(1-p)} + Const. \quad (1)
\end{align}
$$

ここで(1)式を$p$に関して微分した際に$0$になる$p$値を下記のように計算する。
$$
\large
\begin{align}
\frac{d \log{L(p)}}{d p} &= 0 \\
\frac{n}{p} – \frac{y}{1-p} &= 0 \\
\frac{y}{1-p} &= \frac{n}{p} \\
yp &= n(1-p) \\
(n+y)p &= n \\
p &= \frac{n}{n+y}
\end{align}
$$
上記が最尤推定量$\hat{p}$を表すので、$\displaystyle \hat{p} = \frac{n}{n+y}$が成立する。

次に(7.62)式を示す。$\displaystyle E \left[ \frac{1}{(N-1)(N-2)…(N-k)} \right] = E \left[ \frac{1}{(n+y-1)(n+y-2)…(n+y-k)} \right]$は下記のように変形することができる。
$$
\large
\begin{align}
E & \left[ \frac{1}{(N-1)(N-2)…(N-k)} \right] = E \left[ \frac{1}{(n+y-1)(n+y-2)…(n+y-k)} \right] \\
&= \sum_{y=0}^{\infty} \frac{1}{(n+y-1)(n+y-2)…(n+y-k)} \times {}_{n+y-1} C_{y} p^{n} (1-p)^{y} \\
&= \sum_{y=0}^{\infty} \frac{1}{(n+y-1)(n+y-2)…(n+y-k)} \times \frac{(n+y-1)!}{y!(n-1)!} p^{n} (1-p)^{y} \\
&= \sum_{y=0}^{\infty} \frac{(n+y-1-k)!}{y!(n-1)!} p^{n} (1-p)^{y} \\
&= \frac{1}{(n-1)(n-2)…(n-k)} \sum_{y=0}^{\infty} \frac{(n+y-1-k)!}{y!(n-k)!} p^{n} (1-p)^{y} \\
&= \frac{p^k}{(n-1)(n-2)…(n-k)} \sum_{y=0}^{\infty} \frac{(n-k+y-1)!}{y!(n-k)!} p^{n-k} (1-p)^{y}
\end{align}
$$

ここで(2)式の$\displaystyle \sum_{y=0}^{\infty}$の中は負の二項分布$NB(n-k,y)$の$y=0,1,…,$を表している。
従って、確率分布のそれぞれの確率関数の和が1になることを考えることによって$\displaystyle \sum_{y=0}^{\infty} \frac{(n-k+y-1)!}{y!(n-k)!} p^{n-k} (1-p)^{y}=1$であることがわかる。これを(2)に代入することによって、下記を得ることができる。
$$
\large
\begin{align}
E & \left[ \frac{1}{(N-1)(N-2)…(N-k)} \right] = E \left[ \frac{1}{(n+y-1)(n+y-2)…(n+y-k)} \right] \\
&= \frac{p^k}{(n-1)(n-2)…(n-k)} \sum_{y=0}^{\infty} \frac{(n-k+y-1)!}{y!(n-k)!} p^{n-k} (1-p)^{y} \\
&= \frac{p^k}{(n-1)(n-2)…(n-k)} \quad (3)
\end{align}
$$
上記は(7.62)式が成立することを表す。

また、(3)式の両辺に$(n-1)(n-2)…(n-k)$をかけると下記のようになる。
$$
\large
\begin{align}
E \left[ \frac{1}{(N-1)…(N-k)} \right] (n-1)…(n-k) &= \frac{p^k}{(n-1)…(n-k)}(n-1)…(n-k) \\
E \left[ \frac{(n-1)(n-2)…(n-k)}{(N-1)(N-2)…(N-k)} \right] &= p^k \\
E \left[ \frac{(n-1)(n-2)…(n-k)}{(n+y-1)(n+y-2)…(n+y-k)} \right] &= p^k
\end{align}
$$

上記より$\displaystyle E \left[ \frac{n-1}{n+y-1} \right] = p$が成立し、$\displaystyle \frac{n-1}{n+y-1}$が$p$の不偏推定量であることがわかる。

問題7.14の解答例

問題7.15の解答例

(7.63)式と、(7.64)式はそれぞれ左辺を変形することで、右辺を導出できるので以下に示す。

・(7.63)式の導出
$$
\large
\begin{align}
\frac{n}{N} – \frac{n}{N-1} + \frac{n}{(N-1)(N-2)} &= \frac{n(N-1)(N-2) – nN(N-2) + nN}{N(N-1)(N-2)} \\
&= \frac{n(N^2-3N+2) – n(N^2-2N) + nN}{N(N-1)(N-2)} \\
&= \frac{nN^2 – 3nN + 2n – nN^2 + 2nN + nN}{N(N-1)(N-2)} \\
&= \frac{2n}{N(N-1)(N-2)}
\end{align}
$$

・(7.64)式の導出
$$
\large
\begin{align}
\frac{n^2}{N^2} – \frac{n^2}{(N-1)(N-2)} &+ \frac{3n^2}{(N-1)(N-2)(N-3)} \\
&= \frac{n^2(N-1)(N-2)(N-3) – n^2N^2(N-3) + 3n^2(N-3)}{N^2(N-1)(N-2)(N-3)}
\end{align}
$$
上記を計算するにあたっては、分子を整理して$(N-1)(N-2)(N-3) – N^2(N-3) + 3N^2$を計算すればよい。
$$
\large
\begin{align}
(N-1)(N-2)(N-3) – N^2(N-3) + 3N^2 &= (N^2-3N+2)(N-3) – (N^3-3N^2) + 3N^2 \\
&= (N^3 – 3N^2 + 2N – 3N^2 + 9N – 6) – N^3 + 3N^2 + 3N^2 \\
&= 11N – 6
\end{align}
$$

よって、(1)式は下記のように整理することができる。
$$
\large
\begin{align}
\frac{n^2}{N^2} – \frac{n^2}{(N-1)(N-2)} &+ \frac{3n^2}{(N-1)(N-2)(N-3)} \\
&= \frac{n^2(N-1)(N-2)(N-3) – n^2N^2(N-3) + 3n^2N^2}{N^2(N-1)(N-2)(N-3)} \\
&= \frac{11Nn^2 – 6n^2}{N^2(N-1)(N-2)(N-3)}
\end{align}
$$

問題7.16の解答例

ポアソン分布は下記で導出を行ったように再生性が成立し、(3.51)式のようにたたみこみが行える。
https://www.hello-statisticians.com/explain-terms-cat/probdist3.html#i-4
(3.51)式より、$\displaystyle \sum_{i=1}^{n} X_i$は$Po(n \lambda)$に従う。ここで、$e^{-2\lambda}$の推定量が$\delta(y)$であることより、下記が成立する。
$$
\large
\begin{align}
e^{-2\lambda} &= E[\delta(y)] \\
&= \sum_{y=0}^{\infty} \delta(y) \frac{(n \lambda)^y}{y!} e^{-n \lambda}
\end{align}
$$

ここで、両辺を$e^{-n \lambda}$で割ることで下記が導出できる。
$$
\large
\begin{align}
e^{(n-2)\lambda} = \sum_{y=0}^{\infty} \delta(y) \frac{(n \lambda)^y}{y!} \quad (1)
\end{align}
$$

また、$e^{(n-2) \lambda}$に関するマクローリン展開を考えることで、下記が成立することがわかる。
$$
\large
\begin{align}
e^{(n-2)\lambda} = \sum_{y=0}^{\infty} \frac{((n-2) \lambda)^y}{y!} \quad (2)
\end{align}
$$

ここで、(1)と(2)の級数が一致するには下記が成立しなければならない。
$$
\large
\begin{align}
\delta(y) (n \lambda)^y &= ((n-2) \lambda)^y \\
\delta(y) &= \frac{((n-2) \lambda)^y}{(n \lambda)^y} \\
&= \left( \frac{n-2}{n} \right)^y \quad (3)
\end{align}
$$

上記のように$e^{-2 \lambda}$の推定量を得ることができる。

・考察
以下、$\lambda=5$において、実際に$e^{-2 \lambda}=e^{-10}$を(3)式を用いて推定を行い、値を確認する。

  • $e^{-2 \lambda}=e^{-10}$
    $$
    \large
    \begin{align}
    e^{-10} = 4.5399… \times 10^{-5}
    \end{align}
    $$
  • $n = 3, y = n \lambda = 3 \times 5$
    $$
    \large
    \begin{align}
    \delta(y) &= \left( \frac{3-2}{3} \right)^{3 \times 5} \\
    &= \left( \frac{1}{3} \right)^{3 \times 5} \\
    &= 6.969… \times 10^{-8}
    \end{align}
    $$
  • $n = 50, y = n \lambda = 50 \times 5$
    $$
    \large
    \begin{align}
    \delta(y) &= \left( \frac{50-2}{50} \right)^{3 \times 5} \\
    &= \left( \frac{48}{50} \right)^{50 \times 5} \\
    &= 3.69662… \times 10^{-5}
    \end{align}
    $$
  • $n = 100, y = n \lambda = 100 \times 5$
    $$
    \large
    \begin{align}
    \delta(y) &= \left( \frac{100-2}{100} \right)^{100 \times 5} \\
    &= \left( \frac{98}{100} \right)^{100 \times 5} \\
    &= 4.1023… \times 10^{-5}
    \end{align}
    $$
  • $n = 1000, y = n \lambda = 1000 \times 5$
    $$
    \large
    \begin{align}
    \delta(y) &= \left( \frac{1000-2}{1000} \right)^{1000 \times 5} \\
    &= \left( \frac{998}{1000} \right)^{1000 \times 5} \\
    &= 4.4947… \times 10^{-5}
    \end{align}
    $$
  • $n = 1000000, y = n \lambda = 1000000 \times 5$
    $$
    \large
    \begin{align}
    \delta(y) &= \left( \frac{1000000-2}{1000000} \right)^{1000000 \times 5} \\
    &= \left( \frac{999998}{1000000} \right)^{1000000 \times 5} \\
    &= 4.53994… \times 10^{-5}
    \end{align}
    $$

サンプルが増えるに従って、$\delta(y)$が$e^{-2 \lambda}$に近づいており、これにより$e^{-2\lambda} = E[\delta(y)]$が成立することが妥当であることが確認できる。

問題7.17の解答例

問題7.18の解答例

問題7.19の解答例

問題7.20の解答例

問題7.21の解答例

問題7.22の解答例

問題7.23の解答例

問題7.24の解答例

「条件付き期待値」と「期待値の繰り返しの公式」の定義の確認と直感的解釈

統計的決定理論における十分統計量に関連して出てくる「ラオ・ブラックウェルの定理」の証明などにおいて、条件付き期待値(conditional expectation)の考え方に基づく繰り返しの公式が用いられる。
条件付き期待値$E[Y|X]$と繰り返しの公式$E[Y] = E[E[Y|X]]$は、積分などを用いた定義を抑えていないと略記される場合も多く、注意が必要であると思われる。そこで当記事では条件付き期待値と繰り返しの公式の定義と直感的解釈について確認を行う。
作成にあたっては「現代数理統計学(学術図書出版社)」の3.3節の「多次元分布の期待値」や6.2節の「統計的決定理論における十分統計量」を参考とした。

数式定義の確認

条件付き期待値(conditional expectation)

$(X,Y)$を2次元の連続確率変数、同時確率密度関数を$f(x,y)$、$X$に関する周辺確率密度関数を$f_{X}(x)$とおく。

このとき、$X=x$を与えた際の$Y$の条件付き確率密度関数を$f_{Y|X}(y)$のようにおくと、$f_{Y|X}(y)$は下記のように定義される。
$$
\large
\begin{align}
f_{Y|X}(y) = \frac{f(x,y)}{f_{X}(x)}
\end{align}
$$

ここで「$X=x$を与えた際の$Y$の条件付き期待値(conditional expectation of $Y$ given $X=x$)」を$E[Y|X]$とすると、$E[Y|X]$は下記のように定義される。
$$
\large
\begin{align}
E[Y|X] &=E[Y|X=x] \\
&= \int_{-\infty}^{\infty} y f_{Y|X}(y) dy \\
&= \int_{-\infty}^{\infty} y \frac{f(x,y)}{f_{X}(x)} dy
\end{align}
$$
条件付き期待値の存在については$E[Y]$が存在するならばほとんど全ての$x$に対して$E[Y|X=x]$が存在することが知られている。

また、より一般には関数$g(x,y)$に対して$X=x$を与えた際の条件付き期待値の$E[g(X,Y)|X]$は下記のように定義される。
$$
\large
\begin{align}
E[g(X,Y)|X] &= E[g(X,Y)|X=x] \\
&= \int_{-\infty}^{\infty} g(x,y) f_{Y|X=x}(y) dy \\
&= \int_{-\infty}^{\infty} g(x,y) \frac{f(x,y)}{f_{X}(x)} dy
\end{align}
$$

条件付き分散(conditional variance)

条件付き分散(conditional variance)を$V[Y|X]$とおくと、$V[Y|X]$は条件付き期待値と同様に下記のように表すことができる。
$$
\large
\begin{align}
V[Y|X] &= E[(Y-E[Y|X])^2|X]
\end{align}
$$

期待値の繰り返しの公式(全確率の公式)

確率密度関数$f(x,y)$、$X$に関する周辺確率密度関数$f_{X}(x)$が与えられるとき、確率変数$Y$に関する期待値の$E[Y]$は下記のように変形できる。
$$
\large
\begin{align}
E[Y] &= \int \int y f(x,y) dx dy \\
&= \int \int y f(x,y) dy dx \\
&= \int \left( \int y f(x,y) dy \right) dx \\
&= \int \left( \int y \frac{f(x,y)}{f_{X}(x)} dy \right) f_{X}(x) dx \\
&= \int E[Y|X] f_{X}(x) dx \\
&= E[E[Y|X]]
\end{align}
$$
上記が期待値の繰り返しの公式(全確率の公式)である。

より一般化を行うにあたっては任意の関数$g(x,y)$について下記が成立する。
$$
\large
\begin{align}
E[g(X,Y)] &= E[E[g(X,Y)|X]]
\end{align}
$$
上記に関しては下記で導出を行なった。
https://www.hello-statisticians.com/explain-books-cat/math_stat_practice_ch3.html#39

直感的解釈

条件付き期待値(conditional expectation)

$$
\large
\begin{align}
E[g(X,Y)|X] &= E[g(X,Y)|X=x] \\
&= \int_{-\infty}^{\infty} g(x,y) f_{Y|X=x}(y) dy \\
&= \int_{-\infty}^{\infty} g(x,y) \frac{f(x,y)}{f_{X}(x)} dy
\end{align}
$$
前節で確認したように、確率変数$(X,Y)$に対する任意の関数$g(x,y)$の期待値は上記のように表すことができる。多くの導出では$E[g(X,Y)|X]$のようにしか表記されないため、直感的な解釈も同時に抑えておくと良いと思われる。

解釈を行うにあたっては、条件付き確率密度関数の$\displaystyle f_{Y|X=x}(y) = \frac{f(x,y)}{f_{X}(x)}$について詳しく考えることが重要である。
条件付き確率密度関数は$\displaystyle P(A|B) = \frac{P(A \cap B)}{P(B)}$で表される条件付き確率の考え方を確率密度関数に適用したものである。よって、条件付き確率分布と同様の理解を行うと良い。

条件付き確率は「Bが起こった上でAが起こる確率は、AかつBが起こる確率をBが起こる確率で割れば良い」という風に解釈できる。「試験対策を行なった上で試験に合格する確率」と同様に考えれば良い。

さて、この条件付き期待値はここで確認した条件付き確率を用いた期待値である。試験の例だと「試験対策を行なったときの点数の期待値」などを考える際に条件付き期待値と同様の数式を用いる。具体的な処理に関しては、「試験対策を行なった際の得点を列記し、それぞれの確率をかけて和を考える」際に、得点にかける確率に条件付き確率を用いることに注意しておくと良い。条件付き確率と期待値に関しては略記されることが多いが、常に積分と条件付き確率の定義式を考えながら、条件付き期待値を用いると良いと思われる。

期待値の繰り返しの公式(全確率の公式)

期待値の繰り返しの公式は「ラオ・ブラックウェルの定理」の証明などに用いられるが、条件付き期待値と同様に直感的な解釈を行うのが大変であると思われる。
$$
\large
\begin{align}
E[Y] &= \int \left( \int y \frac{f(x,y)}{f_{X}(x)} dy \right) f_{X}(x) dx \\
&= E[E[Y|X]]
\end{align}
$$
具体的には上記が「期待値の繰り返しの公式」であるが、$y$に関して積分を行なったのちに$x$に関して積分を行うことに着目すると良い。

前項の「試験の得点」を例に考えるなら、試験対策の有無を$X$、試験の得点を$Y$で考えれば良い。まずは試験対策を実施したかしなかったかにそれぞれ分けて条件付き確率を用いて期待値を計算し($Y$に関して積分)、その後に試験対策のそれぞれもまとめて期待値を計算する($X$に関して積分)。

上記を元に考えると、処理の直感的な解釈にあたっては、「カテゴリ$X$毎に期待値を計算し、その重み付け平均で全体の期待値を計算する」と同様に考えると良い。よって、期待値の繰り返しの公式はカテゴリ$X$毎の集計操作と同様なイメージで抑えておくと良いと思われる。

正規分布のモーメント母関数の導出に基づく期待値・分散の計算について

正規分布については連続型確率分布のところで簡単に取り扱った。
https://www.hello-statisticians.com/explain-terms-cat/probdist2.html#i-2
一方で、上記ではモーメント母関数の導出やモーメント母関数に基づく期待値・分散の計算の詳細については省略した。
https://www.hello-statisticians.com/explain-books-cat/math_stat_practice_ch2.html#212
一方で上記で取り扱った対数正規分布の期待値・分散の計算などでは正規分布のモーメント母関数の導出と同様に指数の内部の平方完成を行う考え方を用いるので、当記事では正規分布のモーメント母関数の導出に基づく正規分布の期待値・分散の計算について取り扱うこととした。

正規分布のモーメント母関数の導出

正規分布の確率密度関数の$f(x)$は下記のように表すことができる。
$$
\large
\begin{align}
f(x) = \frac{1}{\sqrt{2 \pi \sigma^2}} \exp \left\{ -\frac{(x – \mu)^2}{2 \sigma^2} \right\}
\end{align}
$$
上記に対し、モーメント母関数$m(t) = E[e^{tX}]$は下記のように計算できる。
$$
\large
\begin{align}
m(t) &= E \left[ e^{tX} \right] \\
&= \int_{-\infty}^{\infty} \exp \{tx\} f(x) dx \\
&= \int_{-\infty}^{\infty} \exp \{tx\} \times \frac{1}{\sqrt{2 \pi \sigma^2}} \exp \left\{ -\frac{(x – \mu)^2}{2 \sigma^2} \right\} dx \\
&= \frac{1}{\sqrt{2 \pi \sigma^2}} \int_{-\infty}^{\infty} \exp \left\{ -\frac{(x – \mu)^2}{2 \sigma^2} + tx \right\} dx \\
&= \frac{1}{\sqrt{2 \pi \sigma^2}} \int_{-\infty}^{\infty} \exp \left\{ -\frac{(x – \mu)^2 – 2 \sigma^2 tx}{2 \sigma^2} \right\} dx \\
&= \frac{1}{\sqrt{2 \pi \sigma^2}} \int_{-\infty}^{\infty} \exp \left\{ -\frac{x^2 – 2 \mu x + \mu^2 – 2 \sigma^2 tx}{2 \sigma^2} \right\} dx \\
&= \frac{1}{\sqrt{2 \pi \sigma^2}} \int_{-\infty}^{\infty} \exp \left\{ -\frac{x^2 – 2(\mu+\sigma^2 t)x + \mu^2}{2 \sigma^2} \right\} dx \\
&= \frac{1}{\sqrt{2 \pi \sigma^2}} \int_{-\infty}^{\infty} \exp \left\{ -\frac{(x – (\mu + \sigma^2 t))^2 + \mu^2 – (\mu+\sigma^2 t)^2}{2 \sigma^2} \right\} \\
&= \frac{1}{\sqrt{2 \pi \sigma^2}} \int_{-\infty}^{\infty} \exp \left\{ -\frac{(x – (\mu+\sigma^2 t))^2 + \mu^2 – \mu^2 – 2 \mu \sigma^2 t – \sigma^4 t^2)}{2 \sigma^2} \right\} dx \\
&= \frac{1}{\sqrt{2 \pi \sigma^2}} \int_{-\infty}^{\infty} \exp \left\{ -\frac{(x – (\mu+\sigma^2 t))^2}{2 \sigma^2} + \mu t + \frac{\sigma^2 t^2}{2} \right\} dx \\
&= \exp \left\{ \mu t + \frac{\sigma^2 t^2}{2} \right\} \times \frac{1}{\sqrt{2 \pi \sigma^2}} \int_{-\infty}^{\infty} \exp \left\{ -\frac{(x – (\mu+\sigma^2 t))^2}{2 \sigma^2} \right\} dx
\end{align}
$$

ここで上記において、$\displaystyle \frac{1}{\sqrt{2 \pi \sigma^2}} \int_{-\infty}^{\infty} \exp \left\{ -\frac{(x – (\mu+\sigma^2 t))^2}{2 \sigma^2} \right\} dx$は平均$\mu+\sigma^2 t$、分散$\sigma^2$の正規分布$N(\mu+\sigma^2 t, \sigma^2)$の全区間での積分なので、確率密度関数の定義より$\displaystyle \frac{1}{\sqrt{2 \pi \sigma^2}} \int_{-\infty}^{\infty} \exp \left\{ -\frac{(x – (\mu+\sigma^2 t))^2}{2 \sigma^2} \right\} dx = 1$が成立する。

よって、モーメント母関数$m(t)$は下記のように導出できる。
$$
\large
\begin{align}
m(t) &= \exp \left\{ \mu t + \frac{\sigma^2 t^2}{2} \right\} \times \frac{1}{\sqrt{2 \pi \sigma^2}} \int_{-\infty}^{\infty} \exp \left\{ -\frac{(x – (\mu+\sigma^2 t))^2}{2 \sigma^2} \right\} dx \\
&= \exp \left\{ \mu t + \frac{\sigma^2 t^2}{2} \right\} \times 1 \\
&= \exp \left\{ \mu t + \frac{\sigma^2 t^2}{2} \right\}
\end{align}
$$

また、途中で正規分布の確率密度関数の全区間での積分が$1$であることを用いたが、このことはガウス積分の考え方を用いることで導出できる。ガウス積分については下記で詳しくまとめたので、ここでは省略する。
https://www.hello-statisticians.com/explain-terms-cat/gaussian_integral1.html

期待値・分散の計算

期待値$E[X]$の計算

期待値$E[X]$はモーメント母関数の微分の$m'(t)$を用いて$E[X]=m'(0)$のように計算できる。まずは$m'(t)$を計算する。
$$
\large
\begin{align}
m'(t) &= \left( \exp \left\{ \mu t + \frac{\sigma^2 t^2}{2} \right\} \right)’ \\
&= \exp \left\{ \mu t + \frac{\sigma^2 t^2}{2} \right\} \times \left( \mu t + \frac{\sigma^2 t^2}{2} \right)’ \\
&= (\mu + \sigma^2 t) \exp \left\{ \mu t + \frac{\sigma^2 t^2}{2} \right\}
\end{align}
$$

よって、$E[X]=m'(0)$は下記のように求めることができる。
$$
\large
\begin{align}
E[X] &= m'(0) \\
&= (\mu + \sigma^2 \cdot 0) \exp \left\{ \mu \cdot 0 + \frac{\sigma^2 \cdot 0^2}{2} \right\} \\
&= \mu
\end{align}
$$

分散$V[X]$の計算

分散$V[X]$はモーメント母関数の微分の$m'(t), m^{”}(t)$を用いて$V[X]=m^{”}(0)-(m'(0))^2$のように計算できる。$m'(t)$は前項で求めたので$m^{”}(t)$を計算する。
$$
\large
\begin{align}
m^{”}(t) &= \left( (\mu + \sigma^2 t) \exp \left\{ \mu t + \frac{\sigma^2 t^2}{2} \right\} \right)’ \\
&= (\sigma^2 + (\mu + \sigma^2 t)^2) \exp \left\{ \mu t + \frac{\sigma^2 t^2}{2} \right\}
\end{align}
$$

よって、$V[X]=m^{”}(0) – (m'(0))^2$は下記のように求めることができる。
$$
\large
\begin{align}
V[X] &= m^{”}(0) – (m'(0))^2 \\
&= (\sigma^2 + (\mu + \sigma^2 \cdot 0)^2) \exp \left\{ \mu \cdot 0 + \frac{\sigma^2 \cdot 0^2}{2} \right\} – \mu^2 \\
&= (\sigma^2 + (\mu)^2) \exp { 0 + 0 } – \mu^2 \\
&= \sigma^2 + \mu^2 – \mu^2 \\
&= \sigma^2
\end{align}
$$

Ch.4 「統計量と標本分布」の章末問題の解答例 〜現代数理統計学(学術図書出版社)〜

当記事は「現代数理統計学(学術図書出版社)」の読解サポートにあたってChapter.4の「統計量と標本分布」の章末問題の解説について行います。

基本的には書籍の購入者向けの解説なので、まだ入手されていない方は購入の上ご確認ください。また、解説はあくまでサイト運営者が独自に作成したものであり、書籍の公式ページではないことにご注意ください。(そのため著者の意図とは異なる解説となる可能性はあります)

↓下記が公式の解答なので、正確にはこちらを参照ください。
https://www.gakujutsu.co.jp/text/isbn978-4-7806-0860-1/

章末の演習問題について

問題4.1の解答例

$X \sim N(0,1)$の時の、$X^2$のモーメント母関数$m(t) = E[e^{tX^2}]$は下記のように求めることができる。
$$
\large
\begin{align}
E \left[ e^{tX^2} \right] &= \int_{-\infty}^{\infty} e^{tx^2} \times \frac{1}{\sqrt{2 \pi}} e^{-\frac{x^2}{2}} dx \\
&= \frac{1}{\sqrt{2 \pi}} \int_{-\infty}^{\infty} e^{-\frac{x^2}{2}+tx^2} dx \\
&= \frac{1}{\sqrt{2 \pi}} \int_{-\infty}^{\infty} e^{-\frac{x^2(1-2t)}{2}} dx
\end{align}
$$

上記において$\displaystyle y = \sqrt{1-2t}x$を用いて変数変換を行うことを考える。$\displaystyle \frac{dx}{dy}=\frac{1}{\sqrt{1-2t}}$より、(1)は下記のように変形できる。
$$
\large
\begin{align}
E \left[ e^{tX^2} \right] &= \frac{1}{\sqrt{2 \pi}} \int_{-\infty}^{\infty} e^{-\frac{x^2(1-2t)}{2}} dx \\
&= \frac{1}{\sqrt{2 \pi}} \int_{-\infty}^{\infty} e^{-\frac{y^2}{2}} \frac{dx}{dy} dy \\
&= \frac{1}{\sqrt{2 \pi}} \int_{-\infty}^{\infty} e^{-\frac{y^2}{2}} \frac{1}{\sqrt{1-2t}} dy \\
&= \frac{1}{\sqrt{2 \pi (1-2t)}} \int_{-\infty}^{\infty} e^{-\frac{y^2}{2}} dy \\
&= \frac{\sqrt{2 \pi}}{\sqrt{2 \pi (1-2t)}} \\
&= (1-2t)^{-\frac{1}{2}}
\end{align}
$$
上記において、$\displaystyle \int_{-\infty}^{\infty} e^{-\frac{y^2}{2}} dy = \sqrt{2 \pi}$はガウス積分の考え方を用いた。
https://www.hello-statisticians.com/explain-terms-cat/gaussian_integral1.html

ここで、$X_1,…X_n \sim N(0,1), i.i.d.,$よりモーメント母関数$E[e^{tY}]$は下記のように求めることができる。
$$
\large
\begin{align}
E[e^{tY}] &= E \left[ e^{t(X_1^2+X_2^2+…+X_n^2)} \right] \\
&= E \left[ e^{tX_1^2} \right]E \left[ e^{tX_2^2} \right]…E \left[ e^{tX_n^2} \right] \\
&= \left( (1-2t)^{-\frac{1}{2}} \right)^n \\
&= (1-2t)^{-\frac{n}{2}} \quad (2)
\end{align}
$$

また、ガンマ分布$Ga(\nu,\alpha)$のモーメント母関数$m_{ga}(t)$は下記のように表すことができる。
$$
\large
\begin{align}
m_{ga}(t) &= (1 – t \alpha)^{-\nu}
\end{align}
$$
上記の式において$\displaystyle \nu = \frac{n}{2}, \alpha=2$を代入すると(2)式が得られるので、$Y=X_1^2+…+X_n^2$のモーメント母関数は$\displaystyle Ga \left( \frac{n}{2}, 2 \right)$のモーメント母関数に一致する。

・解説
上記より、自由度$\nu$の$\chi^2$分布$\chi^2(\nu)$は$\displaystyle Ga \left( \frac{n}{2}, 2 \right)$に一致することを示すことができる。

問題4.2の解答例

Helmert変換に用いる行列$G$が直交行列であることは下記で示した。
https://www.hello-statisticians.com/explain-terms-cat/helmert1.html#Helmert-2

問題4.3の解答例

$t$統計量を考えるにあたって$\displaystyle \sum_{i=1}^{n} (X_i-\bar{X})^2$を用いて表すと$t$は下記のように表すことができる。
$$
\large
\begin{align}
t &= \frac{(\bar{X}-\mu)}{\sqrt{\frac{1}{n-1} \sum_{i=1}^{n} (X_i-\bar{X})^2/n}} \\
&= \frac{(\bar{X}-\mu)}{\sqrt{\frac{1}{n(n-1)} \sum_{i=1}^{n} (X_i-\bar{X})^2}} \\
&= \frac{\sqrt{n-1}(\bar{X}-\mu)}{\sqrt{\frac{1}{n} \sum_{i=1}^{n} (X_i-\bar{X})^2}} \\
&= \frac{\sqrt{n-1}(\bar{X}-\mu)}{s}
\end{align}
$$
上記より、$\displaystyle t = \frac{\sqrt{n-1}(\bar{X}-\mu)}{s}$のように表すことができることがわかる。

問題4.4の解答例

$$
\large
\begin{align}
\int_{0}^{\infty} v^{\frac{m+1}{2}-1} e^{-\frac{v(1+t^2/m)}{2}} dv = 2^{\frac{m+1}{2}} \Gamma \left( \frac{m+1}{2} \right) \left( 1+\frac{t^2}{m} \right)^{-\frac{m+1}{2}} \quad (4.19)
\end{align}
$$
上記の(4.19)式が成立することを以下で示す。

$\displaystyle a = \frac{1+t^2/m}{2}$とおき、下記のように(4.19)式の左辺の変形を行う。
$$
\large
\begin{align}
\int_{0}^{\infty} v^{\frac{m+1}{2}-1} e^{-\frac{v(1+t^2/m)}{2}} dv &= \int_{0}^{\infty} v^{\frac{m+1}{2}-1} e^{-va} dv \\
&= \int_{0}^{\infty} a^{-\frac{m+1}{2}+1} a^{\frac{m+1}{2}-1} v^{\frac{m+1}{2}-1} e^{-va} dv \\
&= a^{-\frac{m+1}{2}+1} \int_{0}^{\infty} (va)^{\frac{m+1}{2}-1} e^{-va} dv
\end{align}
$$
上記において$dv = a^{-1} d(va)$のように積分に用いる変数を変換することを考える。このとき$m>0$より$a>0$であるため積分区間は変更せずに、(1)式は下記のように変形できる。
$$
\large
\begin{align}
\int_{0}^{\infty} v^{\frac{m+1}{2}-1} e^{-\frac{v(1+t^2/m)}{2}} dv &= a^{-\frac{m+1}{2}+1} \int_{0}^{\infty} (va)^{\frac{m+1}{2}-1} e^{-va} dv \\
&= a^{-\frac{m+1}{2}+1} \int_{0}^{\infty} (va)^{\frac{m+1}{2}-1} e^{-va} a^{-1} d(va) \\
&= a^{-\frac{m+1}{2}} \int_{0}^{\infty} (va)^{\frac{m+1}{2}-1} e^{-va} d(va) \quad (2)
\end{align}
$$

ここで、下記のガンマ関数$\Gamma(a)$の定義式を考える。
$$
\large
\begin{align}
\Gamma(a) = \int_{0}^{\infty} x^{a-1} e^{-x} dx \quad (3)
\end{align}
$$

(3)式より、(2)式は下記のように変形できる。
$$
\large
\begin{align}
\int_{0}^{\infty} v^{\frac{m+1}{2}-1} e^{-\frac{v(1+t^2/m)}{2}} dv &= a^{-\frac{m+1}{2}} \int_{0}^{\infty} (va)^{\frac{m+1}{2}-1} e^{-va} d(va) \\
&= a^{-\frac{m+1}{2}} \Gamma \left( \frac{m+1}{2} \right) \\
&= \left( \frac{1+t^2/m}{2} \right)^{-\frac{m+1}{2}} \Gamma \left( \frac{m+1}{2} \right) \\
&= \left( \frac{1}{2} \right)^{-\frac{m+1}{2}} \Gamma \left( \frac{m+1}{2} \right) \left( 1 + \frac{t^2}{m} \right)^{-\frac{m+1}{2}} \\
&= 2^{\frac{m+1}{2}} \Gamma \left( \frac{m+1}{2} \right) \left( 1 + \frac{t^2}{m} \right)^{-\frac{m+1}{2}}
\end{align}
$$

ここまでの議論により、(4.19)式が成立することを示すことができる。

問題4.5の解答例

$$
\large
\begin{align}
f(t) &= \frac{\Gamma \left(\frac{m+1}{2} \right)}{\sqrt{\pi m} \Gamma \left(\frac{m}{2} \right)} \left( 1 + \frac{t^2}{m} \right)^{-\frac{m+1}{2}} \quad (4.20) \\
&= \frac{1}{\sqrt{\pi}} \times \frac{\Gamma \left(\frac{m+1}{2} \right)}{\sqrt{m} \Gamma \left(\frac{m}{2} \right)} \times \left( 1 + \frac{t^2}{m} \right)^{-\frac{m+1}{2}} \quad (1)
\end{align}
$$
(4.20)を上記のように整理し、それぞれの項に関して$m \to \infty$の極限を考える。

・(1)式の右辺第3項の$\displaystyle \left( 1 + \frac{t^2}{m} \right)^{-\frac{m+1}{2}}$
$\displaystyle \left( 1 + \frac{t^2}{m} \right)^{-\frac{m+1}{2}}$の$m \to \infty$の極限は$e$の定義を用いて下記のように導出できる。
$$
\large
\begin{align}
\lim_{m \to \infty} \left( 1 + \frac{t^2}{m} \right)^{-\frac{m+1}{2}} &= \lim_{m \to \infty} \left( \left( 1 + \frac{t^2}{m} \right)^{-\frac{m+1}{2t^2}} \right)^{t^2} \\
&= \lim_{m \to \infty} \left( \left( 1 + \frac{t^2}{m} \right)^{\frac{2(m+1)}{2t^2}} \right)^{-\frac{t^2}{2}} \\
&= \lim_{m \to \infty} \left( \left( 1 + \frac{t^2}{m} \right)^{\frac{m+1}{t^2}} \right)^{-\frac{t^2}{2}} \\
&= \lim_{m \to \infty} \left( \left( 1 + \frac{t^2}{m} \right)^{\frac{m}{t^2}} \right)^{-\frac{t^2}{2}} \left( \left( 1 + \frac{t^2}{m} \right)^{\frac{1}{t^2}} \right)^{-\frac{t^2}{2}} \\
&= e^{-\frac{t^2}{2}} \cdot 1 \\
&= e^{-\frac{t^2}{2}}
\end{align}
$$

・(1)式の右辺第2項の$\displaystyle \frac{\Gamma \left(\frac{m+1}{2} \right)}{\sqrt{m} \Gamma \left(\frac{m}{2} \right)}$

$\displaystyle \frac{\Gamma \left(\frac{m+1}{2} \right)}{\sqrt{m} \Gamma \left(\frac{m}{2} \right)}$は下記のように整理することができる。
$$
\large
\begin{align}
& \frac{\Gamma \left(\frac{m+1}{2} \right)}{\sqrt{m} \Gamma \left(\frac{m}{2} \right)} \\
&= \frac{\Gamma \left(\frac{m+1}{2} \right)}{\sqrt{2 \pi \cdot \frac{m-1}{2}} \left( \frac{m-1}{2} \right)^{\frac{m-1}{2}} e^{-\frac{m-1}{2}}} \cdot \frac{\sqrt{2 \pi \cdot \frac{m-2}{2}} \left( \frac{m-2}{2} \right)^{\frac{m-2}{2}} e^{-\frac{m-2}{2}}}{\Gamma \left(\frac{m}{2} \right)} \cdot \frac{\sqrt{2 \pi \cdot \frac{m-1}{2}} \left( \frac{m-1}{2} \right)^{\frac{m-1}{2}} e^{-\frac{m-1}{2}}}{\sqrt{m}\sqrt{2 \pi \cdot \frac{m-2}{2}} \left( \frac{m-2}{2} \right)^{\frac{m-2}{2}} e^{-\frac{m-2}{2}}}
\end{align}
$$

上記の第1項、第2項はスターリングの公式より$m \to \infty$の際に$1$に収束する。よって以下では第3項のみ考える。
$$
\large
\begin{align}
\frac{\sqrt{2 \pi \cdot \frac{m-1}{2}} \left( \frac{m-1}{2} \right)^{\frac{m-1}{2}} e^{-\frac{m-1}{2}}}{\sqrt{m}\sqrt{2 \pi \cdot \frac{m-2}{2}} \left( \frac{m-2}{2} \right)^{\frac{m-2}{2}} e^{-\frac{m-2}{2}}} &= \frac{\sqrt{m-1} \left( \frac{m-1}{2} \right)^{\frac{m-1}{2}} e^{-\frac{1}{2}}}{\sqrt{m}\sqrt{m-2} \left( \frac{m-2}{2} \right)^{\frac{m-2}{2}}} \\
&= \sqrt{\frac{m-1}{m-2}} \cdot \frac{\left( \frac{m-1}{2} \right)^{\frac{m-1}{2}}}{\sqrt{m}\left( \frac{m-2}{2} \right)^{\frac{m-2}{2}}} \cdot e^{-\frac{1}{2}} \\
&= \sqrt{\frac{m-1}{m-2}} \cdot \frac{(m-1)^{\frac{m-1}{2}}}{\sqrt{m}(m-2)^{\frac{m-2}{2}}} \cdot \frac{1}{\sqrt{2}}e^{-\frac{1}{2}}
\end{align}
$$

$m \to \infty$のとき、上記の第1項は$1$に収束する。第2項を考えるにあたっては$l=m-2$を考える。$m \to \infty$のとき、$l \to \infty$も成立する。
$$
\large
\begin{align}
\frac{(m-1)^{\frac{m-1}{2}}}{\sqrt{m}(m-2)^{\frac{m-2}{2}}} &= \frac{(l+1)^{\frac{m+1}{2}}}{\sqrt{l+2}l^{\frac{l}{2}}} \\
&= \sqrt{l+2} \left( 1 + \frac{1}{l} \right)^{\frac{l}{2}} \\
&= \frac{\sqrt{l+1}}{\sqrt{l+2}} \left( 1 + \frac{1}{l} \right)^{\frac{l}{2}}
\end{align}
$$

上記において、$\displaystyle \left( 1 + \frac{1}{l} \right)^{\frac{l}{2}}$の$m \to \infty, l \to \infty$の極限は下記のように導出することができる。
$$
\large
\begin{align}
\lim_{m \to \infty, l \to \infty} \left( 1 + \frac{1}{l} \right)^{\frac{l}{2}} &= \lim_{m \to \infty, l \to \infty} \left( \left( 1 + \frac{1}{l} \right)^{l} \right)^{\frac{1}{2}} \\
&= e^{\frac{1}{2}}
\end{align}
$$

よって$\displaystyle \frac{\Gamma \left(\frac{m+1}{2} \right)}{\sqrt{m} \Gamma \left(\frac{m}{2} \right)}$の$m \to \infty$の極限は下記のように導出できる。
$$
\large
\begin{align}
\lim_{m \to \infty} \frac{\Gamma \left(\frac{m+1}{2} \right)}{\sqrt{m} \Gamma \left(\frac{m}{2} \right)} &= \frac{1}{\sqrt{2}}e^{-\frac{1}{2}} \cdot e^{\frac{1}{2}} \\
&= \frac{1}{\sqrt{2}}
\end{align}
$$

・(1)式の導出
ここまでの議論より、(1)式の$m \to \infty$の極限は下記のように表すことができる。
$$
\large
\begin{align}
\lim_{m \to \infty} \frac{1}{\sqrt{\pi}} \times \frac{\Gamma \left(\frac{m+1}{2} \right)}{\sqrt{m} \Gamma \left(\frac{m}{2} \right)} \times \left( 1 + \frac{t^2}{m} \right)^{-\frac{m+1}{2}} &= \frac{1}{\sqrt{\pi}} \times \frac{1}{\sqrt{2}} \times e^{-\frac{t^2}{2}} \\
&= \frac{1}{\sqrt{2 \pi}}e^{-\frac{t^2}{2}}
\end{align}
$$

上記の導出は自由度$m$の$t$分布の$m \to \infty$の極限が、正規分布に一致することを表す。

問題4.6の解答例

$$
\large
\begin{align}
f(y) = \frac{l^{l/2}m^{m/2}}{B(l/2,m/2)}\frac{y^{l/2-1}}{(m+ly)^{(l+m)/2}} \quad (1)
\end{align}
$$
上記は自由度$(l,m)$の$F$分布の確率密度関数だが、上記において$v=ly$で置き換えると上記が$v$の$\chi^2$に収束することを示す。これは下記が成立することを意味する。
$$
\large
\begin{align}
g(v) = \frac{1}{2^{l/2} \Gamma(l/2)} y^{l/2-1}e^{-y/2} \quad (v>0) \quad (2)
\end{align}
$$

以下、(1)式を(2)式の形にすることを目標に式変形を行う。
$$
\large
\begin{align}
f(y) &= \frac{l^{l/2}m^{m/2}}{B(l/2,m/2)}\frac{y^{l/2-1}}{(m+ly)^{(l+m)/2}} \quad (1) \\
&= \frac{lm^{m/2}}{B(l/2,m/2)}\frac{l^{l/2-1}y^{l/2-1}}{(m+v)^{(l+m)/2}} \\
&= \frac{lm^{m/2}}{B(l/2,m/2)}\frac{v^{l/2-1}}{(m+v)^{(l+m)/2}} \\
&= \frac{lm^{m/2}\Gamma(l/2)\Gamma(m/2)}{\Gamma((l+m)/2)}\frac{v^{l/2-1}}{(m+v)^{(l+m)/2}} \\
&= \frac{1}{\Gamma(l/2)} v^{l/2-1} \times \frac{lm^{m/2}\Gamma(m/2)}{\Gamma((l+m)/2)}\frac{1}{(m+v)^{(l+m)/2}}
\end{align}
$$

問題4.7の解答例

問題4.8の解答例

$T$と$V$の同時密度関数を$f(t,v)$のようにおくと、$f(t,v)$は下記のように表される。
$$
\large
\begin{align}
f(t,v) = \frac{v^{\frac{m+1}{2}-1} e^{-\frac{v}{2}(1+\frac{t^2}{m})} e^{-\frac{\lambda^2}{2}} e^{t \lambda \sqrt{\frac{v}{m}}}}{2^{\frac{m}{2}} \Gamma \left( \frac{m}{2} \right) \sqrt{2 \pi m}} \quad (1)
\end{align}
$$
ここで上記の$\displaystyle e^{t \lambda \sqrt{\frac{v}{m}}}$は下記のようにマクローリン展開できる。
$$
\large
\begin{align}
e^{t \lambda \sqrt{\frac{v}{m}}} = \sum_{i=1}^{\infty} \frac{t^j \lambda^j v^{\frac{j}{2}}}{j! m^{\frac{j}{2}}} \quad (2)
\end{align}
$$

(2)式を(1)式に代入し、下記のように変形を行う。
$$
\large
\begin{align}
f(t,v) &= \frac{v^{\frac{m+1}{2}-1} e^{-\frac{v}{2}(1+\frac{t^2}{m})} e^{-\frac{\lambda^2}{2}}}{2^{\frac{m}{2}} \Gamma \left( \frac{m}{2} \right) \sqrt{2 \pi m}} \times \sum_{j=0}^{\infty} \frac{t^j \lambda^j v^{\frac{j}{2}}}{j! m^{\frac{j}{2}}} \\
&= \frac{e^{-\frac{\lambda^2}{2}}}{\sqrt{\pi m} \Gamma \left( \frac{m}{2} \right)} \sum_{j=0}^{\infty} \frac{v^{\frac{m+1}{2}-1} e^{-\frac{v}{2}(1+\frac{t^2}{m})} t^j \lambda^j v^{\frac{j}{2}}}{j! m^{\frac{j}{2}} 2^{\frac{m+1}{2}}} \\
&= \frac{e^{-\frac{\lambda^2}{2}}}{\sqrt{\pi m} \Gamma \left( \frac{m}{2} \right)} \sum_{j=0}^{\infty} v^{\frac{m+1+j}{2}-1} e^{-\frac{v}{2}(1+\frac{t^2}{m})} \times \frac{t^j \lambda^j}{j! m^{\frac{j}{2}} 2^{\frac{m+1}{2}}}
\end{align}
$$

上記の両辺を$0 \leq v \leq \infty$で積分を行い、右辺に関して項別積分を行えるようにインテグラルとシグマの順序を入れ替える。
$$
\large
\begin{align}
\int_{0}^{\infty} f(t,v) dv &= \int_{0}^{\infty} \frac{e^{-\frac{\lambda^2}{2}}}{\sqrt{\pi m} \Gamma \left( \frac{m}{2} \right)} \sum_{j=0}^{\infty} v^{\frac{m+1+j}{2}-1} e^{-\frac{v}{2}(1+\frac{t^2}{m})} \times \frac{t^j \lambda^j}{j! m^{\frac{j}{2}} 2^{\frac{m+1}{2}}} dv \\
&= \frac{e^{-\frac{\lambda^2}{2}}}{\sqrt{\pi m} \Gamma \left( \frac{m}{2} \right)} \sum_{j=0}^{\infty} \frac{t^j \lambda^j}{j! m^{\frac{j}{2}} 2^{\frac{m+1}{2}}} \int_{0}^{\infty} v^{\frac{m+1+j}{2}-1} e^{-\frac{v}{2}(1+\frac{t^2}{m})} dv \quad (3)
\end{align}
$$

(3)式の項別積分の$\displaystyle \int_{0}^{\infty} v^{\frac{m+1+j}{2}-1} e^{-\frac{v}{2}(1+\frac{t^2}{m})} dv$の計算にあたっては下記のガンマ分布の全確率の式を活用することを考える。
$$
\large
\begin{align}
\int_{0}^{\infty} \frac{1}{\alpha^{\nu} \Gamma(\nu)} x^{\nu-1} e^{-\frac{x}{\alpha}} dx = 1 \quad (4)
\end{align}
$$
全確率の式を考えるにあたっては、下記で取りまとめたガンマ分布の確率密度関数の式を用いた。
https://www.hello-statisticians.com/explain-terms-cat/gamma_distribution1.html#i-3

(4)式を用いることで、項別積分の$\displaystyle \int_{0}^{\infty} v^{\frac{m+1+j}{2}-1} e^{-\frac{v}{2}(1+\frac{t^2}{m})} dv$は下記のように計算できる。
$$
\large
\begin{align}
& \int_{0}^{\infty} v^{\frac{m+1+j}{2}-1} e^{-\frac{v}{2}(1+\frac{t^2}{m})} dv \\
&= \int_{0}^{\infty} \frac{\left(\frac{2}{1+\frac{t^2}{m}}\right)^{\frac{m+1+j}{2}} \Gamma(\frac{m+1+j}{2})}{\left(\frac{2}{1+\frac{t^2}{m}}\right)^{\frac{m+1+j}{2}} \Gamma(\frac{m+1+j}{2})} v^{\frac{m+1+j}{2}-1} e^{-\frac{v}{2/(1+\frac{t^2}{m})}} dv \\
&= \left(\frac{2}{1+\frac{t^2}{m}}\right)^{\frac{m+1+j}{2}} \Gamma \left( \frac{m+1+j}{2} \right) \int_{0}^{\infty} \frac{1}{\left(\frac{2}{1+\frac{t^2}{m}}\right)^{\frac{m+1+j}{2}} \Gamma(\frac{m+1+j}{2})} v^{\frac{m+1+j}{2}-1} e^{-\frac{v}{2/(1+\frac{t^2}{m})}} dv \\
&= \left(\frac{2}{1+\frac{t^2}{m}}\right)^{\frac{m+1+j}{2}} \Gamma \left( \frac{m+1+j}{2} \right) \int_{0}^{\infty} \frac{1}{\alpha^{\nu} \Gamma(\nu)} v^{\nu-1} e^{-\frac{x}{\alpha}} dv \\
&= \left(\frac{2}{1+\frac{t^2}{m}}\right)^{\frac{m+1+j}{2}} \Gamma \left( \frac{m+1+j}{2} \right) \quad (5)
\end{align}
$$
(5)式の導出にあたって(4)式を用いたことを示すにあたって、$\displaystyle \nu = \frac{m+1+j}{2}, \alpha = \frac{2}{1+\frac{t^2}{m}}$のように置き換えを行った。

(5)式を(3)式に代入する。
$$
\large
\begin{align}
& \frac{e^{-\frac{\lambda^2}{2}}}{\sqrt{\pi m} \Gamma \left( \frac{m}{2} \right)} \sum_{j=0}^{\infty} \frac{t^j \lambda^j}{j! m^{\frac{j}{2}} 2^{\frac{m+1}{2}}} \int_{0}^{\infty} v^{\frac{m+1+j}{2}-1} e^{-\frac{v}{2}(1+\frac{t^2}{m})} dv \\
&= \frac{e^{-\frac{\lambda^2}{2}}}{\sqrt{\pi m} \Gamma \left( \frac{m}{2} \right)} \sum_{j=0}^{\infty} \frac{t^j \lambda^j}{j! m^{\frac{j}{2}} 2^{\frac{m+1}{2}}} \left(\frac{2}{1+\frac{t^2}{m}}\right)^{\frac{m+1+j}{2}} \Gamma \left( \frac{m+1+j}{2} \right) \\
&= \frac{e^{-\frac{\lambda^2}{2}}}{\sqrt{\pi m} \Gamma \left( \frac{m}{2} \right)} \sum_{j=0}^{\infty} \frac{\Gamma \left( \frac{m+1+j}{2} \right) 2^{\frac{j}{2}} t^j \lambda^j}{\left(\frac{2}{1+\frac{t^2}{m}}\right)^{\frac{m+1+j}{2}} j! m^{\frac{j}{2}}}
\end{align}
$$
上記が(4.26)式と一致する。

問題4.9の解答例

問題4.10の解答例

「特定の区間の期待値が発散 $\implies$ 有限の期待値・分散を持たない」より、「特定の区間の期待値が発散すること」を示す。ここでは$1 \leq t < \infty$の区間における積分$\displaystyle \int_{1}^{\infty} tf(t) dt$が正の無限大に発散することを示す。
$$
\large
\begin{align}
\int_{1}^{\infty} tf(t) dt &= \int_{1}^{\infty} t \times \frac{1}{\pi (1+t^2)} dt \\
&= \frac{1}{\pi} \int_{1}^{\infty} \frac{t}{(1+t^2)} dt
\end{align}
$$

ここで$1 \leq t$で、$\displaystyle \frac{t}{(1+t^2)} \geq \frac{1}{2t}$が成立することを確認する。
$$
\large
\begin{align}
\frac{t^2}{(1+t^2)} \geq \frac{1}{2} \\
\frac{t}{(1+t^2)} \geq \frac{1}{2t} \quad (2)
\end{align}
$$

(1)式において(2)を考えることにより、下記のように積分の発散を示せる。
$$
\large
\begin{align}
\int_{1}^{\infty} tf(t) dt &= \frac{1}{\pi} \int_{1}^{\infty} \frac{t}{(1+t^2)} dt \\
&\geq \frac{1}{\pi} \int_{1}^{\infty} \frac{1}{2t} dt \\
&= \frac{1}{2 \pi} \int_{1}^{\infty} \frac{1}{t} dt \\
&= \frac{1}{2 \pi} \left[ \log{t} \right]_{1}^{\infty} \\
&= \infty
\end{align}
$$
ここまでの議論により、「コーシー分布は有限の期待値や分散を持たないこと」を示すことができる。

次に、$\displaystyle X = \tan{\left( \pi \left( U – \frac{1}{2} \right) \right)}$がコーシー分布に従うことを示す。$X, U$の確率密度関数をそれぞれ$f(x), g(u)$とおくと変数変換の式より下記が成立する。
$$
\large
\begin{align}
f(x) = g(u) \cdot \frac{du}{dx}
\end{align}
$$

$\displaystyle \frac{du}{dx}$を導出するにあたって、$u$を$x$の式で表す。
$$
\large
\begin{align}
x &= \tan{\left( \pi \left( u – \frac{1}{2} \right) \right)} \\
\tan^{-1}{(x)} &= \pi \left( u – \frac{1}{2} \right) \\
u – \frac{1}{2} &= \frac{1}{\pi} \tan^{-1}{(x)} \\
u &= \frac{1}{\pi} \tan^{-1}{(x)} + \frac{1}{2}
\end{align}
$$
$\displaystyle (\tan^{-1}{(x)})’ = \frac{1}{1+x^2}$より、$\displaystyle \frac{du}{dx}$は下記のように求めることができる。
$$
\large
\begin{align}
\frac{du}{dx} &= \frac{1}{\pi} \times \frac{1}{1+x^2} \\
&= \frac{1}{\pi(1+x^2)}
\end{align}
$$
$\displaystyle (\tan^{-1}{(x)})’ = \frac{1}{1+x^2}$に関しては導出が少々複雑なのでここでは省略し、下記で詳しく取り扱った。
https://www.hello-statisticians.com/explain-terms-cat/diff_formula1.html

$U \sim U[0,1]$から$g(u)=1$が成立するので、$f(x)$は下記のように表すことができる。
$$
\large
\begin{align}
f(x) &= g(u) \cdot \frac{du}{dx} \\
&= 1 \cdot \frac{1}{\pi(1+x^2)} \\
&= \frac{1}{\pi(1+x^2)}
\end{align}
$$
上記はコーシー分布の確率密度関数に一致するので、$\displaystyle X = \tan{\left( \pi \left( U – \frac{1}{2} \right) \right)}$がコーシー分布に従うことがわかる。

また、密度関数の積分を考えることで累積分布関数についても示すことができる。

問題4.11の解答例

式(3.37)の分散の公式より、下記が成立する。
$$
\large
\begin{align}
V[(X_1+…+X_N)] = \sum_{i=1}^{N} V[X_i] + 2 \sum_{i<j} Cov[X_i,X_j] \quad (1)
\end{align}
$$

ここで無作為抽出かつ$V[X_1]=\sigma^2$であることから、$V[X_i]=\sigma^2$が成立し、$Cov[X_i,X_j]$に関しても$Cov[X_i,X_j]=Cov[X_1,X_2]$が成立する。よって、(1)式は下記のように変形できる。
$$
\large
\begin{align}
V[(X_1+…+X_N)] &= \sum_{i=1}^{N} V[X_i] + 2 \sum_{i<j} Cov[X_i,X_j] \\
&= N V[X_1] + N(N-1)Cov[X_1,X_2] \\
&= N \sigma^2 + N(N-1)Cov[X_1,X_2] \quad (2)
\end{align}
$$

また、有限抽出を母集団の総標本と同じ数だけ行った場合、$X_1+…+X_N=a_1+…+a_N$のように定数となり、$V[X_1+…+X_N]=0$となる。(2)式において$V[X_1+…+X_N]=0$を考えることで、$Cov[X_1,X_2]$は下記のように導出することができる。
$$
\large
\begin{align}
V[(X_1+…+X_N)] &= 0 \\
N \sigma^2 + N(N-1)Cov[X_1,X_2] &= 0 \\
N(N-1)Cov[X_1,X_2] &= -N \sigma^2 \\
Cov[X_1,X_2] &= – \frac{N \sigma^2}{N(N-1)} \\
Cov[X_1,X_2] &= – \frac{\sigma^2}{N-1}
\end{align}
$$

問題4.12の解答例

問題4.13の解答例

問題4.14の解答例

区間$[0,1]$における一様分布の$U[0,1]$を元に考える。このとき、順序統計量$X_{(i)}$の標本分布の確率密度関数は、下記で表した式(4.50)のようになる。
$$
\large
\begin{align}
f_{X_{(i)}} = \frac{n!}{(i-1)!(n-i)!} x^{i-1}(1-x)^{n-i} = \frac{x^{i-1}(1-x)^{n-i}}{B(i,n-i+1)} \quad (4.50)
\end{align}
$$
式(4.50)はベータ分布$Be(i,n-i+1)$の確率密度関数を表す。

ここでベータ分布$Be(a,b)$の期待値$E[X]$や分散の$V[X]$は、下記のように表すことができる。
$$
\large
\begin{align}
E[X] &= \frac{a}{a+b} \quad (1) \\
V[X] &= \frac{ab}{(a+b)^2(a+b+1)} \quad (2)
\end{align}
$$
詳しい導出については下記で取りまとめを行った。
https://www.hello-statisticians.com/explain-terms-cat/beta_distribution1.html#i-5

(1)式、(2)式に$a=i, b=n-i+1$を代入することで標本分布の期待値$E[X]$と分散$V[X]$は下記のように求めることができる。
$$
\large
\begin{align}
E[X] &= \frac{a}{a+b} \\
&= \frac{i}{i+n-i+1} \\
&= \frac{i}{n+1} \\
V[X] &= \frac{ab}{(a+b)^2(a+b+1)} \\
&= \frac{i(n-i+1)}{(i+n-i+1)^2(i+n-i+1+1)} \\
&= \frac{i(n-i+1)}{(n+1)^2(n+2)}
\end{align}
$$

Ch.3 「多次元の確率変数」の章末問題の解答例 〜現代数理統計学(学術図書出版社)〜

当記事は「現代数理統計学(学術図書出版社)」の読解サポートにあたってChapter.3の「多次元の確率変数」の章末問題の解説について行います。

基本的には書籍の購入者向けの解説なので、まだ入手されていない方は購入の上ご確認ください。また、解説はあくまでサイト運営者が独自に作成したものであり、書籍の公式ページではないことにご注意ください。(そのため著者の意図とは異なる解説となる可能性はあります)

↓下記が公式の解答なので、正確にはこちらを参照ください。
https://www.gakujutsu.co.jp/text/isbn978-4-7806-0860-1/

章末の演習問題について

問題3.1の解答例

上図のように考えることで示すことができる。

問題3.2の解答例

$$
\large
\begin{align}
F(x_1, x_2, …, x_n) = F(x_1)F(x_2)…F(x_n) \quad (1)
\end{align}
$$
$(1)$式から離散分布の場合$(3.6)$式、連続分布の場合$(3.14)$式を示せばよい。

・連続分布の場合
$(1)$の両辺を$x_1, x_2, …, x_n$で微分することを考える。
$$
\large
\begin{align}
\frac{\partial}{\partial x_1}…\frac{\partial}{\partial x_n} F(x_1, x_2, …, x_n) &= \frac{\partial}{\partial x_1}…\frac{\partial}{\partial x_n}F(x_1)F(x_2)…F(x_n) \\
f(x_1, x_2, …, x_n) &= \prod_{i=1}^{n} \frac{\partial}{\partial x_i} F(x_i) \\
&= \prod_{i=1}^{n} f(x_i)
\end{align}
$$
上記は$(3.14)$式と同義である。

・離散分布の場合
$(3.9)$式、$(3.10)$式を考えることで連続分布の場合と同様に(3.6)式を導出できる。

問題3.3の解答例

$(3.29)$式より、$r$と$\theta$が独立かつ、$\theta$は$0 \leq \theta \leq 2\pi$の一様分布に従うことがわかる。

また、$v=r^2$を用いて変数変換を行うことを考える。変換後を$g(v,\theta)$のようにおくと、下記のように計算を行うことができる。
$$
\large
\begin{align}
g(v,\theta) &= f(r,\theta) \frac{dr}{dv} \\
&= f(\sqrt{v},\theta) \times \frac{1}{2 \sqrt{v}} \\
&= c^2 \sqrt{v} \exp \left( -\frac{v}{2} \right) \times \frac{1}{2 \sqrt{v}} \\
&= \frac{c^2}{2} \exp \left( -\frac{v}{2} \right) \\
& \propto \exp \left( -\frac{v}{2} \right)
\end{align}
$$
上記より、$r^2$は指数分布$Ex(2)$に従うことがわかる。

問題3.4の解答例

問題3.5の解答例

$Z = a_1X_1 + a_2X_2 + … + a_nX_n$を考えた際、$Z$の分散$V[Z]$は分散の定義より下記のように表すことができる。
$$
\large
\begin{align}
V[Z] &= E[(Z-E[Z])^2] \\
&= E[(a_1X_1 + a_2X_2 + … + a_nX_n-E[a_1X_1 + a_2X_2 + … + a_nX_n])^2] \\
&= E[((a_1X_1-E[a_1X_1])+…+(a_nX_n-E[a_nX_n]))^2] \\
&= E[(a_1(X_1-E[X_1])+…+a_n(X_n-E[X_n]))^2] \\
&= E \left[ \sum_{i=1}^{n} a_i^2(X_i-E[X_i])^2 + 2\sum_{i<j} a_ia_j(X_i-E[X_i])(X_j-E[X_j]) \right] \\
&= E \left[ \sum_{i=1}^{n} a_i^2(X_i-E[X_i])^2 \right] + 2 E \left[ \sum_{i<j} a_ia_j(X_i-E[X_i])(X_j-E[X_j]) \right] \\
&= \sum_{i=1}^{n} a_i^2 E[(X_i-E[X_i])^2] + 2 \sum_{i<j} a_ia_j E[(X_i-E[X_i])(X_j-E[X_j])] \\
&= \sum_{i=1}^{n} a_i^2 V[X_i] + 2 \sum_{i<j} a_ia_j Cov(X_i,X_j)
\end{align}
$$

上記より、式$(3.37)$が成立することを示すことができる。

問題3.6の解答例

$$
\large
\begin{align}
\mathbf{X} = \left(\begin{array}{c} X_1 \\ … \\ X_n \end{array} \right)
\end{align}
$$

上記のように$n$次元確率ベクトルの$\mathbf{X}$を定義する。$(3.40)$式は$n$次元の定数ベクトル$\mathbf{a}$と$n$次の定数行列$\mathbf{B}$に関して下記のように表される。
$$
\large
\begin{align}
E[\mathbf{a} + \mathbf{B}\mathbf{X}] = \mathbf{a} + \mathbf{B}E[\mathbf{X}] \quad (1)
\end{align}
$$

以下、上記の$(1)$式を示す。
$\mathbf{a} + \mathbf{B}\mathbf{X}$は下記のように計算できる。
$$
\large
\begin{align}
\mathbf{a} + \mathbf{B}\mathbf{X} &= \left(\begin{array}{c} a_1 \\ … \\ a_n \end{array} \right) + \left(\begin{array}{ccc} B_{11} & … & B_{1n} \\ … & … & … \\ B_{n1} & … & B_{nn} \end{array} \right) \left(\begin{array}{c} X_1 \\ … \\ X_n \end{array} \right) \\
&= \left(\begin{array}{c} a_1 + B_{11}X_1+B_{12}X_2+…+B_{1n}X_n \\ … \\ a_n + B_{n1}X_1+B_{n2}X_2+…+B_{nn}X_n \end{array} \right)
\end{align}
$$

上記の期待値を取ることで、$E[\mathbf{a} + \mathbf{B}\mathbf{X}]$は下記のように表せる。
$$
\large
\begin{align}
E[ \mathbf{a} + \mathbf{B}\mathbf{X} ] &= E \left[ \left(\begin{array}{c} a_1 + B_{11}X_1+B_{12}X_2+…+B_{1n}X_n \\ … \\ a_n + B_{n1}X_1+B_{n2}X_2+…+B_{nn}X_n \end{array} \right) \right] \\
&= \left(\begin{array}{c} a_1 + E[ B_{11}X_1+B_{12}X_2+…+B_{1n}X_n ] \\ … \\ a_n + E[ B_{n1}X_1+B_{n2}X_2+…+B_{nn}X_n ] \end{array} \right) \\
&= \left(\begin{array}{c} a_1 + B_{11}E[X_1]+B_{12}E[X_2]+…+B_{1n}E[X_n] \\ … \\ a_n + B_{n1}E[X_1]+B_{n2}E[X_2]+…+B_{nn}E[X_n] \end{array} \right) \\
&= \mathbf{a} + \left( \begin{array}{c} B_{11}E[X_1]+B_{12}E[X_2]+…+B_{1n}E[X_n] \\ … \\ B_{n1}E[X_1]+B_{n2}E[X_2]+…+B_{nn}E[X_n] \end{array} \right) \\
&= \mathbf{a} + \mathbf{B} E[\mathbf{X}]
\end{align}
$$

上記より$(1)$式は示すことができる。

問題3.7の解答例

・$(3.42)$式の導出
$$
\large
\begin{align}
\mathbf{X} = \left(\begin{array}{c} X_1 \\ … \\ X_n \end{array} \right), \quad \mathbf{\mu} = \left(\begin{array}{c} \mu_1 \\ … \\ \mu_n \end{array} \right)
\end{align}
$$
上記のように$\mathbf{X}, \mathbf{\mu}$を定義する。このとき、$(\mathbf{X}-\mathbf{\mu})(\mathbf{X}-\mathbf{\mu})^{T}$は下記のように表すことができる。
$$
\large
\begin{align}
(\mathbf{X}-\mathbf{\mu})(\mathbf{X}-\mathbf{\mu})^{T} &= \left(\begin{array}{c} X_1-\mu_1 \\ … \\ X_n-\mu_n \end{array} \right) \left(\begin{array}{ccc} X_1-\mu_1 & … & X_n-\mu_n \end{array} \right) \\
&= \left(\begin{array}{ccc} (X_1-\mu_1)^2 & … & (X_1-\mu_1)(X_n-\mu_n) \\ … & … & … \\ (X_n-\mu_n)(X_1-\mu_1) & … & (X_n-\mu_n)^2 \end{array} \right)
\end{align}
$$

上記の両辺の期待値を取り、$E[(\mathbf{X}-\mathbf{\mu})(\mathbf{X}-\mathbf{\mu})^{T}]$を考えると下記のように変形できる。
$$
\large
\begin{align}
E[(\mathbf{X}-\mathbf{\mu})(\mathbf{X}-\mathbf{\mu})^{T}] &= E \left[ \left(\begin{array}{ccc} (X_1-\mu_1)^2 & … & (X_1-\mu_1)(X_n-\mu_n) \\ … & … & … \\ (X_n-\mu_n)(X_1-\mu_1) & … & (X_n-\mu_n)^2 \end{array} \right) \right] \\
&= \left(\begin{array}{ccc} E[(X_1-\mu_1)^2] & … & E[(X_1-\mu_1)(X_n-\mu_n)] \\ … & … & … \\ E[(X_n-\mu_n)(X_1-\mu_1)] & … & E[(X_n-\mu_n)^2] \end{array} \right) \\
&= \left(\begin{array}{ccc} V[X_1] & … & Cov(X_1,X_n) \\ … & … & … \\ Cov(X_n,X_1) & … & V[X_n] \end{array} \right) \\
&= \left(\begin{array}{ccc} \sigma_{11} & … & \sigma_{1n} \\ … & … & … \\ \sigma_{n1} & … & \sigma_{nn} \end{array} \right) \\
&= \Sigma
\end{align}
$$

・$(3.43)$式の導出

問題3.8の解答例

ポアソン分布、正規分布に関する再生性は下記で導出を行なったため省略する。

・ポアソン分布
https://www.hello-statisticians.com/explain-terms-cat/probdist3.html#i-5

・正規分布
https://www.hello-statisticians.com/explain-terms-cat/probdist3.html#i-8

以下、負の二項分布とガンマ分布に関して確認する。

・負の二項分布
https://www.hello-statisticians.com/explain-books-cat/math_stat_practice_ch2.html#28

上記の導出により、負の二項分布の確率母関数は下記のように表せる。
$$
\large
\begin{align}
G(s) = \frac{p^{r}}{(1-sq)^{r}}
\end{align}
$$

ここ負の二項分布のモーメント母関数を$m(t)$とおくと、$m(t)=G(e^t)$より、$m(t)$は下記のように表せる。
$$
\large
\begin{align}
m(t) &= G(s) \\
&= G(e^t) \\
&= \frac{p^{r}}{(1 – q e^t)^{r}}
\end{align}
$$

ここで確率変数$X_1$はパラメータ$p, q=1-p, r_1$の負の二項分布$NB(r_1,p)$に従い、確率変数$X_2$はパラメータ$p, q=1-p, r_2$の負の二項分布$NB(r_2,p)$に従うとする。また、このときのモーメント母関数を$m_{X_1}(t), m_{X_2}(t)$でおくことを考える。これに対して確率変数$X=X_1+X_2$に関するモーメント母関数を$m_{X}(t)$とすると、$m_{X}(t)$は下記のように表すことができる。
$$
\large
\begin{align}
m_{X}(t) &= E[e^{tX}] \\
&= E[e^{t(X_1+X_2)}] \\
&= E[e^{tX_1}]E[e^{tX_2}] \\
&= \frac{p^{r_1}}{(1 – q e^t)^{r_1}} \times \frac{p^{r_2}}{(1 – q e^t)^{r_2}} \\
&= \frac{p^{r_1+r_2}}{(1 – q e^t)^{r_1+r_2}}
\end{align}
$$
上記より、$(3.51)$式の$NB(r_1,p)*NB(r_2,p) = NB(r_1+r_2,p)$が導出できる。

・ガンマ分布
$(2.76)$式より、ガンマ分布$Ga(\nu,\alpha)$のモーメント母関数は下記のように表すことができる。
$$
\large
\begin{align}
m(t) = (1 – \theta \alpha)^{\nu}
\end{align}
$$

ここで確率変数$X_1$はパラメータ$\nu_1, \alpha$のガンマ分布$Ga(\nu_1, \alpha)$に従い、確率変数$X_2$はパラメータ$\nu_2, \alpha$のガンマ分布$Ga(\nu_2, \alpha)$に従うとする。また、このときのモーメント母関数を$m_{X_1}(t), m_{X_2}(t)$でおくことを考える。これに対して確率変数$X=X_1+X_2$に関するモーメント母関数を$m_{X}(t)$とすると、$m_{X}(t)$は下記のように表すことができる。
$$
\large
\begin{align}
m_{X}(t) &= E[e^{tX}] \\
&= E[e^{t(X_1+X_2)}] \\
&= E[e^{tX_1}]E[e^{tX_2}] \\
&= (1 – \theta \alpha)^{\nu_1} (1 – \theta \alpha)^{\nu_2} \\
&= (1 – \theta \alpha)^{\nu_1+\nu_2}
\end{align}
$$

上記より、$(3.51)$式の$Ga(\nu_1, \alpha)*Ga(\nu_2, \alpha) = Ga(\nu_1+\nu_2, \alpha)$が導出できる。

問題3.9の解答例

連続分布の場合に関して以下示す。$x, y$の同時確率密度関数を$f(x,y)$、確率変数$X$に関する周辺密度関数を$f_{X}(x)$と定義する。このとき、$E[g(X,Y)]$は下記のように変形できる。
$$
\large
\begin{align}
E[g(X,Y)] &= \int \int g(x,y) f(x,y) dx dy \\
&= \int \int g(x,y) f(x,y) dy dx \\
&= \int \left( \int g(x,y) \frac{f(x,y)}{f_{X}(x)} dy \right) f_{X}(x) dx \\
&= \int E[g(x,y)|X=x] f_{X}(x) dx \\
&= E[E[g(x,y)|X=x]]
\end{align}
$$

上記より$(3.55)$式を示すことができる。

問題3.10の解答例

$E[(Z-c)^2]$は下記のように変形できる。
$$
\large
\begin{align}
E[(Z-c)^2] &= E[Z^2 – 2Zc + c^2] \\
&= E[Z^2] -2cE[Z] + c^2 \\
&= (c-E[Z])^2 + E[Z^2] – (E[Z])^2
\end{align}
$$

$(c-E[Z])^2$は$c$に関して下に凸の二次関数であるので、上記より$E[(Z-c)^2]$を最小にする$c$は$c = E[Z]$であることがわかる。

問題3.11の解答例

$$
\large
\begin{align}
E[(Y – a – b_1X_1 – … – b_nX_n)^2] \qquad &(3.62) \\
a = E[Y] – b_1E[X_1] – … – b_nE[X_n] \quad &(3.63)
\end{align}
$$

上記のように$(3.62)$式、$(3.63)$式が与えられる。ここで$(3.63)$式を$(3.62)$式に代入する。
$$
\large
\begin{align}
& E[(Y – a – b_1X_1 – … – b_nX_n)^2] \\
&= E[(Y -(E[Y] – b_1E[X_1] – … – b_nE[X_n]) – b_1X_1 – … – b_nX_n)^2] \\
&= E[((Y – E[Y]) – b_1(X_1-E[X_1]) – … – b_n(E[X_n]-X_n))^2] \\
&= E[(Y – E[Y])^2] – 2\sum_{i=1}^{n}b_iE[(Y – E[Y])(X_i-E[X_i])] + \sum_{i=1}^{n}\sum_{j=1}^{n}b_ib_jE[(X_i-E[X_i])(X_j-E[X_j])] \\
&= V[Y] – 2\sum_{i=1}^{n}b_i Cov[Y,X_i] + \sum_{i=1}^{n}\sum_{j=1}^{n}b_ib_jCov[X_i,X_j] \quad (1)
\end{align}
$$

上記が$(3.64)$式に一致するので、$(3.64)$式を示すことができる。

次に、下記のように(1)式を$b_i$について偏微分し$0$とおく。
$$
\large
\begin{align}
\frac{\partial}{\partial b_i} \left( V[Y] – 2 \sum_{i=1}^{n}b_i Cov[Y,X_i] + \sum_{i=1}^{n}\sum_{j=1}^{n}b_ib_jCov[X_i,X_j] \right) = 0 \quad (2)
\end{align}
$$

ここで、上記の左辺の第$2$項と第$3$項についてそれぞれ微分を考える。
・第$2$項
$$
\large
\begin{align}
\frac{\partial}{\partial b_i} & \left( – 2 \sum_{i=1}^{n}b_i Cov[Y,X_i] \right) \\
&= -2 \frac{\partial}{\partial b_i} \left( b_1 Cov[Y,X_1] + … + b_i Cov[Y,X_i] + … + b_n Cov[Y,X_n] \right) \\
&= -2 Cov[Y,X_i]
\end{align}
$$

・第$3$項
$$
\large
\begin{align}
\frac{\partial}{\partial b_i} & \left( \sum_{i=1}^{n}\sum_{j=1}^{n}b_ib_jCov[X_i,X_j] \right) \\
&= \frac{\partial}{\partial b_i} \left( b_i^2 Cov[X_i,X_i] + 2 b_i\sum_{j \neq i} Cov[X_i,X_j] + Const \right) \\
&= 2b_i Cov[X_i,X_i] + 2 \sum_{j \neq i} Cov[X_i,X_j] \\
&= 2 \sum_{j=1}^{n} Cov[X_i,X_j]
\end{align}
$$

第$2$項、第$3$項の計算結果を$(2)$式に代入し、下記のように整理を行う。
$$
\large
\begin{align}
\frac{\partial}{\partial b_i} & \left( V[Y] – 2 \sum_{i=1}^{n}b_i Cov[Y,X_i] + \sum_{i=1}^{n}\sum_{j=1}^{n}b_ib_jCov[X_i,X_j] \right) = 0 \\
& -2 Cov[Y,X_i] + 2 \sum_{j=1}^{n} Cov[X_i,X_j] = 0 \\
& Cov[Y,X_i] = \sum_{j=1}^{n} b_jCov[X_i,X_j] \quad (3)
\end{align}
$$

$(3)$式が$(3.65)$式に一致するので、$(3.65)$式を示すことができる。

問題3.12の解答例

$n!$通りの並べ方を考えた上で、左から$y_1, y_2, …, y_n$のようにグループを割り当てていくと考えればよい。

このとき、同一のグループに所属するものの順番は考慮しないので、それぞれ$y_i!$通りの重複が生じる。よって、多項係数は下記のように表すことができる。
$$
\large
\begin{align}
\frac{n!}{y_1!y_2!…y_n!}
\end{align}
$$

また、多項分布の確率$P(Y_1=y_1, …, Y_n=y_n)$は下記のように表すことができる。
$$
\large
\begin{align}
P(Y_1=y_1, …, Y_n=y_n) = \frac{n!}{y_1!y_2!…y_n!} p^{y_1!}…p^{y_n!}
\end{align}
$$

問題3.13の解答例

問題3.14の解答例

$$
\large
\begin{align}
\mathbf{x} &= \left(\begin{array}{c} x_1 \\ … \\ x_n \end{array} \right), \quad \mathbf{\mu} = \left(\begin{array}{c} \mu_1 \\ … \\ \mu_n \end{array} \right) \\
\mathbf{\Sigma} &= \left(\begin{array}{c} \Sigma_{11} & … & \Sigma_{1n} \\ … \\ \Sigma_{n1} & … & \Sigma_{nn} \end{array} \right)
\end{align}
$$
上記のように$\mathbf{x}, \mathbf{\mu}, \mathbf{\Sigma}$を考える際に、多変量正規分布$N(\mathbf{\mu}, \mathbf{\Sigma})$の確率密度関数は下記のように表すことができる。
$$
\large
\begin{align}
f(\mathbf{x}) = \frac{1}{(2 \pi)^{n/2} (det \Sigma)^{1/2}} \exp \left\{ -\frac{1}{2} (\mathbf{x} – \mathbf{\mu})^{T} \Sigma^{-1} (\mathbf{x} – \mathbf{\mu}) \right\}
\end{align}
$$

$$
\large
\begin{align}
\mathbf{X} &= \left(\begin{array}{c} X_1 \\ … \\ X_n \end{array} \right) \\
\mathbf{t} &= \left(\begin{array}{c} t_1 \\ … \\ t_n \end{array} \right)
\end{align}
$$

このとき、上記のように$\mathbf{X}, \mathbf{t}$を定義し、モーメント母関数$m(\mathbf{t}) = E[e^{\mathbf{t}^{T} \mathbf{X}}]$を考える。
$$
\large
\begin{align}
m(\mathbf{t}) &= E \left[ e^{\mathbf{t}^{T} \mathbf{X}} \right] \\
&= \int e^{\mathbf{t}^{T} \mathbf{x}} f(\mathbf{x}) d \mathbf{x} \\
&= \int e^{\mathbf{t}^{T} \mathbf{x}} \times \frac{1}{(2 \pi)^{n/2} (det \Sigma)^{1/2}} \exp \left\{ -\frac{1}{2} (\mathbf{x} – \mathbf{\mu})^{T} \Sigma^{-1} (\mathbf{x} – \mathbf{\mu}) \right\} d \mathbf{x} \\
&= \frac{1}{(2 \pi)^{n/2} (det \Sigma)^{1/2}} \int \exp \left\{ \mathbf{t}^{T} \mathbf{x} – \frac{1}{2} (\mathbf{x} – \mathbf{\mu})^{T} \Sigma^{-1} (\mathbf{x} – \mathbf{\mu}) \right\} d \mathbf{x}
\end{align}
$$

上記の指数関数部分に対し、$\mathbf{x}$に関する平方完成を行うことを考える。
$$
\large
\begin{align}
\mathbf{t}^{T} \mathbf{x} – \frac{1}{2} (\mathbf{x} – \mathbf{\mu})^{T} \Sigma^{-1} (\mathbf{x} – \mathbf{\mu}) &= – \frac{1}{2} (\mathbf{x}^{T} \Sigma^{-1} \mathbf{x} – \mathbf{x}^{T} \Sigma^{-1} \mathbf{\mu} – \mathbf{\mu}^{T} \Sigma^{-1} \mathbf{x} + \mathbf{\mu}^{T} \Sigma^{-1} \mathbf{\mu} – 2 \mathbf{t}^{T} \mathbf{x}) \\
&= \frac{1}{2} (\mathbf{x}^{T} \Sigma^{-1} \mathbf{x} – 2 \mathbf{\mu}^{T} \Sigma^{-1} \mathbf{x} + \mathbf{\mu}^{T} \Sigma^{-1} \mathbf{\mu} – 2 \mathbf{t}^{T} \mathbf{x}) \\
&= – \frac{1}{2} (\mathbf{x}^{T} \Sigma^{-1} \mathbf{x} – 2 (\mathbf{\mu}^{T} \Sigma^{-1} + \mathbf{t}^{T}) \mathbf{x} + \mathbf{\mu}^{T} \Sigma^{-1} \mathbf{\mu}) \\
&= – \frac{1}{2} (\mathbf{x} – \mathbf{\mu} – \Sigma \mathbf{t})^{T} \Sigma^{-1} (\mathbf{x} – \mathbf{\mu} – \Sigma \mathbf{t}) + \mathbf{t}^{T} \mathbf{\mu} + \frac{1}{2} \mathbf{t}^{T} \Sigma^{-1} \mathbf{t}
\end{align}
$$

上記の右辺の$1$項目は積分により消えるため、モーメント母関数の下記が導出できる。
$$
\large
\begin{align}
m(\mathbf{t}) = \exp \left\{ \mathbf{t}^{T} \mathbf{\mu} + \frac{1}{2} \mathbf{t}^{T} \Sigma^{-1} \mathbf{t} \right\}
\end{align}
$$

問題3.15の解答例

$\mathbf{x}, \mathbf{y}, \mathbf{a}$はそれぞれ下記のような$n$次元ベクトルで定義できる。
$$
\large
\begin{align}
\mathbf{x} = \left(\begin{array}{c} x_1 \\ … \\ x_n \end{array} \right), \quad \mathbf{y} = \left(\begin{array}{c} y_1 \\ … \\ y_n \end{array} \right), \quad \mathbf{a} = \left(\begin{array}{c} a_1 \\ … \\ a_n \end{array} \right)
\end{align}
$$

$\mathbf{B}$が$n$次の正則行列であるので、$\mathbf{y} = \mathbf{a} + \mathbf{B}\mathbf{x}$は下記のように変形できる。
$$
\large
\begin{align}
\mathbf{y} &= \mathbf{a} + \mathbf{B}\mathbf{x} \\
\mathbf{B}\mathbf{x} &= \mathbf{y} – \mathbf{a} \\
\mathbf{x} &= \mathbf{B}^{-1} (\mathbf{y} – \mathbf{a})
\end{align}
$$

ここで$\mathbf{B}’ = \mathbf{B}^{-1}$を下記のように定義する。
$$
\large
\begin{align}
\mathbf{B}’ = \left(\begin{array}{c} B’_{11} & … & B’_{1n} \\ … & … & … \\ B’_{n1} & … & B’_{nn} \end{array} \right)
\end{align}
$$
このとき$\mathbf{x} = \mathbf{B}^{-1} (\mathbf{y} – \mathbf{a})$は下記のように表せる。
$$
\large
\begin{align}
\mathbf{x} &= \mathbf{B}^{-1} (\mathbf{y} – \mathbf{a}) \\
\mathbf{x} &= \mathbf{B}’ (\mathbf{y} – \mathbf{a}) \\
\left(\begin{array}{c} x_1 \\ … \\ x_n \end{array} \right) &= \left(\begin{array}{c} B’_{11} & … & B’_{1n} \\ … & … & … \\ B’_{n1} & … & B’_{nn} \end{array} \right) \left(\begin{array}{c} y_1 – a_1 \\ … \\ y_n – a_n \end{array} \right) \\
&= \left(\begin{array}{c} B’_{11}(y_1 – a_1)+…+B’_{1n}(y_n – a_n) \\ … \\ B’_{n1}(y_1 – a_1)+…+B’_{nn}(y_n – a_n) \end{array} \right)
\end{align}
$$

ここで、$J(\partial x / \partial y)$は下記のように計算できる。
$$
\large
\begin{align}
J(\partial x / \partial y) &= \left(\begin{array}{c} \partial x_1 / \partial y_1 & … & \partial x_1 / \partial y_n \\ … & … & … \\ \partial x_n / \partial y_1 & … & \partial x_n / \partial y_n \end{array} \right) \\
&= \left(\begin{array}{c} B’_{11} & … & B’_{1n} \\ … & … & … \\ B’_{n1} & … & B’_{nn} \end{array} \right) \\
&= \mathbf{B}^{-1}
\end{align}
$$

ここまでの議論により$J(\partial x / \partial y) = \mathbf{B}^{-1}$を示すことができる。

問題3.16の解答例

$$
\large
\begin{align}
f_{X,Y|Z}(x,y) = f_{X|Z}(x) f_{Y|Z}(y) \quad (3.18)
\end{align}
$$
上記の$(3.18)$式は条件付き確率の定義に基づいて、下記のように表すことができる。
$$
\large
\begin{align}
f_{X,Y|Z}(x,y) &= f_{X|Z}(x) f_{Y|Z}(y) \\
\frac{f_{X,Y,Z}(x,y,z)}{f_{Z}(z)} &= \frac{f_{X,Z}(x,z)}{f_{Z}(z)} \cdot \frac{f_{Y,Z}(y,z)}{f_{Z}(z)} \quad (1)
\end{align}
$$

ここで$(1)$式の両辺を$\displaystyle \frac{f_{Y,Z}(y,z)}{f_{Z}(z)}$で割ると下記のようになる。
$$
\large
\begin{align}
\frac{f_{X,Y,Z}(x,y,z)}{f_{Z}(z)} \cdot \frac{f_{Z}(z)}{f_{Y,Z}(y,z)} &= \frac{f_{X,Z}(x,z)}{f_{Z}(z)} \\
\frac{f_{X,Y,Z}(x,y,z)}{f_{Y,Z}(y,z)} &= \frac{f_{X,Z}(x,z)}{f_{Z}(z)}
\end{align}
$$
上記は$f_{X|Y,Z}(x) = f_{X|Z}(x)$を意味し、これは$(3.19)$式に一致する。

問題3.17の解答例

「$(3.18)$が成立 $\implies$ $f(x,y,z)=g(x,z)h(y,z)$」と「$f(x,y,z)=g(x,z)h(y,z)$ $\implies$ $(3.18)$が成立」に分けて示す。

・「$(3.18)$が成立 $\implies$ $f(x,y,z)=g(x,z)h(y,z)$」に関して
$$
\large
\begin{align}
f_{X,Y|Z}(x,y) = f_{X|Z}(x) f_{Y|Z}(y) \quad (3.18)
\end{align}
$$

上記の$(3.18)$式は条件付き確率の定義に基づいて、下記のように表すことができる。
$$
\large
\begin{align}
f_{X,Y|Z}(x,y) &= f_{X|Z}(x) f_{Y|Z}(y) \\
\frac{f_{X,Y,Z}(x,y,z)}{f_{Z}(z)} &= \frac{f_{X,Z}(x,z)}{f_{Z}(z)} \cdot \frac{f_{Y,Z}(y,z)}{f_{Z}(z)} \quad (1)
\end{align}
$$

ここで$(1)$式の両辺に$f_{Z}(z)$をかけると下記のようになる。
$$
\large
\begin{align}
\frac{f_{X,Y,Z}(x,y,z)}{f_{Z}(z)} \cdot f_{Z}(z) &= \frac{f_{X,Z}(x,z)}{f_{Z}(z)} \cdot \frac{f_{Y,Z}(y,z)}{f_{Z}(z)} \cdot f_{Z}(z) \\
f_{X,Y,Z}(x,y,z) &= f_{X,Z}(x,z) \cdot \frac{f_{Y,Z}(y,z)}{f_{Z}(z)}
\end{align}
$$
上記において、$\displaystyle g(x,y)=f_{X,Z}(x,z), h(y,z)=\frac{f_{Y,Z}(y,z)}{f_{Z}(z)}$とおくと、$f(x,y,z)=g(x,z)h(y,z)$が成立する。

・「$f(x,y,z)=g(x,z)h(y,z)$ $\implies$ $(3.18)$が成立」に関して
$f(x,y,z)=g(x,z)h(y,z)$のように表せる際に、下記のように$g_{Z}(z), h_{Z}(z)$を定義する。
$$
\large
\begin{align}
g_{Z}(z) &= \int g(x,z) dx \\
h_{Z}(z) &= \int h(y,z) dy
\end{align}
$$

このとき$f(x,y,z)=g(x,z)h(y,z)$より、下記のように表記することもできる。
$$
\large
\begin{align}
f_{X,Z}(x,z) &= g(x,z)h_{Z}(z) \\
f_{Y,Z}(y,z) &= g_{Z}(z)h(y,z) \\
f_{Z}(z) &= g_{Z}(z)h_{Z}(z)
\end{align}
$$

このとき条件付き確率分布の$f_{X,Y|Z}(x,y)$は下記のように表すことができる。
$$
\large
\begin{align}
f_{X,Y|Z}(x,y) &= \frac{f_{X,Y,Z}(x,y,z)}{f_{Z}(z)} \\
&= \frac{g(x,z)h(y,z)}{f_{Z}(z)} \\
&= \frac{f_{X,Z}(x,z)}{h_{Z}(z)} \cdot \frac{f_{Y,Z}(y,z)}{g_{Z}(z)} \cdot
\frac{1}{f_{Z}(z)} \\
&= \frac{f_{X,Z}(x,z)}{f_{Z}(z)} \cdot \frac{f_{Y,Z}(y,z)}{g_{Z}(z)h_{Z}(z)} \\
&= \frac{f_{X,Z}(x,z)}{f_{Z}(z)} \cdot \frac{f_{Y,Z}(y,z)}{f_{Z}(z)} \\
&= f_{X|Z}(x) f_{Y|Z}(y)
\end{align}
$$
上記は$(3.18)$式に一致する。

問題3.18の解答例

$$
\large
\begin{align}
Z_i &= X_iY_i \\
X_i-Z_i &= X_i – X_iY_i \\
&= X_i(1-Y_i) \\
Y_i-Z_i &= Y_i – X_iY_i \\
&= (1-X_i)Y_i \\
1 – X_i – Y_i + Z_i &= 1 – X_i – Y_i + X_iY_i \\
&= (1 – X_i)(1 – Y_i)
\end{align}
$$

上記のように考え、$X_i, Y_i \in \left\{0, 1 \right\}$であることを考慮すると、$(Z_i, X_i-Z_i, Y_i-Z_i, 1-X_i-Y_i+Z_i)$はどれか$1$つのみが$1$でその他が$0$に対応する。これは$4$次元のベルヌーイ試行になる。また、$(Z_i, X_i-Z_i, Y_i-Z_i, 1-X_i-Y_i+Z_i)$のそれぞれの和が$(Z, X-Z, Y-Z, n-X-Y+Z)$に対応するので、これは$4$項分布に従うことを意味する。このとき、確率変数$(Z_i, X_i-Z_i, Y_i-Z_i, 1-X_i-Y_i+Z_i)$の成功確率は$p_1p_2, p_1(1-p_2), (1-p_1)p_2, (1-p_1)(1-p_2)$にそれぞれ対応する。

この$4$項分布の確率関数$P(z,x-z,y-z,n-x-y+z|p_1p_2, p_1(1-p_2), (1-p_1)p_2, (1-p_1)(1-p_2))$は下記のように表すことができる。
$$
\large
\begin{align}
& P(z,x-z,y-z,n-x-y+z|p_1p_2, p_1(1-p_2), (1-p_1)p_2, (1-p_1)(1-p_2)) \\
&= \frac{n!}{z!(x-z)!(y-z)!(n-x-y+z)!} (p_1p_2)^{z} (p_1(1-p_2))^{x-z} ((1-p_1)p_2)^{y-z} ((1-p_1)(1-p_2))^{n-x-y+z} \\
&= \frac{n!}{z!(x-z)!(y-z)!(n-x-y+z)!} p_1^{z+x-z}p_2^{z+y-z}(1-p_1)^{y-z+n-x-y+z}(1-p_2)^{x-z+n-x-y+z} \\
&= \frac{n!}{z!(x-z)!(y-z)!(n-x-y+z)!} p_1^{x}p_2^{y}(1-p_1)^{n-x}(1-p_2)^{n-y}
\end{align}
$$

また、$X, Y$はそれぞれ独立に二項分布に従い、それぞれの確率関数$P(x,n-x|p_1,n), P(y,n-y|p_2,n)$は下記のように表すことができる。
$$
\large
\begin{align}
P(x,n-x|p_1,n) &= \frac{n!}{x!(n-x)!} p_1^{x}(1-p_1)^{n-x} \\
P(y,n-y|p_2,n) &= \frac{n!}{y!(n-y)!} p_1^{y}(1-p_2)^{n-y}
\end{align}
$$

よって、$X, Y$が与えられた際の$Z$の条件付き分布$P(X=x,Y=y|Z=z)$は下記のようになる。
$$
\large
\begin{align}
& P(X=x,Y=y|Z=z) \\
&= \frac{P(z,x-z,y-z,n-x-y+z|p_1p_2, p_1(1-p_2), (1-p_1)p_2, (1-p_1)(1-p_2))}{P(x,n-x|p_1,n)P(y,n-y|p_2,n)} \\
&= \frac{n! p_1^{x}p_2^{y}(1-p_1)^{n-x}(1-p_2)^{n-y}}{z!(x-z)!(y-z)!(n-x-y+z)!} \times \frac{x!(n-x)!}{n! p_1^{x}(1-p_1)^{n-x}} \times \frac{y!(n-y)!}{n! p_2^{y}(1-p_2)^{n-y}} \\
&= \frac{n!}{z!(x-z)!(y-z)!(n-x-y+z)!} \times \frac{x!(n-x)!}{n!} \times \frac{y!(n-y)!}{n!} \\
&= \frac{x!(n-x)!y!(n-y)!}{n!z!(x-z)!(y-z)!(n-x-y+z)!}
\end{align}
$$

・考察
超幾何分布の$N,M,n,k$を解釈すると、「壺に玉が赤玉が$M$個、白玉が$N-M$個の計$N$個入っており、$n$個非復元抽出を行った際の赤玉の個数が$k$個になる際の確率」を考える確率分布である。
これを$(1)$式に置き換えると、「全$n$個のうちの$x$個が赤、$n-x$個が白の際に、$y$個抽出した際に$z$個が赤玉である確率を表す」と考えることができる。
ここで「赤かつ選ばれた場合」を$z$個とカウントしているが、「$Z_i=X_iY_i$は$X_i=1$かつ$Y_i=1$を表す」と考えることで、ここで論じられた$4$項分布と超幾何分布の関連を見て取ることができる。

問題3.19の解答例

$$
\large
\begin{align}
u &= xy \quad (1) \\
v &= \frac{x}{y} \quad (2)
\end{align}
$$

上記に関して逆変換の導出を行う。$(2)$式を変形した$x=vy$を$(1)$式に代入する。
$$
\large
\begin{align}
u &= vy \times y \\
y^2 &= \frac{u}{v} \\
y &= \sqrt{\frac{u}{v}}
\end{align}
$$

上記で得られた$y$を$x=vy$に代入すると下記が得られる。
$$
\large
\begin{align}
x &= vy \\
&= v \sqrt{\frac{u}{v}} \\
&= \sqrt{uv}
\end{align}
$$

よって、下記のような逆変換が得られる。
$$
\large
\begin{align}
x &= \sqrt{uv} \quad (3) \\
y &= \sqrt{\frac{u}{v}} \quad (4)
\end{align}
$$

$(3)$式、$(4)$式で表した逆変換に基づいて、ヤコビ行列$\mathbf{J}$を下記のように考える。
$$
\large
\begin{align}
\mathbf{J} &= \left(\begin{array}{cc} \frac{\partial x}{\partial u} & \frac{\partial x}{\partial v} \\ \frac{\partial y}{\partial u} & \frac{\partial y}{\partial v} \end{array} \right) \\
&= \left(\begin{array}{cc} \frac{\partial}{\partial u} \sqrt{uv} & \frac{\partial}{\partial v} \sqrt{uv} \\ \frac{\partial}{\partial u} \sqrt{\frac{u}{v}} & \frac{\partial}{\partial v} \sqrt{\frac{u}{v}} \end{array} \right) \\
&= \frac{1}{2} \left(\begin{array}{cc} \sqrt{\frac{v}{u}} & \sqrt{\frac{u}{v}} \\ \sqrt{\frac{1}{uv}} & -\sqrt{\frac{u}{v^3}} \end{array} \right) \quad (5)
\end{align}
$$

$(5)$式を元にヤコビアン$|\det \mathbf{J}|$の計算を行う。
$$
\large
\begin{align}
|\det \mathbf{J}| &= \frac{1}{2^2} \left| \sqrt{\frac{v}{u}} \cdot \left( -\sqrt{\frac{u}{v^3}} \right) – \sqrt{\frac{u}{v}} \cdot \sqrt{\frac{1}{uv}} \right| \\
&= \frac{1}{4} \left| -\frac{1}{v} – \frac{1}{v} \right| \\
&= \frac{1}{2v} \quad (6)
\end{align}
$$
$(6)$式の導出にあたっては$x \geq 0, y \geq 0$より$v$が非負であることを前提に絶対値を外した。

次に確率密度関数について考える。$X,Y$に関する確率密度関数の$f(x,y)$は、下記のように表すことができる。
$$
\large
\begin{align}
f(x,y) &= 1, \quad if \quad 0 \leq x \leq 1 \quad and \quad 0 \leq y \leq 1 \\
&= 0, \quad otherwise
\end{align}
$$
$U,V$に関する確率密度関数を$g(u,v)$とすると、$\displaystyle g(u,v) = f(x,y)|\det \mathbf{J}|$が成立する。変換式より$f(x,y)=0$の場合は$g(u,v)=0$であるので、以下は$0 \leq x \leq 1, 0 \leq y \leq 1$に対応する$u,v$の範囲のみを考える。

$0 \leq x \leq 1, 0 \leq y \leq 1$と$(3)$式、$(4)$式より、$u,v$に関して下記の式が成立する。
・$0 \leq x \leq 1$
$$
\large
\begin{align}
0 \leq &\sqrt{uv} \leq 1 \\
0 \leq &uv \leq 1 \\
0 \leq &u \leq \frac{1}{v} \quad (7)
\end{align}
$$
・$0 \leq y \leq 1$
$$
\large
\begin{align}
0 \leq &\sqrt{\frac{u}{v}} \leq 1 \\
0 \leq &\frac{u}{v} \leq 1 \\
0 \leq &u \leq v \quad (8)
\end{align}
$$
不等号の計算にあたっては$v$が非負であることを前提に計算を行った。

$(7)$式、$(8)$式を元に、$0 \leq x \leq 1, 0 \leq y \leq 1$に対応する$u,v$に対して$\displaystyle g(u,v) = f(x,y)|\det \mathbf{J}|$を考える。
$$
\large
\begin{align}
g(u,v) &= f(x,y)|\det \mathbf{J}| \\
&= \frac{1}{2v}, \quad if \quad 0 \leq u \leq \frac{1}{v} \quad and \quad 0 \leq u \leq v \quad (9)
\end{align}
$$

また、$V$に関する周辺密度関数$g(v)$は$(9)$式を$u$に関して積分することで得られる。
$$
\large
\begin{align}
g(v) &= \int_{0}^{\infty} g(u,v) du \\
&= \int_{0}^{\max \{v,1/v\}} \frac{1}{2v} du \\
&= \left[ \frac{u}{2v} \right]_{0}^{\max \{v,1/v\}} \\
&= \frac{1}{2v} \max \{v,1/v\} \\
&= \frac{1}{2} \max \{1,1/v^2\}
\end{align}
$$

・考察
一様分布に関しては式だけではわかりにくいため、以下図示を行う。

まず$g(u,v)$に関しては、上記のように図示を行った。赤線があるところが確率密度関数の$g(u,v)$が$0$ではない領域を表しており、$v$が$0$に近い方が確率密度関数の値が大きくなることは線の幅で表した。

次に周辺密度関数の$g(v)$に関しては上記のように表した。$v \leq 1$では一様分布であり、$v>1$では$1/v^2$に一致することを抑えておくと良いと思われる。

問題3.20の解答例

確率変数$Z$が連続である場合と離散である場合に分けて示す。

・$Z$が連続
$E[|Z-c|]$は確率密度関数の$f(z)$を用いて下記のように表すことができる。
$$
\large
\begin{align}
E[|Z-c|] = \int_{-\infty}^{c} -(x-c) f(x) dx + \int_{c}^{\infty} (x-c) f(x) dx
\end{align}
$$

上記を$c$で微分すると下記のようになる。
$$
\large
\begin{align}
\frac{d E[|Z-c|]}{dc} &= \int_{-\infty}^{c} f(x) dx – \int_{c}^{\infty} f(x) dx \\
&= P(Z \leq c) – P(Z > c)
\end{align}
$$

$c$に関する最小値を考えるので、$\displaystyle \frac{d E[|Z-c|]}{dc} = 0$より、下記が成立する。
$$
\large
\begin{align}
\frac{d E[|Z-c|]}{dc} &= 0 \\
P(Z \leq c) – P(Z > c) &= 0 \\
P(Z \leq c) &= P(Z > c)
\end{align}
$$

確率の定義より$P(Z \leq c) + P(Z > c) = 1$となるので、下記が成立する。
$$
\large
\begin{align}
P(Z \leq c) = P(Z > c) = \frac{1}{2}
\end{align}
$$
上記は$c$がメディアンであることを表すので、$E[|Z-c|]$を最小にする定数$c$は$Z$の分布のメディアンである。

・$Z$が離散
$E[|Z-c|]$は確率関数の$p(z)$を用いて下記のように表すことができる。
$$
\large
\begin{align}
E[|Z-c|] = \sum_{x=-\infty}^{c} -(x-c) p(x) + \sum_{x=c+1}^{\infty} (x-c) p(x)
\end{align}
$$

上記を$c$で微分すると下記のようになる。
$$
\large
\begin{align}
\frac{d E[|Z-c|]}{dc} = \sum_{x=-\infty}^{c} p(x) – \sum_{x=c}^{\infty} p(x) \\
P(Z \leq c) – P(Z > c) &= 0 \\
P(Z \leq c) &= P(Z > c)
\end{align}
$$

上記は連続の場合と同じ式であり、連続の場合と同様に$P(Z \leq c) + P(Z > c) = 1$を用いて、$E[|Z-c|]$を最小にする定数$c$は$Z$の分布のメディアンであることを示すことができる。

問題3.21の解答例