Ch.6 「十分統計量」の章末問題の解答例 〜現代数理統計学(学術図書出版社)〜

当記事は「現代数理統計学(学術図書出版社)」の読解サポートにあたってChapter.6の「十分統計量」の章末問題の解説について行います。
基本的には書籍の購入者向けの解説なので、まだ入手されていない方は購入の上ご確認ください。また、解説はあくまでサイト運営者が独自に作成したものであり、書籍の公式ページではないことにご注意ください。(そのため著者の意図とは異なる解説となる可能性はあります)

↓下記が公式の解答なので、正確にはこちらを参照ください。
https://www.gakujutsu.co.jp/text/isbn978-4-7806-0860-1/

章末の演習問題について

問題6.1の解答例

$P(X_i=x)=p(1-p)^x$より、同時確率$P(X_1=x_1, X_2=x_2, …, X_n=x_n)$は下記のように計算できる。
$$
\large
\begin{align}
P(X_1=x_1, X_2=x_2, &…, X_n=x_n) = \prod_{i=1}^{n} p(1-p)^{x_i} \\
&= p^{n} (1-p)^{x_1} (1-p)^{x_2} … (1-p)^{x_n} \\
&= p^{n} (1-p)^{\sum_{i=1}^{n} x_i}
\end{align}
$$
$\mathbf{x}=(x_1,x_2,…,x_n)$を表すと考える。ここで分解定理が「同時確率密度関数が$f(t,\mathbf{x}|\theta)=g(t|\theta)h(\mathbf{x})$で表現できるか」について取り扱っていると考えると、幾何分布においては下記のようにそれぞれの関数があてはまると考えることができる。
$$
\large
\begin{align}
f(t,x|\theta) &= P(X_1=x_1, X_2=x_2, …, X_n=x_n) \\
&= p^{n} (1-p)^{\sum_{i=1}^{n} x_i} \\
g(t|\theta) &= p^{n} (1-p)^{\sum_{i=1}^{n} x_i} \\
&= p^{n} (1-p)^{t} \\
t &= \sum_{i=1}^{n} x_i \\
h(x) &= 1
\end{align}
$$
したがって、$\displaystyle T = \sum_{i=1}^{n} X_i$が十分統計量となる。

問題6.2の解答例

正規分布$N(0,\sigma^2)$の同時確率密度関数$f(X_1=x_1,X_2=x_2,…,X_n=x_n|\sigma^2)$は下記のように表すことができる。
$$
\large
\begin{align}
f(X_1=x_1,X_2=x_2,&…,X_n=x_n|\sigma^2) = \prod_{i=1}^{n} f(X_i=x_i|\sigma^2) \\
&= \prod_{i=1}^{n} \frac{1}{(2 \pi \sigma^2)^{1/2}} exp \left( -\frac{x_i^2}{2 \sigma^2} \right) \\
&= \frac{1}{(2 \pi \sigma^2)^{n/2}} exp \left( -\frac{x_1^2}{2 \sigma^2} \right) … exp \left( -\frac{x_n^2}{2 \sigma^2} \right) \\
&= \frac{1}{(2 \pi \sigma^2)^{n/2}} exp \left( -\frac{x_1^2}{2 \sigma^2} – \frac{x_2^2}{2 \sigma^2} – … – \frac{x_n^2}{2 \sigma^2} \right) \\
&= \frac{1}{(2 \pi \sigma^2)^{n/2}} exp \left( – \sum_{i=1}^{n} \frac{x_i^2}{2 \sigma^2} \right) \\
&= \frac{1}{(2 \pi \sigma^2)^{n/2}} exp \left( – \frac{1}{2\sigma^2} \sum_{i=1}^{n} x_i^2 \right)
\end{align}
$$
$\mathbf{x}=(x_1,x_2,…,x_n)$を表すと考え、分解定理の$f(t,\mathbf{x}|\sigma^2)=g(t|\sigma^2)h(\mathbf{x})$を考えるにあたって、下記のようにそれぞれの関数を考える。
$$
\large
\begin{align}
f(t,\mathbf{x}|\sigma^2) &= \frac{1}{(2 \pi \sigma^2)^{n/2}} exp \left( – \frac{1}{2 \sigma^2} \sum_{i=1}^{n} x_i^2 \right) \\
g(t|\sigma^2) &= \frac{1}{(2 \pi \sigma^2)^{n/2}} exp \left( – \frac{1}{2 \sigma^2} \sum_{i=1}^{n} x_i^2 \right) \\
&= \frac{1}{(2 \pi \sigma^2)^{n/2}} exp \left( – \frac{t}{2 \sigma^2} \right) \\
t &= \sum_{i=1}^{n} x_i^2 \\
h(\mathbf{x}) &= 1
\end{align}
$$
上記より、$\displaystyle T = \sum_{i=1}^{n} X_i^2$が$\sigma^2$に関する十分統計量となる。

また、$\displaystyle t = \sum_{i=1}^{n} x_i^2$のように$t$を設定すると、(1)の同時確率密度関数は下記のように表すことができる。
$$
\large
\begin{align}
f(X_1=x_1,X_2=x_2,…,X_n=x_n|\sigma^2) = \frac{1}{(2 \pi \sigma^2)^{n/2}} exp \left( – \frac{1}{2 \sigma^2} t \right)
\end{align}
$$
上記より、半径$\sqrt{t}$の超球上一定であることが確認できる。よって、条件付き確率密度関数は半径$\sqrt{t}$の超球上の一様分布であることが確認できる。

問題6.3の解答例

$n$次元ベクトル$\mathbf{p}, \bar{\mathbf{x}}$を下記のように考える。
$$
\large
\begin{align}
\mathbf{p} &= \left(\begin{array}{c} X_1 – \bar{X} \\ … \\ X_n – \bar{X} \end{array} \right) \\
\bar{\mathbf{x}} &= \left(\begin{array}{c} \bar{X} \\ … \\ \bar{X} \end{array} \right)
\end{align}
$$

このとき、$n$次元ベクトル$\mathbf{p}, \bar{\mathbf{x}}$に関して下記が成立する。
$$
\large
\begin{align}
\mathbf{p} \cdot \bar{\mathbf{x}} &= \left(\begin{array}{c} X_1 – \bar{X} \\ … \\ X_n – \bar{X} \end{array} \right) \cdot \left(\begin{array}{c} X_1 – \bar{X} \\ … \\ X_n – \bar{X} \end{array} \right) \\
&= \sum_{i=1}^{n} (X_i – \bar{X})\bar{X} \\
&= \sum_{i=1}^{n} X_i \bar{X} – \sum_{i=1}^{n} \bar{X}^2 \\
&= \bar{X} \sum_{i=1}^{n} X_i – n \bar{X}^2 \\
&= \bar{X} \cdot n \bar{X}- n \bar{X}^2 \\
&= 0
\end{align}
$$
上記より、$\mathbf{p}$と$\bar{\mathbf{x}}$が直交することがわかる。

前問と同様に考え、$\displaystyle t_2 = \sum_{i=1}^{n} (X_i – \bar{X})^2$のようにおくと、$\mathbf{p}$は半径$\displaystyle \sqrt{t_2}$の超球のうち、$\bar{\mathbf{x}}$と直交する集合上の一様分布に従うことがわかる。

問題6.4の解答例

$$
\large
\begin{align}
\mathit{I}_{[\underset{i}{\min} x_i \geq \theta_1]} (x_1, x_2, …, x_n) &= 1 \quad (\underset{i}{\min} x_i \geq \theta_1) \\
&= 0 \quad (otherwise)
\end{align}
$$
$$
\large
\begin{align}
\mathit{I}_{[\underset{i}{\max} x_i \leq \theta_2]} (x_1, x_2, …, x_n) &= 1 \quad (\underset{i}{\max} x_i \leq \theta_2) \\
&= 0 \quad (otherwise)
\end{align}
$$
上記のように指示関数(indicator function)の$\displaystyle \mathit{I}_{[\underset{i}{\min} x_i \geq \theta_1]} (x_1, x_2, …, x_n), \mathit{I}_{[\underset{i}{\max} x_i \leq \theta_2]} (x_1, x_2, …, x_n)$を考えると、一様分布の同時確率密度関数の$f(x_1, x_2, …, x_n)$は下記のように表すことができる。
$$
\large
\begin{align}
f(x_1, x_2, …, x_n) &= \frac{1}{(\theta_2-\theta_1)^n} \mathit{I}_{[\underset{i}{\min} x_i \geq \theta_1]} (x_1, x_2, …, x_n) \mathit{I}_{[\underset{i}{\max} x_i \leq \theta_2]} (x_1, x_2, …, x_n)
\end{align}
$$

上記のように同時確率密度関数が書けることにより、分解定理に基づいて$\mathbf{T}=(\underset{i}{\min} x_i, \underset{i}{\max} x_i)$が$(\theta_1, \theta_2)$に関する十分統計量となる。

条件付き分布に関しては、$x_1, x_2, …, x_n$の中から最小値となる$x_i$と最大値となる$x_j$が無作為に選ばれ、その他の$x_k$が独立に一様分布の$U[\underset{i}{\min} x_i, \underset{i}{\max} x_i]$に従うと考えればよい。

問題6.5の解答例

$$
\large
\begin{align}
f(x,\theta) = h(x)exp \left( \sum_{j=1}^{k} T_j(x) \psi_j(\theta) – c(\theta) \right) \quad (1)
\end{align}
$$
上記の指数型分布族の式の形で二項分布と正規分布が表せることを以下確認する。

・(6.15)式と二項分布
$$
\large
\begin{align}
P(x|n,p) = {}_n C_x p^{x}(1-p)^{n-x}
\end{align}
$$
二項分布$Bin(n,p)$の確率関数は上記のように表すことができる。上記の$p^{x}(1-p)^{n-x}$に関して、$p^{x}(1-p)^{n-x} = exp(log(p^{x}(1-p)^{n-x}))$の計算を行う。
$$
\large
\begin{align}
P(x|n,p) &= {}_n C_x p^{x}(1-p)^{n-x} \\
&= {}_n C_x exp(\log{(p^{x}(1-p)^{n-x})}) \\
&= {}_n C_x exp(x\log{p} + (n-x)\log{(1-p)}) \\
&= {}_n C_x exp(x(\log{p}-\log{(1-p)}) + n\log{(1-p)}) \\
&= {}_n C_x exp \left( x \log{\frac{p}{1-p}} + n\log{(1-p)} \right) \quad (2)
\end{align}
$$

(1)式の指数型分布族の定義式において$k=1$とすると下記のようになる。
$$
\large
\begin{align}
f(x,\theta) = h(x)exp \left( T_1(x) \psi_1(\theta) – c(\theta) \right) \quad (3)
\end{align}
$$
(2)式と(3)式を見比べることで、下記のように(6.15)式を導出できる。
$$
\large
\begin{align}
\theta &= p \\
h(x) &= {}_n C_x \\
T_1(x) &= x \\
\psi_1(p) &= \log{\frac{p}{1-p}} \\
c(p) &= -n\log{(1-p)}
\end{align}
$$

・(6.16)式と正規分布
$$
\large
\begin{align}
P(x_1,x_2,…,x_n|\mu,\sigma^2) = \prod_{i=1}^{n} \frac{1}{\sqrt{2 \pi \sigma^2}} exp \left( – \frac{(x_i-\mu)^2}{2 \sigma^2} \right)
\end{align}
$$
標本$(x_1,x_2,…,x_n)$が観測されたとき、正規分布$N(\mu,\sigma^2)$の同時確率分布は上記のように表すことができる。上記は下記のように変形できる。
$$
\large
\begin{align}
P(x_1,x_2,…,x_n|\mu,\sigma^2) &= \prod_{i=1}^{n} \frac{1}{\sqrt{2 \pi \sigma^2}} exp \left( – \frac{(x_i-\mu)^2}{2 \sigma^2} \right) \\
&= \frac{1}{(2 \pi \sigma^2)^{n/2}} \prod_{i=1}^{n} exp \left( – \frac{(x_i-\mu)^2}{2 \sigma^2} \right) \\
&= \frac{1}{(2 \pi \sigma^2)^{n/2}} exp \left( – \sum_{i=1}^{n} \frac{(x_i-\mu)^2}{2 \sigma^2} \right) \\
&= \frac{1}{(2 \pi \sigma^2)^{n/2}} exp \left( – \sum_{i=1}^{n} \frac{x_i^2 – 2x_i \mu + \mu^2}{2 \sigma^2} \right) \\
&= \frac{1}{(2 \pi \sigma^2)^{n/2}} exp \left( – \frac{1}{2 \sigma^2} \sum_{i=1}^{n} x_i^2 + \frac{\mu}{\sigma^2} \sum_{i=1}^{n} x_i – \frac{\mu^2}{2 \sigma^2} \right) \\
&= \frac{1}{(2 \pi \sigma^2)^{n/2}} exp \left(\frac{n \mu}{\sigma^2} \bar{x} – \frac{1}{2 \sigma^2} \sum_{i=1}^{n} x_i^2 – \frac{\mu^2}{2 \sigma^2} \right) \\
&= exp \left(\frac{n \mu}{\sigma^2} \bar{x} – \frac{1}{2 \sigma^2} \sum_{i=1}^{n} x_i^2 – \frac{\mu^2}{2 \sigma^2} – \frac{n}{2}\log{2 \pi \sigma^2} \right) \quad (4)
\end{align}
$$

(1)式の指数型分布族の定義式において$k=2$とすると下記のようになる。
$$
\large
\begin{align}
f(x,\theta) = h(x)exp \left( T_1(x) \psi_1(\theta) + T_2(x) \psi_2(\theta) – c(\theta) \right) \quad (5)
\end{align}
$$
(4)式と(5)式を見比べることで、下記のように(6.16)式を導出できる。
$$
\large
\begin{align}
\theta &= (\mu,\sigma^2) \\
h(x) &= 1 \\
T_1(x) &= \bar{x} \\
T_2(x) &= \sum_{i=1}^{n} x_i^2 \\
\psi_1(p) &= \frac{n \mu}{\sigma^2} \\
\psi_2(p) &= – \frac{1}{2 \sigma^2} \\
c(\mu,\sigma^2) &= \frac{\mu^2}{2 \sigma^2} + \frac{n}{2}\log{2 \pi \sigma^2}
\end{align}
$$
(6.16)式の表記に合わせて作成したが、$\displaystyle h(x) = \frac{1}{(2 \pi \sigma^2)^{n/2}}, c(\mu,\sigma^2) = \frac{\mu^2}{2 \sigma^2}$でも良いと思われる。

問題6.6の解答例

$$
\large
\begin{align}
f(x,\theta) = h(x)exp \left( \sum_{j=1}^{k} T_j(x) \psi_j(\theta) – c(\theta) \right) \quad (1)
\end{align}
$$
上記の指数型分布族の式の形でポアソン分布、負の2項分布、ガンマ分布が表せることを以下確認する。

・ポアソン分布
$$
\large
\begin{align}
P(x_1,x_2,…,x_n|\lambda) &= \prod_{i=1}^{n} \frac{\lambda^{x_i} exp(-\lambda)}{x_i!} \\
&= \prod_{i=1}^{n} \frac{exp(\log{\lambda^{x_i}}) exp(-\lambda)}{x_i!} \\
&= \prod_{i=1}^{n} \frac{exp(x_i\log{\lambda}) exp(-\lambda)}{x_i!} \\
&= \prod_{i=1}^{n} \frac{exp(x_i\log{\lambda} – \lambda )}{x_i!} \\
&= \frac{1}{\prod_{i=1}^{n} x_i!} exp \left( \sum_{i=1}^{n} (x_i\log{\lambda} – \lambda) \right) \\
&= \left( \prod_{i=1}^{n} x_i! \right)^{-1} exp \left( n\bar{x}\log{\lambda} – n\lambda \right) \quad (2)
\end{align}
$$
標本$(x_1,x_2,…,x_n)$が観測されたとき、ポアソン分布$Po(\lambda)$の同時確率分布は上記のように変形することができる。

(1)式の指数型分布族の定義式において$k=1$とすると下記のようになる。
$$
\large
\begin{align}
f(x,\theta) = h(x)exp \left( T_1(x) \psi_1(\theta) – c(\theta) \right) \quad (3)
\end{align}
$$
(2)式と(3)式を見比べることで、下記のようにそれぞれの関数を表すことができる。
$$
\large
\begin{align}
\theta &= \lambda \\
h(x) &= \left( \prod_{i=1}^{n} x_i! \right)^{-1} \\
T_1(x) &= \bar{x} \\
\psi_1(\lambda) &= n \log{\lambda} \\
c(\lambda) &= – n \lambda
\end{align}
$$

問題6.7の解答例

問題6.8の解答例

$T$が強い意味での最小十分であると考え、$U=g(T)$が十分であると考える。このとき強い意味での最小十分性より$T=h(U)$ともできることより、$g^{-1}=h$が成立し$g$は1対1となる。したがってこのとき$T$は弱い意味でも最小十分となる。

次に強い意味での最小十分統計量を$T$、弱い意味での最小十分統計量を$S$とする。このとき$S$は十分であるから$T=h(S)$のように書くことができる。ここで$S$と$T$は1対1対応する必要があるので、$h$は1対1の対応となる。よってこのとき$S$は強い意味でも最小十分となる。

問題6.9の解答例

標本空間$\mathscr{X} = \{ 0,1 \}^4$は0か1の値を4回選び、ベクトルを考えることで表現できる。$2^4$通りを書き出すと下記のようになる。
$$
\large
\begin{align}
&\left(\begin{array}{c} 0 \\ 0 \\ 0 \\ 0 \end{array} \right), \left(\begin{array}{c} 0 \\ 0 \\ 0 \\ 1 \end{array} \right), \left(\begin{array}{c} 0 \\ 0 \\ 1 \\ 0 \end{array} \right), \left(\begin{array}{c} 0 \\ 0 \\ 0 \\ 1 \end{array} \right), \left(\begin{array}{c} 0 \\ 1 \\ 0 \\ 0 \end{array} \right), \left(\begin{array}{c} 0 \\ 1 \\ 0 \\ 1 \end{array} \right), \left(\begin{array}{c} 0 \\ 1 \\ 1 \\ 0 \end{array} \right), \left(\begin{array}{c} 0 \\ 1 \\ 0 \\ 1 \end{array} \right), \\
&\left(\begin{array}{c} 1 \\ 0 \\ 0 \\ 0 \end{array} \right), \left(\begin{array}{c} 1 \\ 0 \\ 0 \\ 1 \end{array} \right), \left(\begin{array}{c} 1 \\ 0 \\ 1 \\ 0 \end{array} \right), \left(\begin{array}{c} 1 \\ 0 \\ 0 \\ 1 \end{array} \right), \left(\begin{array}{c} 1 \\ 1 \\ 0 \\ 0 \end{array} \right), \left(\begin{array}{c} 1 \\ 1 \\ 0 \\ 1 \end{array} \right), \left(\begin{array}{c} 1 \\ 1 \\ 1 \\ 0 \end{array} \right), \left(\begin{array}{c} 1 \\ 1 \\ 0 \\ 1 \end{array} \right)
\end{align}
$$
上記に対し、上二つの要素の和と下二つの要素の和をそれぞれ$Y_1=X_1+X_2, Y_2=X_3+X_4$のように定義し、$(Y_1,Y_2)$に対して$(0,0), (1,0), (0,1), (2,0), (0,2), (1,1), (2,1), (1,2), (2,2)$のように分けて部分集合に分割を行ったのが(6.19)である。

$(0,0), (2,0), (0,2) (2,2)$に関しては1パターンしかないのでそれぞれ1通り、$(1,0), (0,1), (2,1), (1,2)$については2パターンあるのでそれぞれ2通り、$(1,1)$については4パターンあるのでそれぞれ4通りが対応すると考えれば全$1 \times 4 + 2 \times 4 + 4 = 16$通りとなる。

問題6.10の解答例

「$P_g$が$P_f$より粗い分割である $\iff$ ある関数$h$が存在して$f(x)=h(g(x))$のように書ける」を示す。必要十分条件を示すにあたっては、それぞれ分けて考える方がわかりやすいので、以下では必要条件と十分条件にそれぞれ分けて考える。

・必要条件
$f(x) = h(g(x))$と書けるとき、$g(x)=g(x’)$なら$f(x)=h(g(x))=h(g(x’))=f(x’)$より、$g$による特定の同値類は$f$の同値類の部分集合となる。よって、「$P_f$が$P_g$より粗い分割である」は「ある関数$h$が存在して$f(x)=h(g(x))$のように書ける」の必要条件である。

・十分条件
$P_f$が$P_g$より粗い分割となるとき、$a=g(x)=g(x’)$となる$P_g$の同値類は$b=f(x)=f(x’)$となる同値類の部分集合となる。この時、$a=g(x)$の全ての地域に関して$b=h(a)$が成立するような$h$を考えると、$f(x)=h(g(x))$のように書ける関数$h$が定まる。

問題6.11の解答例

前問より、「$P_f$が$P_g$より粗い分割である $\iff$ ある関数$h$が存在して$f(x)=h(g(x))$のように書ける」が成立する。よって、「$P_T$が$P_U$より粗い分割である $\iff$ ある関数$h$が存在して$T(x)=h(S(x))$のように書ける」が成立する。

統計量$T$が強い意味での最小十分統計量であるための必要十分条件は「任意の十分統計量$S$に対してある$h$が存在して$T=h(S)$となる」とされるが、これは$T(x)=h(S(x))$より示すことができる。

・直感的な解釈
「最小十分統計量」は「他の十分統計量」に比較して制約の少ない統計量であり、十分統計量の値による標本空間の分割が比較的少ない分け方である。問題6.9で取り扱ったように、統計量が最小十分統計量よりも多い場合は標本空間の分割が多くなり、全ての標本を保持するのと近しい空間分割となる。

問題6.12の解答例

$$
\large
\begin{align}
f(x,\theta) = h(x,x’)f(x’,\theta)
\end{align}
$$
上記の式において、$h(x,x’)$について下記が導出できる。
$$
\large
\begin{align}
f(x,\theta) &= h(x,x’)f(x,\theta) \\
1 &= h(x,x’) \\
h(x,x’) &= 1
\end{align}
$$

次に$h(x,x’)$について下記が成立する。
$$
\large
\begin{align}
f(x,\theta) &= h(x,x’)f(x’,\theta) \quad (1) \\
f(x’,\theta) &= h(x’,x)f(x,\theta) \quad (2)
\end{align}
$$
(1)と(2)の両辺を掛け合わせて下記のように$h(x,x’)$に関して解く。
$$
\large
\begin{align}
f(x,\theta)f(x’,\theta) &= h(x,x’)h(x’,x)f(x’,\theta)f(x,\theta) \\
1 &= h(x,x’)h(x’,x) \\
h(x,x’) &= \frac{1}{h(x’,x)}
\end{align}
$$

次に、$h(x,x^{”})$に関しても導出を行う。
$$
\large
\begin{align}
f(x,\theta) &= h(x,x’)f(x’,\theta) \quad (3) \\
f(x,\theta) &= h(x,x^{”})f(x^{”},\theta) \quad (4) \\
f(x’,\theta) &= h(x’,x^{”})f(x^{”},\theta) \quad (5)
\end{align}
$$
$(4)$の左辺と右辺を入れ替えると下記のようになる。
$$
\large
\begin{align}
h(x,x^{”})f(x^{”},\theta) &= f(x,\theta) \quad (4)’
\end{align}
$$
$(3), (4)’, (5)$の両辺を掛け合わせることで下記が導出できる。
$$
\large
\begin{align}
f(x,\theta)h(x,x^{”})f(x^{”},\theta)f(x’,\theta) &= h(x,x’)f(x’,\theta)f(x,\theta)h(x’,x^{”})f(x^{”},\theta) \\
h(x,x^{”}) &= h(x,x’)h(x’,x^{”})
\end{align}
$$

ここまでの導出により、離散分布の場合に考えると任意の特定の同値類の2点での確率の比が$h(x,x’)$で与えられ、$\theta$に依存しないことがわかる。

上記までを(6.20)にあてはめて考えると、「$x \sim x’$が同値」で、「$x \sim x’$を用いた分割は強い意味での最小十分な分割である」といえる。

問題6.13の解答例

一様分布$U[a,b]$の同時確率密度関数$f_{a,b}(x_1, x_2, …, x_n)$は問題6.4と同様に考えることで、下記のように表すことができる。
$$
\large
\begin{align}
f_{a,b}(x_1, x_2, …, x_n) &= \frac{1}{(b-a)^n} \mathit{I}_{[\underset{i}{\min} x_i \geq a]} (x_1, x_2, …, x_n) \mathit{I}_{[\underset{i}{\max} x_i \leq b]} (x_1, x_2, …, x_n)
\end{align}
$$

上記において分解定理の$p(x_1, …, x_n) = g(T(x_1,…,x_n))h(x)$を考えると、$h(x)=1$とおけるので、(6.20)式より、$\mathbf{T}=(\underset{i}{\min} x_i, \underset{i}{\max} x_i)$が最小十分統計量であると示せる。

問題6.14の解答例

問題6.15の解答例

$$
\large
\begin{align}
f(x,\theta) = h(x)exp \left( \sum_{j=1}^{k} T_j(x) \psi_j(\theta) – c(\theta) \right) \quad (6.17)
\end{align}
$$
上記で表された(6.17)式に関して、(6.20)式のように$x, x’$が同値となる条件を考える。
$$
\large
\begin{align}
\frac{f(x,\psi)}{f(x’,\psi)} &= \frac{h(x)exp \left( \sum_{j=1}^{k} T_j(x) \psi_j(\theta) – c(\theta) \right)}{h(x’)exp \left( \sum_{j=1}^{k} T_j(x’) \psi_j(\theta) – c(\theta) \right)} \\
&= \frac{h(x)}{h(x’)} \exp \left( \sum_{j=1}^{k} (T_j(x)-T_j(x’)) \psi_j(\theta) \right)
\end{align}
$$
上記が$\psi_j(\theta)$に依存しないための必要十分条件は$T_j(x) = T_j(x’)$であるので、$(T_1(x), T_2(x), …, T_k(x)$が指数型分布族の最小十分統計量であることがわかる。

問題6.16の解答例

まとめ

「Ch.6 「十分統計量」の章末問題の解答例 〜現代数理統計学(学術図書出版社)〜」への2件のフィードバック

  1. […] 式(1)の定義が特徴的なのが「十分統計量」の$T_j(x)$を用いて$x$の関数ではなく、統計量$T_j(x)$と見ることである。このことにより、(1)式の$exp$の中身は$T_j$を定めることにより$x$に関係のない値となる。これに対し分解定理が成立し、これは$T_j(x)$が十分統計量であることを意味する。章末問題の解答例では「2項分布・正規分布の例」や「ポアソン分布・負の二項分布・ガンマ関数の例」をそれぞれ具体的に取り扱っているので、関数の各要素と具体的な分布の関係式については解答例が参考になると思われる。 […]

  2. […] 「十分統計量」に関しては下記でも取り扱いましたので、こちらも合わせて確認してみてください。https://www.hello-statisticians.com/explain-terms-cat/sufficient_statistic1.htmlhttps://www.hello-statisticians.com/explain-terms-cat/sufficient_statistic2.htmlhttps://www.hello-statisticians.com/explain-books-cat/math_stat_practice_ch6.html […]

コメントは受け付けていません。