ブログ

統計検定準1級 問題解説 ~2021年6月実施 論述問題 問2 ベイズ法と事後分布~

問題

過去問題は統計検定公式が問題と解答例を公開しています。こちらを参照してください。

解答

[1] 解答

$[1$-$1]$
$(A)$と$(B)$が正しい。

$[1$-$2]$
$X=x_0$が得られたときの二項分布の確率関数を$p(X=x_0|n,\theta)$とおくと$p(X=x_0|n,\theta)$は下記のように表すことができる。
$$
\large
\begin{align}
p(X=x_0|n,\theta) = {}_{n} C_{x_0} \theta^{x_0} (1-\theta)^{n-x_0}
\end{align}
$$

よって、$\theta$の事後分布$f(\theta|x_0)$は下記のように考えることができる。
$$
\large
\begin{align}
f(\theta|x_0) & \propto p(X=x_0|n,\theta) f(\theta|\alpha_0,\beta_0) \\
& = {}_{n} C_{x_0} \theta^{x_0} (1-\theta)^{n-x_0} \times \frac{1}{B(\alpha_0,\beta_0)} \theta^{\alpha-1} \theta^{\beta_0-1} \\
& \propto \theta^{x_0+\alpha_0-1} \theta^{n-x_0+\beta_0-1}
\end{align}
$$

上記より、事後分布のベータ分布のパラメータに関して$\alpha_1=x_0+\alpha_0, \beta_1=n-x_0+\beta_0$のように表すことができる。

$[1$-$3]$
$[1$-$2]$で取り扱った$f(\theta|x_0)$が最大となる$\theta$がわかれば良い。以下$\log{f(\theta|x_0)}$の$\theta$に関する偏微分を考える。
$$
\large
\begin{align}
\frac{\partial \log{f(\theta|x_0)}}{\partial \theta} &= \frac{\partial}{\partial \theta} ( (x_0+\alpha_0-1) \log{\theta} + (n-x_0+\beta_0-1) \log{(1-\theta)} ) \\
&= \frac{x_0+\alpha_0-1}{\theta} – \frac{n-x_0+\beta_0-1}{1-\theta} \\
&= \frac{(x_0+\alpha_0-1)(1-\theta) – (n-x_0+\beta_0-1)\theta}{\theta(1-\theta)} \\
&= \frac{(x_0+\alpha_0-1) – (x_0+\alpha_0-1+n-x_0+\beta_0-1)\theta}{\theta(1-\theta)} \\
&= \frac{(x_0+\alpha_0-1) – (n+\alpha_0+\beta_0-2)\theta}{\theta(1-\theta)}
\end{align}
$$

上記が$0<\theta<1$で単調減少であることより、$\displaystyle \frac{\partial \log{f(\theta|x_0)}}{\partial \theta} = 0$を解けば良い。
$$
\large
\begin{align}
\frac{\partial \log{f(\theta|x_0)}}{\partial \theta} &= 0 \\
\frac{(x_0+\alpha_0-1) – (n+\alpha_0+\beta_0-2)\theta}{\theta(1-\theta)} &= 0 \\
(x_0+\alpha_0-1) – (n+\alpha_0+\beta_0-2)\theta &= 0 \\
(n+\alpha_0+\beta_0-2)\theta &= x_0+\alpha_0-1 \\
\theta &= \frac{x_0+\alpha_0-1}{n+\alpha_0+\beta_0-2}
\end{align}
$$

上記より、事後確率密度関数を最大にする$\theta$は$\displaystyle \theta=\frac{x_0+\alpha_0-1}{n+\alpha_0+\beta_0-2}$であると考えることができる。

[2] 解答

$[2$-$1]$
観測値とパラメータの事前分布がどちらも正規分布の場合事後分布は正規分布に従う。よって$(B)$が正しいことがわかる。

$[2$-$2]$
$[2$-$1]$と同様に事後分布は正規分布が得られる。事前分布を$f(\mu)$、観測値$X=x$に関する同時確率密度関数を$f(X_1=3.0,X_2=2.3,X_3=4.2,X_4=1.5)$のようにおくとき、事後分布$f(\mu|X_1=3.0,X_2=2.3,X_3=4.2,X_4=1.5)$は下記のように考えることができる。
$$
\large
\begin{align}
f(\mu| & X_1=3.0,X_2=2.3,X_3=4.2,X_4=1.5) \propto f(X_1=3.0,X_2=2.3,X_3=4.2,X_4=1.5) f(\mu) \\
& \propto \exp \left( – \frac{(3.0-\mu)^2}{2 \times 4} – \frac{(2.3-\mu)^2}{2 \times 4} – \frac{(4.2-\mu)^2}{2 \times 4} – \frac{(1.5-\mu)^2}{2 \times 4} \right) \times \exp \left( – \frac{\mu^2}{2} \right) \\
&= \exp \left[ -\frac{1}{8} \left(4 \mu^2 + 4 \mu^2 – 22 \mu + … \right) \right] \\
&= \exp \left[ -\frac{8}{8} \left( \mu^2 – \frac{11}{4} \mu + … \right) \right] \\
& \propto \exp \left[ -\frac{2}{2} \left( \mu – \frac{11}{8} \mu \right)^2 \right]
\end{align}
$$

よって、事後分布は$\displaystyle N \left( \frac{11}{8},\frac{1}{2} \right)$であるとわかる。

解説

オーソドックスな事後分布の計算の問題であり、論述問題に適した内容であるように思われました。$[1$-$2]$や$[2$-$2]$ではパラメータに関して着目するにあたって$\propto$をうまく活用することで記述量を減らせるので、この辺の書き方の工夫は重要だと思います。

また$[1$-$3]$では極値ではなく最大を示すにあたって、$\displaystyle \frac{\partial \log{f(\theta|x_0)}}{\partial \theta} = 0$を解くだけでなく$\displaystyle \frac{\partial \log{f(\theta|x_0)}}{\partial \theta}$が単調増加であることを示すことは本来必要です。教科書などの議論では省略されがちではありますが、式の形を整理すると単調増加がわかる場合が多いので、なるべく単調増加も同時に示すようにすると良いと思います。

参考

・統計検定準1級 まとめ
https://www.hello-statisticians.com/toukeikentei-semi1

統計検定準1級 問題解説 ~2021年6月実施 問4 最小二乗法・尤度比検定~

問題

過去問題は統計検定公式が問題と解答例を公開しています。こちらを参照してください。

解答

[1-1] 解答

$\boxed{ \ \mathsf{3}\ }$ : ③
二乗和誤差$(y-bx)^{\mathrm{T}}(y-bx)$は下記のように考えることができる。
$$
\large
\begin{align}
(y-bx)^{\mathrm{T}}(y-bx) &= y^{\mathrm{T}}y – b y^{\mathrm{T}}x – b x^{\mathrm{T}} y + b^2 x^{\mathrm{T}}x \\
&= y^{\mathrm{T}}y – 2 b x^{\mathrm{T}} y + b^2 x^{\mathrm{T}}x
\end{align}
$$

上記の計算にあたっては$x^{\mathrm{T}} y = y^{\mathrm{T}}x$であること用いて項をまとめた。ここで上記の$b$に関する偏微分を考える。
$$
\large
\begin{align}
\frac{\partial (y-bx)^{\mathrm{T}}(y-bx)}{\partial b} = – 2 x^{\mathrm{T}} y + 2 b x^{\mathrm{T}}x
\end{align}
$$

上記は$b$に関して単調増加であることから、$\displaystyle \frac{\partial (y-bx)^{\mathrm{T}}(y-bx)}{\partial b} = 0$のとき$(y-bx)^{\mathrm{T}}(y-bx)$は最小値を取る。以下このときの$b$を求める。
$$
\large
\begin{align}
\frac{\partial (y-bx)^{\mathrm{T}}(y-bx)}{\partial b} &= 0 \\
– 2 x^{\mathrm{T}} y + 2 b x^{\mathrm{T}}x &= 0 \\
2 b x^{\mathrm{T}}x &= 2 x^{\mathrm{T}} y \\
b &= \frac{x^{\mathrm{T}} y}{x^{\mathrm{T}}x} \\
&= 2.2994…
\end{align}
$$

上記より③の$\hat{b} \simeq 2.3$が正しいことがわかる。

[1-2] 解答

$\boxed{ \ \mathsf{4}\ }$ : ③
$\sigma^2$の不偏推定量を$s^2$とおくと、$s^2$は下記のように考えることができる。
$$
\large
\begin{align}
s^2 &= \frac{1}{6-1} (y-\hat{b}x)^{\mathrm{T}}(y-\hat{b}x) \\
&= \frac{1}{5} ( y^{\mathrm{T}}y – 2 \hat{b} x^{\mathrm{T}} y + \hat{b}^2 x^{\mathrm{T}}x )
\end{align}
$$

上記に$y^{\mathrm{T}}y=171.04, x^{\mathrm{T}} y=69.88, x^{\mathrm{T}}x=30.39$と$[1$-$1]$の導出結果を代入すると下記が得られる。
$$
\large
\begin{align}
s^2 &= \frac{1}{5} ( y^{\mathrm{T}}y – 2 \hat{b} x^{\mathrm{T}} y + \hat{b}^2 x^{\mathrm{T}}x ) \\
&= \frac{1}{5} ( 171.04 – 2 \times 2.299… \times 69.88 + 2.299^2 \times 30.39 ) \\
&= 2.07…
\end{align}
$$

上記より③の$s^2 \simeq 2.1$が正しいことがわかる。

[2] 解答

$\boxed{ \ \mathsf{5}\ }$ : ②

[3] 解答

$\boxed{ \ \mathsf{6}\ }$ : ①

解説

$[1$-$1]$、$[1$-$2]$はベクトル表記な分やや難しいですが、計算内容自体はそれほど難しくないのでベクトル表記を把握しているかどうかで差がつく問題だと思われます。

参考

準$1$級関連まとめ
https://www.hello-statisticians.com/toukeikentei-semi1

統計検定準1級 問題解説 ~2021年6月実施 問5 最小二乗法・決定係数~

問題

過去問題は統計検定公式が問題と解答例を公開しています。こちらを参照してください。

解答

[1] 解答

$\boxed{ \ \mathsf{7}\ }$ : ②

[2] 解答

$\boxed{ \ \mathsf{8}\ }$ : ②
決定係数の定義より、予測値$\hat{y}_{i}$の$\bar{y}$からの変動の二乗和を実際の値$y_i$の$\bar{y}$からの変動の二乗和で割れば良い。よって②が正しい。

[3] 解答

$\boxed{ \ \mathsf{9}\ }$ : ④
回帰直線が概ねサンプルに対応していることから④か⑤に絞られる。また、破線は右上のサンプルに対して大きく外していることに着目すると、$R_1^2 > R_2^2$であると考えることができる。よって④が正しいと考えることができる。

解説

一般化最小二乗法が出てくることで難しく見えるかもしれませんが、$[2], [3]$は決定係数の定義を抑えていれば解ける問題なので、解けるところから解くというのも重要なように思われました。

参考

準1級関連まとめ
https://www.hello-statisticians.com/toukeikentei-semi1

「統計学実践ワークブック」 演習問題 Ch.16 「重回帰分析」
https://www.hello-statisticians.com/explain-books-cat/stat_workbook/stat_workbook_ch16.html


統計検定準1級 問題解説 ~2021年6月実施 問12 相関係数の検定~

問題

過去問題は統計検定公式が問題と解答例を公開しています。こちらを参照してください。

解答

[1] 解答

$\boxed{ \ \mathsf{記述6}\ }$ : $2.45$
検定統計量は自由度$8-2=6$の$t$分布$t(6)$に従うので、$5$%両側検定を行うにあたっては上側$2.5$%確率を考えればよい。これに該当する点を$t_{\alpha=0.025}(6)$とおくと、付表$2$より$2.447$が読み取れる。$2.447$の小数第$3$位を四捨五入することで$2.45$が得られる。

[2] 解答

$\boxed{ \ \mathsf{記述7}\ }$ : $2.47$
$x$の偏差平方和を$s_x$、$y$の偏差平方和を$s_y$、$x$と$y$の偏差積和を$s_{xy}$とおくとき、相関係数$R$は下記のように計算することができる。
$$
\large
\begin{align}
R &= \frac{s_{xy}}{\sqrt{s_x s_y}} \\
&= \frac{5.91}{\sqrt{7.16 \times 9.68}} \\
&= 0.7098…
\end{align}
$$

よって、検定統計量$T$は下記のように計算できる。
$$
\large
\begin{align}
T &= \sqrt{\frac{6R^2}{1-R^2}} \\
&= 2.4689…
\end{align}
$$

$2.4689…$の小数第$3$位の値を四捨五入することで$2.47$が得られる。

解説

$[2]$は相関係数の定義式に関して計算を行うだけなので、相関係数の式を把握した上で「偏差平方和」や「偏差積和」の意味がわかれば無理なく解ける問題のように思われました。

参考

準1級関連まとめ
https://www.hello-statisticians.com/toukeikentei-semi1

統計検定準1級 問題解説 ~2021年6月実施 問11 主成分分析・オートエンコーダ~

問題

過去問題は統計検定公式が問題と解答例を公開しています。こちらを参照してください。

解答

[1] 解答

$\boxed{ \ \mathsf{26}\ }$ : ③
$PC1$と$PC2$の例を表した表より、$1$は図の左、$2$は図の右上、$7$は図の右下に概ね配置されることがわかる。これより③が適切であると考えることができる。

[2] 解答

$\boxed{ \ \mathsf{27}\ }$ : ①
オートエンコーダは符号化器で潜在空間に写像した後に「復号化器」を用いて潜在空間から元の空間に写像を行うニューラルネットワークである。また、ニューラルネットワークの各層では活性化関数という非線形処理を行う。以上より、①が正しいことがわかる。

[3] 解答

$\boxed{ \ \mathsf{28}\ }$ : ①
通常の勾配降下法では全てのパラメータを同時に更新を行うので、①が正しいことがわかる。

解説

主成分分析やオートエンコーダに関する基本的な問題であるので、基本的な内容を抑えていればわかる内容だと思います。一方で、主成分分析が$1$題、オートエンコーダが$2$題の出題であるのは受験者が主成分分析を中心に学習したと思われることから逆の方が良い印象を受けました。

参考

準1級関連まとめ
https://www.hello-statisticians.com/toukeikentei-semi1

「統計学実践ワークブック」 演習問題 Ch.22 「主成分分析」
https://www.hello-statisticians.com/explain-books-cat/stat_workbook/stat_workbook_ch22.html

統計検定準1級 問題解説 ~2021年6月実施 問7 AIC・BIC・交差検証~

問題

過去問題は統計検定公式が問題と解答例を公開しています。こちらを参照してください。

解答

[1-1] 解答

$\boxed{ \ \mathsf{12}\ }$ : ④

実測値$y_t$が正規分布$N(\beta_{0} + \beta_{1} x_{i1} + \beta_{2} x_{i2} + \beta_{3} x_{i3}, \sigma^2)$に従って生成されたと考えることができるので、標準正規分布を考えるにあたってはこの標準化を行うことを考えれば良い。

よって、④が正しい。

[1-2] 解答

$\boxed{ \ \mathsf{13}\ }$ : ①
$AIC$は$AIC = -2 \log{L(\theta)} + 2k$で定義され、$AIC$を最小にするパラメータ$\theta$が最適であると考える。表よりモデル$1$とモデル$3$だけを考えれば十分であることがわかるので、以下それぞれに関して$AIC_{1}, AIC_{3}$を計算する。
$$
\large
\begin{align}
AIC_{1} &= -2 \times (−842.9193) + 2 \times 5 = 1695.8386 \\
AIC_{3} &= -2 \times (−845.3840) + 2 \times 4 = 1698.768
\end{align}
$$

$AIC_{1} < AIC_{3}$より①のモデル$1$が最適であると考えることができる。

[3] 解答

$\boxed{ \ \mathsf{15}\ }$ : ③
$AIC$と$BIC$はそれぞれ$AIC = -2 \log{L(\theta)} + 2k$、$BIC = k \log{n}$のように計算できるが、計算式が同様であるので計算処理時間は同じであると考えられる。よって手法$(A), (B)$が$AIC, BIC$に対応し、手法$(C)$が$CV$に対応すると考えることができる。

また、$BIC$を用いると$n \to \infty$のとき、正しいモデルを選択する確率が$1$に近づくことから$(A)$が$BIC$、$(B)$が$AIC$に対応することがわかる。以上より③が正しいと考えることができる。

解説

$AIC$・$BIC$・交差検証に関するオーソドックスな問題だと思います。基本的な問題なので取り組みやすい内容であると思われました。

参考

準1級関連まとめ
https://www.hello-statisticians.com/toukeikentei-semi1

「統計学実践ワークブック」 演習問題 Ch.30 「モデル選択」
https://www.hello-statisticians.com/explain-books-cat/stat_workbook/stat_workbook_ch30.html

書籍プレゼントキャンペーン

統計の森で扱っているおすすめ書籍のプレゼントキャンペーンをしています。
対象書籍や募集期間はTwitterで告知しますが、詳細はこちらを確認してください。

趣旨

統計の森では、当webサイトの運営を通して統計を学ぶ仲間を増やしたいと思っています。
特に私たちとしては、書籍を読むことを重視しています。このキャンペーンを通して、仲間が増えたら良いなと思っています。そして、webサイトなどにも訪問してくれるとうれしいです。

キャンペーン詳細

応募方法

Twitterで @t4175176860 が 対象書籍と期間を告知しますので、以下の2つの手順で応募してください。

  1. @t4175176860 をフォロー(既にフォローしてくれてる方はこのステップ飛ばしてください)
  2. 告知のtweetを RT

当選と発送

当選した方には、 @t4175176860 からDMで連絡があります。住所など送り先を教えてください。なお、個人情報は書籍の発送に利用するのみです。他の用途には利用しません。

対象者

本を活用して一緒に学んでくれる方が対象です。
なので、我々の感覚で対象に合わないなと感じた方は抽選から外させていただくことがあります。具体的には、Twitterで同様のプレゼントキャンペーンやっていることありますが、そのようなキャンペーンのRTしか見られないような場合には外させていただく場合があります。

フォロワー数やアカウント開設期間などで除外することはないので、その点は安心してください。

なお、対象者からの除外などについては個別には連絡しません。

統計検定準1級 問題解説 ~2019年6月実施 問10 ロジスティック回帰~

問題

過去問題は統計検定公式が問題と解答例を公開しています。こちらを参照してください。

解答

[1] 解答

$\boxed{ \ \mathsf{21}\ }$ : ①

ロジスティック回帰の目的変数はベルヌーイ分布に基づいて生成されたと考えられるので①の$\mathit{Bin}(1,\pi_i)$が正しい。

[2] 解答

$\boxed{ \ \mathsf{22}\ }$ : ①

ロジスティック回帰のリンク関数は$\displaystyle \log{\frac{x}{1-x}}$であることから①の$\displaystyle \log{\frac{\pi_{i}}{1-\pi_{i}}} = \alpha + \beta x_i$が該当する。

[3] 解答

$\boxed{ \ \mathsf{23}\ }$ : ④

$[2]$の$\displaystyle \log{\frac{\pi_{i}}{1-\pi_{i}}} = \alpha + \beta x_i$に$\pi_{i} = 0.5, \alpha = 15.0429, \beta = -0.2322$を代入して対応する$x_i$を計算すれば良い。
$$
\large
\begin{align}
\log{\frac{\pi_{i}}{1-\pi_{i}}} &= \alpha + \beta x_i \\
x_i &= \frac{1}{\beta} \left( \log{\frac{\pi_{i}}{1-\pi_{i}}} – \alpha \right) \\
&= \frac{1}{-0.2322} \left( \log{\frac{0.5}{0.5}} – 15.0429 \right) \\
&= \frac{-15.0429}{-0.2322} \\
&= 64.7…
\end{align}
$$

よって④が正しいと考えられる。

[4] 解答

$\boxed{ \ \mathsf{24}\ }$ : ⑤

$[2]$の$\displaystyle \log{\frac{\pi_{i}}{1-\pi_{i}}} = \alpha + \beta x_i$に$\alpha = 15.0429, \beta = -0.2322, x_i=31$を代入して対応する$\pi_i$を計算すれば良い。
$$
\large
\begin{align}
\log{\frac{\pi_{i}}{1-\pi_{i}}} &= \alpha + \beta x_i \\
\frac{\pi_{i}}{1-\pi_{i}} &= \exp(\alpha + \beta x_i) \\
\pi_{i} (1+\exp(\alpha + \beta x_i)) &= \exp(\alpha + \beta x_i) \\
\pi_{i} &= \frac{\exp(\alpha + \beta x_i)}{1+\exp(\alpha + \beta x_i)} \\
&= \frac{\exp(15.0429 + (-0.2322) \cdot 31)}{1+\exp(15.0429 + (-0.2322) \cdot 31)} \\
&= \frac{\exp(7.8447)}{1+\exp(7.8447)} \\
& \simeq \frac{2.7183^{7} \cdot 2.3164}{1+2.7183^7 \cdot 2.3164} \\
&= 0.9996…
\end{align}
$$

上記より⑤が正しいことがわかる。

解説

ロジスティック回帰に関するオーソドックスな問題であり、$[2]$が正答できれば$[2]$の式を用いて$[3]$と$[4]$を計算することができます。$[3]$に関しては$\pi_i=0.5$より$\displaystyle \log{\frac{\pi_{i}}{1-\pi_{i}}} = \log{1} = 0$であることがわかれば計算をシンプルに考えることができます。$[4]$に関しては$e^{7.84} = e^{7}e^{0.84}$であることを元に付表$5$を用いることで計算を行うことができます。

参考

準1級関連まとめ
https://www.hello-statisticians.com/toukeikentei-semi1

「統計学実践ワークブック」 演習問題 Ch.18 「質的回帰
https://www.hello-statisticians.com/explain-books-cat/stat_workbook/stat_workbook_ch18.html

最尤法・GLMに関する演習
https://www.hello-statisticians.com/practice/stat_practice7.html

統計検定準1級 問題解説 ~2019年6月実施 問12 AR(p)モデル、MA(q)モデル~

問題

過去問題は統計検定公式が問題と解答例を公開しています。こちらを参照してください。

解答

[1] 解答

$\boxed{ \ \mathsf{記述9}\ }$ :

$1-a_1z-a_2z^2 = 1-az-az^2 = 0$の全ての解の絶対値が$1$より大きくなる$a$の範囲を$0<a$で考えれば良い。二次方程式の解の公式より、$1-az-az^2 = az^2+az-1 = 0$は下記のように得られる。
$$
\large
\begin{align}
z = \frac{-a \pm \sqrt{a^2+4a}}{2a}
\end{align}
$$

ここで$\displaystyle \left| \frac{-a + \sqrt{a^2+4a}}{2a} \right| < \left| \frac{-a – \sqrt{a^2+4a}}{2a} \right|$であるので、$\displaystyle 1 < \left| \frac{-a + \sqrt{a^2+4a}}{2a} \right|$となる$a$を求めれば良い。
$$
\large
\begin{align}
1 &< \left| \frac{-a + \sqrt{a^2+4a}}{2a} \right| \\
1^2 &< \left( \frac{-a + \sqrt{a^2+4a}}{2a} \right)^2 \\
1 &< \frac{(-a + \sqrt{a^2+4a})^2}{4a^2} \\
4a^2 &< (-a + \sqrt{a^2+4a})^2 \\
4a^2 &< a^2 + (\sqrt{a^2+4a})^2 – 2a \sqrt{a^2+4a} \\
4a^2 &< a^2 + a^2 + 4a – 2a \sqrt{a^2+4a} \\
2a^2 – 4a &< – 2a \sqrt{a^2+4a} \\
2-a &> \sqrt{a^2+4a} \\
(2-a)^2 &> a^2+4a \\
8a &< 4 \\
a &< \frac{1}{2}
\end{align}
$$

上記より求める必要十分条件は$0<a<1/2$であることがわかる。

[2] 解答

$\boxed{ \ \mathsf{記述10}\ }$ :
$i \neq j$のとき$E[\varepsilon_{i}\varepsilon_{j}]=0$より、$q=2$と推測できる。

解説

$[1]$の二次不等式を解くにあたっては両辺の符号の変化に注意が必要なので気をつけると良いです。特に問題文の$0<a$があることでシンプルに式変形を行えることは注意しておくと良いです。

参考

準1級関連まとめ
https://www.hello-statisticians.com/toukeikentei-semi1

統計検定準1級 問題解説 ~2019年6月実施 問11 マルコフ連鎖と遷移行列~

問題

過去問題は統計検定公式が問題と解答例を公開しています。こちらを参照してください。

解答

[1] 解答

$\boxed{ \ \mathsf{記述7}\ }$ : $0.05$
$$
\begin{align}
M &= \left(\begin{array}{ccc} 1-\theta & \theta & 0 \\ \theta & 1-\theta-\phi & \phi \\ 0 & \phi & 1-\phi \end{array} \right) \\
&= \left(\begin{array}{ccc} 1-\theta & \theta & 0 \\ \theta & 0.99-\theta & 0.01 \\ 0 & \phi & 0.99 \end{array} \right)
\end{align}
$$

上記を元に$A$から$A$が$95$回、$A$から$B$が$5$回、$B$から$A$が$1$回、$B$から$B$が$19$回観測される確率を考えるとこれが尤度$L(\theta)$に一致する。$L(\theta), \log{L(\theta)}$は下記のように計算できる。
$$
\begin{align}
L(\theta) &= (1-\theta)^{95} \theta^{5} \theta^{1} (0.99-\theta)^{19} \\
&= (1-\theta)^{95} \theta^{6} (0.99-\theta)^{19} \\
\log{L(\theta)} &= 95 \log{(1-\theta)} + 5 \log{\theta} + 19 \log{(0.99-\theta)}
\end{align}
$$

上記の$\log{L(\theta)}$を$\theta$で微分し、$L(\theta)$が最大となる$\theta$の導出を行う。
$$
\begin{align}
\frac{\partial \log{L(\theta)}}{\partial \theta} &= – \frac{95}{1-\theta} + \frac{5}{\theta} – \frac{19}{0.99-\theta} \\
&= \frac{95(0.99-\theta)\theta + 6(1-\theta)(0.99-\theta) – 19(1-\theta)\theta}{(1-\theta)(0.99-\theta)\theta} \\
&= \frac{120 \theta^2 – 124.99 \theta +5.94}{(1-\theta)(0.99-\theta)\theta}
\end{align}
$$

上記は$0 < \theta < 0.99$では単調減少関数であるので$0 < \theta < 0.99$で$\displaystyle \frac{\partial \log{L(\theta)}}{\partial \theta} = 0$となる$\theta$の値を計算すれば良い。

二次方程式の解の公式より下記が得られる。
$$
\begin{align}
\theta &= \frac{124.99 \pm \sqrt{124.99^2 – 4 \times 120 \times 5.94}}{2 \times 120} \\
&= 0.049915, 0.991667
\end{align}
$$

上記より、$\theta = 0.049915$の小数第$3$位を四捨五入して$\theta=0.05$が得られる。

[2] 解答

$\boxed{ \ \mathsf{記述8}\ }$ : $\displaystyle \sum_{j=1}^{3} \lambda_{j}^{n} u_{1j} u_{3j}$
$A = U^{\mathrm{T}}MU$とおくと、$U$が直交行列であることより$U^{\mathrm{T}}U = UU^{\mathrm{T}} = I$であることを元に、下記のように考えることができる。
$$
\begin{align}
A &= U^{\mathrm{T}} M U \\
UAU^{\mathrm{T}} &= U U^{\mathrm{T}} M U U^{\mathrm{T}} \\
M &= UAU^{\mathrm{T}}
\end{align}
$$

上記より$M^{n}$は下記のように得られる。
$$
\begin{align}
M^{n} &= (UAU^{\mathrm{T}})^{n} \\
&= U A^{n} U^{\mathrm{T}}
\end{align}
$$

ここで$M^{n} = (m^{n}_{ij})$とおくと求める確率は$m^{n}_{13}$に一致する。よって下記のように計算を行うことができる。
$$
\begin{align}
m^{n}_{13} &= \left(\begin{array}{ccc} u_{11} & u_{12} & u_{13} \end{array} \right) \left(\begin{array}{ccc} \lambda_1^{n} & 0 & 0 \\ 0 & \lambda_2^{n} & 0 \\ 0 & 0 & \lambda_3^{n} \end{array} \right) \left(\begin{array}{c} u_{31} \\ u_{32} \\ u_{33} \end{array} \right) \\
&= \left(\begin{array}{ccc} u_{11} \lambda_1^{n} & u_{12} \lambda_2^{n} & u_{13} \lambda_3^{n} \end{array} \right) \left(\begin{array}{c} u_{31} \\ u_{32} \\ u_{33} \end{array} \right) \\
&= u_{11} \lambda_1^{n} u_{31} + u_{12} \lambda_2^{n} u_{32} + u_{13} \lambda_3^{n} u_{33} \\
&= \sum_{j=1}^{3} \lambda_{j}^{n} u_{1j} u_{3j}
\end{align}
$$

解説

$[1]$の式は少々複雑ですが、$120 \theta^2 – 124.99 \theta + 5.94$まで導出できれば二次方程式の解の公式を用いることで解を計算することができます。また、$\phi=0.01$であることで$\theta$の定義域が$0 \leq \theta \leq 0.99$のように考えられることは抑えておくと良いです。$[2]$に関しては直交行列が$U^{\mathrm{T}}U = UU^{\mathrm{T}} = I$を元に対角行列の$n$乗を計算できることを元に考えると良いです。また、$m^{n}_{13}$だけを計算すれば良いことからどの行と列を計算すれば良いかが判断できれば途中計算をシンプルに表記できることも抑えておくと良いと思います。

参考

準1級関連まとめ
https://www.hello-statisticians.com/toukeikentei-semi1

「統計学実践ワークブック」 演習問題 Ch.14 「マルコフ連鎖」
https://www.hello-statisticians.com/explain-books-cat/stat_workbook/stat_workbook_ch14.html

行列の成分表示