ブログ

統計検定準1級 問題解説 ~2017年6月実施 選択問題及び部分記述問題 問12~

過去問題

過去問題は統計検定公式が問題と解答例を公開しています。こちらを参照してください。

解答

[1] 解答

$\boxed{ \ \mathsf{18}\ }$ : ②

問題の表から,$\bar{X}=6.2$のとき,$P(\overline{X^*} < 6.2) = \dfrac{4}{10} = 0.4$である.
($\overline{X^*}=5.1,5.2,6.0,5.3$の$4$つのブートストラップ平均値が該当する)

[2] 解答

$\boxed{ \ \mathsf{19}\ }$ : ④

与えられた分布の下側$5\%$点を$\alpha$,上側$5\%$点を$\beta$として,$\mu$の$90\%$信頼区間を$(\alpha, \beta)$とする.サンプルサイズは$10^3$であるから,$\alpha$は累積度数が$50$の点,$\beta$は累積度数が$950$の点である.

与えられた分布から

   \[
       P(\overline{X^*} \leq 4) =\dfrac{17}{1000}
   \]

   \[
       P(\overline{X^*} \leq 4.5) =\dfrac{57}{1000}
   \]

   であるから,$\alpha \in (4,4.5)$がわかる.同様に,

   \[
       P(\overline{X^*} \leq 8) =\dfrac{918}{1000}
   \]

   \[
       P(\overline{X^*} \leq 8.5) =\dfrac{976}{1000}
   \]

   であるから,$\beta \in (8, 8.5)$である.この条件を満たす選択肢は$(4.24, 8.25)$である.

参考

ブートストラップ法については、具体的に実装を通してイメージするとわかりやすい。下記ページなどを参考にするとよい。

Ch.3 「2次元のデータ」の章末問題の解答例 〜基礎統計学Ⅰ 統計学入門(東京大学出版会)〜

統計検定準1級 問題解説 ~2017年6月実施 選択問題及び部分記述問題 問11~

過去問題

過去問題は統計検定公式が問題と解答例を公開しています。こちらを参照してください。

解答

[1] 解答

$\boxed{ \ \mathsf{15}\ }$ : ①

  • 傘が$0$本の場所から移動する場合は,移動先には必ず$2$本の傘があるため,$p_{11} ,p_{12} = 0$,$p_{13} = 1$がわかる.また,傘は全部で$2$本であり,一度に移動させることができる傘の本数が$1$本であることを考慮すると$p_{12}  = p_{33} = 0$もわかる.
  • 晴れている場合,傘は移動させないので$p_{22} = p_{31} = 1-\theta$.
  • 雨の場合,傘を移動させるので$p_{23} = p_{32} = \theta$.

したがって,これをまとめると  \(
   \left(
   \begin{array}{ccc}
   0        & 0        & 1      \\
   0        & 1-\theta & \theta \\
   1-\theta & \theta   & 0 \\
   \end{array}
   \right)
   \) となる.

[2] 解答

$\boxed{ \ \mathsf{16}\ }$ : ③

$$
\begin{align*}
       &P(X_1 = x_1, X_2 = x_2,\dots , X_8 = x_8) \\
     =&P(X_1=x_1)P(X_2=x_2|X_1=x_1)\cdots P(X_8=x_8|X_7=x_7) \\
     =&1\cdot P_{22}\cdot P_{23}\cdot P_{31}\cdot P_{13}\cdot P_{32}\cdot P_{22}\cdot P_{22} \\
     =&1\cdot (1-\theta)^4 \theta ^2
\end{align*}
$$

となる。$f(\theta) = \theta^2 (1-\theta)^4$とおき、$\theta$で微分すると、$\dfrac{df}{d\theta} = 2\theta(1-\theta)^3(1-3\theta)$となる。$0 < \theta < 1$に注意して増減表を書くと

$$
\begin{array}{c|c|c|c|c|c}
\theta              & 0 & \cdots & 1/3 & \cdots & 1  \\
       \hline
 \dfrac{df}{d\theta} &   & +      & 0   & –      & 
\end{array}
$$

となる。

したがって、$\theta = \dfrac{1}{3}$で$f$は最大となるので、$\theta$の最尤推定量は約$0.33$である。

なお補足として、上記の$f(\theta)$の微分は積の微分となり、多少複雑である。最尤推定値の導出には、尤度関数の対数をとった対数尤度関数の微分を考えても同じ結果が得られる(参考)。対数尤度関数を考えると、その微分はシンプルな計算になるため$f(\theta)$の微分がわかりにくいと感じた場合は$\log f(\theta)$の微分を考えると良い。

[3] 解答

$\boxed{ \ \mathsf{17}\ }$ : ④

移動の開始時に傘が$i$本の場所にいる確率を$\pi = (\pi_0, \pi_1, \pi_2)$とおく.定常分布が満たす条件は$\pi = \pi Q$かつ$\pi_0 + \pi_1 + \pi_2 = 1$である.ここで、

$\pi = \pi Q$で,

$$
Q=  
       \left(
       \begin{array}{ccc}
       0   & 0        & 1      \\
       0   & 2/3 & 1/3 \\
       2/3 & 1/3   & 0 \\
       \end{array}
       \right)
$$

なので($\theta = 1/3$とした)、

$$
\begin{align*}
       (\pi_0 \quad \pi_1 \quad \pi_2) &= (\pi_0 \quad\pi_1 \quad \pi_2) Q\\
                                       &= \left(\dfrac{2}{3}\pi_2 \quad \dfrac{2}{3}\pi_1 + \dfrac{1}{3}\pi_2 \quad \pi_0+\dfrac{1}{3}\pi_1 \right)\\ 
   \end{align*}
$$

よって,次の連立方程式を解けば良い.

   \[
   \left\{
   \begin{array}{l}
   \pi_0  = \dfrac{2}{3}\pi_2\\
   \pi_1 = \dfrac{2}{3}\pi_1 + \dfrac{1}{3}\pi_2\\
   \pi_2 = \pi_0+\dfrac{1}{3}\pi_1\\
   \pi_0 + \pi_1 + \pi_2 = 1
   \end{array}
   \right.
   \]

これを解いて,$\pi_0 = \dfrac{1}{4}$,$\pi_1 = \dfrac{3}{8}$,$\pi_2 = \dfrac{3}{8}$.

Ch.18 「部分ベクトル空間」の演習問題の解答例 〜統計学のための数学入門30講(朝倉書店)〜

当記事は「統計学のための数学入門$30$講(朝倉書店)」の読解サポートにあたってChapter.$18$の「部分ベクトル空間」の章末問題の解答の作成を行いました。
基本的には書籍の購入者向けの解説なので、まだ入手されていない方は購入の上ご確認ください。また、解説はあくまでサイト運営者が独自に作成したものであり、書籍の公式ページではないことにご注意ください。

・書籍解答まとめ
https://www.hello-statisticians.com/answer_textbook_math#math_stat

本章のまとめ

演習問題解答

問題$18.1$

$$
\large
\begin{align}
A = \left(\begin{array}{cccc} \mathbf{a}_{1} & \mathbf{a}_{2} & \mathbf{a}_{3} & \mathbf{a}_{4} \end{array} \right), \quad \mathbf{x}_{1}=\left(\begin{array}{c} 1 \\ 1 \\ 1 \\ 1 \end{array} \right), \quad \mathbf{x}{2}=\left(\begin{array}{c} 1 \\ 2 \\ 3 \\ 4 \end{array} \right)
\end{align}
$$

$A \mathbf{x}_{1}, A \mathbf{x}_{2}$はそれぞれ下記のように表せる。
$$
\large
\begin{align}
A \mathbf{x}_{1} &= \mathbf{a}_{1} + \mathbf{a}_{2} + \mathbf{a}_{3} + \mathbf{a}_{4} \\
A \mathbf{x}_{2} &= \mathbf{a}_{1} + 2 \mathbf{a}_{2} + 3 \mathbf{a}_{3} + 4 \mathbf{a}_{4}
\end{align}
$$

問題$18.2$

2022年度 共通テスト 数学IA 第2問 [2] データの分析 〜四分位範囲・相関係数 etc〜

はじめに

本記事では$2022$年度 共通テスト$ 数学\rm{IA} 第2問 [2] $より、データの分析を扱います。第$2$問だけで$10$ページもありました(データの分析は図表が多いですが、$6$ページです)。受験生は$15$~$20$ 分で解き切るのが目安です(難しい)。

・入試問題 解答・解説まとめ
https://www.hello-statisticians.com/entrance_exam

(1)

スでは四分位範囲を考えるので、上から四分位数などを求めていくときにメモしていきましょう。まず、データのサンプル数は$ 29$ ですので、中央値は$ 15 $番目の値、第一四分位数は$ 7、8 $番目の値、第三四分位数は$21、22$ 番目の値(上から$7、8$番目)に着目します。ヒストグラムからそれぞれ(が入っている階級)を求めると、以下のようになります。

代表値 2009 2018
中央値 30~45 30~45
第一四分位数 15~30 15~30
第三四分位数 60~75 45~60

②, ②, ⓪ が正解です。の範囲については、明らかに $2018$ 年度の方が小さいので、⓪です。

の四分位範囲は (第三四分位数) – (第一四分位数) で与えられますが、この問題では具体的な値が出てきません。第一四分位数は両年度で等しく、第三四分位数は $2018$ 年度の方が小さいので ⓪ が答えっぽいですが、違います。$2009$ 年度の(第一四分位数, 第三四分位数)= $ (30,  60)、 2018 $年度の(第一四分位数, 第三四分位数)=$ (15,  60)$ のとき、$2018$年度の四分位範囲の方が大きいです。実際どちらの四分位範囲の方が大きいかは判断できません。よって、③です。

 

(2)

箱ひげ図から横軸の最大値が$480$くらいです。①は達していないので除外できます。

箱ひげ図から第三四分位数は$ 245 $くらいです。⓪は上から$8$番目のデータが $250$ 以上なので除外できます。

箱ひげ図から第一四分位数は$ 90 $くらいです。③において、$100$以上のデータ($100$以下の部分が見えにくかったので、多いけどこちらを数えました)は$ 23$ あるので、第一四分位数はもっと大きな値になります。

従って ② が正解です。

 

(3)

ソタチ

共分散を S, T それぞれの標準偏差で割れば求まります。$\displaystyle \frac{735.3}{39.3 \times 29.9} = 0.625…$ より $0.63$ が答えです。

脱線しますが、めんどくさがって$ 29.9$ なんて大体 $30$ だと思い、$\displaystyle \frac{735.3}{39.3 \times 29.9}$ を計算すると、$0.6236… $が出ます。筆者はこれで間違えました。

(4)

難問だと思います。⓪,② では相関係数は $0.6$ もないです。①,③を見ると、①の方が全体的に上に寄っていますね。Tの平均に差が現れそうです。実際の値は $72.9$ であり、①においては $9$ 個の点の T の値が $80$ を下回っています。逆に、$20$個の点は $80$ 以上です。$80$ を下回っている$9$個の点と上位$9$番目の点の計$18$個の点の平均を考えると$ 72.9$を超えます。よって全体でも$ 平均は$ 72.9$ を超えるでしょう。よって、③が正解です。

終わりに

サンプル数が $29$ なので、かなり細かく見ないといけませんでした。マニアックな知識は不要なので、解き慣れると高得点を狙い易い大問だと思います。

出典: 2022年度 共通テスト 数学IA

2022年度共通テスト 数学IA 第 3 問 確率 〜順列・組合せ・確率〜

はじめに

この記事では$2022$年度共通テスト 数学IA より、第$3$問 確率を扱います。

・入試問題 解答・解説まとめ
https://www.hello-statisticians.com/entrance_exam

問題となる試行は以下の通りです。

複数人でプレゼントを持ち寄り、交換する。その手順として、代表者がそれらを回収し、全員にひとつずつランダムに配布するという方法をとる。これを、全員が自分以外の人が持ってきたプレゼントを受け取るまで繰り返す(全員が自分以外の人が持ってきたプレゼントを受け取れば終了)。

人数が変動していきます。

$2, 3$ 人で行うケース

$(1)$

(i) アイウ

$1$通り,求める確率は $\displaystyle \frac{1}{2}$

(ii) エオカ

この大問では、この後$ 4,5$ 人の場合を考えることになります。そのときのヒントになると思われるので、全事象を書き出してみます。$A, B, C$ の$3$ 人でそれぞれが$ a,b,c$ というプレゼントを持ってきたとします。一回の交換で$ A,B,C$ ぞれぞれがもつプレゼントの組み合わせの表です。

ABC終了
abc
acb
bac
bcaYES
cabYES
cba

表から、一回の交換で終了する受け取り方の総数は$ 2 $ 通りです。確率は$ \displaystyle \frac{2}{6} = \frac{1}{3}$です。

(iii)キクケコ

(ちょうど$1$回の交換で終了する確率)+(ちょうど$2$回の交換で終了する確率)+(ちょうど$3$回の交換で終了する確率)+(ちょうど$4$回の交換で終了する確率) を求めます。

$(ちょうど1回の交換で終了する確率) = \displaystyle \frac{1}{3}$

(ちょうど$2$回の交換で終了する確率) : $1$回目では終わらない(余事象)、かつ$2$回目で終わる確率です。(ii)の答えから,一回の交換で終了となる確率が $1/3$ です。よって、$$\displaystyle \left(1-\frac{1}{3}\right)\times\frac{1}{3} = \frac{2}{9}$$

$(ちょうど3回の交換で終了する確率) = \displaystyle \left(1 – \frac{1}{3} – \frac{2}{9}\right) \times \frac{1}{3} = \frac{4}{27}$

$(ちょうど4回の交換で終了する確率) = \displaystyle \left(1 – \frac{1}{3} – \frac{2}{9} – \frac{4}{27}\right) \times \frac{1}{3} = \frac{8}{81}$

全部足して,$\displaystyle \frac{65}{81}$ (答)

$4,5$ 人で行うケース

$(2)$

$1人以外の3人$は違う人のプレゼントを受け取ることになります。自分のプレゼントを受け取る人の選び方が$ 4 $通りあり、残りの$3$人が違う人のプレゼントを受け取る場合の数は $(1) $の表から $2$ 通りです。答えは 8 通りです。

$2$人の選び方$({_4}C{_2})$と、残り$2$人は自分のではないプレゼントを受け取るという場合の数を考慮して、$6 \times 1 = 6 (通り)$

スセ

サ,シで考えた場合と、ちょうど$3$人が自分のプレゼントを受け取る場合を考えます。$3$人が自分のプレゼントを受け取る場合の数は$ 1 $です。よって、$8+6+1=15$

ソタ

求める確率は$$\displaystyle 1 – \frac{15}{24} = \frac{3}{8}$$

$(3)$ チツテト

受け取り方の総数は$ 5! = 120 $通りです。全問と同様、何人かが自分のを受け取り、それ以外は別の人のを受け取る場合を表にまとめました。

自身のを受け取る人数その選び方残りが別の人のを受け取る場合の数(全問を参考に)
$1$${_5}C{_1}$$9 (= 24 – 15)$
$2$$10$$2$
$3$$10$$1$
$5$$1$$1$

$2,3$ 列目を掛け算して、足し合わせると、$76$が出てきます。これは$5$人の場合に、終了しない受け取り方の総数です。余事象を考えて、$$\displaystyle 1 – \frac{76}{120} = \frac{11}{30}$$が答えです。

$(4)$ ナニヌネ

$\displaystyle \frac{P\{(A,B,C,D が自分以外のを受け取る)AND(終了)\}}{P\{A,B,C,D が自分以外のを受け取る\}} $を求めます。

事象 {A,B,C,D が自分以外のを受け取る} は {全員が自分以外のを受け取る} $\vee$ {Eだけ自身のを受け取る} と等価であり、これらは排反です。

$P${全員が自分以外のを受け取る} = $\displaystyle \frac{11}{30}$

$P${Eだけ自身のを受け取る}

$= P${(Eだけ自身の) AND (他の$4$人は互いに別の人のを受け取る($9$通り))} = $\displaystyle \frac{9}{120}$

$P${(A,B,C,D が自分以外のを受け取る)AND(終了)} は、1回目で終了する確率$\displaystyle \frac{11}{30}$であるため、求める確率は

$$\displaystyle \frac{\frac{11}{30}}{\frac{11}{30} + \frac{9}{120}}=\frac{44}{53}$$

出典: $2022$年度共通テスト 数学IA

【技術書】統計の森が注目している新刊情報まとめ【2023/01~2023/03】

統計の森が注目している新刊をまとめて紹介します。紹介する書籍は統計学、数学、機械学習関連の書籍が中心です。

ここでは、2023年1月から3月に発売される書籍を紹介します。気になった書籍があれば、ぜひこちらのリンクから確認してみてください。

2023年3月発売

著者後藤 俊介
発売日2023/03/15
発行技術評論社
出版社からの紹介2018年に正式安定版ver.1.0がリリースされて以降、数値計算分野などで注目を集めている言語・Juliaの本格的な入門書です。本書では言語仕様や基本機能の解説に重きを置きながら、実践的な実用例まで解説します。
(Amazonのサイトから引用)
統計の森コメントJulia言語はPythonのように書けてCのように速いと言われています。
データ分析界隈でも利用者が増えているようで、習得しておきたい技術の一つです(私t41は既存の書籍で入門だけはしました)。

2023年2月発売

著者岡野原 大輔
発売日2023/02/21
発行岩波書店
出版社からの紹介テキストに対応する画像を生成する――従来は困難であった高次元のデータを創り出す生成モデルの技術が注目されている。現在、最高の性能を発揮し、画像・動画・音声・化合物の生成など、多様な応用が期待されているのが拡散モデルである。その数理の心から課題までを世界に先駆けて解説し、理論のさらなる発展を追究する。
(Amazonのサイトから引用)
統計の森コメント拡散モデルは深層生成モデルとして、その高品質な生成結果からも今最も注目されているといっても過言ではないモデルと思います。その拡散モデルについて、PFNの岡野原さんが執筆された書籍です。
理論の発展としてどのようなことを展望されているのか注目しています。
著者古賀 政純
発売日2023/02/21
発行インプレス
出版社からの紹介本書では、技術者だけでなく、IT基盤の方向性の検討や戦略の立案、意思決定を行う立場の方が、導入前の検討を実践できる内容を盛り込みました。具体的には、コンテナの特徴、導入時の検討項目、注意点などのチェックリストを設け、システム構成例などを解説図にまとめ、要点を把握しやすいようにしました。また、大規模データセンター向けのコンテナ基盤構築の経験がない技術者でも、その基礎を理解できるよう、Docker(v20.10.系)のインストール手順、使用法などを具体的に記載しています。
(Amazonのサイトから引用)
統計の森コメントデータ分析環境としてもDockerは有効な場面多いと思います。クリーンな環境を容易に用意できるので、ライブラリの依存関係などに悩ませられることが少なくなります。
第3版では、Docker Compose(これは知っておくと良い)やKubernetes(データ分析視点ではここまでは不要かも)などの解説も網羅されているようです。

2023年1月発売

著者
発売日2023/01/18
発行
出版社からの紹介
統計の森コメント準$1$級までの統計検定の試験はPBTからCBTに移行された一方で、CBT向けの問題集が統計検定公式ではこれまでありませんでした。この度発売されたので、購入者向けに解答例の作成などを行う予定です。
著者Cathy Tanimura(著)
発売日2023/01/26
発行オライリー・ジャパン
出版社からの紹介クラウドの普及とともに、SQLの利用範囲は拡大し、データサイエンティストもデータベースを直接扱う機会が増えています。本書は、データ分析に関わるSQLのテクニックを学び、分析プロセスにおいてSQLを最大限に活用するためのものです。時系列解析などでは、SQLが日付・時刻の比較や処理に長けており、威力を発揮できる最たるものです。
(Amazonのサイトから引用)
統計の森コメント「データ分析」となるとPythonやRを使ってと身構えることが多いと思います。しかし、データを扱うという意味ではDB+SQLは非常に重要と思います。
実際、SQLでデータを抽出するところだけでもかなりのことができます。また、データ構造についても考えが向くと思いますので、データ分析視点でのSQL本、気になります。
オライリー本は実践的な内容が多いのでわかりやすそうな点もポイントです。

その他参考

Ch.29 「重積分での変数変換」の演習問題の解答例 〜統計学のための数学入門30講(朝倉書店)〜

当記事は「統計学のための数学入門$30$講(朝倉書店)」の読解サポートにあたってChapter.$29$の「重積分での変数変換」の章末問題の解答の作成を行いました。
基本的には書籍の購入者向けの解説なので、まだ入手されていない方は購入の上ご確認ください。また、解説はあくまでサイト運営者が独自に作成したものであり、書籍の公式ページではないことにご注意ください。

・書籍解答まとめ
https://www.hello-statisticians.com/answer_textbook_math#math_stat

本章のまとめ

演習問題解答

問題$29.1$

上記の図の「左の赤で囲った面積」から「右の青で囲った面積」を引いた面積を$S$とおくと、平行四辺形の面積は$2S$で計算できる。$2S = ad – bc$が成立することを以下に示す。
$$
\large
\begin{align}
2S &= 2 \times \left[ \left( ac + \frac{1}{2}(a+b)(d-c) \right) – \left( \frac{1}{2}ac + \frac{1}{2}bd \right) \right] \\
&= 2ac+(a+b)(d-c) – (ac+bd) \\
&= \cancel{2ac} + ad – \cancel{ac} + \cancel{bd} – bc – \cancel{ac} – \cancel{bd} = ad – bc
\end{align}
$$

・別解
下記のように内積の式や三角関数の加法定理を用いて導出を行なっても良い。

問題$29.2$

$$
\large
\begin{align}
\int \int_{D} \frac{1}{\sqrt{a^2-(x^2+y^2)}} \, dxdy, \quad D=\{ (x,y) | x^2+y^2 \leq a^2 \}, \quad a > 0
\end{align}
$$

上記に対し、$x = r \cos{\theta}, y = r \sin{\theta}$のような変数変換を考える。このとき変数変換にあたってのヤコビ行列式を$\det{J}$とおくと$\det{J}$は下記のように計算できる。
$$
\large
\begin{align}
\det{J} &= \left| \begin{array}{cc} \frac{\partial x}{\partial r} & \frac{\partial x}{\partial \theta} \\ \frac{\partial y}{\partial r} & \frac{\partial y}{\partial \theta} \end{array} \right| \\
&= \left| \begin{array}{cc} \cos{\theta} & -r \sin{\theta} \\ \sin{\theta} & r \cos{\theta} \end{array} \right| \\
&= r(\cos^{2}{\theta} + \sin^{2}{\theta}) = r
\end{align}
$$

また、$x^2+y^2 \leq a^2$に対応する$r, \theta$の範囲は下記のように表せる。

$r$$0 \to a$
$\theta$$0 \to 2 \pi$

よって重積分は下記のように計算できる。
$$
\large
\begin{align}
& \int \int_{D} \frac{1}{\sqrt{a^2-(x^2+y^2)}} \, dxdy, \quad D=\{ (x,y) | x^2+y^2 \leq a^2 \}, \quad a > 0 \\
&= \int \int_{D’} \frac{1}{\sqrt{a^2-r^2}} \det{J} \, dr d \theta, \quad D’=\{ (r,\theta) | 0 \leq r \leq a, 0 \leq \theta \leq 2 \pi \} \\
&= \int_{0}^{2 \pi} 1 d \theta \times \int_{0}^{a} \frac{r}{\sqrt{a^2-r^2}} dr \\
&= \int_{0}^{2 \pi} 1 d \theta \times \int_{0}^{a} \left( -\sqrt{a^2-r^2} \right)’ dr \\
&= \left[ \theta \right]_{0}^{2 \pi} \times \left[ -\sqrt{a^2-r^2} \right]_{0}^{a} \\
&= 2 \pi \times a \\
&= 2 \pi a
\end{align}
$$

Ch.28 「重積分」の演習問題の解答例 〜統計学のための数学入門30講(朝倉書店)〜

当記事は「統計学のための数学入門$30$講(朝倉書店)」の読解サポートにあたってChapter.$28$の「重積分」の章末問題の解答の作成を行いました。
基本的には書籍の購入者向けの解説なので、まだ入手されていない方は購入の上ご確認ください。また、解説はあくまでサイト運営者が独自に作成したものであり、書籍の公式ページではないことにご注意ください。

・書籍解答まとめ
https://www.hello-statisticians.com/answer_textbook_math#math_stat

本章のまとめ

演習問題解答

問題$28.1$

・$[1]$
$f(x,y)=x^2+y^2, \, D=[0,1] \times [2,3]$のとき、下記のように重積分を計算できる。
$$
\large
\begin{align}
\int \int_{D} f(x,y) dx dy &= \int_{2}^{3} \int_{0}^{1} (x^2+y^2) dx dy \\
&= \int_{2}^{3} \left[ \frac{1}{3} x^3 + y^2 x \right]_{x=0}^{x=1} dy \\
&= \int_{2}^{3} \left( \frac{1}{3} + y^2 \right) dy \\
&= \left[ \frac{1}{3} y + \frac{1}{3} y^3 \right]_{2}^{3} \\
&= \left( \frac{3}{3} + \frac{3^3}{3} \right) – \left( \frac{2}{3} + \frac{2^3}{3} \right) \\
&= \frac{3+27-2-8}{3} = \frac{20}{3}
\end{align}
$$

・$[2]$
$f(x,y) = x e^{-y}, \, D=[0,1] \times [2,3]$のとき、下記のように重積分を計算できる。
$$
\large
\begin{align}
\int \int_{D} f(x,y) dx dy &= \int \int_{D} x e^{-y} dx dy \\
&= \int_{0}^{1} x dx \cdot \int_{2}^{3} e^{-y} dx \\
&= \left[ \frac{1}{2} x^2 \right]_{0}^{1} \cdot \left[ -e^{-y} \right]_{2}^{3} \\
&= \frac{1}{2} \cdot (-e^{-3} – e^{-2}) \\
&= \frac{1}{2} (e^{-2} – e^{-3})
\end{align}
$$

問題$28.2$

$D=\{ (x,y) | x \geq 0, y \geq 0, x+y \leq 1 \}$は$0 \leq x \leq 1$で$0 \leq y \leq 1-x$を考えることで下記のように積分を行うことができる。
$$
\large
\begin{align}
\int \int_{D} f(x,y) \, dx dy &= \int \int_{D} xy \, dx dy \\
&= \int_{0}^{1} \int_{0}^{1-x} xy \, dy dx \\
&= \int_{0}^{1} \left[ \frac{1}{2}xy^2 \right]_{y=0}^{y=1-x} dy \\
&= \int_{0}^{1} \frac{1}{2}x(1-x)^2 dy \\
&= \int_{0}^{1} \frac{1}{2}(x^3-2x^2+x) dy \\
&= \left[ \frac{1}{8}x^4 – \frac{1}{3}x^3 + \frac{1}{4}x^2 \right]_{0}^{1} \\
&= \frac{1}{8} – \frac{1}{3} + \frac{1}{4} = \frac{1}{24}
\end{align}
$$

Ch.20 「行列式」の演習問題の解答例 〜統計学のための数学入門30講(朝倉書店)〜

当記事は「統計学のための数学入門$30$講(朝倉書店)」の読解サポートにあたってChapter.$20$の「行列式」の章末問題の解答の作成を行いました。
基本的には書籍の購入者向けの解説なので、まだ入手されていない方は購入の上ご確認ください。また、解説はあくまでサイト運営者が独自に作成したものであり、書籍の公式ページではないことにご注意ください。

・書籍解答まとめ
https://www.hello-statisticians.com/answer_textbook_math#math_stat

本章のまとめ

演習問題解答

問題$20.1$

問題$20.2$

$$
\large
\begin{align}
A = \left( \begin{array}{ccc} 1 & 1 & 0 \\ -2 & 0 & 0 \\ 0 & 1 & 1 \end{array} \right)
\end{align}
$$

上記の行列$A$の行列式$\det{A}=|A|$は下記のように計算できる。
$$
\large
\begin{align}
\det{A} &= |A| = \left| \begin{array}{ccc} 1 & 1 & 0 \\ -2 & 0 & 0 \\ 0 & 1 & 1 \end{array} \right| \\
&= -2 \cdot (-1)^{2+1} \left| \begin{array}{cc} 1 & 0 \\ 1 & 1 \end{array} \right| \\
&= 2 \cdot 1 = 2
\end{align}
$$

次に行列$A$の余因子行列を$\Delta$とおくと、$\Delta$は下記のように得られる。
$$
\large
\begin{align}
\Delta &= \left( \begin{array}{ccc} \Delta_{11} & \Delta_{21} & \Delta_{31} \\ \Delta_{12} & \Delta_{22} & \Delta_{32} \\ \Delta_{13} & \Delta_{23} & \Delta_{33} \end{array} \right) \\
&= \left( \begin{array}{ccc} (-1)^{1+1} \cdot 0 & (-1)^{2+1} \cdot 1 & (-1)^{3+1} \cdot 0 \\ (-1)^{1+2} \cdot (-2) & (-1)^{2+2} \cdot 1 & (-1)^{3+2} \cdot 0 \\ (-1)^{1+3} \cdot (-2) & (-1)^{2+3} \cdot 1 & (-1)^{3+3} \cdot 2 \end{array} \right) \\
&= \left( \begin{array}{ccc} 0 & -1 & 0 \\ 2 & 1 & 0 \\ -2 & -1 & 2 \end{array} \right)
\end{align}
$$

また、$(20.22)$式より逆行列$A^{-1}$は下記のように得られる。
$$
\large
\begin{align}
A^{-1} = \frac{1}{|A|} \Delta = \frac{1}{2} \left( \begin{array}{ccc} 0 & -1 & 0 \\ 2 & 1 & 0 \\ -2 & -1 & 2 \end{array} \right)
\end{align}
$$

確率分布(probability distribution)②|問題演習で理解する統計学【2】

上記の「確率分布(probability distribution)①」で取り扱えなかった確率分布に関する演習を以下では取り扱いました。

・標準演習$100$選
https://www.hello-statisticians.com/practice_100

離散型確率分布

超幾何分布と母分散の有限修正

・問題
$N$個のサンプルが$2$つのグループで構成されており、グループ$1$が$M$個、グループ$2$が$N-M$個あると仮定する。このとき、$n$個の標本の無作為抽出を考える際に、$N$が有限であるならば一度抽出を行なった標本を戻すか戻さないかによって取り扱いが変わることに注意が必要である。

具体的には抽出を行なった標本を戻した上で次の抽出を行う「復元抽出」と戻さないで抽出を行う「非復元抽出」があるが、「復元抽出」が二項分布で表される一方で、「非復元抽出」は超幾何分布で表される。

以下では「非復元抽出」に関して取り扱う「超幾何分布」の確率関数や期待値$E[Y]$、分散$V[Y]$の導出、さらに二項分布の分散との対応から「母分散の有限修正(finite correction)」に関して取り扱う。下記の問いにそれぞれ答えよ。

i)
$M$個のグループ$1$の標本と$N-M$個のグループ$2$の標本から構成される$N$個から$n$個の「非復元無作為抽出」を行う際にグループ$1$が抽出された個数を確率変数の$Y$で表すとき、確率関数$p(y)=P(Y=y)$を表せ。ただし$\max(0,n-(N-M)) \leq y \leq \min(n,M)$を仮定して良い。

ⅱ)
i)で用いた「$\max(0,n-(N-M)) \leq y \leq \min(n,M)$」の仮定に関して簡単に解釈せよ。

ⅲ)
$i$回目の抽出でグループ$1$を引いた場合に$X_i=1$、グループ$2$を引いた場合に$X_i=0$のように確率変数$X_i$を定義する。このとき確率変数$Y$は$Y = X_1 + X_2 + \cdots + X_n$のように表せる。$X_i$に関して$E[X_i], E[X_i^2]$を答えよ

iv)
ⅲ)で定めた$X_i$を元に$E[X_iX_j], \, i \neq j$を表せ。

v)
$V[X_i]=E[X_i^2]-E[X_i]^2, \, \mathrm{Cov}(X_i,X_j)=E[X_iX_j]-E[X_i]E[X_j]$を用いて$V[X_i], \mathrm{Cov}(X_i,X_j)$を計算せよ。

vi)
$E[Y] = E[X_1 + X_2 + \cdots + X_n]$を元に超幾何分布の期待値$E[Y]$を計算せよ。

vⅱ)
$V[Y] = V[X_1 + X_2 + \cdots + X_n]$を元に超幾何分布の分散$V[Y]$を計算せよ。

vⅲ)
「復元抽出」の場合は二項分布を元に考えることができるが、$Z \sim \mathrm{Bin}(n,p)$の分散を$V[Z]$とおくと$V[Z]=np(1-p)$のように表せる。ここで$p=M/N$のように表すとき、$V[Y]/V[Z]$を計算せよ。

・解答
i)
確率関数$p(y)=P(Y=y)$は下記のように表すことができる。
$$
\large
\begin{align}
p(y) = \frac{{}_{M} C_{y} {}_{N-M} C_{n-y}}{{}_{N} C_{n}}
\end{align}
$$

ⅱ)
$y \leq \min(n,M)$は「グループ$1$を抽出する個数$y$」が「抽出する個数$n$」と「グループ$1$の個数$M$個」のどちらも上回らないことを表す。$\max(0,n-(N-M)) \leq y$は「グループ$1$を抽出する個数$y$」が「$0$以上」かつ「グループ$2$の個数$N-M$個が$n$より少なくなる際の$y$の下限値が$n-(N-M)$」であることを表す。$y \leq \min(n,M)$と$\max(0,n-(N-M)) \leq y$の数式は特にグループ$1$と$2$の数に偏りがある場合や$n$がそれなりに大きい場合に注意が必要である。

ⅲ)
$E[X_i], E[X_i^2]$はそれぞれ下記のように表せる。
$$
\large
\begin{align}
E[X_i] &= 0 \cdot P(X_i=0) + 1 \cdot P(X_i=1) \\
&= P(X_i=1) \\
&= \frac{M}{N} \\
E[X_i^2] &= 0^2 \cdot P(X_i=0) + 1^2 \cdot P(X_i=1) \\
&= P(X_i=1) \\
&= \frac{M}{N}
\end{align}
$$

iv)
$i \neq j$のとき、$E[X_iX_j]$は下記のように表せる。
$$
\large
\begin{align}
E[X_iX_j] &= 0 \cdot (P(X_i=0,X_j=0)+P(X_i=1,X_j=0)+P(X_i=0,X_j=1)) + 1 \cdot P(X_i=1,X_j=1) \\
&= P(X_i=1,X_j=1) \\
&= \frac{M(M-1)}{N(N-1)}
\end{align}
$$

v)
$V[X_i], \mathrm{Cov}(X_i,X_j)$は下記のように計算できる。
$$
\large
\begin{align}
V[X_i] &= E[X_i^2] – E[X_i]^2 \\
&= \frac{M}{N} – \left( \frac{M}{N} \right)^2 \\
&= \frac{M(N-M)}{N^2} \\
\mathrm{Cov}(X_i,X_j) &= E[X_iX_j] – E[X_i]E[X_j] \\
&= \frac{M(M-1)}{N(N-1)} – \frac{M^2}{N^2} \\
&= \frac{MN(M-1)}{N^2(N-1)} – \frac{M^2(N-1)}{N^2(N-1)} \\
&= \frac{\cancel{M^2N} – MN – \cancel{M^2N} + M^2}{N^2(N-1)} \\
&= -\frac{M(N-M)}{N^2(N-1)}
\end{align}
$$

vi)
超幾何分布の期待値$E[Y]$は下記のように計算できる。
$$
\large
\begin{align}
E[Y] &= E[X_1 + X_2 + \cdots + X_n] \\
&= nE[X_i] \\
&= \frac{nM}{N}
\end{align}
$$

vⅱ)
超幾何分布の分散$V[Y]$は下記のように計算できる。
$$
\large
\begin{align}
V[Y] &= V[X_1 + X_2 + \cdots + X_n] \\
&= nV[X_i] + 2 \cdot {}_{n} C_{2} \mathrm{Cov}(X_i,X_j) \\
&= nV[X_i] + n(n-1) \mathrm{Cov}(X_i,X_j) \\
&= \frac{nM(N-M)}{N^2} – \frac{n(n-1)M(N-M)}{N^2(N-1)} \\
&= \frac{nM(N-M)}{N^2(N-1)} [(N-\cancel{1})-(n-\cancel{1})] \\
&= \frac{nM(N-M)(N-n)}{N^2(N-1)} \\
&= n \cdot \frac{M}{N} \left( 1-\frac{M}{N} \right) \times \frac{N-n}{N-1}
\end{align}
$$

vⅲ)
$V[Z]=np(1-p)$に$p=M/N$を代入することで下記が得られる。
$$
\large
\begin{align}
V[Z] &= np(1-p) \\
&= n \cdot \frac{M}{N} \left( 1-\frac{M}{N} \right)
\end{align}
$$

よって$V[Y]/V[Z]$は下記のように考えることができる。
$$
\large
\begin{align}
\frac{V[Y]}{V[Z]} = \frac{N-n}{N-1}
\end{align}
$$

・解説
「統計検定準$1$級対応 ワークブック」の問題$5.3$を元に作成を行いました。vⅱ)の計算では$V[X_1 + X_2 \cdots X_n]$の計算にあたって、共分散の$\mathrm{Cov}(X_i,X_j)$を考える必要があることに注意が必要です。詳しくは下記などを確認すると良いと思います。

また、vⅲ)の答えが有限修正(finite correction)の際の項に一致することは確認しておくと良いです。

重複組合せと負の二項分布

・問題
負の二項分布$NB(r,p)$は確率$p$の事象$1$が$r$回起こるまでに$(1-p)$の事象$2$が$Y$回起こると考える場合の$Y$の分布であり、$Y=y$回起こる確率を表す確率関数を$p(y)$とおくと、$p(y)$は下記のように表すことができる。
$$
\large
\begin{align}
p(y) &= {}_{r} H_{y} p^{r} (1-p)^{y}, \quad y=0,1,2, \cdots \\
{}_r H_{y} &= {}_{y+r-1} C_{y} = \frac{(y+r-1)(y+r-2) \cdots (r+1)r}{y!}
\end{align}
$$

以下では上記の重複組合せ${}_{r} H_{y}$や確率関数の理解と、幾何分布の期待値$E[X_i]$と分散$V[X_i]$を用いて$NB(r,p)$の期待値$E[Y]$と分散$V[Y]$の導出を行う。下記の問いにそれぞれ答えよ。

i) 重複組合せ${}_{r} H_{y}$は「$r$種類のものを重複して$y$個選ぶ際の選び方」とされるが、${}_{r} H_{y}$が${}_{r+y-1} C_{y}$に一致することを下図などを用いることで簡単に解説せよ。

ⅱ) 整数$a$と$0$以上の整数$b$に対し、二項係数の一般化を下記のように定める。
$$
\begin{align}
\left(\begin{array}{c} a \\ b \end{array} \right) \equiv \frac{a(a-1) \cdots (a-b+1)}{b!}
\end{align}
$$
このとき下記が成立することを示せ。
$$
\begin{align}
{}_{r} H_{y} = (-1)^{y} \left(\begin{array}{c} -r \\ y \end{array} \right)
\end{align}
$$

ⅲ) $p=0.5, r=3$のとき、確率関数$p(y)$を元に$p(0), p(1), p(2), p(3), p(4), p(5)$をそれぞれ計算せよ。

iv) 確率$p$の事象が$X_i$回目に起こると考えるとき、幾何分布$\mathrm{Geo}(p)$に基づいて期待値$E[X_i], V[X_i]$は下記のように表すことができる。
$$
\begin{align}
E[X_i] &= \frac{1}{p} \\
V[X_i] &= \frac{1-p}{p^2}
\end{align}
$$

ここで$\displaystyle Y = \sum_{i=1}^{r} X_i, Y \sim \mathrm{NB}(r,p)$であることに基づいて負の二項分布$\mathrm{NB}(r,p)$の期待値$E[Y]$を計算せよ。

v) $\displaystyle Y = \sum_{i=1}^{r} X_i, Y \sim \mathrm{NB}(r,p)$であることに基づいて負の二項分布$\mathrm{NB}(r,p)$の分散$V[Y]$を計算せよ。

・解答
i)
図を元に「○」と「|」の並べ替え方の総数が重複組合せの定義に一致することが確認できる。

ⅱ)
下記のように導出を行うことができる。
$$
\large
\begin{align}
{}_r H_{y} &= {}_{y+r-1} C_{y} \\
&= \frac{(y+r-1)(y+r-2) \cdots (r+1)r}{y!} \\
&= \frac{r(r+1) \cdots (r+y-2)(r+y-1)}{y!} \\
&= (-1)^{y} \frac{(-r)(-r-1) \cdots (-r-y+2)(-r-y+1)}{y!} \\
&= (-1)^{y} \left(\begin{array}{c} -r \\ y \end{array} \right)
\end{align}
$$

ⅲ)
下記のようにそれぞれ計算できる。
$$
\large
\begin{align}
p(0) &= {}_{3} H_{0} 0.5^3(1-0.5)^0 \\
&= {}_{3+0-1} C_{0} 0.5^3 = 0.125 \\
p(1) &= {}_{3} H_{1} 0.5^3(1-0.5)^1 \\
&= {}_{3+1-1} C_{1} 0.5^4 = 3 \cdot 0.5^4 \simeq 0.188 \\
p(2) &= {}_{3} H_{2} 0.5^3(1-0.5)^2 \\
&= {}_{3+2-1} C_{2} 0.5^5 = 6 \cdot 0.5^5 \simeq 0.188 \\
p(3) &= {}_{3} H_{3} 0.5^3(1-0.5)^3 \\
&= {}_{3+3-1} C_{3} 0.5^6 = 10 \cdot 0.5^6 \simeq 0.156 \\
p(4) &= {}_{3} H_{4} 0.5^3(1-0.5)^4 \\
&= {}_{3+4-1} C_{3} 0.5^7 = 15 \cdot 0.5^7 \simeq 0.117 \\
p(5) &= {}_{3} H_{5} 0.5^3(1-0.5)^5 \\
&= {}_{3+5-1} C_{5} 0.5^8 = 21 \cdot 0.5^7 \simeq 0.082
\end{align}
$$

iv)
確率変数$\displaystyle Y = \sum_{i=1}^{r} (X_i-1)$に関して下記が成立する。
$$
\large
\begin{align}
E[Y] &= E \left[ \sum_{i=1}^{r} (X_i-1) \right] = E \left[ -r + \sum_{i=1}^{r} X_i \right] \\
&= – r + \sum_{i=1}^{r} E[X_i] \\
&= -r+\frac{r}{p} = \frac{r(1-p)}{p}
\end{align}
$$

v)
確率変数$\displaystyle Y = \sum_{i=1}^{r} (X_i-1)$に関して下記が成立する。
$$
\large
\begin{align}
V[Y] &= V \left[ \sum_{i=1}^{r} (X_i-1) \right] = V \left[ -r + \sum_{i=1}^{r} X_i \right] \\
&= 0 + \sum_{i=1}^{r} V[X_i] \\
&= \frac{r(1-p)}{p^2}
\end{align}
$$

・解説
ⅲ)の計算結果に関して$p(0)+p(1)+p(2)=0.5$が成立することが確認できますが、$3$本先取で$3$勝$0$敗〜$3$勝$2$敗の確率の和に対応させると結果が妥当であると解釈できます。

多項分布

・問題
$2$項分布では確率変数$X$が$0, 1$の$2$値を取る場合を取り扱うが、$Y$が$K \leq 2$の$K$値を取るように拡張したときに確率変数ベクトル$Y$が従う分布が多項分布である。
$$
\large
\begin{align}
X_{n} &= \left(\begin{array}{cc} X_{n1} \\ \vdots \\ X_{nK} \end{array} \right) \quad (1) \\
Y &= \left(\begin{array}{cc} Y_{1} \\ \vdots \\ Y_K \end{array} \right) = \left(\begin{array}{cc} \displaystyle \sum_{n=1}^{N} X_{n1} \\ \vdots \\ \displaystyle \sum_{n=1}^{N} X_{nK} \end{array} \right) \quad (2) \\
\sum_{k=1}^{K} X_{nk} &= 1, \quad \sum_{k=1}^{K} Y_k = n
\end{align}
$$

二項分布では$n$回の試行それぞれで$X=1$である確率を$p$、$X=0$である確率を$1-p$で取り扱うが、多項分布の場合は$(1)$式の$X_{nk}=1$の確率を$p_k$とおき、$p_1, p_2, p_3, \cdots p_{K-1}, p_{K}$のようにそれぞれの値に対する確率を取り扱う。確率パラメータが$p$の二項分布は$\mathrm{Bin}(n,p)$のように表記することが多いが、$N$回の試行に関して確率パラメータが$p_1, p_2, p_3, \cdots p_{K-1}, p_{K}$である多項分布は下記のように表される。
$$
\large
\begin{align}
Y & \sim \mathrm{Multi}(N, p_1, \cdots , p_K) \\
\sum_{k=1}^{K} p_k &= 1
\end{align}
$$

ここで上記の確率関数を$p(y_1,\cdots,y_K)$とおくと$p(y_1,\cdots,y_K)$は$p_1, p_2, p_3, \cdots p_{K-1}, p_{K}$を用いて下記のように表すことができる。
$$
\large
\begin{align}
p(y_1,\cdots,y_K) &= \frac{(y_1 + \cdots + y_K)!}{y_1! \cdots y_K!} p_1^{y_1} \cdots p_K^{y_K} \\
&= \frac{\displaystyle \left( \sum_{k=1}^{K} y_k \right)!}{\displaystyle \prod_{k=1}^{K} y_k!} \prod_{k=1}^{K} p_k^{y_k}
\end{align}
$$

この問題では以下、多項分布の確率関数や期待値、分散、共分散、確率母関数などの表記や導出について取り扱う。下記の問いにそれぞれ答えよ。
i) $n=3, p_1=0.2, p_2=0.5, p_3=0.3$のとき、$y_1=1, y_2=1, y_3=1$である確率を計算せよ。
ⅱ) $1$〜$N$回の試行の$n$回目の試行の確率変数$X_{nk}$に関して期待値$E[X_{nk}]$と分散$V[X_{nk}]$の式をそれぞれ表せ。
ⅲ) 確率変数$Y_k$の期待値$E[Y_{k}]$と分散$V[Y_{k}]$の式をそれぞれ表せ。
iv) 確率変数$X_{nk}, X_{nk’}, \, k \neq k’$の共分散$\mathrm{Cov}(X_{nk}, X_{nk’})$を導出せよ。
v) 確率変数$Y_{k}, Y_{k’}, \, k \neq k’$の共分散$\mathrm{Cov}(Y_{k}, Y_{k’})$を導出せよ。
vi) $X_{n1}, \cdots X_{nK}$に関して確率母関数$G_{X_{n1}, \cdots X_{nK}}(s_1, \cdots, s_K)=E[s_1^{X_{n1}} \cdots s_K^{X_{nK}}]$を定めるとき、$G_{X_{n1}, \cdots X_{nK}}(s_1, \cdots, s_K)$を導出せよ。
vⅱ) vi)を元に確率母関数$G_{Y_{1}, \cdots X_{K}}(s_1, \cdots, s_K)=E[s_1^{Y_{1}} \cdots s_K^{Y_{K}}]$を導出せよ。

・解答
i)
下記のように計算を行うことができる。
$$
\large
\begin{align}
p(y_1,\cdots,y_K) &= \frac{(y_1 + \cdots + y_K)!}{y_1! \cdots y_K!} p_1^{y_1} \cdots p_K^{y_K} \\
&= \frac{(1+1+1)!}{1 \cdot 1 \cdot 1} 0.2^{1} \cdot 0.5^{1} \cdot 0.3^{1} \\
&= 3 \cdot 0.09 = 0.27
\end{align}
$$

ⅱ)
確率変数$X_{nk}$の期待値$E[X_{nk}]$と分散$V[X_{nk}]$はそれぞれ下記のように表せる。
$$
\large
\begin{align}
E[X_{nk}] &= 1 \cdot P(X_{nk}=1) + 0 \cdot P(X_{nk} \neq 1) \\
&= p_{k} \\
E[X_{nk}^{2}] &= 1^2 \cdot P(X_{nk}=1) + 0^2 \cdot P(X_{nk} \neq 1) \\
&= p_{k} \\
V[X_{nk}] &= E[X_{nk}^{2}] – E[X_{nk}]^{2} \\
&= p_{k} – p_{k}^{2} = p_{k}(1-p_{k})
\end{align}
$$

ⅲ)
確率変数$Y_k$の期待値$E[Y_{k}]$と分散$V[Y_{k}]$はそれぞれ下記のように表せる。
$$
\large
\begin{align}
E[Y_{k}] &= E \left[ \sum_{n=1}^{N} X_{nk} \right] \\
&= \sum_{n=1}^{N} E[X_{nk}] \\
&= N p_{k} \\
V[Y_{k}] &= V \left[ \sum_{n=1}^{N} X_{nk} \right] \\
&= \sum_{n=1}^{N} V[X_{nk}] \\
&= N p_{k} (1-p_k)
\end{align}
$$

iv)
共分散$\mathrm{Cov}(X_{nk}, X_{nk’})$は下記のように考えることができる。
$$
\large
\begin{align}
\mathrm{Cov}(X_{nk}, X_{nk’}) &= E[X_{nk} X_{nk’}] – E[X_{nk}] E[X_{nk’}] \\
&= 0 – p_{k} p_{k’} \\
&= – p_{k} p_{k’}
\end{align}
$$

v)
確率変数$Y_{k}, Y_{k’}, \, k \neq k’$の共分散$\mathrm{Cov}(Y_{k}, Y_{k’})$は下記のように表せる。
$$
\large
\begin{align}
\mathrm{Cov}(Y_{k}, Y_{k’}) &= N \mathrm{Cov}(X_{nk}, X_{nk’}) \\
&= – N p_{k} p_{k’}
\end{align}
$$

vi)
確率母関数$G_{X_{n1}, \cdots X_{nK}}(s_1, \cdots, s_K)$は下記のように表せる。
$$
\large
\begin{align}
G_{X_{n1}, \cdots X_{nK}}(s_1, \cdots, s_K) &= E[s_1^{X_{n1}} \cdots s_K^{X_{nK}}] \\
&= p_{1} s_1^{1} \cdots s_K^{0} + \cdots + p_{K} s_1^{0} \cdots s_K^{1} \\
&= p_{1} s_1 + \cdots p_{K} s_{K}
\end{align}
$$

vⅱ)
確率母関数$G_{Y_{1}, \cdots X_{K}}(s_1, \cdots, s_K)=E[s_1^{Y_{1}} \cdots s_K^{Y_{K}}]$は下記のように導出できる。
$$
\large
\begin{align}
G_{Y_{1}, \cdots X_{K}}(s_1, \cdots, s_K) &= E[s_1^{Y_{1}} \cdots s_K^{Y_{K}}] \\
&= E[s_1^{\sum_{n=1}^{N} X_{n1}} \cdots s_K^{\sum_{n=1}^{N} X_{nK}}] \\
&= E \left[ \prod_{n=1}^{N} s_1^{X_{n1}} \cdots \prod_{n=1}^{N} s_1^{X_{n1}} \right] \\
&= \prod_{n=1}^{N} E[s_1^{X_{n1}} \cdots s_K^{X_{nK}}] \\
&= (p_{1} s_1 + \cdots p_{K} s_{K})^{N}
\end{align}
$$

・解説
統計検定準$1$級対応ワークブックの$5$章の内容を元に問題の作成を行いましたので合わせて確認すると良いと思います。

確率変数の定義に関しては下記を参考に作成を行いました。
カテゴリ分布
多項分布

この問題では$X$が従う分布がカテゴリ分布、$Y$が従う分布が多項分布に一致するように確率変数ベクトルの定義を行いました。

連続型確率分布

コーシー分布

・問題
自由度$1$の$t$分布に対応するコーシー分布の確率密度関数を$f(x)$とおくと$f(x)$は下記のように表せる。
$$
\large
\begin{align}
f(x) = \frac{1}{\pi (1+x^2)}
\end{align}
$$

この問題では以下、コーシー分布の確率密度関数の形状や全区間での積分などに関して演習形式で確認を行う。以下の問いにそれぞれ答えよ。
i) $f(x)$の導関数$f'(x)$を計算し、増減表を作成せよ。

ⅱ) $x=\tan{\theta}$とおき、置換積分を行うことで下記を示せ。
$$
\large
\begin{align}
\int_{-\infty}^{\infty} f(x) dx = \int_{-\infty}^{\infty} \frac{1}{\pi (1+x^2)} dx = 1
\end{align}
$$

ⅲ) 自由度$n$の$t$分布の確率密度関数を$g(x)$とおくと$g(x)$は下記のように表せる。
$$
\large
\begin{align}
g(x) = \frac{\displaystyle \Gamma \left( \frac{n+1}{2} \right)}{\displaystyle \sqrt{\pi n} \Gamma \left( \frac{n}{2} \right)} \left( 1 + \frac{x^2}{n} \right)^{-\frac{n+1}{2}}
\end{align}
$$

上記に$n=1$を代入し、変形を行うとコーシー分布の確率密度関数$f(x)$が得られることを示せ。

・解答
i)
$f'(x)$は下記のように計算できる。
$$
\large
\begin{align}
f'(x) &= ([\pi (1+x^2)]^{-1})’ \\
&= \frac{1}{\pi} \times -\frac{1}{(1+x^2)^2} \times (1+x^2)’ \\
&= -\frac{2x}{\pi (1+x^2)^2}
\end{align}
$$

よって$f(x)$の増減表は下記のように作成できる。
$$
\large
\begin{array}{|c|*5{c|}}\hline x & -\infty & \cdots & 0 & \cdots & \infty \\
\hline f'(x)& & + & 0 & – & \\
\hline f(x)& 0 & \nearrow & \displaystyle \frac{1}{\pi} & \searrow & 0 \\
\hline
\end{array}
$$

ⅱ)
$x=\tan{\theta}$より、$\displaystyle \frac{dx}{d \theta} = \frac{1}{\cos^{2}{\theta}}$である。また、$x$と$\theta$は下記のように対応する。

$x$$-\infty \to \infty$
$\theta$$\displaystyle -\frac{\pi}{2} \to \frac{\pi}{2}$

よって、下記のように置換積分を行うことができる。
$$
\large
\begin{align}
\int_{-\infty}^{\infty} f(x) dx &= \int_{-\infty}^{\infty} \frac{1}{\pi (1+x^2)} dx \\
&= \int_{-\frac{\pi}{2}}^{\frac{\pi}{2}} \frac{1}{\pi (1+\tan{\theta}^2)} \cdot \frac{1}{\cos^{2}{\theta}} d \theta \\
&= \int_{-\frac{\pi}{2}}^{\frac{\pi}{2}} \frac{\cancel{\cos^{2}{\theta}}}{\pi} \cdot \frac{1}{\cancel{\cos^{2}{\theta}}} d \theta \\
&= \frac{1}{\pi} \left[ \theta \right]_{-\frac{\pi}{2}}^{\frac{\pi}{2}} \\
&= \frac{1}{\pi} \left[ \frac{\pi}{2} – \left( -\frac{\pi}{2} \right) \right] \\
&= 1
\end{align}
$$

ⅲ)
$g(x)$に$n=1$を代入すると下記のように変形を行うことができる。
$$
\large
\begin{align}
g(x) &= \frac{\displaystyle \Gamma \left( \frac{1+1}{2} \right)}{\displaystyle \sqrt{\pi \cdot 1} \Gamma \left( \frac{1}{2} \right)} \left( 1 + \frac{x^2}{1} \right)^{-\frac{1+1}{2}} \\
&= \frac{\Gamma(1)}{\displaystyle \sqrt{\pi} \Gamma \left( \frac{1}{2} \right)} (1+x^2)^{-1} \\
&= \frac{1}{\pi(1+x^2)}
\end{align}
$$

・解説
下記などを元に作成を行いました。

対数正規分布

・問題
$Y \sim \mathcal{N}(\mu,\sigma^2)$のように正規分布$\mathcal{N}(\mu,\sigma^2)$に従う確率変数$Y$に関して$X=e^Y$のような変数変換を考えたとき、$X$は対数正規分布$\Lambda(\mu,\sigma^2)$に従う。
対数正規分布$\Lambda(\mu,\sigma^2)$の確率密度関数を$f(x)$とおくと$f(x)$は下記のように表せる。
$$
\large
\begin{align}
f(x) = \frac{1}{\sqrt{2 \pi \sigma^2} x} \exp{\left( -\frac{(\log{x}-\mu)^2}{2 \sigma^2} \right)}, \quad x>0
\end{align}
$$

以下、上記の確率密度関数の導出や対数正規分布$\Lambda(\mu,\sigma^2)$の$k$次モーメント$E[X^k]$や期待値・分散などの導出に関して演習形式で確認を行う。下記の問いにそれぞれ答えよ。
i) 正規分布$\mathcal{N}(\mu,\sigma^2)$の確率密度関数を$g(y)$とおくとき、$g(y)$を表せ。
ⅱ) i)の$g(y)$に対し、$x=e^{y}$を元に変数変換を行うことで、対数正規分布$\Lambda(\mu,\sigma^2)$の確率密度関数$f(x)$を導出せよ。
ⅲ) $X=e^{Y}$であることを元に、$E[X^{k}]=E[e^{kY}]$であることを確認せよ。
iv) ⅲ)で確認を行った$E[X^{k}]=E[e^{kY}]$より、$E[X^{k}]$は正規分布$\mathcal{N}(\mu,\sigma^2)$のモーメント母関数$m_{Y}(t)=E[e^{tY}]$に$t=k$を代入することで得られる。$m_{Y}(t)$を$\mu, \sigma^2$を用いて表せ。
v) 対数正規分布$\Lambda(\mu,\sigma^2)$の期待値$E[X]$と分散$V[X]$をそれぞれ表せ。
vi) 対数正規分布$\Lambda(0,1^2)$の確率密度関数$f(x)$のグラフを描け。
vⅱ) 対数正規分布$\Lambda(0,1^2)$の確率密度関数$f(x)$に関して下記が成立することを示せ。
$$
\large
\begin{align}
\lim_{x \to +0} f(x) &= 0 \\
\lim_{x \to \infty} f(x) &= 0
\end{align}
$$

・解答
i)
正規分布$\mathcal{N}(\mu,\sigma^2)$の確率密度関数を$g(y)$は下記のように表せる。
$$
\large
\begin{align}
g(x) = \frac{1}{\sqrt{2 \pi \sigma^2}} \exp{\left( -\frac{(y-\mu)^2}{2 \sigma^2} \right)}
\end{align}
$$

ⅱ)
$x=e^{y}$より$y=\log{x}, \, x>0$が得られ、$\displaystyle \frac{dy}{dx} = \frac{1}{x}$である。よって確率密度関数$f(x)$は変数変換の公式を元に下記のように導出できる。
$$
\large
\begin{align}
f(x) &= g(y) \left| \frac{dy}{dx} \right| \\
&= g(\log{x}) \cdot \frac{1}{x} \\
&= \frac{1}{\sqrt{2 \pi \sigma^2} x} \exp{\left( -\frac{(\log{x}-\mu)^2}{2 \sigma^2} \right)}, \quad x>0
\end{align}
$$

ⅲ)
$X=e^{Y}$より、下記のような変形を行える。
$$
\large
\begin{align}
E[X^{k}] &= E[(e^{Y})^{k}] \\
&= E[e^{kY}]
\end{align}
$$

iv)
正規分布$\mathcal{N}(\mu,\sigma^2)$のモーメント母関数$m_{Y}(t)=E[e^{tY}]$は下記のように表せる。
$$
\large
\begin{align}
m_{Y}(t) &= E[e^{tY}] \\
&= \exp{\left( \mu t + \frac{1}{2} \sigma^2 t^2 \right)}
\end{align}
$$

v)
対数正規分布$\Lambda(\mu,\sigma^2)$の期待値$E[X]$と分散$V[X]$はそれぞれ下記のように得られる。
$$
\large
\begin{align}
E[X] &= \exp{\left( \mu \cdot 1 + \frac{1}{2} \sigma^2 \cdot 1^2 \right)} \\
&= \exp{\left( \mu + \frac{1}{2} \sigma^2 \right)} \\
V[X] &= E[X^2] – E[X]^2 \\
&= \exp{\left( \mu \cdot 2 + \frac{1}{2} \sigma^2 \cdot 2^2 \right)} – \exp{\left[ 2 \left( \mu + \frac{1}{2} \sigma^2 \right) \right]} \\
&= \exp{\left( 2 \mu + 2 \sigma^2 \right)} – \exp{\left( 2 \mu + \sigma^2 \right)} \\
&= \exp{(\sigma^2)} \exp{\left( 2 \mu + \sigma^2 \right)} – \exp{\left( 2 \mu + \sigma^2 \right)} \\
&= \exp{\left( 2 \mu + \sigma^2 \right)} (\exp{(\sigma^2)} – 1)
\end{align}
$$

vi)
下記を実行することで対数正規分布$\Lambda(0,1^2)$のグラフを描くことができる。

import numpy as np
import matplotlib.pyplot as plt

mu, sigma = 0., 1.

x = np.arange(0.01, 5.01, 0.01)
f_x = np.e**(-(np.log(x)-mu)**2/(2.*sigma**2))/(np.sqrt(2*np.pi)*sigma*x)

plt.plot(x,f_x)
plt.show()

実行結果

vⅱ)
$$
\large
\begin{align}
\lim_{x \to +0} \log{f(x)} &= -\infty \\
\lim_{x \to \infty} \log{f(x)} &= -\infty
\end{align}
$$

$f(x) \to +0 \iff \log{f(x)} \to -\infty$より、上記を示せば良い。
$$
\large
\begin{align}
\lim_{x \to +0} \log{f(x)} &= \log{\left[ \frac{1}{\sqrt{2 \pi} x} \exp{\left( -\frac{(\log{x})^2}{2} \right)} \right]} \\
&= \lim_{x \to +0} \log{f(x)} \left[ -x – \frac{(\log{x})^2}{2} – \frac{1}{2} \log{(2 \pi)} \right] \\
&= -\infty \\
\lim_{x \to \infty} \log{f(x)} &= \lim_{x \to +0} \log{f(x)} \left[ -x – \frac{(\log{x})^2}{2} – \frac{1}{2} \log{(2 \pi)} \right] \\
&= -\infty
\end{align}
$$

よって下記が成立する。
$$
\large
\begin{align}
\lim_{x \to +0} f(x) &= 0 \\
\lim_{x \to \infty} f(x) &= 0
\end{align}
$$

・解説
この問題では対数正規分布$\Lambda(\mu,\sigma^2)$の導出や$k$次モーメント$E[X^k]$や期待値$E[X]$・分散$V[X]$などに関して取り扱いました。統計検定準$1$級のワークブックを元に作成を行いましたが、グラフに関しては解説がないので合わせて抑えておくと良いと思います。