幾何分布を用いた試行回数の期待値計算|統計学の応用例を考える【1】

教科書的なトピックを確認するだけではなかなかイメージをつかむのが大変なので、統計学の応用についてのコラムを取りまとめることとしました。第一回は幾何分布を用いた試行回数の期待値計算について取り扱います。
幾何分布を用いた試行回数の期待値計算は、「カードを全種類集める際に必要な試行回数」を考える際にも用いることができるので、応用事例はかなり多くなかなか面白いのではないかと思います。

事前知識の確認

幾何分布について復習

https://www.hello-statisticians.com/explain-terms-cat/probdist1.html
幾何分布について詳しくは上記で取り扱いました。確率変数を$X$、確率関数を$P(X=k|p)$、期待値を$E[X]$とすると、確率関数と期待値はそれぞれ下記のように表すことができます。
$$
\begin{align}
P(X=k|p) &= p(1-p)^{k-1} \\
E[X] &= \frac{1}{p}
\end{align}
$$
今回の内容は事象が起こる確率$p$のベルヌーイ試行を繰り返した際に、最初に事象が観測される際の試行回数の期待値を求めることに関連するので、上記の$\displaystyle E[X] = \frac{1}{p}$が要所要所の導出で用いられます。

基本的な考え方

当記事では具体的な問題に対して幾何分布を用いて試行回数の期待値を計算を行いますが、基本的な計算のパターンは同じなので、先に簡単に取りまとめを行います。$5$種類のカードがそれぞれ同じ確率$\displaystyle \frac{1}{5}$で得られる際に、コンプリートするにはどのくらいの試行回数が必要かを考えます。

このようなことを考えるにあたっては、$0$種類から$1$種類、$1$種類から$2$種類、…、$4$種類から$5$種類、のように手持ちの種類の移行に伴ってそれぞれ個々に期待値を考えるとします。この時、$0$種類から$1$種類に移行する際はどのカードを引いても良いので確率$p=1$で移行します。よって、この期待値は$\displaystyle E[X] = \frac{1}{p} = \frac{1}{1} = 1$となります。次に$1$種類から$2$種類へと移行する際は手持ちの$1$種類以外の4種類のカードを引ければ良いので、確率$\displaystyle p = \frac{4}{5}$で移行します。この期待値は$\displaystyle E[X] = \frac{1}{p} = \frac{1}{4/5} = \frac{5}{4}$です。
同様に$2$種類から$3$種類の場合は$\displaystyle E[X] = \frac{5}{3}$、$3$種類から$4$種類の場合は$\displaystyle E[X] = \frac{5}{2}$、$4$種類から$5$種類の場合は$\displaystyle E[X] = \frac{5}{1} = 5$のように計算することができます。

応用事例では、このような考え方に基づいて具体的な事例を確認します。

応用事例

カードのコンプリート①

カードのコンプリートの事例は前述でも取り扱いましたが、より具体的な問題設定に基づいて考えようと思います。
以下、レアカード10種、ノーマルカード50種のカードパックがあり、1枚のレアカードと9枚のノーマルカードが入った1パック10枚を300円で購入できる際に、カードコンプリートのために必要な所持金の期待値を考えます。レアカード10種とノーマルカード50種はそれぞれ同じ確率で得られると考えます。

このことを考えるにあたっては、レアカードとノーマルカードの試行回数の期待値をそれぞれ算出し、ノーマルカードは1パックあたりの9で割り、パック数の期待値を計算し、300円をかけて予算を計算することができます。まずはレアカード10種について考えます。
$$
\begin{align}
\sum_{i=1}^{10} \frac{1}{(11-i)/10} &= \sum_{i=1}^{10} \frac{10}{11-i} \\
&= \frac{10}{10} + \frac{10}{9} + \frac{10}{8} + … + \frac{10}{2} + \frac{10}{1} \\
&= 29.289…
\end{align}
$$
次にノーマルカード50種について考えます。
$$
\begin{align}
\sum_{i=1}^{50} \frac{1}{(51-i)/50} &= \sum_{i=1}^{10} \frac{50}{51-i} \\
&= \frac{50}{50} + \frac{50}{49} + \frac{50}{48} + … + \frac{50}{1} \\
&= 224.96…
\end{align}
$$
上記を9で割ると、$24.995…$のようになるので、レアカード10種の方がお金がかかることになります。

よって必要な予算の期待値は$29.289… \times 300 = 8786.90…$円となります。

カードのコンプリート②

ここではレアカード5種、ノーマルカード25種の1パック10枚300円のカードパックが2つある際に、2つのカードパックのカードをコンプリートするために必要な所持金の期待値を考えるとします。これは①の類題で、2種のカードパックを交互に購入すると考えるなら①とほぼ同様な期待値になる一方で、②ではコンプリートできた時点でカードパックを購入するのをやめることができます。このことによって、直感的にはカードのコンプリートのためのコストが下がるであろうことが推測できます。
まずはレアカード5種について考えます。
$$
\begin{align}
2 \times \sum_{i=1}^{5} \frac{1}{(6-i)/10} &= 2\sum_{i=1}^{5} \frac{5}{6-i} \\
&= 2\left( \frac{5}{5} + \frac{5}{4} + \frac{5}{3} + \frac{5}{2} + \frac{5}{1} \right) \\
&= 22.833…
\end{align}
$$
次にノーマルカード25種について考えます。
$$
\begin{align}
2 \times \sum_{i=1}^{25} \frac{1}{(26-i)/25} &= \sum_{i=1}^{25} \frac{25}{26-i} \\
&= 2\left( \frac{25}{25} + \frac{25}{24} + \frac{25}{23} + … + \frac{25}{1} \right) \\
&= 190.79…
\end{align}
$$
上記を9で割ると$21.199…$のようになるため、レアカード5種のみを考えれば良いことになります。

よって必要な予算の期待値は$22.833… \times 300 = 6850.0…$円となり、①の際よりもカードのコンプリートにあたっての予算が少なくなります。

個別購入かカードパックの購入か

①と同様なカードパックの購入を検討する時に、手に入れたいレアカードは1種のみである状況を考えます。一方で、そのカードの新品が$2500$円で購入することができるとした際に、「個別で購入するのが良いかカードパックの購入が良いか」について考察を行います。

手に入れたいレアカードを手に入れられる確率は$\displaystyle p=\frac{1}{10}$なので、手に入れるにあたっての試行回数の期待値は下記のように計算できます。
$$
\begin{align}
E[X] &= \frac{1}{p} \\
&= \frac{1}{1/10} \\
&= 10
\end{align}
$$
よって、手に入れたいカードをカードパックの購入で手に入れるにあたっての予算は$3000$円程度となると考えておけば良く、これは個別購入の$2500$円を上回ります。

一方で、手に入れたいレアカードが2種ある際は、試行回数の期待値は下記のようになります。
$$
\begin{align}
\frac{1}{1/10} + \frac{1}{2/10} &= 10+5 \\
&= 15
\end{align}
$$
この時予算の期待値は$4500$円となりますが、個別で2枚のカードを購入するにあたっては$5000$円必要なので、手に入れたいレアカードの枚数によって個別購入が良いかカードパックの購入が良いかが異なることに注意が必要です。

まとめ