統計の森では、「統計の森ちゃんねる」というYouTubeチャンネルを運営しています。
統計の森ちゃんねるでは、ゲームを題材に統計的手法を使ってゲームにまつわる様々な秘密をのぞいて遊ぼうという企画「ゲーム×統計」を進めています。
本記事では、ゲーム×統計の第一弾である「ゲーム×統計@桃鉄」のまとめ記事です。
Contents
#01 普通にプレイしながら企画説明
3年決戦を普通にプレイしながら、本動画企画の趣旨を説明しています。
動画企画の目的
桃鉄定番の最強キャラ「さくま鉄人」の強さの秘密はどこにあるのか?を取得したデータに基づいて考察して遊ぶ。
ゲーム設定
- 「ひとりで桃鉄」の「桃鉄3年決戦」
- 対戦相手(CPU)
- ガキ
- ようきひ
- さくま鉄人
データの取得について
エミュレーターなどのツールは利用しない。ゲームプレイを通してデータを集める。
#02 3年決戦結果の単純集計を眺める
3年決戦を19戦した結果を単純集計しています。
単純集計結果
19戦した結果、さくま鉄人が圧倒的に強いというわけではないことがわかった。下記notebookを参照。
#03 勝敗数の差を評価する(仮説検定)
適合度の$\chi^2$検定を利用して勝敗数の違いについて有意差を評価しています。
アプローチ
各プレーヤーの「勝率」に従ってランダムに勝敗が決まると仮定し、プレーや毎の勝率が同じ(強さは変わらない)という仮説(帰無仮説)を評価する。
評価結果
5%有意基準で帰無仮説は棄却されることがわかった。つまり、各プレーヤーの勝敗数の差はランダムに生じたものとはいえず、「勝率」に差があるだろうことがわかった。
下記参照
#04 3人の勝率を推論しよう(ベイズ推定)
3人の勝率をデータに基づいて直接推論します。推論にあたっては勝率に関して確率モデルを構築し、いわゆるベイズ推論をおこなっています。
アプローチ
#03と同様に勝率に基づいてランダムに勝敗が決まると仮定する。このように仮定すると、カテゴリ分布で勝敗がモデル化できる。
カテゴリ分布の共役事前分布はディリクレ分布であり、事後分布はディリクレ分布になる。
なお、カテゴリ分布は多項分布を扱うことでも同じ結果となる。
結果
事後分布の95%区間(95%信用区間)を比較すると、「さくま鉄人」と「ようきひ」の勝率は「ようきひ」の方が高いということがわかった。
下記参照
- カテゴリ分布(categorical distribution)のベイズ推定と多クラス分類
- ディリクレ分布(Dirichlet distribution)と多項分布の事後分布
- 共役事前分布(Conjugate Prior Distribution)まとめ
#05 ようきひの強さを探る(データ収集回)
前回と前々回の分析結果から、「3年決戦」において「さくま鉄人」よりも「ようきひ」の方が強そうだということがわかりました。そこで、今回は「ようきひ」の強さについて、サイコロの出目の分布を評価しています。
アプローチ
#03 と同様に適合度の$\chi^2$検定を利用して、サイコロの出目が等確率であるかを評価する。
しかし、未だデータが1戦分しかないため、今回はサイコロの出目を「小さい(1~3)」と「大きい(4~6)」に分けて、小さい目と大きい目が等確率で生じるのかを評価する。
結果
さくま鉄人のサイコロ出目は等確率であるという仮説を棄却することはできなかったが、ようきひとガキはどちらも棄却された。つまり、ようきひはサイコロ出目が大きい確率が高く、ガキはサイコロ出目が小さい確率が高いと言えそうである。
ただし、データが少なく、確定はできないと考えている。
下記参照
[…] 共役事前分布を利用したベイズ推論の基礎として、カテゴリ分布のパラメータを推論しています。本動画シリーズは、「【ゲーム×統計@桃鉄】# 04 (YouTube)」で使っている手法を解説する動画となっています。「ゲーム×統計@桃鉄」シリーズのまとめも参照してください。 […]