当まとめでは統計検定$2$級の公式テキストの副教材に用いることができるように、統計学入門に関して取り扱います。当記事では「統計検定$2$級対応 統計学基礎」の$1.4.1$節「$5$数要約」の内容を元に最小値・第$1$四分位数・中央値・第$3$四分位数・最大値を用いた観測値の要約に関して取り扱いました。
統計検定$2$級のテキストとの対応がわかりやすいように、目次を「統計検定$2$級対応 統計学基礎」と対応させました。学びやすさの観点からあえて目次を対応させましたが、当まとめは「統計の森」オリジナルのコンテンツであり、統計検定の公式とは一切関係ないことにご注意ください。
・統計検定$2$級対応・統計学入門まとめ
https://www.hello-statisticians.com/stat_basic
5数要約の概要
概要
得られた観測値を数字で要約するにあたっては、中央値や四分位数のように大まかにパターンがあるので、表の形式で数字をまとめて取り扱うと作成や解釈がしやすいです。
当記事では最小値・第$1$四分位数・中央値・第$3$四分位数・最大値を元に構成される要約の$5$数要約(five-number summary)について以下具体的な例を元に詳しく確認します。変数の分類で取り扱った例を同じく取り扱うので合わせて確認しておくと良いです。
必要な数学
中央値、四分位数を主に取り扱うので、$2$級範囲では数学知識は特に必要ありません。
5数要約
ID | 近さ | 家賃 | 間取り | 大きさ($m^2$) | 方角 | 築年数(年) |
$1$ | B | $68,000$ | $1K$ | $19$ | 西 | $12$ |
$2$ | B | $68,000$ | $1K$ | $19$ | 南 | $12$ |
$3$ | B | $69,000$ | $1K$ | $19$ | 北西 | $14$ |
$\vdots$ | $\vdots$ | $\vdots$ | $\vdots$ | $\vdots$ | $\vdots$ | $\vdots$ |
$139$ | A | $148,000$ | $1LDK$ | $42$ | 南 | $13$ |
$140$ | B | $150,000$ | $1LDK$ | $41$ | 南東 | $5$ |
上記の詳細は下記より入手することができます。
http://www.tokyo-tosho.co.jp/books/978-4-489-02227-2/
家賃、大きさ、築年数の$5$数要約は下記のように作成できます。
項目 | 家賃(円) | 大きさ($m^2$) | 築年数(年) |
最小値 | $68,000$ | $15.00$ | $0.00$ |
第$1$四分位数 | $86,750$ | $21.75$ | $6.00$ |
中央値 | $98,750$ | $25.00$ | $9.00$ |
第$3$四分位数 | $113,250$ | $29.00$ | $13.00$ |
最大値 | $150,000$ | $60.00$ | $28.00$ |