過去問題
過去問題は統計検定公式問題集が問題と解答例を公開しています。こちらを参照してください。
- 統計検定3級(2019.06)【問題】(統計検定公式)<※期間限定>
- 統計検定3級(2019.06)【正解】(統計検定公式)
問9 解答
(クロス集計表、グラフ)
[1]
$\boxed{ \ \mathsf{17}\ }$ ③
$A_1$のチーズの販売個数が、合計で$78$、そのうち平日で$47$なので、土日の個数は$a=78-47=31$、
平日の販売個数の合計が$170$で、$C$のチーズ以外は販売個数がわかっているので、$C$のチーズの個数は$b=170-(47+23+17+33+35)=15$、
$C$のチーズの販売個数が、合計で$28$、そのうち平日で$15$なので、土日の個数は$a=28-15=13$
となります。
[2]
$\boxed{ \ \mathsf{18}\ }$ ②
割合を表すのに適しているグラフは、円グラフや帯グラフです。
※)①の左側のような立体のグラフは、値の大きさなど見た目から誤解を生みやすくなりますので、使うときは非常に注意が必要です。(通常のグラフ表現では滅多に用いることはありません。)
問10 解答
(棒グラフ、帯グラフ)
$\boxed{ \ \mathsf{19}\ }$ ④
問題のグラフは、各階級別の値を棒グラフで表しているほか、個別の階級では正規と非正規の割合を帯グラフ的に表現しています。
各階級の「非正規の職員・従業員」の割合を求めると以下のようになります。
年齢階級 | 男性 | 女性 | 女性ー男性 |
$15$-$24$歳 | $42\div(138+42)$ $=0.233$ | $55\div(122+55)$ $=0.311$ | $0.311-0.233=0.078$ |
$25$-$34$歳 | $89\div(493+89)$ $=0.153$ | $185\div(291+185)$ $=0.389$ | $0.389-0.153=0.236$ |
$35$-$44$歳 | $66\div(652+66)$ $=0.092$ | $306\div(277+306)$ $=0.525$ | $0.525-0.092=0.433$ |
$45$-$54$歳 | $59\div(616+59)$ $=0.087$ | $354\div(250+354)$ $=0.586$ | $0.586-0.087=0.499$ |
$55$-$64$歳 | $149\div(342+149)$ $=0.303$ | $273\div(131+273)$ $=0.676$ | $0.676-0.303=0.373$ |
$65$歳以上 | $170\div(68+170)$ $=0.714$ | $146\div(41+146)$ $=0.781$ | $0.781-0.714=0.067$ |
Ⅰ.$65$歳以上では、「非正規の職員・従業員」の数が男性で$170$人、女性で$146$人で、男性のほうが多くなっています。
Ⅱ.上表の結果より、非正規の割合は男性より女性のほうが大きいことがわかります。
Ⅲ.上表の結果より、非正規の割合の男女差が最も大きいのは、$45$-$54$歳であることがわかります。
問11 解答
(確率)
[1]
$\boxed{ \ \mathsf{20}\ }$ ③
クラスからある$1$人を選んだとき、$3$月生まれでない確率は$(365-31)/365=334/365$となります。
各生徒の誕生日の確率は独立(ほかの生徒の誕生日に依らない)なので、$16$人の生徒の誕生日がすべて$3$月生まれでない確率は、$(334/365)^{16}\fallingdotseq0.24$となります。
[2]
$\boxed{ \ \mathsf{21}\ }$ ⑤
クラスの中で誕生日が同一のペアが少なくとも$1$組以上存在する確率は、クラス全員が全く別の誕生日となっていない確率と考えることができます。クラス全員$16$人が全く別の誕生日となる確率は、
$\displaystyle\begin{eqnarray}&\frac{365}{365}&\times\frac{365-1}{365}\times\frac{365-2}{365}\times\cdots\times\frac{365-14}{365}\times\frac{365-15}{365}\\=&\frac{364}{365}&\times\frac{363}{365}\times\cdots\times\frac{351}{365}\times\frac{350}{365}\end{eqnarray}$
ですので、クラス全員が全く別の誕生日となっていない確率は、
$\displaystyle1-\frac{364}{365}\times\frac{363}{365}\times\cdots\times\frac{351}{365}\times\frac{350}{365}$
となります。
問12 解答
(確率)
$\boxed{ \ \mathsf{22}\ }$ ③
サイコロを投げてからコインを振ったときに求められる数字は、コインで表が出た場合は$2,4,6,8,10,12$、コインで裏が出た場合は$3,5,7,9,11,13$となり、全部で$12$通りあります。このうち、素数になるのは$2,3,5,7,11,13$の$6$通りで、各数字の出る確率は同じなので、求める確率は、$6/12=1/2$となります。
問13 解答
(相関係数、散布図)
[1]
$\boxed{ \ \mathsf{23}\ }$ ②
与えられた要約から、相関係数を求めると、
$\displaystyle\frac{-29.05}{6.90\times5.45}\fallingdotseq-0.773$
となり、やや強い負の相関がみられますので、散布図の点の分布は、左上から右下にやや直線的になります。
[2]
$\boxed{ \ \mathsf{24}\ }$ ④
相関係数を求める式は
$\displaystyle r=\frac{s_{xy}}{s_xs_y}=\frac{\frac1n\sum_{i=1}^n(x_i-\bar x)(y_i-\bar y)}{\sqrt{\frac1n\sum_{i=1}^n(x_i-\bar x)^2}\cdot\sqrt{\frac1n\sum_{i=1}^n(y_i-\bar y)^2}}$
となります。
Ⅰ.どちらの変数もデータの単位を同じように変えた場合は、元のデータを正の実数倍したということなので、上の式で各変数を$\alpha$倍$(\alpha>0)$すると、平均も$\alpha$倍になるので、
$\displaystyle\begin{eqnarray} &&\frac{\frac1n\sum_{i=1}^n(\alpha x_i-\alpha\bar x)(\alpha y_i-\alpha\bar y)}{\sqrt{\frac1n\sum_{i=1}^n(\alpha x_i-\alpha\bar x)^2}\cdot\sqrt{\frac1n\sum_{i=1}^n(\alpha y_i-\alpha\bar y)^2}}\\&=&\frac{\frac{\alpha^2}n\sum_{i=1}^n(x_i-\bar x)(y_i-\bar y)}{\sqrt{\frac{\alpha^2}n\sum_{i=1}^n(x_i-\bar x)^2}\cdot\sqrt{\frac{\alpha^2}n\sum_{i=1}^n(y_i-\bar y)^2}}\\&=&\frac{\frac1n\sum_{i=1}^n(x_i-\bar x)(y_i-\bar y)}{\sqrt{\frac1n\sum_{i=1}^n(x_i-\bar x)^2}\cdot\sqrt{\frac1n\sum_{i=1}^n(y_i-\bar y)^2}}=r\end{eqnarray}$
となり、相関係数の値は変わりません。
Ⅱ.一方の変数$\{x_i\}$を、元のデータの平均から個々のデータを引いた値$\{\bar x-x_i\}$に置き換えると、この平均は$0$になるので、相関係数は、
$\displaystyle\begin{eqnarray} &&\frac{\frac1n\sum_{i=1}^n(\bar x-x_i)(y_i-\bar y)}{\sqrt{\frac1n\sum_{i=1}^n(\bar x-x_i)^2}\cdot\sqrt{\frac1n\sum_{i=1}^n(y_i-\bar y)^2}}\\&=&\frac{\frac1n\sum_{i=1}^n\{-(x_i-\bar x)(y_i-\bar y)\}}{\sqrt{\frac1n\sum_{i=1}^n(x_i-\bar x)^2}\cdot\sqrt{\frac1n\sum_{i=1}^n(y_i-\bar y)^2}}\\&=&-\frac{\frac1n\sum_{i=1}^n(x_i-\bar x)(y_i-\bar y)}{\sqrt{\frac1n\sum_{i=1}^n(x_i-\bar x)^2}\cdot\sqrt{\frac1n\sum_{i=1}^n(y_i-\bar y)^2}}=-r\end{eqnarray}$
となり、相関係数の符号が反転します。
Ⅲ.標準化すると、平均が$0$、分散は$1$となるので、標準化した変数の相関係数は、
$\displaystyle\begin{eqnarray}
&&\frac{\frac1n\sum_{i=1}^n\left(\frac{x_i-\bar x}{s_x}-0\right)\left(\frac{y_i-\bar y}{s_y}-0\right)}{\sqrt{1}\cdot\sqrt{1}}\\&=&\frac{\frac1n\sum_{i=1}^n{(x_i-\bar x)(y_i-\bar y)}}{s_xs_y}=r\end{eqnarray}$
となり、相関係数の値は変わりません。
[3]
$\boxed{ \ \mathsf{25}\ }$ ②
Ⅰ.相関係数の絶対値が最も大きいのは、通勤・通学の$-0.773$なので、最も相関が強いと言えます。
Ⅱ.正の相関関係がみられるということは、片方の変数が大きくなるにつれて、もう片方の変数も大きくなる傾向がみられることになります。
Ⅲ.強い負の相関関係がみられるということは、片方の変数が大きくなるにつれて、もう片方の変数も小さくなる傾向がみられることになりますが、だからと言って、この相関関係から変数間に因果関係が存在するとは、必ずしもいうことができません。
問14 解答
(時系列データ、前年同月比)
[1]
$\boxed{ \ \mathsf{26}\ }$ ②
Ⅰ.$2015$年以外では、$65$万人を下回る月が存在しています。
Ⅱ.各年とも●で表示されている$3$月が最も利用者数が多くなっています。
Ⅲ.$2018$年では$10$月の利用者数が$11$月の利用者数を下回っています。
[2]
$\boxed{ \ \mathsf{27}\ }$ ①
対前年同月比(%)は、ある年ある月の値を前年の同じ月の値を$100$としたときの比率を表したものです。よって、前年同月よりも値が下回っていれば、対前年同月比は$100$を下回り、前年同月よりも値が上回っていれば、対前年同月比は$100$を上回ります。
時系列の推移のグラフをみると、まず、$3$月の値に注目してみると、$16$年の値は$15$年の値を下回っており、$17$年の値は$16$年の値を下回っていることがわかります。よって、対前年同月比は$16$年$3$月と$17$年$3$月は$100$を下回ることになります。次に、$11$月の値に注目してみると、$16$年の値は$15$年の値を下回っており、$17$年の値は$16$年の値を上回っていることがわかります。よって、対前年同月比は$16$年$11$月は$100$を下回り、$17$年$3$月は$100$を上回ることになります。これらを満たすのは、①のグラフのみとなります。
[3]
$\boxed{ \ \mathsf{28}\ }$ ②
3か年分の幾何平均は
$\sqrt[3]{0.9292\times1.0455\times0.9613}\fallingdotseq\sqrt[3]{0.9339}\fallingdotseq0.9775$
となります。
※)3乗根の計算は、試験会場に持ち込める電卓では計算できないので、選択肢の値の3乗を求めて$0.9339$に最も近い値となるのが正解と考えます。
問15 解答
(標本調査、誤差)
$\boxed{ \ \mathsf{29}\ }$ ① or ⑤
Ⅰ.誤差には、標本誤差のような統計的な誤差のほか、計測誤差や調査の入力ミスなどに起因する誤差のようなものが存在します。標本調査の結果には標本誤差はありますが、全数調査の結果にも標本誤差でない誤差が含まれることがあります。標本調査では標本誤差が含まれますが、全数調査では標本調査は含まれません。しかし、標本調査以外の誤差は全数調査であっても起こりうるので、全数調査であっても誤差が全くないとは言えません。
当初、この問題の「誤差」は、ここでいう標本誤差を意識していたので、Ⅰは正しいのですが、上述の理由から標本誤差以外の誤差も考えられることから、Ⅰは間違いといえます。
Ⅱ.全数名簿がなくても標本を抽出する方法はあります。
Ⅲ.全数調査はコストや時間の観点から実施が困難なことが多いので、標本調査を行うことが多いです。
問16 解答
(無作為抽出法)
$\boxed{ \ \mathsf{30}\ }$ ①
無作為抽出法は、母集団の中から全く偏りがなくどの個体も同じ確率で抽出され、さらにどんな抽出の組も同じ確率で選択されるような抽出方法です。乱数を用いて抽出する方法が一般的です。
②③は名簿の順番によるバイアスがかかるので無作為抽出であるとは言えません。
④は調査に協力してくれる(特定の)生徒だけを対象としているので、無作為抽出であるとは言えません。
⑤はグループ間に偏りがあると見込まれることと、希望者を対象としているので、無作為抽出であるとは言えません。