統計検定準1級 問題解説 ~2018年6月実施 問7 クラスタリング、主成分分析~

解答

[1] 解答

$\boxed{ \ \mathsf{9}\ }$ : ④

ウォード法の定義より④が正しい。

[2] 解答

$\boxed{ \ \mathsf{10}\ }$ : ⑤

下記のような計算を実行することでそれぞれの回答の相関行列の作成を行う。なお、試験時はPythonを用いることはできないが、同様の計算を電卓で行えばよいので、ここでは確認しやすさの観点からPythonを用いて表す。

import numpy as np

Ans = np.array([[5., 3., 2., 4., 5.], [3., 4., 5., 5., 3.], [4., 5., 5., 4., 4.]])

print("Dist 0-1: {:.2f}".format(np.sqrt(np.sum((Ans[0,:]-Ans[1,:])**2))))
print("Dist 0-2: {:.2f}".format(np.sqrt(np.sum((Ans[0,:]-Ans[2,:])**2))))
print("Dist 1-2: {:.2f}".format(np.sqrt(np.sum((Ans[1,:]-Ans[2,:])**2))))

・実行結果

> print("Dist 0-1: {:.2f}".format(np.sqrt(np.sum((Ans[0,:]-Ans[1,:])**2))))
Dist 0-1: 4.36
> print("Dist 0-2: {:.2f}".format(np.sqrt(np.sum((Ans[0,:]-Ans[2,:])**2))))
Dist 0-2: 3.87
> print("Dist 1-2: {:.2f}".format(np.sqrt(np.sum((Ans[1,:]-Ans[2,:])**2))))
Dist 1-2: 2.00

上記より、”[イ]-[ウ]”に対応する”1-2″のユークリッド距離が最も小さいので、⑤が正しいことがわかる。

[3] 解答

$\boxed{ \ \mathsf{11}\ }$ : ④

「サーモン」と「うに・いくら」の横軸の値が負なのは④のみであるので、④が正しいとわかる。

解説

比較的解きやすい内容だと思われました。特に$[3]$は簡単な図表の読み取りだけで答えられるので、確実に解けるのが望ましいと思います。