統計検定準1級 問題解説 ~2018年6月実施 論述問題 問3 分散分析とブロック因子~

問題

過去問題は統計検定公式が問題と解答例を公開しています。こちらを参照してください。

解答

[1] 解答

ブロック因子の効果を$\gamma_k$とおくと、構造式は下記のように表すことができる。
$$
\large
\begin{align}
Y_{ijk} &= \mu + \alpha_i + \beta_j + (\alpha \beta)_{ij} + \gamma_k + \epsilon_{ijk}, \quad \epsilon_{ijk} \sim N(0,\sigma^2) \\
\sum_{i=1}^{2} \alpha_i &= 0, \quad \sum_{j=1}^{3} \beta_j = 0, \\
\sum_{i=1}^{2} (\alpha \beta)_{ij} &= \sum_{j=1}^{3} (\alpha \beta)_{ij} = 0, \quad \sum_{k=1}^{3} \gamma_k = 0
\end{align}
$$

制御因子$A,B$とブロック因子の交互作用は誤差と考えることができる。

[2] 解答

ブロック因子を用いる乱塊法では、「繰り返しのある二元配置法」では検証することのできなかった日当たりによる変動を考慮することができ、誤差から日当たりによる変動を分離することができる。

[3] 解答

平方和は下記のような手順に沿って計算を行うことができる。

import numpy as np

x = np.array([[[926., 970., 1035.], [1040., 1052., 1076.], [1068., 1057., 1082.]], [[1009., 1033., 1039.], [1054., 1061., 1089.], [1071., 1073., 1093.]]])

S_A = ((np.mean(x[0,:,:])-np.mean(x))**2 + (np.mean(x[1,:,:])-np.mean(x))**2)*9.
S_B = ((np.mean(x[:,0,:])-np.mean(x))**2 + (np.mean(x[:,1,:])-np.mean(x))**2+(np.mean(x[:,2,:])-np.mean(x))**2)*6.
S_C = ((np.mean(x[:,:,0])-np.mean(x))**2 + (np.mean(x[:,:,1])-np.mean(x))**2+(np.mean(x[:,:,2])-np.mean(x))**2)*6.

S_AB = 0
for i in range(x.shape[0]):
    for j in range(x.shape[1]):
        S_AB += ((np.mean(x,axis=2)[i,j]-np.mean(x[i,:,:])-np.mean(x[:,j,:])+np.mean(x))**2)*3.

S_T = np.sum((x-np.mean(x))**2)
S_E = S_T - S_A - S_B - S_C - S_AB 

print("S_A: {:.1f}".format(S_A))
print("S_B: {:.1f}".format(S_B))
print("S_C: {:.1f}".format(S_C))
print("S_AB: {:.1f}".format(S_AB))
print("S_E: {:.1f}".format(S_E))
print("S_T: {:.1f}".format(S_T))

・実行結果

S_A: 2592.0
S_B: 17856.0
S_C: 5268.0
S_AB: 1524.0
S_E: 3218.0
S_T: 30458.0

分散分析表は上記の結果に基づいて下記のように作成することができる。
$$
\large
\begin{array}{|c|*4{c|}}\hline factor & S & \phi & V & F \\
\hline A & 2592.0 & 1 & 2592.0 & 8.0547 \\
\hline B & 17856.0 & 2 & 8928.0 & 27.7439 \\
\hline A \times B & 1524.0 & 2 & 762.0 & 2.3679 \\
\hline C & 5268.0 & 2 & 2634.0 & 8.1852 \\
\hline error & 3218.0 & 10 & 321.8 & \\
\hline Total & 30458.0 & 17 & & \\
\hline
\end{array}
$$

[4] 解答

自由度$(k,m)$の$F$分布の上側確率を$F_{\alpha}(k,m)$とおく。

このとき、$F_{\alpha=0.025}(1,10) = 6.937, F_{\alpha=0.025}(2,10) = 5.456$より、$A,B,C$の因子の主効果は有意である一方で、交互作用$A \times B$は有意ではないと考えられる。

[5] 解答

因子$A$と因子$B$に交互作用が存在しないことより、最適な水準は各因子の水準ごとの平均値より$(A_2,B_3)$が該当すると考えることができる。

解説

ブロック因子を含めると$3$因子の取り扱いであり少々複雑なので、何度か確認することで手法を抑えておくと良いと思います。

参考

・統計検定準1級 まとめ
https://www.hello-statisticians.com/toukeikentei-semi1