偏相関(Partial Correlation)係数の定義と導出方法を把握する

この記事では偏相関係数の定義とその導出方法について解説します.

偏相関係数とは

$X,Y,Z$の確率変数があり,互いに影響を及ぼしているとします.
$X$の影響を除いた$Y$と$Z$の編相関係数$\rho_{YZ,X}$とは, 「$X$の影響を除いた$Y$」と「$X$の影響を除いた$Z$」の相関係数のことで,次で計算されます.
$$
\rho_{YZ,X} := \cfrac{\rho_{YZ}-\rho_{XY}\rho_{XZ}}{\sqrt{1-\rho_{XY}^2}\sqrt{1-\rho_{XZ}^2}}
$$
ここで,$\rho_{XY}$はいわゆる普通の相関係数で,
$$
\rho_{XY} := \frac{\mathop{\rm Cov}(X,Y)}{\sigma_X\sigma_Y}=\frac{E\left[(X-\mu_X)(Y-\mu_Y)\right]}{\sqrt{E\left[(X-\mu_X)^2\right]}\sqrt{E\left[(Y-\mu_Y)^2\right]}}
$$
ここで,$\mu_X$は$X$の平均で
$$
\mu_X := E[X]
$$

導出

なぜ上の定義式が「$X$の影響を除いた$Y$」と「$X$の影響を除いた$Z$」の相関係数とみなせるのか導出してみましょう.
$Y$に$X$がどれだけ影響しているかを測るために線形回帰式$Y=aX+b$を計算します.
$X$に対する$Y$の回帰直線は,$a$と$b$を最小二乗法で解析的に解くと
$$
\begin{array}{lll}
Y &=& aX+b \\
&=& \cfrac{\mathop{\rm Cov}(X,Y)}{\sigma_X^2}(X-\mu _X)+\mu _Y \
\end{array}
$$
よって「$X$の影響を除いた$Y$」は
$$
Y’ = Y – \hat{Y} = (Y-\mu_Y) – (X-\mu _X)\cfrac{\mathop{\rm Cov}(X,Y)}{\sigma_X^2}
$$
同様に,「$X$の影響を除いた$Z$」は
$$
Z’ = Z – \hat{Z} = (Z-\mu_Z) – (X-\mu _X)\cfrac{\mathop{\rm Cov}(X,Z)}{\sigma_X^2}
$$
求めたい「$X$の影響を除いた$Y$」と「$X$の影響を除いた$Z$」の相関係数は,$Y’$と$Z’$の相関係数と考えるとができるので,計算すると
$$
\begin{array}{lll}
\rho_{YZ,X} &=& \rho_{Y’Z’} \\
&=&\cfrac{E\left[(Y’-\mu_{Y’})(Z’-\mu_{Z’})\right]}{\sqrt{E\left[(Y’-\mu_{Y’})^2\right]}\sqrt{E\left[(Z’-\mu_{Z’})^2\right]}} \\
&=& \cfrac{E[Y’Z’]-\mu_{Y’}\mu_{Z’}}{\sqrt{E[Y^{‘2}]-\mu_{Y’}^2}\sqrt{E[Z^{‘2}]-\mu_{Z’}^2}} \\
\end{array}
$$

各項を分解して計算していきます
$$
\begin{array}{lll}
\mu_{Y’}&=&E\left[ (Y-\mu_Y) – (X-\mu _X)\cfrac{\mathop{\rm Cov}(X,Y)}{\sigma_X^2} \right] \\
&=&E\left[ (Y-\mu_Y) \right]- \cfrac{\mathop{\rm Cov}(X,Y)}{\sigma_X^2}E\left[ (X-\mu _X) \right] \\
&=& 0
\end{array}
$$
同様に,
$$
\begin{array}{lll}
\mu_{Z’}&=&E\left[ (Z-\mu_Z) – (X-\mu _X)\cfrac{\mathop{\rm Cov}(X,Z)}{\sigma_X^2} \right] \\
&=&E\left[ (Z-\mu_Z) \right]- \cfrac{\mathop{\rm Cov}(X,Z)}{\sigma_X^2}E\left[ (X-\mu _X) \right] \\
&=& 0
\end{array}
$$

また,
$$
\begin{array}{lll}
E[Y^{‘2}]&=& E\left[ \left( (Y-\mu_Y) – (X-\mu X)\cfrac{\mathop{\rm Cov}(X,Y)}{\sigma_X^2} \right)^2 \right] \\
&=& E\left[ (Y-\mu_Y)^2 \right] -2\cfrac{\mathop{\rm Cov}(X,Y)}{\sigma_X^2}E\left[ (Y-\mu_Y)(X-\mu _X)\right] + \left( \cfrac{\mathop{\rm Cov}(X,Y)}{\sigma_X^2} \right)^2 E\left[ (X-\mu_X)^2 \right] \\
&=& \sigma_Y^2 -2 \cfrac{\mathop{\rm Cov}(X,Y)^2}{\sigma_X^2} + \cfrac{\mathop{\rm Cov}(X,Y)^2}{\sigma_X^2} \\ &=& \sigma_Y^2 – \cfrac{\mathop{\rm Cov}(X,Y)^2}{\sigma_X^2} \\
&=& \sigma_Y^2 (1-\rho_{XY}^2)
\end{array}
$$

同様に,
$$
\begin{array}{lll}
E[Z^{‘2}]&=& E\left[ \left( (Z-\mu_Z) – (X-\mu X)\cfrac{\mathop{\rm Cov}(X,Z)}{\sigma_X^2} \right)^2 \right] \\ &=&E\left[ (Z-\mu_Z)^2 \right] -2\cfrac{\mathop{\rm Cov}(X,Z)}{\sigma_X^2}E\left[ (Z-\mu_Z)(X-\mu _X)\right] + \left( \cfrac{\mathop{\rm Cov}(X,Z)}{\sigma_X^2} \right)^2 E\left[ (X-\mu_X)^2 \right] \\
&=& \sigma_Z^2 -2 \cfrac{\mathop{\rm Cov}(X,Z)^2}{\sigma_X^2} + \cfrac{\mathop{\rm Cov}(X,Z)^2}{\sigma_X^2} \\ &=& \sigma_Z^2 – \cfrac{\mathop{\rm Cov}(X,Z)^2}{\sigma_X^2} \\
&=& \sigma_Z^2 (1-\rho_{XZ}^2)
\end{array}
$$

最後に
$$
\begin{array}{lll}
E[Y’Z’] &=& E\left[ \left( (Y-\mu_Y) – (X-\mu _X)\cfrac{\mathop{\rm Cov}(X,Y)}{\sigma_X^2} \right) \left( (Z-\mu_Z) – (X-\mu _X)\cfrac{\mathop{\rm Cov}(X,Z)}{\sigma_X^2} \right) \right] \\
&=& E\left[ (Y-\mu_Y)(Z-\mu_Z) \right]
– \cfrac{\mathop{\rm Cov}(X,Z)}{\sigma_X^2}E\left[ (Y-\mu_Y)(X-\mu_X) \right] \\
&-& \cfrac{\mathop{\rm Cov}(X,Y)}{\sigma_X^2} E\left[ (X-\mu_X)(Z-\mu_Z) \right]
+ \cfrac{\mathop{\rm Cov}(X,Y)\mathop{\rm Cov}(X,Z)}{\sigma_X^4}E\left[ (X-\mu_X)^2\right] \\
&=&\mathop{\rm Cov}(Y,Z) – \cfrac{\mathop{\rm Cov}(X,Y)\mathop{\rm Cov}(X,Z)}{\sigma_X^2}
\end{array}
$$
よって
$$
\begin{array}{lll}
\rho_{YZ,X} &=& \cfrac{\mathop{\rm Cov}(Y,Z) – \cfrac{\mathop{\rm Cov}(X,Y)\mathop{\rm Cov}(X,Z)}{\sigma_X^2}}{\sqrt{\sigma_Y^2 (1-\rho_{XY}^2)}\sqrt{\sigma_Z^2 (1-\rho_{XZ}^2)}} \\
&=&\cfrac{\rho_{YZ}-\rho_{XY}\rho_{XZ}}{\sqrt{1-\rho_{XY}^2}\sqrt{1-\rho_{XZ}^2}}
\end{array}
$$
となります.

以上から,
$$
\rho_{YZ,X} := \cfrac{\rho_{YZ}-\rho_{XY}\rho_{XZ}}{\sqrt{1-\rho_{XY}^2}\sqrt{1-\rho_{XZ}^2}}
$$
が確かに 「$X$の影響を除いた$Y$」と「$X$の影響を除いた$Z$」 相関係数とみなせることがわかりました.
複数の確率変数があり,他の変数を除去した相関を計算したいときに使ってみてください.