【統計的時系列解析】定常時系列における自己共分散関数の重要な3つの性質

自己共分散関数(Autocovariance Function)は時間差$k$(時間差をラグとも呼ぶ)のデータ間の相関の強さを表す自己共分散を時間差 $k$ の関数としたものです。これは、定常な時系列データの時間依存性を特徴づけるため、時系列解析において基礎的で中心的な役割を持っています。

本稿では、自己共分散関数が持っている3つの重要な数学的性質について扱います。

自己共分散関数の定義

自己共分散とは、同一時系列データにおける、時間的に隔てた点との共分散であり、下記の式で定義される

$$
\gamma_{k,t} = \mathrm{Cov}\left( y_t, y_{t-k} \right) = E\left[ \left( y_t – \mu_t \right) \left( y_{t-k} – \mu_{t-k} \right) \right]
$$

ここで、 $k$は時間差(時刻 $t$ からの遅れ)を表し、$\mu_t = E[y_t]$ は時刻 $t$ における期待値である。

自己共分散を $k$ の関数とみたとき、 $\gamma_{k, t} = \gamma_t(k)$ を時刻 $t$ の自己共分散関数と呼ぶ。

ここで、 $y_t$ を弱定常過程とすると、 弱定常性により平均・分散・自己共分散が時間に依存しなくなる。特に、平均は時間不変で$\mu = E[y_t]$(定数)となり、自己共分散は下記の通り時間差$k$のみに依存する。

$$
\gamma(k) = \mathrm{Cov}\left( y_t, y_{t-k} \right) = E\left[ \left( y_t – \mu \right) \left( y_{t-k} – \mu \right) \right]
$$

なお、$k=0$とした場合の自己共分散 $\gamma(0)$ は、定義より過程の分散 $\mathrm{Var}(y_t)$ に等しい。

本稿では、時系列データとして弱定常な1変量の時系列データを考える。

自己共分散関数の性質

単変量の時系列データの自己共分散関数は3つの重要な性質がある。

  1. 自己共分散関数は偶関数: $\gamma(k) = \gamma(-k)$ → $k \geq 0$ のみを考慮すればよい
  2. 絶対値の最大は $\gamma_0$ : $|\gamma(k)| \leq \gamma(0)$ → 分散 $\gamma(0)$ が自己共分散の「基準値」となる
  3. 非負定値性: 任意の線形結合で非負 → Yule-Walker方程式が解を持つ

以下、数学的証明をする。

自己共分散関数は偶関数

自己共分散関数 $\gamma(k)$ は偶関数の性質を持つ

$$
\gamma(k) = \gamma(-k) \quad \forall k
$$

証明

まず、$\gamma(k)$ は定義から下記の通り

$$
\gamma(k) = \mathrm{Cov}(y_t, y_{t-k})
$$

次に、$\gamma(-k)$ は1変量の時系列データ(つまり$y_t$はスカラ)と定常性の性質を利用して下記の通り変換できる

$$
\begin{aligned}
\gamma(-k) & =\operatorname{Cov}\left(y_t, y_{t+k}\right) \\
& =E\left[\left(y_t-\mu\right)\left(y_{t+k}-\mu\right)\right] \\
& =E\left[\left(y_{t+k}-\mu\right)\left(y_t-\mu\right)\right] \\
& =\operatorname{Cov}\left(y_{t+k}, y_t\right)=\operatorname{Cov}\left(y_t, y_{t-k}\right)=\gamma_{(k)}
\end{aligned}
$$

2行目から3行目の入れ替えは$y_t$がスカラ量であることを利用して入れ替えている。4行目は定常性の性質で自己共分散の時間不変性を利用し、ラグが同じであれば水平に移動できる性質を利用している。

実用的意味

時間差(ラグ) $k$ の符号に対して対象であるので、$k$の符号を区別することが不要になる。また、自己共分散関数を考えるにあたって、$k \geq 0$ のケースのみを考えれば十分である。

自己共分散関数の最大値は自己分散

自己共分散関数は以下の性質を持つ

$$
| \gamma(k) | \leq \gamma(0)
$$

証明

Cauchy-Schwarz不等式を利用する(下記)

まず、 $ E\left[(\lambda a+b)^2\right] \geq 0$ とすると、

$$
\begin{aligned}
& E\left[(\lambda a+b)^2\right] \\
= & E\left[\lambda^2 a^2+2 \lambda a b+b^2\right] \\
= & E\left[a^2\right]\left(\lambda+\frac{E[a b]}{E\left[a^2\right]}\right)^2+\left(E\left[b^2\right]-\frac{E[a b]^2}{E\left[a^2\right]}\right) \geq 0 \\
\end{aligned}
$$

3行目の第1項は二乗の期待値に二乗をかけているため、0以上の値をとる。つまり第2項が0以上であれば、最初の不等式が成り立つ。そのため、下記のように変形することができる。

$$
E\left[a^2\right] E\left[b^2\right] \geq E[a b]^2
$$

これを利用するため、$a, b$を以下の値とする。

$$
a \leftarrow y_t – \mu, \quad b \leftarrow y_{t-k} – \mu
$$

すると、$E[a^2], E[b^2], E[ab]$は下記の通りとなる

$$
\begin{aligned}
& E\left[a^2\right]=E\left[\left(y_t-a\right)^2\right]=\gamma(0) \\
& E\left[b^2\right]=E\left[\left(y_{t-k}-a\right)^2\right]=\gamma(0) \\
& E[a b]=E\left[\left(y_t-a\right)\left(y_{t-k}-a\right)\right]=\gamma(k)
\end{aligned}
$$

すると、Cauchy-Schwarz不等式として表した式に代入すると下記の通り、最大値性が証明される

$$
\begin{aligned}
\gamma(0) \gamma(0) &\geq \gamma(k)^2 \\
\gamma(k) & \leq \gamma(0)
\end{aligned}
$$

実用的意味

分散 $\gamma(0)$ が共分散の基準値となることがわかる。自己相関(自己共分散を規格化したもの)が$[-1,1]$の範囲に収まるための根拠になる。

非負定値性

非負定値性は以下の性質

$$
\sum_{i=1}^m \sum_{j=1}^m \alpha_i \alpha_j \gamma(i-j) \geq 0
$$

証明

まず、 $\gamma(i-j)$ を展開する。なおここで、定常時系列は一般性を損なうことなく平均0($\mu=0$)の系列に変換できることを利用する。

$$
\begin{aligned}
\gamma(i-j) & =\operatorname{Cov}\left[y_t, y_{t-(i-j)}\right] \\
& =\operatorname{Cov}\left[y_{t-i}, y_{t-j}\right] \\
& =E\left[\left(y_{t-i}-\mu\right)\left(y_{t-j}-\mu\right)\right] \\
& =E\left[y_{t-i} y_{t-j}\right]
\end{aligned}
$$

1行目から2行目への変換は、定常時系列の性質を利用している。4行目の変換に $\mu=0$ であることを利用している。

次に、$\alpha_i y_{t-i}$ の$i$についての総和の2乗を考える

$$
\begin{aligned}
& E\left[\left(\sum_{i=1}^m \alpha_i y_{t-i}\right)^2\right] \\
= & E\left[\sum_{i=1}^m \sum_{j=1}^m \alpha_i \alpha_j y_{t-i} y_{t-j}\right] \\
= & \sum_{i=1}^m \sum_{j=1}^m \alpha_i \alpha_j E\left[y_{t-i} y_{t-j}\right] \\
= & \sum_{i=1}^m \sum_{j=1}^m \alpha_i \alpha_j \gamma(i-j)
\end{aligned}
$$

このように、$\alpha_i y_{t-i}$ の$i$についての総和の2乗の期待値が $\sum_{i=1}^m \sum_{j=1}^m \alpha_i \alpha_j \gamma(i-j)$ と一致することがわかった。2乗の期待値は必ず0以上の値をとるため、非負定値性が証明された。

実用的意味

統計的推論の理論的な基礎となる。

まとめ

自己共分散関数の持つ3つの性質は、時系列解析の理論的基礎を構成する重要な特徴である。

偶関数性は時間差(ラグ)kについて対称的な依存構造を反映し、最大値性質は相関の強さの上限を規定し、非負定値性は統計的推論の妥当性を理論的に保証する。

参考