弱定常過程のパワースペクトルと表現定理 - ケィオスの時系列解析メモランダム

なぜ，実験でえられた時系列を分析するとき，とりあえず，パワースペクトルを計算するのか？

　それは，自己相関至上主義を信仰している人が多いからです．自己相関至上主義って何？と思った皆さん，ググっても，何も出てこないと思います．ちなみにChatGPTで「自己相関至上主義とは」と入力すると，

　自己相関至上主義（じこそうかんしじょうしゅぎ、英: autocorrelationism）とは、ある時系列データが自己相関を持っていることを前提とし、その自己相関関係に基づいて分析・予測を行おうとする考え方・手法のことを指します。

　自己相関は、あるデータの過去の値と現在の値との相関関係を示す指標です。自己相関を持っている時系列データは、過去のデータから未来のデータを予測することが可能であると考えられます。そのため、自己相関至上主義者は、時系列データの分析や予測において、自己相関を重視する傾向があります。

　一方で、自己相関至上主義にはいくつかの欠点が指摘されています。例えば、自己相関関係があることを前提とした分析手法では、時系列データの性質によっては適切な結果を得られないことがある、という点が挙げられます。また、時系列データの背後にある複雑な要因を無視することにもなり得るため、解釈には注意が必要です。

と，私が想定していた意味に近い内容を答えてくれます．学生の答案であれば高得点をあげます．しかし，弱定常に関連した説明がないので，満点ではありません．注意しておきますが，自己相関至上主義とか，autocorrelationismとか，そんな用語は一般に使われていません．つまり，私が作った架空の用語です．

　自己相関至上主義という皮肉った表現を使って私が言いたいことは，弱定常な確率過程を意識して，時系列が評価されることが多いということです．弱定常では，平均値と自己共分散 (自己相関)が時間シフトに対して不変です．時間発展のルールは「自己相関」のみで完全に指定されます．これは数学的な扱いを簡単にするための仮定で，現実世界の時系列がすべて弱定常というわけではありません．

　最初の疑問に戻って，「なぜ，パワースペクトル？」という疑問に答えると，自己相関至上主義では，自己相関が最も大事なもので，自己相関とパワースペクトルには1対1の関係があり，どちらも同じ情報をもっているからです．自己相関至上主義は，パワースペクトル至上主義と言い換えることもできます (こんなこと言っている人いませんが)．観測時系列から自己相関関数の推定する場合，時間ラグが大きい領域で推定精度が急激に悪くなったり，非定常なトレンドの影響を大きく受けたり，という推定における欠点があります．それらの点については，パワースペクトルの推定の方がましですので，自己相関関数ではなく，パワースペクトルの推定が使われるとうことです．

　導入が長くなりましたが，今回は，弱定常過程のスペクトル表現定理についてのお話です．証明なんかは一切しません．スペクトル表現定理は，パワースペクトルを読み解き，確率過程の特性を解釈するときの基礎となります．パワースペクトルの解釈では，波に分解して読み解く，といった説明がされることがあると思います．私も，時間がないときは，その点だけ説明することがあります．しかし，この説明では，波形のパターンが固定された振動 (確定信号)を想定している印象があります．したがって，確率過程を考えるときには，その視点だけでは不十分です．

スペクトル表現定理

　ここでは，スペクトル表現定理を一般的に説明するというよりは，スペクトル表現定理から言える具体的な内容を説明します．

以下では，平均0の弱定常な離散確率過程の時系列を

　 $\left\{x[0], x[1], x[2], \cdots, x\left[\left(N-1\right) \right] \right\}$

とします (値は実数です)．

　一般に，

　 $\displaystyle x[n] = \sum_{j = 1}^{M} \left[A_{j} \cos \left(2 \pi f_j n \right) + B_{j} \sin \left(2 \pi f_j n \right) \right]$

と書けます．ここで， $f_j = j/N$ ， $M = \lfloor N/2 \rfloor$ です．

　スペクトル表現定理から，弱定常過程では， $A_{j}$ と $B_{j}$ は平均0の確率変数になります．つまり，

　 $\begin{eqnarray} {\rm E} \left(A_{j} \right) &=& 0\\ {\rm E} \left(B_{j} \right) &=& 0\end{eqnarray}$

です．

　さらに， $A_{j}$ と $B_{j}$ は

　 $\begin{eqnarray} {\rm E} \left(A_{j} \, A_{k} \right) &=& \left\{\begin{array}{lc} \displaystyle \sigma_j^2 & \left( j = k \right) \\ \displaystyle 0 & \left( j \neq k \right) \end{array}\right. \\ {\rm E} \left(B_{j} \, B_{k} \right) &=& \left\{\begin{array}{lc} \displaystyle \sigma_j^2 & \left( j = k \right) \\ \displaystyle 0 & \left( j \neq k \right) \end{array}\right. \\ {\rm E} \left(A_{j} \, B_{k} \right) &=& 0 \quad \left({\rm all} \ j \ {\rm and} \ k \right)\end{eqnarray}$

を満たします．

　これらの性質から

　 $\begin{eqnarray} {\rm E} \left(x[n]^2 \right) &=& \sum_{j = 1}^{M} \sigma_j^2 \\ {\rm E} \left(x[n]\, x[(n-k)] \right) &=& \sum_{j = 1}^{M} \sigma_j^2 \, \cos \left(2 \pi f_j k \right) \end{eqnarray}$

を示すことができます．

　上で現れる $\sigma_j^2$ は，この過程のパワースペクトル (両側パワースペクトル)を $S \left( f_j \right)$ とすれば，

　 $\displaystyle \sigma_j^2 = 2 \frac{S \left( f_j \right)}{N}$

で与えられます．ただし， $f_j = 1/2$ のときは，

　 $\displaystyle \sigma_j^2 = \frac{S \left( f_j \right)}{N}$

です．片側パワースペクトルであれば，後者の関係がどの周波数でも成り立ちます．片側パワースペクトルとは，パワースペクトルの負の周波数側を正の周波数側に足したものです．

　 $S \left( f_j \right)$ を片側パワースペクトルとして，上の式に代入してみれば，

　 $\begin{eqnarray} {\rm E} \left(x[n]^2 \right) &=& \sum_{j = 1}^{M} \sigma_j^2 = \sum_{j = 1}^{M} \frac{S \left( f_j \right)}{N} = \sum_{j = 1}^{M} S \left( f_j \right) \, \Delta f \end{eqnarray}$

は，パーセバルの定理，

　 $\begin{eqnarray} {\rm E} \left(x[n]\, x[(n-k)] \right) &=& \sum_{j = 1}^{M} \sigma_j^2 \, \cos \left(2 \pi f_j k \right) = \frac{1}{N} \sum_{j = 1}^{M} S \left( f_j \right) \, \cos \left(2 \pi f_j k \right) \end{eqnarray}$

は，ウィーナー・ヒンチンの定理に対応します．

　スペクトル表現定理では， $N \to \infty$ とした，より一般的な場合が扱われます．その話は，今回は面倒なので省略します．

何が言いたいの？

　ここで私が言いたいことは，パワースペクトルが，弱定常過程の特性をどのように指定しているのか，ということです．

下の図は，1次自己回帰過程のパワースペクトルを描いたものです．図中の赤い破線が，理論的に計算した真のパワースペクトルです．3つの図があるのは，パワースペクトルの平均をとるサンプル数を変えるとどうなるかを見るためです．一番左は1本，中は10本，右は100本の時系列のパワースペクトルを推定して，平均をとっています．

1次自己回帰過程のパワースペクトル．赤破線が理論的結果．青は数値的に生成した時系列からパワースペクトルを推定した結果．

　時系列が1本の場合 (上図左)は，真のパワースペクトル (赤破線)と時系列から推定したもの (青実線)とのズレが結構あります．縦軸が対数スケールなので，1000倍以上のズレがある部分もあります．しかも，時系列から推定したパワースペクトルは無茶苦茶ギザギザです．これで，真のパワースペクトル (赤破線)と合っていると言えるの？と思うかもしれません．でも，スペクトル表現定理の主張を踏まえれば，そのようになるのは当然だということが分かります．

　なぜなら，時系列を周波数成分に分解したとき，

　 $\displaystyle x[n] = \sum_{j = 1}^{M} \left[A_{j} \cos \left(2 \pi f_j n \right) + B_{j} \sin \left(2 \pi f_j n \right) \right]$

$A_{j}$ と $B_{j}$ は平均0の確率変数になり，その2乗の期待値を考えたときに，真のパワースペクトルと結びつけられます．つまり， $S \left( f_j \right)$ を片側パワースペクトルとして，

　 $\begin{eqnarray} {\rm E} \left(A_{j} \, A_{k} \right) &=& \left\{\begin{array}{lc} \displaystyle \frac{S \left( f_j \right)}{N} & \left( j = k \right) \\ \displaystyle 0 & \left( j \neq k \right) \end{array}\right. \\ {\rm E} \left(B_{j} \, B_{k} \right) &=& \left\{\begin{array}{lc} \displaystyle \frac{S \left( f_j \right)}{N} & \left( j = k \right) \\ \displaystyle 0 & \left( j \neq k \right) \end{array}\right. \\ {\rm E} \left(A_{j} \, B_{k} \right) &=& 0 \quad \left({\rm all} \ j \ {\rm and} \ k \right)\end{eqnarray}$