ケィオスの時系列解析メモランダム

時系列解析,生体情報学,数学・物理などの解説です.

【時系列解析】長時間相関って何だ

Detrended fluctuation analysis (DFA)の解釈の説明で,

  •  \alpha = 0.5のときが無相関
  •  \alpha < 0.5のときが長時間の負の相関(長時間反相関,長時間逆相関)
  •  \alpha > 0.5のときが長時間の正の相関(長時間正相関)

と説明されることがよくあります.今回は,私がこの説明に抱く違和感と,私が考える,その解決策について説明します.

まずは,違和感についての説明です.

上の説明で登場する「相関」が,自己相関(あるいは,自己共分散)関数を意味するように私は感じ,それが違和感の原因です.なぜなら, \alpha > 0.5の範囲でも, \alpha \ge 1となると,その確率過程は非定常(分散が発散)になり,自己相関関数が弱定常過程とは異なる形(ラグの関数にはならない)になるからです.弱定常でありえるのは, 0 < \alpha < 1の範囲です.もちろん,有限の時間スケールで,相関が消えれば, \alpha \ge 1でも,確率過程としては弱定常もありえます.ここでは,スケーリングレンジが無限に続く場合の話のしていることに注意してください.

1 < \alpha < 2では,その増分が,長時間反相関( 1 <\alpha < 1.5),あるいは,長時間相関( 1.5 <\alpha < 2)を示します.この説明は,もっともらしい説明法の一つです.時系列を積分(累積)すると,\alphaは,1増加し,差分をとると1減少しますので,基本は 0 < \alpha < 1の領域にあります.

ということで,違和感は「 \alpha > 0.5のときが長時間の正の相関(長時間正相関)」という説明は単純化しすぎで,一部間違っていると感じるということです.

時系列のイメージをもってもらうために,サンプル時系列の図を示します.まずは,非整数ガウスノイズの時系列です.

非整数ガウスノイズの標本時系列(左)とパワースペクトルの推定結果(100サンプルの平均スペクトル)(右)

上の,非整数ガウスノイズの時系列を積分すると,下図の非整数ブラウン運動の時系列になります.逆に言うと,非整数ブラウン運動の時系列の差分が,非整数ガウスノイズです.

非整数ブラウン運動の標本時系列(左)とパワースペクトルの推定結果(100サンプルの平均スペクトル)(右)

上の2つの図では,パワースペクトルS(f)が,S(f)\approx f^{-\beta}の形になっています.スケーリング指数について,(\beta+1)/2 = \alphaの関係が成り立ちます.

上記の違和感の解決策として,パワースペクトルを使って,一般化された「相関」のイメージをもてば良いのではないかと,最近,考えるようになりました.

ここからは,違和感の解決策です.

S(f)\approx f^{-\beta}となるパワースペクトルで,\beta > 0のときは,低い周波数の成分が強くなります.元の時系列を,低周波数成分だけで近似することを考えれば,この成分(ゆっくりとした正弦波)は,正の値が続きやすい,あるいは,負の値が続きやすい特徴があります.低周波数成分が強ければ強いほど,この傾向が顕著になります.上の図で,パワースペクトル(右図)が左上がりになれば,なるほど,時系列(左図)が,ゆっくりと変化するようになるということです.

逆に,\beta < 0のときは,高い周波数の成分が強くなります.元の時系列を,高周波数成分だけで近似することを考えれば,この成分(プラスとマイナスを繰り返す振動)は,正の後に負になりやすく,負の後に正になりやすい特徴があります.高周波数成分が強ければ強いほど,この傾向が顕著になります.時系列を粗く(平均化)してみても,常に,高周波数成分が支配的ですので,正が続けば,負が続きやすい,反相関の傾向があらゆるスケールで存在します.

ということで,「相関」=「自己相関関数」という固定観念を捨てて,低周波成分が支配的になることによる特徴(正の相関),高周波成分が支配的になることによる特徴(正の相関),低周波と高周波がバランスすることによる特徴(無相関)と理解すれば良いのではないか,というのが今回のポイントです.

今日は図を作る余裕がないので,そのうち図を使って,より詳しく説明します.