時系列分析:ホワイトノイズとiid
ホワイトノイズとiid(independent and identically distributed:独立同分布)を混同してしまう事があります。本投稿ではこの2つを整理します。普段の分析ではホワイトノイズとiidをそこまで厳密に区別するケースは少ないと思います。理論を追っていて、前提条件として同一分布を意識するときぐらいでしょうか
ホワイトノイズとiidの違い(まとめ)
共通点:
ホワイトノイズとiidはどちらも確率変数の列がそれぞれ互いに独立です。なので自己共分散は0となります。
違い:
- ホワイトノイズはノイズの性質なので平均が0。一方で、iidは独立同分布といっているだけなので、平均値は必ずしも0とは限らない
- ホワイトノイズは独立でさえあればいいけど、一方でiidの系列は独立かつ同分布の必要がある
要素を全部まとめると次の表のようになります(意味合い重複した部分あり)
よく使う表記 | 平均 | 自己共分散 | 独立 | 同分布 | 定常性 | |
---|---|---|---|---|---|---|
ホワイトノイズ | 0 | 必要あり | 必要なし | 弱定常 | ||
iid | 必要あり | 必要あり | 強定常 |
iidのように同一分布に従うことは強い仮定なので、それに比べて同一分布を仮定しないホワイトノイズは仮定が弱いです。また定常性という視点では、ホワイトノイズは弱定常、iidは強定常になります。
ホワイトノイズの定義
沖本本の定義をそのまま引用するとホワイトノイズの定義は以下のようになっています。ホワイトノイズは平均値0、分散、自己相関(共分散)が0です。
すべての時点 において
iidの定義
同様にiidの定義は以下です
各時点のデータが互いに独立でかつ同一の分布に従う系列
引用:経済・ファイナンスデータの計量時系列分析 - 沖本 竜義 p11
分布が同じで独立な系列であることを要求しているだけなので、そもそもガウシアンのように期待値と分散のみで決定される分布かどうかも分かりません。
一般的な使い分け
我々がシミュレーションなどで誤差項を生成する場合、平均値0の正規分布に従うノイズを発生させることが多いと思います。これらのノイズは独立なのでホワイトノイズですが、同一の分布に従うためiidでもあります。いわゆるガウシアンホワイトノイズと言われるもので、iidになります。
各モデル誤差項の設定
沖本本やWikipediaを参考に各モデルの誤差項の仮定を確認してみたいと思います。結論から言うと、MAモデル、ARモデル、ARMAモデルともに撹乱項はホワイトノイズで、iidを仮定していません。ランダムウォークだけなぜかiidを仮定しているみたいです。
撹乱項の仮定 | |
---|---|
MAモデル | ホワイトノイズ |
ARモデル | ホワイトノイズ |
ARMAモデル | ホワイトノイズ |
ランダムウォーク | iid |
MAモデル
沖本本のMA(q)過程の定義では、MA(q)過程はホワイトノイズの線形和になっています。iidを仮定していません
引用:経済・ファイナンスデータの計量時系列分析 - 沖本 竜義 p24
Wikipediaでも同様にをwhite noise error terms
と記載しています。
ARモデル
ARモデルの撹乱項もホワイトノイズです。iidを仮定していません
引用:経済・ファイナンスデータの計量時系列分析 - 沖本 竜義 p26
Wikipediaでも同様にをwhite noise
と記載しています。
ARMAモデル
ARMAモデルの撹乱項もホワイトノイズです。iidを仮定していません
引用:経済・ファイナンスデータの計量時系列分析 - 沖本 竜義 p34
ランダムウォーク
ランダムウォークでは撹乱項にiidを仮定しています。
引用:経済・ファイナンスデータの計量時系列分析 - 沖本 竜義 p106
ランダムウォークをAR(1)過程と考えるならホワイトノイズでも良さそうなものですが、このiidの仮定が重要なのでしょうか。Wikipediaでも独立かつ同分布な Rd 値確率変数族
と書いてあります。
なぜランダムウォークだけiidを仮定しているのか分かってません。どなたかご存知でしたら教えて下さい。日々精進