over 2 years ago

Autoregressive (AR)模型

有些資料隨時間的趨勢,在現在時間點與前一個時間點(或前p個)是有相關性的,這樣的資料我們稱之為時間相關資料。如果我們能寫成,
$$
y_t = c + \phi_1 y_{t-1} + \phi_2 y_{t-2} + \dots \phi_p y_{t-p} + e_t \tag{AR}
$$
稱之為Autoregressive 模型,其中為白噪音,為前一個時間點的資料,而上式為AR(p)模型。

對AR(1)模型,

  • : 資料等同於白噪音(white noise)
  • :資料等同於隨機漫步(random walk)
  • :資料等同於隨機漫步(random walk) + 漂移(drift)
  • 資料:會隨時間快速震盪(oscillate)

對於AR模型必須確認資料為穩定的(stationary),須滿足以下限制,

  • AR(1) :
  • AR(2) :

對於AR(p)這樣(非季節變化)的模型來說,如果觀察自相關函數(Auto Correlation Function)與偏自相關(PACF)函數,會呈現如下現象。

  1. ACF會隨著Lag階數減少而快速減少,之後呈現指數衰減或正弦方式變化。
  2. 同時PACF會在第P階前有明顯的值,之後快速消失為零。

以上圖來說這是一個類似AR(1)模型的情況。


Moving Average(MA)模型

當資料隨時間變化為與前一段時間的噪音相關,即
$$
y_t = c + e_t + \theta_1 e_{t-1} + \theta_2 e_{t-2} + \dots +\theta_q e_{t-q} \tag{MA}
$$
上式即為MA(q)模型。與AR模型相似,對於參數必須有所限制,以確保MA與AR之間可互相轉換(可逆性),並簡化數學問題。

  • MA(1) :
  • MA(2) :

同樣的,數學上也能證明MA(q)的ACF與PACF有如下的現象,

  1. PACF會隨著Lag階數減少而快速減少,之後呈現指數衰減或正弦方式變化。
  2. 同時ACF會在第q階前有明顯的值,之後快速消失為零。

剛好和AR模型有完全對稱(相反)的現象。


上圖即為MA(q=1)模型。


ARIMA模型

如果把這兩個模型擺在一起,即稱為Auto Regressive Integrated Moving Average Model (ARIMA)模型,

引進為Lag operator()上式可以重新整理成,

即為ARIMA(p,d,q)模型。其中

ARIMA(p,d,q) 資料狀態
(0,0,0) 白噪音(white noise)
(0,1,0) 隨機漫步(random walk)
(p,0,0) AR(p)
(0,0,q) MA(q)

分析流程

  1. 先確定資料是否為穩態解
    • 平均趨勢為零、標準差固定
    • 檢查Dickly-Fuller test
  2. 若否則執行d次差分(difference) 直到有穩態解
  3. 判斷ACF, PACF是否能選擇最簡易的AR或MA模型。並找到最小的AIC值
  4. 選擇ARIMA(p,d,q)並預測資料
  5. 檢查殘差的ACF, PACF是否沒有任何的特徵(白噪音特性)

關於ARIMA詳細的討論請看這裡

← 決策樹 Decision Tree(二)-應用案例 ARIMA時間模型(非季節性)-應用案例 →
 
comments powered by Disqus