全文鏈接:https:///?p=33838傳統(tǒng)時間序列模型允許包含過去觀察到的系列信息,但不允許客戶包含其他可能相關(guān)的信息。例如,假期的影響、競爭對手的活動、法律變化、整體經(jīng)濟或其他外部變量可能解釋了某些歷史變動,并且可能導(dǎo)致更準確的預(yù)測(點擊文末“閱讀原文”獲取完整代碼數(shù)據(jù))。 相關(guān)視頻 另一方面,回歸模型允許客戶從預(yù)測變量中包含大量相關(guān)信息,但不允許處理ARIMA模型中可以處理的細微時間序列動態(tài)。在本文中,我們幫助客戶考慮如何擴展ARIMA模型,以便允許其他信息被納入模型中。 我們考慮了以下形式的回歸模型:
在本文中,我們允許回歸中的誤差包含自相關(guān)。例如,如果ηt'遵循ARIMA(1,1,1)模型,我們可以寫成:
其中εt'是一個白噪聲序列。 估計在估計帶有ARMA誤差的回歸模型時,一個重要的考慮因素是模型中的所有變量必須首先是平穩(wěn)的。因此,我們首先必須檢查yt'和所有預(yù)測變量(x1,t,...,xk,t)(β,...,γ)是否呈現(xiàn)出平穩(wěn)性。 因此,我們首先對模型中的非平穩(wěn)變量進行差分處理。 如果模型中的所有變量都是平穩(wěn)的,那么我們只需要考慮殘差的ARMA誤差。我們得到如下模型:
其中y′t=yt?yt?1,x′t,i=xt,i?xt?1,i,β′=β?β?1,η′t=ηt?ηt?1,這是一個帶有ARMA誤差的差分模型。 R中ARIMAX回歸以下R命令: 將擬合模型y′t=β1x′t+η′t,其中η′t=?1η′t?1+εt是一個AR(1)誤差。這等同于帶有ARIMA誤差的差分模型。
其中ηt是一個ARIMA(1,1,0)誤差。由于進行差分,常數(shù)項消失。如果要在差分模型中包含常數(shù)項,需要指定include.drift=TRUE。 最終模型的AICc將被計算,并且該值可用于確定最佳預(yù)測變量。也就是說,應(yīng)對要考慮的所有預(yù)測變量子集重復(fù)此過程,并選擇AICc值最小的模型。 示例:個人消費和收入圖1顯示了1970年至2016年第3季度個人消費支出和個人可支配收入的季度變化。我們希望根據(jù)收入變化來預(yù)測支出變化。
圖1:1970年至2016年第三季度個人消費支出和可支配個人收入的季度百分比變化。
數(shù)據(jù)已經(jīng)是平穩(wěn)的了(我們考慮的是百分比變化而不是原始支出和收入),因此不需要進行差分處理。擬合的模型是
我們可以使用
應(yīng)該看出ARIMA誤差類似于一個白噪聲序列。
圖3: 殘差(即ARIMA誤差)與白噪聲沒有顯著差異。 點擊標題查閱往期內(nèi)容 ![]() ![]() 左右滑動查看更多 ![]()
預(yù)測使用具有ARIMA誤差的回歸模型進行預(yù)測時,我們需要預(yù)測模型的回歸部分和ARIMA部分,并合并結(jié)果。與普通的回歸模型一樣,為了獲得預(yù)測值,我們首先需要預(yù)測預(yù)測變量。 示例:個人消費和收入我們將計算未來八個季度的預(yù)測值,假設(shè)未來的可支配收入百分比變化將等于過去四十年的平均百分比變化。
圖4:使用采用ARIMA(1,0,2)誤差模型回歸消費支出百分比變化與可支配收入百分比變化,獲取的預(yù)測值。 該模型的預(yù)測區(qū)間開發(fā)的模型更窄,因為我們現(xiàn)在能夠使用收入預(yù)測變量來解釋數(shù)據(jù)的一部分變異性。 示例:預(yù)測用電量日用電量可以建模為與溫度有關(guān)的函數(shù)。正如在電費單上可以觀察到的,在寒冷的天氣里由于加熱和炎熱的天氣里由于空調(diào)等原因使用更多的電。寒冷和炎熱天氣對電力需求的增加反映在圖中的U形,其中將日需求與日最高氣溫相關(guān)聯(lián)。
圖5:2014年每日用電量與最高氣溫的關(guān)系。 圖6顯示了每日需求和每日最高氣溫的時間序列。這些圖強調(diào)了需要一個非線性動態(tài)模型。
圖6:2014年每日用電量和最高溫度。 在此示例中,我們使用
圖7:每日電力需求的動態(tài)回歸模型殘差診斷。
該模型的殘差存在顯著的自相關(guān)性,這意味著預(yù)測區(qū)間可能無法提供準確的覆蓋范圍。此外,殘差直方圖顯示出一個正的異常值,這也會影響預(yù)測區(qū)間的覆蓋范圍。 使用估計的模型,我們從2015年1月1日(星期四,新年假日)開始預(yù)測未來14天的數(shù)據(jù)。
圖8:每日電力需求的動態(tài)回歸模型預(yù)測。所有未來溫度都設(shè)置為26攝氏度,工作日虛擬變量被設(shè)置為已知的未來值。 隨機趨勢和確定性趨勢有兩種不同的方法來對線性趨勢進行建模。通過回歸模型可以得到一個“確定性趨勢”,如下所示:
其中ηt為ARMA過程。通過以下模型可以得到一個“隨機趨勢”:
這類似于帶趨勢的隨機游走,但這里的誤差項是一個ARMA過程,而不僅僅是白噪聲。 盡管這些模型看起來非常相似(它們只有在應(yīng)用到ηt′′時需要應(yīng)用的差分數(shù)量不同),它們的預(yù)測特性卻非常不同。 示例:國際游客數(shù)據(jù)
圖9:1980年至2015年年際國際游客人數(shù)。 圖9顯示了1980年至2015年每年國際游客總數(shù)。我們將對這些數(shù)據(jù)擬合一個確定性趨勢模型和一個隨機趨勢模型。確定性趨勢模型的擬合如下:
這個模型可以表示為:
預(yù)計每年游客數(shù)量的增長為0.17百萬人。 或者,可以使用隨機趨勢模型進行估計。
在這種情況下,游客數(shù)量的預(yù)計增長也是0.17百萬人。盡管增長估計相似,但預(yù)測區(qū)間不同,如圖所示。特別是,由于誤差是非平穩(wěn)的,隨機趨勢具有更寬的預(yù)測區(qū)間。
圖10:使用確定趨勢模型和隨機趨勢模型對國際游客的年度預(yù)測。 確定性趨勢隱含了一個假設(shè),即趨勢的斜率不會隨時間而變化。另一方面,隨機趨勢可以變化,并且估計的增長僅被假設(shè)為歷史時期的平均增長,而不一定是未來觀察到的增長率。因此,使用隨機趨勢進行預(yù)測更安全,特別是對于較長的預(yù)測時間范圍,在這種情況下,預(yù)測區(qū)間允許未來增長的不確定性更大。 ![]() |
|
|
來自: 拓端數(shù)據(jù) > 《待分類》