掌握時間序列特徵工程:常用特徵總結與 Feature-engine 的應用

時間序列數據的特徵工程是一種技術,用於從時間序列數據中提取信息或構造特徵,這些特徵可用於提高機器學習模型的性能。以下是一些常見的時間序列特徵工程技術:

  1. 滾動統計量:計算時間窗口內的統計量,如平均值、中位數、標準偏差、最小值和最大值。這些統計量可以捕捉到時間序列在不同時間段的行爲變化。
  2. 滯後特徵:創建時間序列的過去值作爲新的特徵,以揭示序列的自相關性質。例如,可以使用前一天(滯後1)或前一週(滯後7)的數據作爲預測當前值的特徵。
  3. 差分和季節差分:計算時間序列的一階差分(即當前值與前一個值的差)或季節性差分(如當前值與前一年同一天的值的差)來幫助去除趨勢和季節性影響。
  4. 變換:應用變換如對數變換、平方根變換等,可以幫助穩定時間序列的方差,使其更適合某些統計模型。
  5. 時間戳信息:提取時間戳的特定部分,如小時、周天、月份等,用於捕捉週期性模式。
  6. 傅里葉變換:通過傅里葉變換將時間序列轉換爲頻域表示,提取週期性特徵。
  7. 波動性度量:對於金融時間序列,可以計算曆史波動性或返回序列的標準偏差等度量。
  8. 窗口函數:使用滑動窗口操作,如滑動平均或指數平滑,以平滑時間序列並減少噪聲。

本文將通過使用feature-engine來簡化這些特徵的提取,首先我們看看數據。

https://avoid.overfit.cn/post/db4091bc5c8d489aa6f4df807ff7894f

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章