微軟Azure AI Gallery 預測性維護案例

微軟 Azure AI Gallery

1. 簡介

預測性維護是一個綜合性的概念,它包括但不限於:故障預測,故障診斷(根因分析),故障探測,故障分類,故障發生前的緩解建議,故障發生後的維護行動。

預測性維護重點關注:預測長期運行的機器何時會發生故障的技術。這項技術通過學習大量與機器運行狀態相關的先驗知識,生成預測模型。該模型輸入機器的實時運行狀態數據,輸出機器故障發生時間點或故障維護建議,從而實現設備故障時間的預判,並提前執行維護工作,降低維護成本。

本預測性維護案例致力於解決三大類問題:

  1. 迴歸問題:預測剩餘使用壽命(RUL, Remaining Useful Life),失效時間(TTF,Time to Failure);
  2. 二分類問題:預測在某一特定時間段內,設備是否會故障;
  3. 多分類問題:預測在多個不同時間段內,設備是否會發生故障

注:上述問題的時間單位可以按工時,週期,里程碑,事物發展等具體業務場景來確定。

本預測性維護模型基於虛擬飛機引擎的運行-故障事件記錄構建。進行設備故障預測性維護前提:設備工作時滿足漸進老化至故障的規律,該規律反映在設備的傳感器測量中。 通過檢查設備傳感器的時序採樣值,機器學習算法可以學習傳感器採集值和變化值,及其相對於歷史故障值之間的關係,來預測未來的故障。 具體過程設計以下三個步驟:

  1. 數據準備和特徵工程

  2. 訓練和評估下面三種模型

    • 迴歸模型
    • 二分類模型
    • 多分類模型
  3. 使用上述三種模型部署web服務器

2. 數據準備與特徵工程

2.1 數據準備

數據集

  • 訓練數據:飛機引擎從正常運行到出故障的完整運行狀態數據的時序記錄;
  • 測試數據:飛機引擎還未發生故障的運行狀態數據的時序記錄;
  • 驗證數據:測試數據的後半段運行數據(發生故障的時間點標識)。

數據採集

  • 訓練數據:按一定週期採集,確保第一個週期採集的數據爲設備正常運行數據,最後一個週期採集的數據爲設備異常運行數據(超過正常門限值),即訓練數據集涵蓋設備由正常到故障的整個過程。
  • 測試數據:和訓練數據類似,但是最後一個週期採集的數據並不是異常運行數據點,此時設備運行正常,但是不知道到底要經過多少個週期,才能遇到故障點。
  • 驗證數據:直接給出每個測試設備之後發生異常時的採集週期值。

數據標籤

  • 迴歸模型:目前這個正常運行的設備還需要多少個週期纔會發生故障。
  • 二分類模型:設備是否會在未來某個時間點發生故障
  • 多分類模型:15天故障預警,30天故障預警,,,,即判斷未來不同時間點是否會發生故障。
    數據標籤

2.2 特徵工程

特徵數據的來源:

  • 原始特徵:從原始的採集數據中挑選合適的特徵,這個過程需要豐富的專業領域知識。
  • 聚合特徵:總結歷史數據集,經過算法運算處理,轉換爲新的特徵。(一段時間內採集數據的平均值或方差,採集值變動的範圍,採集值相對於初始值的差值,採集值變化的速率,超過安全閾值的特徵點個數)

經驗提示:時變特徵的提取,注意採集時間的粒度(例如某個故障每兩個月發生一次,採樣週期按天和周計比按秒計效果會更好,從另一方面改善了正常運行數據和故障數據的分佈不平衡性問題)

3. 模型訓練與評估

第一章節講過預測性維護模型按使用場景劃分,主要涉及三大類:迴歸模型,二分類模型,多分類模型。儘管三者的訓練與評估方法各不相同(後文會依次展開),但是他們依然有一些共同之處,說明如下:

  • 享有共同的訓練測試數據集和流程
  • 享有共同的特徵工程來挑選特徵

3.1 迴歸模型

3.2 二分類模型

3.3 多分類模型

發佈了8 篇原創文章 · 獲贊 0 · 訪問量 367
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章