交通事故預測——《RiskOracle: A Minute-level Citywide Traffic Accident Forecasting Framework》

1、文章信息

AAAI頂級會議,2020年的一篇關於利用深度學習模型進行交通事故預測的文章,文章標題爲:RiskOracle: A Minute-level Citywide Traffic Accident Forecasting Framework .譯爲:RiskOracle:一種時空細粒度交通事故預測框架(分鐘級)。文章是開源的,代碼可以從文章作者給的github地址上查看。

原文github地址:https://github.com/zzyy0929/AAAI2020-RiskOracle/
在這裏插入圖片描述

2、摘要

研究內容:
實時交通事故預測(分鐘級)
以往研究的侷限:
小時級、只考慮區域間的靜態相關性
本文要解決的問題:
由於道路網絡具有高度動態特性,且樣本中事故記錄數本身很稀少,這會導致結果偏差和零膨脹問題。因此,提高預測的粒度仍然是一個挑戰。
本文的主要研究思路:
提出了一個新穎的框架RiskOracle,以將預測的時間粒度提高到足夠細的水平。具體來說,(由於神經網絡往往易於訓練連續型的函數)首先將標籤中的所有風險爲零的值轉換爲適合訓練網絡的連續值。然後,我們提出了差分時變圖神經網絡(DTGN),以捕獲交通狀況的瞬時變化和子區域間動態相關性。此外,我們採用結合多任務的區域選擇方案來突出顯示全市範圍內最可能發生的事故子區域,從而彌合了具有一定偏置的風險值與零星事故分佈之間的溝壑。

3、簡介

文章首先對現有的研究情況做了深度分析,基本介紹了最近幾年最流行的幾個模型,並總結其優缺點,引出本文的研究內容,下面是一張總結的研究表:
在這裏插入圖片描述

回到文章中,提到現有研究有如下三個重要問題在很大程度上被忽略了,導致這些模型不能直接應用到更短期的、分鐘級的預測中:

  • 當預測任務的時空分辨率提高時,將出現零膨脹問題,將所有結果預測爲零。如果沒有任何解決此問題的策略,則訓練數據中稀有的非零項將使模型無法生效。
  • 儘管可以通過卷積神經網絡(CNN)瞭解靜態的子區域關聯度,但時變的子區域關聯在全市短期事故預測中也起着至關重要的作用,即兩個子區域在由於潮汐流動存在上午的相關性較低,下午的相關性較低的情形。
  • 在相鄰時間間隔內同一子區域內交通狀況的異常變化通常會引發事故或其他事件的發生。如果不考慮上述時空問題,以前的小時級預測模型的能力將受到嚴重阻礙。

針對以上問題文章的解決方案描述如下:

  • 在數據預處理階段,提出了一種協同感知策略以最大程度地推斷全局交通狀況,然後基於先驗知識的數據增強功能可解決零膨脹問題,以進行短期預測。
  • 在訓練階段,提出了多任務差分時變圖卷積網絡(Multi-task DTGN),其中時變總親和度矩陣可以顯式地對短期動態的子區域相關性進行建模,而差分特徵生成器則在交通狀況在同一區域的短期變化與事故之間建立更爲高階的關聯,多任務方案解決事故預測中的空間異質性問題。
  • 通過在預測階段利用學習到的多尺度事故分佈,可以獲得一組離散的最有可能的子區域。

4、模型

首先區域劃分上就有所不同,儘可能做到了空間的細化:將一個城市圖劃分爲q箇中等大小的矩形區域,再將每個矩形區域劃分成若干個子區域,總共m個子區域,同時整個城市地圖看作爲一個無向圖G(V,E),V由一系列的子區域構成,E表示一系列具有相關聯性的子區域的連接邊。
同時從兩個方面探討特徵:分別是靜態的路網特徵和動態交通特徵
靜態路網特徵:
車道數量,道路類型,路段長度和寬度,除雪優先級以及高架電子標誌的數量, 內部的所有路段都可以表示爲固定長度向量。
動態交通特徵:
交通流量,交通狀態(速度),事故風險

模型框架如下圖所示:
在這裏插入圖片描述

在數據預處理過程中:
(1)空間異質性問題
由於大多數的交通事故往往發生在交通流量較大、具有較高風險值的市中心區域,導致嚴重的風險空間失衡,而忽視了農村地區相對高風險的地區。 要進行全市範圍的預測,必須選擇最可能發生事故的區域並解決空間異質性問題。因此,對城市以不同大小的尺度劃分,中等的矩形區域負責收集粗粒度的事故分佈而小的方形區域負責收集細粒度事故分佈。 然後,將進一步分別高亮出每個中型矩形區域中的子區域。多尺度事故信息分佈可視爲一種空間層次性事故分佈。
(2)零膨脹問題
如果訓練標籤中的非零項目非常少見,深度神經網絡(DNN)會使得訓練的權重爲全0,從而使得模型失效、遭受零膨脹問題。採用一種基於先驗知識的數據增強(PKDE)策略來區分訓練數據集標籤中的風險值。
(3)填充稀疏的感知數據
實時交通信息通常難以充分收集到以進行事故預測,但是,動態交通信息往往與靜態空間路網結構具有交互作用。 因此,通過利用因子分解機(FM)的交互操作將xDeepFM修改爲適合交通數據的時空深度分解機(ST-DFM),提出了一種協同感知策略。

DTGN模型實現細節:
在這裏插入圖片描述

對比實驗:
一共有5個baseline,也是近些年比較新的解決方案:
(1) ARIMA: 經典的機器學習算法,用於理解和預測未來值,尤其是時間序列預測;
(2) Hetero-ConvLSTM: 針對daily的事故預測模型,也是最新、效果最好的事故預測方法;
(3) ST-ResNet: 針對人流量預測提出的經典方法,也是潛在的能夠用於事故預測的深度學習模型;
(4) SDAE: 針對短期事故預測,引入人流量(人類活動等)作爲事故預測的指示;
(5) SDCAE: 針對短期事故預測的模型。

評估策略:
從迴歸(MSE)和分類(最高M的準確度)兩個角度評估。
在這裏插入圖片描述

5、總結

這篇文章採用的是圖卷積神經網絡,相對於傳統的CNN,RNN網絡理解起來可能比較困難些,具體可以深度下原文,文章的源代碼博主目前還沒有做實驗,後續可能將補充。總結下這篇文章的幾個關鍵點吧:
(1)首先是零膨脹,稀疏感知問題,文章給出了兩種策略;
(2)空間異質性問題,多任務方案處理。

參考資源:
[1]Zhou, Z., Wang, Y., Xie, X., Chen, L., & Liu, H. (2020). RiskOracle: A Minute-level Citywide Traffic Accident Forecasting Framework. ArXiv, abs/2003.00819.
[2]https://www.jianshu.com/p/09ae9e392ccd

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章