交通流量預測數據集解讀

智慧交通系統

即Intelligent TransportationSystem (ITS)

   屬於時空預測方向,在人工智能相關會議上有不少工作值得借鑑。中科院計算所9樓網數的徐冰冰在github上有建微信羣討論,下週約在計算所給課題組做報告。羣中Davidham(宋超,北交)也撰寫了不少論文筆記,最近還發現了CSDN上張博士的 “當交通遇上機器學習”,也很不錯。


 

原始數據集總結

一、TaxiBJ,北京出租車數據集,鄭宇,"BJ15_M32x32_T30_InOut.h5",原始數據shape=(5596,2,32,32),"2"代表出In/Out兩種流量。

備註:數據應用在ST-ResNet(AAAI17,鄭宇的經典,該領域的里程碑)中。

二、METR-LA,洛杉磯高速路數據集,"metr-la.h5",原始數據shape=(12,6850,207)——間隔5分鐘,預測未來1小時(12,207,2)->(12,207,1)

備註:數據應用在DCRNN文章中。

三、NYC-Taxi,紐約出租車數據集,"volume.train.npz",原始數據shape=(1920,10,20,2),"10,20"代表網格化地圖形狀,同鄭宇的"32,32"

備註:數據應用在STDN文章中。

四、PeMS04/08,加利福尼亞高速數據,"data.npz",原始數據shape=(10195,307,3)——間隔5分鐘預測1小時(307,3,36)->(307,3,12)

備註:數據應用在ASTGCN文章中,"3"代表交通流量3種特徵(flow,speed,occupancy)。

五、MetroHZ,杭州地鐵數據集,"raw_data.npy",原始數據shape=(2448,81,2)——間隔10分鐘預測下一個時間片

備註:數據應用在我的ADST文章(T-ITS)中

六、BusJN,濟南公交數據集,原始數據shape=(26496,11,81)

備註:數據應用在師姐的文章XXX(Ubicomp->T-ITS)中

七、其他數據集

1)2009.5月——北京出租車數據集(一個月);

備註:數據應用在我的開題 “載客熱點區域挖掘” 中(帶上下車載客標識,數據略老)。

2)2014.8月——成都出租車數據集(一個月);

備註:數據應用在牛老師的L-CNN文章(TVT 2018)中。

3)kaggle比賽紐約數據集(預測行程時間);

備註:數據應用在曉雲師姐的大論文中。

 

學術論文梳理

TKDE期刊  (IEEE Transactions on Knowledge and Data Engineering)

 

NIPS會議

    2017,PredRNN 清華,利用自定義的 “時空LSTM” 單元,基於歷史數據幀預測未來圖片,數據集採用Moving Mnist(Mnist視頻流也是高端...),也找到了作者Yunbo Wanggit分享

CVPR會議

    2017,Structural-RNNJain,將時空圖轉換成RNN混合體的一種通用的可擴展的方法。作者是用來做行爲識別的。感覺是非常視覺的paper,膜拜一下就好...

AAAI會議

    2017,ST-Net 鄭宇;目前已經基本復現了微軟亞研院鄭宇在人羣流量預測工作中使用的ST-ResNet殘差網絡。

    2018,DMVST 賓夕法尼亞(姚驊修,滴滴實習生等);綜合考慮時間、空間、語義三方面信息,預測出租車需求(筆記),其中數據來自2017年滴滴出行在廣州的近兩個月數據。作者提供了開源代碼這個團隊後續在AAAI2019又發表了一篇"Revisting Spatial-Temporal similar",提出STDN網絡(姚驊修,數據來自NYC紐約),工作也是相當多的。

    2019,ASTGCN 北交(郭晟楠,林友芳,宋超等):學習PPT(已經聯繫作者找到原文),採用加利福尼亞的兩段高速數據,目前爲預測1小時後的交通流量,使用mxnet搭建神經網絡(添加了注意力機制的STGCN,源碼)。使用三個組件對時間序列上三個不同長短的週期模式進行建模。2019.2.15在北交網站發表了動態

    2019,STMGCN(李亞光,滴滴):空間上引入Multi-Graph多圖,針對地圖區域間非歐關係,本文提出更加詳細的三種關係圖(距離臨近、功能相似、道路相通),對多圖進行圖卷積並聚合。時間上Contextual Gated RNN,實際爲SENet思想。針對訓練樣本序列,利用SENet的Squeeze和Excitation操作,對每個時刻圖進行全局池化,和圖自身卷積池化的結果相加,再利用Excitation達到不同通道權重化的效果。

ICLR會議

    2018,DCRNN 南加大(李亞光,虞琦等人):作者提供了github鏈接,本文借鑑ICLR2017的一篇reject文章(RNN對圖結構數據的推廣)的思想,將該模型用於交通預測。本文在會議官網上收到了很好的Review評價。首先構建圖,這個圖可以加權也可以不加權,可以有向也可以無向,本文使用的是加權雙向有向圖。交通預測挑戰在於:空間路網複雜,時間依賴非線性。本文乾的事概括來講是:給定歷史車速與路網數據,預測未來的車速。使用基於圖bidirectional random walks捕獲空間依賴,使用基於序列的帶預定採樣的編解碼機制捕獲時間依賴。上來創新點扣了個大帽子:“交通空間結構非歐,有向”。本文在洛杉磯構建了帶權有向圖,圖的頂點是sensors(207個),邊是權重,通過路網上 sensor 之間的距離得到。時間間隔5分鐘,預測未來1小時的速度,所以輸入數據中一個樣本是(12,207,2),輸出爲(12,207,1)。

    2018,GAT 劍橋大學(還有Bengio大神),圖注意力,徐博在計算所提到過。

IJCAI會議

    2018 STGCN,提出了時空圖卷積的網絡架構,有一個中文博客輔助說明,作者通過構建時空卷積塊預測交通圖中不同路網節點的速度v,且利用的是加州和北京兩個數據集進行驗證。使用局部圖卷積(基於拉普拉斯圖的一階近似),無向圖。

    2018 GeoMan,還是鄭宇,張均波那些人的,預測傳感器值的迴歸問題,同樣有中文博客的說明。使用水質數據和空氣質量兩個數據集進行驗證。

Sensors

    2017 Deep CNN 北航+北交,用CNN模擬空間相關性,但空間結構在歐式空間 (例如:2D圖像),理解爲普通網格地圖策略。

IJCNN會議

    2018 Deep Transport 百度,通過明確收集各道路上下游的鄰域道路, 並分別對這些鄰域進行傳統卷積, 對空間依賴關係進行建模。

 

附錄:

交通領域期刊影響因子

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章