初步初始化檢測點

昨天已經得到了類似下面格式的數據:

  * 37.751340000000006 -122.39445
  * 37.751310000000004 -122.39502000000001
  1211035434
  * 37.751310000000004 -122.39502000000001
  * 37.7513 -122.39526000000001
  * 37.751000000000005 -122.39536000000001
  * 37.75067000000001 -122.39533000000001
  1211035796

我將這些數據分爲兩類:1. 只有起點和終點的一條直線段(如上面的第一組數據);2. 包含若干中間點的折線(如上面的第二組數據)。第一類數據,我將起點設置爲檢測點;第二類數據,我將除了起點和終點的其他點設置爲檢測點。一共有8萬多條GPS數據(每一個“*”開頭的行表示一條數據),通過一個小的python腳本,我得到初始檢測點的個數:15511,這個數字還是太大了,怎樣能夠進一步優化呢?

其實每一條第一類數據都可以和他相近的第二類數據合併,因第一類數據是個直線段,它可以作爲第二類數據的一部分,這樣,第一類數據產生的檢測點就基本可以刪掉了,我通過一個腳本得到第一類數據的個數是6千多條,這樣剩下的檢測點就只剩下9千多個。這個方法的可行性還得通過進一步實驗才能知道。還有一些可以刪掉的就是那些交通流量爲1的,或是比較偏遠的。具體結果我會明天在博客中說。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章