交通信號控制系統綜述

最初基於現代控制理論的交通控制方法,統稱爲基於模型的控制(model based control, MBC)理論與方法。【2】

之後以智能體、神經網絡、模糊邏輯、羣體智能爲代表的人工智能理論與方法逐漸成熟,將每一個交叉口看作是具有智能計算能力的智能體(Agent),並採用多智能體系統(MAS)協調優化來實現區域交通控制。【3】

從三方面系統跟蹤交通信號自適應控制方法:
基於模型的控制MBC理論與方法
基於智能計算控制方法
基於數據驅動控制方法


1 基於MBC的自適應控制方法

基於 MBC 的控制方法遵循前饋控制理論,採用 自適應控制最優控制,建立網絡級交通信號的多目標配時模型,並採用在線優化模塊計算最優的控制方案(週期、綠信比和相位差),及時更新交通信號機的控制參數,以響應路口到達交通需求的變化。

根據控制目標的不同,交通信號 MBC控制方法又可分爲 基於綜合性能指標協調控制方法(綜合指標法)基於綠波帶的協調控制方法(綠波帶法)


1.1 綜合指標法

綜合指標法綜合考慮延誤、停車次數、排隊長度或通過量,以獲得網絡整體效益的最優。 當前絕大多數的自適應交通信號控制都採用基於綜合性能指標的集中式協調控制方法。
SCOOT、U-TOPIA 等主流的商業交通控制系統和 TRANSYT 等配時軟件都是在 MBC 控制方法的基礎上演變發展而來的,這些系統的基準協調方案的優化生成都採用與 TRANSYT 相似的控制邏輯,只是具體配時模型的形式和尋優的方法各不相同【5】。

根據交通控制模型中交通預測模塊的地位和作用,典型的交通信號 MBC 控制方法:
數理統計模型控制:無交通流預測過程
存儲-轉發響應式控制:採用網絡內實時監測的到達-離開的交通數據
預測模型控制:僅採用歷史交通流數據模擬路段上車隊運動過程
滑動時間窗控制:更精細地模擬未來控制段時間內的網絡交通流的演化


1.2 綠波帶法

綠波帶法通過增加幹線走廊上綠波帶來減小協調方向上行駛車輛的延誤,大幅提升主線的交通效益。
典型的基於綠波帶的幹線協調控制方法包括:
最大綠波帶法 MAXBAND
變帶寬多綠波帶法 MULTIBAND 【6】

綠波帶法在理論上沒有直接將延誤、停車次數或排隊長度作爲控制目標,通過最大化不停車連續通過時間帶,有效地減少協調方向車輛的行程時間,使協調方向車延誤均達最小。但綠波帶法旨在尋找幹線車隊連續行駛時的最大綠波帶,公共週期時長通常比較大,容易造成非關鍵交叉口大週期控制等問題【7】。


2 基於智能計算的自適應控制方法

人工智能計算技術模擬人的推理和學習過程,在交通控制器與道路環境的交互過程中自主學習優化的控制策略,具有較強的學習能力。
近10年,採用多智能體建模技術,基於智能計算的交通控制方法無需精確的數學模型得到了衆多學者的關注,其中,模糊邏輯、神經網絡和羣體智能算法佔據着主導地位【8】。

2.1 模糊邏輯

模糊邏輯(fuzzy logic, FL)可將交通管理者或專家積累的信號控制經驗用 if-else 的模糊規則表達出來,通過模糊推理,實現決策推理過程,是一種處理非線性和不確定性的有效工具。

城市交通信號模糊控制是解決城市交通問題有效的內涵式解決方案之一。
早在1977年,Pappis等【10】就將模糊控制運用在交通控制上,通過建立規則庫或是專家系統對各種交通狀況進行模糊控制,取得了很好的效果。
此後,爲提升模糊控制器解決實際交通問題的水平,兩級模糊【11】、三級模糊【12】等多級模糊結構模型先後被提出,並從單點向區域交通控制應用方向發展
除此之外,結合羣體智能、神經網絡等的混合智能控制方法被衆多學者研究以提升模糊邏輯自身的學習能力。

研究表明:基於模糊邏輯交通信號控制可獲得好的控制效果,但人工設置的模糊控制器結構及模糊控制器參數帶有很強主觀性,模糊控制器的結構、模糊控制器參數在線優化方法是目前模糊應用於城市交通信號控制的研究熱點。

2.2 神經網絡

人工神經網絡(ANN)是一種自學習系統,在理論上已被證明具有較強的自學習的功能,被廣泛地應用於交通系統模式識別、自適應控制等領域。

Nakastuji【13】在前向動態規劃算法中採用模糊神經網絡,大幅提高了算法的計算速度,並將其應用於 PRODYN 區域實時控制系統中。
Choy 等【14】提出了一個三層分佈式的多智能體交通信號控制架構,包括路口控制智能體、子區控制智能體和區域控制智能體,每層智能體的學習推理均採用基於神經網絡的模糊邏輯並以控制效果的實時回饋爲準則,採用強化學習在線學習控制規則,以響應動態變化的交通環境。
爲降低系統複雜度,Srinivasan等【15】提出一個單層分佈式的多智能體交通信號控制系統,每一智能體負責網絡中每一路口的交通信號,且分屬於各自的協調子區,協調子區可根據路網交通條件進行動態更新和劃分,協調子區內的智能體採用集體協同決策的方式優化關聯路口的控制方案。

研究表明:基於神經網絡交通控制方法具有良好的映射能力和學習功能,但這種監督學習的方法要求有足夠合適的控制策略樣本。由於交通系統的強烈非線性,樣本收集過程是非常困難和耗時的,系統收斂速度慢,且訓練初始值的設定對訓練時間和訓練效果有很大影響。


2.3 羣體智能

進化遺傳算法(GA)、蟻羣算法(ACO)和粒子羣算法(PSO)等羣體智能算法模擬生物的社會行爲,採用羣體搜索策略和羣體中個體之間的信息交換,開展全局隨機搜索與並行優化,且搜索過程不依賴於對象的梯度信息,在交通控制中具有廣泛應用。

根據智能配時方案中羣體智能算法的作用,典型的羣體智能算法應用包括:
配時方案啓發式搜索【18】
結構模型參數學習【19】
配時模型的優化求解【20】

最新的 TRANSYT - T7FS.1 及以後的版本採用了遺傳算法進行配時。
常雲濤等【21】提出了基於遺傳算法的交通信號配時優化方法,它整合了基於延誤和基於帶寬模型方法的優點,同時優化週期、綠信比、相位差和相序。但對於複雜的多目標最優化控制,傳統羣體智能算法面臨違背約束條件或收斂到次最優解等問題。
在實際應用中常引入模擬退火、黃金分割局部尋優化算子或是多種算法組合應用,提出具有混合結構的羣體智能算法【22】,以增加遺傳算法等傳統羣體算法的局部尋優能力。但受限於優化效率,混合羣體智能算法僅適用於離線最優的自適應控制。


3 基於數據驅動的自適應控制方法

候忠生在2009年給出了數據驅動控制(data driven control, DDC)的一般化定義【23】,由於 DDC 是直接使用被控對象的 I/O 量測數據進行控制器設計的控制理論與方法,無需環境的數學模型,也稱爲 Model-free Control。

根據控制器結構的不同, DDC 方法可分爲兩類:
控制器結構已知的 DDC 方法
控制器結構未知的 DDC 方法。

郝建根等【24】將結構已知的 DDC 方法應用於過飽和單交叉口、交通幹線、快速路出入口的控制,提出了面向不同對象的排隊長度均衡控制的方法。據作者認知,結構已知的 DDC 算法的理論分析和系統設計都採用 MBC 的方法和思路,其在本質上是將控制器的設計問題轉化爲控制器參數的辨識問題,隱式包含了系統的模型結構和動態信息,這是一種基於數據在線整定模型參數的 MBC 控制方法。

作爲一種典型的無模型數據驅動控制方法,迭代學習控制(ILC)的思想已經在強化學習(RL)算法中獲得了大量的應用,併成功應用於單點、幹線和區域交通信號控制。


4 總結

在這裏插入圖片描述

在不能完全獲取交通系統狀態信息、不能完全理解系統內部機理、不能建立被控對象精確動力學模型的條件下,數據驅動控制法自主尋找隱含的控制知識,具有無模型、自學習等特性,在理論上可解決 MBC 法需要精確數學模型以及智能計算法無自學習能力等固有不足,是區域交通閉環反饋控制理論與技術應用的重要方向。

這其中,多智能體強化學習(MARL) 採用無模型迭代學習控制思想,採用“揚好抑壞”機制倒逼受控對象的最優控制策略,具有很好的應用前景,但用於解釋數據的好的算法和交通數據的質量將是決定數據驅動控制成功的關鍵。

因此,研究具有更好不確定性響應能力和更高智能決策水平的閉環反饋自適應控制方法將是下一代交通控制系統發展的必然選擇,而這要求控制系統具有無模型、自學習、閉環反饋等特徵。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章