清華大學研究成果:如何用博弈論解決自動駕駛路口的會車決策問題?

雷鋒網新智駕按:4月24日,雷鋒網新智駕聯合MMC在2017年上海車展舉辦“構建智能駕駛的關鍵”主題沙龍,本文來自清華大學自動化系統工程研究所教授姚丹亞的分享。本文講述了V2X技術在自動駕駛中的一個重要應用場景,即自動駕駛汽車在路口會車時的通行決策問題。

清華大學研究成果:如何用博弈論解決自動駕駛路口的會車決策問題?

*清華大學自動化系統工程研究所教授姚丹亞在上海車展新智駕&MMC沙龍現場

有一篇來自清華大學的論文名叫《基於完全信息動態博弈的無燈控交叉口的車輛協同駕駛模型》(作者:楊卓,姚丹亞),它試着解決了一個可能很多人都想過但還沒有解決的問題,那就是使自動駕駛汽車在路口會車時相互協調,最終彼此配合完成通行決策。

你可以將它看作V2X助力自動駕駛決策的應用之一。對於V2X對自動駕駛的作用,人們談得更多的是V2X在環境感知中的作用,即除汽車自身的傳感器感知外,藉助V2X完成更大範圍的環境感知。

但V2X還有一個重要作用,就是協同決策。目前我們能做到在自主感知的基礎上決策,但V2X環境使“羣決策”成爲可能,在可能在未來會是自動駕駛中的一個重要應用。

如何基於V2X實現羣決策?

以一個具體的場景爲例,即無信號交叉路口的車車協同。兩輛車抵達路口,在沒有控制中心的情況下,聽誰的?它們之間是一個博弈的關係,要通過博弈,保證雙方安全又順利地通過交叉路口。

首先,做一個簡單的場景描述。

1、存在參與車輛,左邊駛來一輛車,下方駛來一輛車,已知彼此的速度、加速度和位置,以及達到路口會車點的距離。

2、路口爲無信號交叉路口,即在沒有信號燈控制。

3、存在V2X環境,車車間可以進行交互。

以上是前提假設。接下來將問題拆分。

第一,判斷車輛間是否存在衝突。我們選擇一個指標來描述這個衝突,這個指標就叫作“衝突時間差”,即兩輛車到達衝突點的時間差值。該差值越小,就越有可能相撞,如爲零則相撞,如差值很大,則代表在完全不同的時刻通過交叉點,定不會相撞。

第二,如果存在衝突,如何提前避免。在這個部分要考慮的因素很多,爲了保證安全,當兩輛車存在衝突時,需要用一個算法保證它們最後不相撞。因此,二者通過路口可以看成一個博弈問題。博弈包括三個要素。

  • 要素一:對象,要存在博弈雙方,此處的對象是車輛。

  • 要素二:策略,忽略具體的油門、剎車等不同操作,用一個“加速度”來作爲各種操作的表現形式,加速度構成了策略。

  • 要素三:收益,需要定義博弈的收益。我們在模型裏定義了三種收益,即安全、快速、舒適。安全是首要需求,即不能撞車;快速指的是使車輛儘快通過路口;舒適指符合人的駕駛習慣,不能過度加速和減速,保證駕駛舒適。

以上就是一些決策的基本場景假設。

基於此,兩輛車的路口博弈在數學上可以看作一個有約束的多目標規劃問題。即,將不同加速度組合的情況下,使獲得的收益“Ω”達到最大。其中涉及一些數學問題,如多重納什均衡、求最優解等,我們在這個模型中是用遺傳算法求取最優解。

下面就具體地來計算這個問題。

對於兩輛車,首先要判斷其是否進入衝突區。博弈系統的實例模型如下所示,紅點表示衝突點(碰撞的點),通過車輛到達衝突點的時間差判斷是否進入衝突區域。

清華大學研究成果:如何用博弈論解決自動駕駛路口的會車決策問題?

*出自該模型作者曾發表的論文

若兩輛車並未進入衝突區,則不需要博弈,正常行駛即可。一旦進入衝突區,博弈即開始,通過博弈使得收益最大。前面講到三個收益指標(安全、快速、舒適),此時就要具體定義這三個指標。

1、安全性指標。安全性指標指已到達衝突點的時間差,在這個模型中,該差值一定要大於某個給定的閾值,才能確保安全。這個公式比較簡單,基本是中學時候關於距離、速度、時間的簡單公式。

2、快速性指標。指的是兩個週期內速度的變化,是當前時刻加速度值的直接反應。

3、舒適性指標。舒適性指標其實可以直接用加速度的絕對值來表示,絕對值越大,舒適型越差,在這個模型中我們基本選擇0.25g加速度指標來進行博弈。當然,前提還是要安全,如果要發生碰撞了,那麼舒適性指標是可以犧牲的。此外,舒適性指標也定義了一些不良加速度行爲,如加速度增幅達到200%,或是該加速時變成反向加速度等。

對於以上三個收益值,需要做一個標準化的工作。三種數據的量綱不同,有的是時間,有的是加速度,如何求和呢?這其中就涉及到標準化問題。這裏不具體解釋,基本的計算方法是將當前值減去期望值除以標準差。最後,需要用到遺傳算法,儘可能得到全局最優解。

仿真實驗

對於這套理論,我們還沒有用在實車控制中,只是進行了仿真實驗。這是個具體的仿真例子。兩輛車初始速度分別爲60km/h和50km/h,距離衝突點的距離分別爲250米和150米,設定約束條件:最大速度不能超過70km/h,最小速度是零(即停車),加速度值控制在±0.3g之間。用於求解的遺傳算法在此不贅述,它主要用於獲得最優解的。下圖,是兩車路口會車的仿真實驗結合曲線圖。

清華大學研究成果:如何用博弈論解決自動駕駛路口的會車決策問題?

*出自該模型作者曾發表的論文

從上圖可以看出,這次仿真實驗得到了蠻有意思的結果。在這個場景下,兩輛車出現了兩次博弈的過程。第一次,計算得出到衝突點的時間差小於給定閾值,進行了一輪博弈後,衝突危險解除,判斷安全後又開始自由駕駛;自由駕駛一段時間以後又進入了一次博弈過程,最後直到車輛安全通過路口。

上面的圖給出了許多博弈曲線。第一排曲線是收益曲線,紅色、藍色代表兩輛車分別的收益,綠色表示兩輛車的總收益。第二排是加速度曲線,拿加速度曲線來說,博弈的效果不是特別好,因爲跳動很大,博弈算法還有些需要完善的地方。第三排是速度曲線。

最後一排的碰撞時間差(TDTC)。我們爲TDTC設置一個閾值,當TDTC小於閾值的時候,就會告知存在碰撞風險,開始博弈。而這個過程是變化的,一旦TDTC超出閾值,就證明沒有風險,雙方就可以自由駕駛。最後車輛安全駛離交通路口,這是一個完整的博弈過程。

在一些具體參數上,主要考慮三點。

  • 第一,收益。如圖,對於第一輛車而言,它得到的是負收益,第二輛車是正收益,我們的博弈規則,是將二者相加,儘量使得整體收益最大。

  • 第二,高速度佔比和不良加速度。

  • 第三,收益函數的係數。這是一個很重要的參數,這個係數會直接影響最後博弈的效果。具體的確定的方法,我認爲是值得研究的。比如,α大是更強調安全,β大是強調快速性,γ大是強調舒適性,看你如何選擇評估方式。

總結

該模型的研究,考慮到了駕駛安全、舒適等指標之間的博弈和決策,避免碰撞是最重要的部分,同時也要儘可能避免那些降低舒適性的操作。未來,通過豐富策略集,可以在模型的基礎上,有更多方向、更多方式的相關研究。

同時,羣決策算法是一個亮點。剛纔只是兩輛車的模型,我們的博士生還在研究路口多車博弈的通用模型。

當然,我們現在的實驗還在仿真基礎上,不過也在做一些實用的產品。我們課題組和一個叫作星雲互聯的公司合作,開發了一些V2X的產品,如智能車載終端、路側通信機、路側主機等,其中內置了多種通信模塊,支持多種通信方式接入,完成車車、車路之間的數據交互。目前我們的產品,主要應用在各種自動駕駛和智能駕駛測試場,同時,還推出了了一些實際應用。例如我們在校園公交系統中裝入了路側系統、校園公交車上安裝了車載裝置,用以測試和積累數據。此外,我們還在蕪湖交警支隊的支持下,在中心城區路口建設了V2X基礎設施。之後,我們還和很多的企業和測試場開展更多的合作,在實際的項目中進行測試。

雷鋒網(公衆號:雷鋒網)推薦閱讀:讓汽車與萬物連接起來的V2X技術,將如何改變自動駕駛行業?

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章