雷鋒網新智駕按：4月24日，雷鋒網新智駕聯合MMC在2017年上海車展舉辦“構建智能駕駛的關鍵”主題沙龍，本文來自清華大學自動化系統工程研究所教授姚丹亞的分享。本文講述了V2X技術在自動駕駛中的一個重要應用場景，即自動駕駛汽車在路口會車時的通行決策問題。

*清華大學自動化系統工程研究所教授姚丹亞在上海車展新智駕&MMC沙龍現場

有一篇來自清華大學的論文名叫《基於完全信息動態博弈的無燈控交叉口的車輛協同駕駛模型》（作者：楊卓，姚丹亞），它試着解決了一個可能很多人都想過但還沒有解決的問題，那就是使自動駕駛汽車在路口會車時相互協調，最終彼此配合完成通行決策。

你可以將它看作V2X助力自動駕駛決策的應用之一。對於V2X對自動駕駛的作用，人們談得更多的是V2X在環境感知中的作用，即除汽車自身的傳感器感知外，藉助V2X完成更大範圍的環境感知。

但V2X還有一個重要作用，就是協同決策。目前我們能做到在自主感知的基礎上決策，但V2X環境使“羣決策”成爲可能，在可能在未來會是自動駕駛中的一個重要應用。

如何基於V2X實現羣決策？

以一個具體的場景爲例，即無信號交叉路口的車車協同。兩輛車抵達路口，在沒有控制中心的情況下，聽誰的？它們之間是一個博弈的關係，要通過博弈，保證雙方安全又順利地通過交叉路口。

首先，做一個簡單的場景描述。

1、存在參與車輛，左邊駛來一輛車，下方駛來一輛車，已知彼此的速度、加速度和位置，以及達到路口會車點的距離。

2、路口爲無信號交叉路口，即在沒有信號燈控制。

3、存在V2X環境，車車間可以進行交互。

以上是前提假設。接下來將問題拆分。

第一，判斷車輛間是否存在衝突。我們選擇一個指標來描述這個衝突，這個指標就叫作“衝突時間差”，即兩輛車到達衝突點的時間差值。該差值越小，就越有可能相撞，如爲零則相撞，如差值很大，則代表在完全不同的時刻通過交叉點，定不會相撞。

第二，如果存在衝突，如何提前避免。在這個部分要考慮的因素很多，爲了保證安全，當兩輛車存在衝突時，需要用一個算法保證它們最後不相撞。因此，二者通過路口可以看成一個博弈問題。博弈包括三個要素。

要素一：對象，要存在博弈雙方，此處的對象是車輛。
要素二：策略，忽略具體的油門、剎車等不同操作，用一個“加速度”來作爲各種操作的表現形式，加速度構成了策略。
要素三：收益，需要定義博弈的收益。我們在模型裏定義了三種收益，即安全、快速、舒適。安全是首要需求，即不能撞車；快速指的是使車輛儘快通過路口；舒適指符合人的駕駛習慣，不能過度加速和減速，保證駕駛舒適。

以上就是一些決策的基本場景假設。

基於此，兩輛車的路口博弈在數學上可以看作一個有約束的多目標規劃問題。即，將不同加速度組合的情況下，使獲得的收益“Ω”達到最大。其中涉及一些數學問題，如多重納什均衡、求最優解等，我們在這個模型中是用遺傳算法求取最優解。

下面就具體地來計算這個問題。

對於兩輛車，首先要判斷其是否進入衝突區。博弈系統的實例模型如下所示，紅點表示衝突點（碰撞的點），通過車輛到達衝突點的時間差判斷是否進入衝突區域。

*出自該模型作者曾發表的論文

若兩輛車並未進入衝突區，則不需要博弈，正常行駛即可。一旦進入衝突區，博弈即開始，通過博弈使得收益最大。前面講到三個收益指標（安全、快速、舒適），此時就要具體定義這三個指標。

1、安全性指標。安全性指標指已到達衝突點的時間差，在這個模型中，該差值一定要大於某個給定的閾值，才能確保安全。這個公式比較簡單，基本是中學時候關於距離、速度、時間的簡單公式。

2、快速性指標。指的是兩個週期內速度的變化，是當前時刻加速度值的直接反應。

3、舒適性指標。舒適性指標其實可以直接用加速度的絕對值來表示，絕對值越大，舒適型越差，在這個模型中我們基本選擇0.25g加速度指標來進行博弈。當然，前提還是要安全，如果要發生碰撞了，那麼舒適性指標是可以犧牲的。此外，舒適性指標也定義了一些不良加速度行爲，如加速度增幅達到200%，或是該加速時變成反向加速度等。

對於以上三個收益值，需要做一個標準化的工作。三種數據的量綱不同，有的是時間，有的是加速度，如何求和呢？這其中就涉及到標準化問題。這裏不具體解釋，基本的計算方法是將當前值減去期望值除以標準差。最後，需要用到遺傳算法，儘可能得到全局最優解。

仿真實驗

對於這套理論，我們還沒有用在實車控制中，只是進行了仿真實驗。這是個具體的仿真例子。兩輛車初始速度分別爲60km/h和50km/h，距離衝突點的距離分別爲250米和150米，設定約束條件：最大速度不能超過70km/h，最小速度是零（即停車），加速度值控制在±0.3g之間。用於求解的遺傳算法在此不贅述，它主要用於獲得最優解的。下圖，是兩車路口會車的仿真實驗結合曲線圖。

*出自該模型作者曾發表的論文

從上圖可以看出，這次仿真實驗得到了蠻有意思的結果。在這個場景下，兩輛車出現了兩次博弈的過程。第一次，計算得出到衝突點的時間差小於給定閾值，進行了一輪博弈後，衝突危險解除，判斷安全後又開始自由駕駛；自由駕駛一段時間以後又進入了一次博弈過程，最後直到車輛安全通過路口。

上面的圖給出了許多博弈曲線。第一排曲線是收益曲線，紅色、藍色代表兩輛車分別的收益，綠色表示兩輛車的總收益。第二排是加速度曲線，拿加速度曲線來說，博弈的效果不是特別好，因爲跳動很大，博弈算法還有些需要完善的地方。第三排是速度曲線。

最後一排的碰撞時間差（TDTC）。我們爲TDTC設置一個閾值，當TDTC小於閾值的時候，就會告知存在碰撞風險，開始博弈。而這個過程是變化的，一旦TDTC超出閾值，就證明沒有風險，雙方就可以自由駕駛。最後車輛安全駛離交通路口，這是一個完整的博弈過程。

在一些具體參數上，主要考慮三點。

第一，收益。如圖，對於第一輛車而言，它得到的是負收益，第二輛車是正收益，我們的博弈規則，是將二者相加，儘量使得整體收益最大。
第二，高速度佔比和不良加速度。
第三，收益函數的係數。這是一個很重要的參數，這個係數會直接影響最後博弈的效果。具體的確定的方法，我認爲是值得研究的。比如，α大是更強調安全，β大是強調快速性，γ大是強調舒適性，看你如何選擇評估方式。

總結

該模型的研究，考慮到了駕駛安全、舒適等指標之間的博弈和決策，避免碰撞是最重要的部分，同時也要儘可能避免那些降低舒適性的操作。未來，通過豐富策略集，可以在模型的基礎上，有更多方向、更多方式的相關研究。

同時，羣決策算法是一個亮點。剛纔只是兩輛車的模型，我們的博士生還在研究路口多車博弈的通用模型。

當然，我們現在的實驗還在仿真基礎上，不過也在做一些實用的產品。我們課題組和一個叫作星雲互聯的公司合作，開發了一些V2X的產品，如智能車載終端、路側通信機、路側主機等，其中內置了多種通信模塊，支持多種通信方式接入，完成車車、車路之間的數據交互。目前我們的產品，主要應用在各種自動駕駛和智能駕駛測試場，同時，還推出了了一些實際應用。例如我們在校園公交系統中裝入了路側系統、校園公交車上安裝了車載裝置，用以測試和積累數據。此外，我們還在蕪湖交警支隊的支持下，在中心城區路口建設了V2X基礎設施。之後，我們還和很多的企業和測試場開展更多的合作，在實際的項目中進行測試。

雷鋒網(公衆號：雷鋒網)推薦閱讀：讓汽車與萬物連接起來的V2X技術，將如何改變自動駕駛行業？

清華大學研究成果：如何用博弈論解決自動駕駛路口的會車決策問題？

如何基於V2X實現羣決策？

仿真實驗

總結

使用neovim打造go ide(支持代碼跳轉, 代碼補全, 實時語法檢查)

挑戰程序設計競賽 2.3章習題 poj 3046 Ant Counting

Shell/Python中的用戶名獲取

二維坦克大戰遊戲代碼開發

linux常用小知識點

如何定位內存泄漏問題

交易撮合系統···實現得比較簡陋

什麼是進程？什麼是線程？總結

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結