強化學習 baselines項目源碼部分解讀

最近發現強化學習挺有意思,但是發現這樣的博客挺少的,就隨手記錄下學習的過程!
baselines github地址
下載慢的同學用百度雲:鏈接:https://pan.baidu.com/s/1shRa5hl6kqffESmnpF72uA
提取碼:kkw3

DeepMind團隊整合了gym環境方便後人能更方便的學習,之後又把目前的強化學習算法做成了一個baselines項目,項目中包含了到目前爲止各種強化學習算法,包括Q-learning,DQN,和DQN的各種改進,A2C,DDPG,PPO等。用戶使用只需要像使用sklearn庫裏的機器學習算法那樣簡單,調用一下函數,修改一下超參數就能坐享其成了。感謝DeepMind。
在這裏插入圖片描述苦於現在只能mac和linux系統裝,我Windows的就很尷尬了。我花了些時間來閱讀它的DQN以及相關的源代碼。以下分開來列出:

Google的DeepMind團隊專門致力於研究人工智能,當然在強化學習領域也是世界領先水平,在2015年,DeepMind團隊在nature雜誌上發表了一片名爲《Human-level control through deep reinforcement learning》的論文,成功將強化學習和深度學習結合起來-------命名爲深度強化學習(DQN),可以說是具有劃時代意義的文章,同年深度強化學習DeepMind團隊的研發下,產出了Alpha Go,攻破了象徵着人類智力頂峯的圍棋!有人說,如果一千年後,回首你所經歷過最有意義的歷史事件,那一定是2016年人工智能alpha go戰勝圍棋世界冠軍李世石的那場比賽。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章