關於飛槳深度學習學院《強化學習7日打卡訓練營》的一點心得體會

1 引言

積跬步以至千里,積怠情以至深淵,我要做一個踏實的ABCer。

本文將介紹在近期聽講飛槳深度學習學院《強化學習7日打卡訓練營》的一點心得體會,該課程由百度NeurIPS全球頂會冠軍團隊親自授課,授課老師講解深入淺出,零基礎入門強化學習!特講此次學習相關筆記整理如下~

2 關於PaddlePaddle/PARL

經過此次課程的參與,最大的收穫應該就在於瞭解了基於百度 PaddlePaddle 打造的深度強化學習框架PaddlePaddle PARL。通過完成的幾個課程作業,初步掌握了這個框架的使用。

個人體會:PaddlePaddle PARL 凝聚了百度多年來在強化學習領域的技術深耕和產品應用經驗。與現有強化學習工具和平臺相比,PaddlePaddle PARL 具有更高的可擴展性、可復現性和可複用性,強大的大規模並行化和稀疏特徵的支持能力,以及工業級應用案例的驗證。這個框架對於初步踏入強化學習領域的新手來說,相對友好,封裝了RL相關的經典算法,方便使用,並進行驗證諸多RL場景。

框架的github地址,部分目錄結構如下,
在這裏插入圖片描述

3 關於授課內容

在這裏插入圖片描述
雖然在參與課程前,已經對課程涉及的這些強化學習經典算法已經有了一定的瞭解和掌握。但還是被“百度NeurIPS全球頂會冠軍團隊親自授課”這個頭銜以及結課獎勵所吸引。
但通過參與課程,發現重溫一遍這些算法也是受益匪淺的。科科老師授課內容真的深入淺出,令人易於理解,也讓我對強化學習的知識得到了進一步的鞏固。並且使用PaddlePaddle/PARL完成了下圖所示的幾個作業內容,學會使用了一個新的深度強化學習框架。
在這裏插入圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章