未來兩個月要完成的博文

1. 蒙特卡洛搜索算法

2. 有限馬爾可夫決策過程

3. Dynamic Programming

4. Temporal-Difference Learning

5. Boot-strapping

6. Tabular Methods

7. DQN

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章