機器學習-西洋跳棋

原創

2018-09-12 05:14

Tesanro1992.1995設計了世界上最好的西洋雙陸棋程序TD-GAMMON,它是通過一百萬次以上與自己對弈來學習起策略的，現在他的水平能與人類的世界冠軍相比。此程序使用人工神經元網絡表示學到的評估函數，考慮對棋局的完整描述，而不是棋盤的幾個參數。

西洋跳棋學習問題：

任務 T ：下西洋跳棋

性能標準 P ：比賽中擊敗對手的百分比

訓練經驗 E：和自己對弈

注：實際上，學習的樣例通常與最終系統被評估時的樣例又一定差異。

算法在機器學習中的實際應用：

可以只簡單地存儲訓練樣例，然後對尋找保存的“最接近的”情形來匹配新的情況（最臨近算法）。

可以產生大量候選的西洋跳棋程序，並讓他們相互比賽，保留最成功的程序並進一步用模擬進化的方式培育或變異它們（遺傳算法）。

分析或向自己解釋比賽中碰到的某一次成敗的原因（基於解釋的學習）。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.