機器學習-西洋跳棋

       Tesanro1992.1995設計了世界上最好的西洋雙陸棋程序TD-GAMMON,它是通過一百萬次以上與自己對弈來學習起策略的,現在他的水平能與人類的世界冠軍相比。此程序使用人工神經元網絡表示學到的評估函數,考慮對棋局的完整描述,而不是棋盤的幾個參數。
       
              西洋跳棋學習問題:
       任務 T :下西洋跳棋
       性能標準 P :比賽中擊敗對手的百分比
       訓練經驗 E:和自己對弈
       
         注:實際上,學習的樣例通常與最終系統被評估時的樣例又一定差異。
     
              算法在機器學習中的實際應用:
        可以只簡單地存儲訓練樣例,然後對尋找保存的“最接近的”情形來匹配新的情況(最臨近算法)。
        可以產生大量候選的西洋跳棋程序,並讓他們相互比賽,保留最成功的程序並進一步用模擬進化的方式培育或變異它們(遺傳算法)。
       分析或向自己解釋比賽中碰到的某一次成敗的原因(基於解釋的學習)。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章