AI中的搜索主要分爲兩大類:啓發式搜索和對抗搜索
啓發式搜索
對抗搜索
對抗搜索也稱爲博弈搜索
主要有三種搜索方法
- 最小最大搜索(Minimax Search)
- Alpha-Beta剪枝搜索(Pruning Search)
- 蒙特卡洛樹搜索(Monte-Carlo Tree Search)
最小最大搜索和α-β剪枝搜索,這些方法在IBM的深藍中曾大量應用
最小最大搜索(Minimax Search)
雙人對戰,博弈樹,
雙方所希望的目標是相對的,A希望B輸,B希望A輸,A希望某個利益最大化,B就希望某個利益最小化(因爲最大化對A有利)
Alpha-Beta剪枝搜索(Pruning Search)
在最小最大搜索的基礎上,剪掉一些不必要的搜索節點
Alpha-Beta搜索和最小最大搜索所得的結論相同,但剪去了不影響最終結果的搜索分支
蒙特卡洛樹搜索(Monte-Carlo Tree Search)
Alphago採用的搜索策略
單一狀態蒙特卡洛規劃:多臂賭博機(multi-armed bandits)
上限置信區間策略(Upper Confidence Bound Strategies,UCB)
蒙特卡洛樹搜索(Monte-Carlo Tree Search)
UCT(Upper Confidence Bounds on Trees)