博弈論

1.巴什博弈
• 問題模型:只有一堆n個物品,兩個人輪流從這堆物品中取物,規定 每次⾄至少取一個,最多取m個,最後取光者得勝
• n%(m + 1) == 0時,先手敗,否則先手勝。
•巴什博弈的一般情況見HDU-2897
<抽象模型,有些要找規律>
2.威佐夫博弈
• 問題模型:有兩堆各若干個物品,兩個人輪流從某一堆或同時從兩堆 中取同樣多的物品,規定每次至少取⼀一個,多者不限,最後取 光者得勝。
• 求解:
  ak =[k(1+√5)/2],bk= ak + k (k=0,1,2,…,n 方括號表示取整函數)
(ak,bk)是奇異局勢,當A面對奇異局勢是必輸
<熟記公式>

3.尼姆博弈

• 問題模型:有三堆各若干個物品,兩個人輪流從某一堆取任意多的物品,規定每次至少取一個,多者不限,最後取光者得勝。
  若a ^ b ^ c == 0,則(a, b, c)是必敗態
4.SG定理

• SG函數需要Sprague-Grundy定理(SG定理)的理論支持。假設這樣一個類nim遊戲,n堆火柴,每堆有num[ i ]根火柴,可以把這個遊戲拆成n個遊戲,每個遊戲爲:有一堆火柴(設爲總遊戲中的第k堆),每次一個遊戲者可以拿至少一個,至多全部,無法拿者輸,兩個遊戲者輪流取。恩恩,建了這樣一個問題模型,SG定理:遊戲和的SG函數等於各個子游戲SG函數的Nim和。這樣,可以用分治的思想簡化問題。(所以,Nim中的Bouton定理(即所有數nim和 ?= 0 的判定定理)可以看做SG定理在Nim遊戲中的直接應用,因爲單堆Nim遊戲SG函數爲SG(x) = x ),SG函數值是它的所有子游戲的SG函數值的異或。(0必敗)
SG函數的難點就在於找必敗(必勝狀態)然後和單堆nim思路建立聯繫,或者直接模擬sg函數過程。
主要有兩種模擬SG函數的過程:(總結自hdu 1848)
1:普通直接模擬
#define MAXN 1000
int sg[MAXN + 5];
//num[ 1 , 2 ....] :可以取走的石子個數
//而used數組用於記錄後繼狀態的sg值存在與否
//count:num數組中有效數字總數
void SG(int x)
{
memset(sg , 0 , sizeof(sg));
     for(int i = 1; i <= x; i++)
     {
        bool used[MAXN + 5] = {0};  
        for(int j = 1; j <= count; j++)
        {
            if(i - num[ j ] >= 0)
                used[ sg [ i - num[ j ] ] ] = 1;
        }
        for(int j = 0; j <= i; j++)
        {
            if(used[j] == 0)
            {
                sg[i] = j;
                break;
            }
        }
    }
}
2:用dfs進行優化
int SG_dfs(int x)
{
   if(sg[x] != -1)
        return sg[x];
    bool used[MAXN + 5] = {0};
    for(int i = 1; i <= count; i++)
    {
        if(x >= num[ i ])
        {
            sg[x - num[i]] = SG_dfs(x - num[i]);
            used[ sg [ x - num[ i ] ] ] = 1;
        }
    }
    for(int i = 0; i <= x; i++)//i <= x可有可無,但爲了安全,還是加上
    {
        if(used[i] == 0)
        {
            return sg[x] = i;
        }
    }
}

5.PN圖的構建
P(previous):必敗狀態
N(next):必勝狀態
特點1:該狀態爲必敗狀態,當且僅當所有後繼都是必勝狀態。
特點1:該狀態爲必勝狀態,當且僅當至少一個後繼時必敗狀態。
特例:沒有後繼狀態(即終態)爲必敗狀態。
所以,可以根據終態爲P
例如:HDU-2147
PN圖構建代碼爲:
#include <bits/stdc++.h>
using namespace std;
bool ma[2001][2001];//1 P 0 N;
int main(){
       int i,j,k;
       ma[1][1]=1;
       for(i=2;i<=2000;i++)
       {
              if(ma[i-1][1])
                     ma[i][1]=0;
              else ma[i][1]=1;
              for(j=2;j<i;j++){
                     if(!ma[i][j-1]&&!ma[i-1][j-1]&&!ma[i-1][j])
                            ma[i][j]=1;
                     else ma[i][j]=0;
              }
              if(ma[1][i-1])
                     ma[1][i]=0;
              else ma[1][i]=1;
              for(j=2;j<i;j++){
                     if(!ma[j-1][i]&&!ma[j-1][i-1]&&!ma[j][i-1])
                            ma[j][i]=1;
                     else ma[j][i]=0;
              }
              if(!ma[i][i-1]&&!ma[i-1][i-1]&&!ma[i-1][i])
                     ma[i][i]=1;
              else ma[i][i]=0;
       }
       int M,N;
       for(i=1;i<=10;i++){
              for(j=1;j<=10;j++)
                     printf("%c ",ma[i][j]?'P':'N');
              printf("\n");
       }
       while(scanf("%d%d",&M,&N)&&M&&N){
              if(ma[M][N]) printf("What a pity!\n");
              else printf("Wonderful!\n");
       }
       return 0;
}
<不同題目有不同的構建代碼,但都按照PN圖兩個特點來實現>
<部分題目手動畫PN圖很方便~>
6.FIB博弈 

有一堆個數爲n的石子,遊戲雙方輪流取石子,滿足:

1.先手不能在第一次把所有的石子取完;

2.之後每次可以取的石子數介於1到對手剛取的石子數的2倍之間(包含1和對手剛取的石子數的2倍)。

約定取走最後一個石子的人爲贏家,求必敗態。

斐波那契博弈有一個非常重要的性質:

先手必敗,當且僅當石子數爲斐波那契數:
(圖截自360百科)

先看看FIB數列的必敗證明:

 

1、當i=2時,先手只能取1顆,顯然必敗,結論成立。

2、假設當i<=k時,結論成立。

     則當i=k+1時,f[i] = f[k]+f[k-1]。

     則我們可以把這一堆石子看成兩堆,簡稱k堆和k-1堆。

    (一定可以看成兩堆,因爲假如先手第一次取的石子數大於或等於f[k-1],則後手可以直接取完f[k],因爲f[k] < 2*f[k-1])對於k-1堆,由假設可知,不論先手怎樣取,後手總能取到最後一顆。下面我們分析一下後手最後取的石子數x的情況。

     如果先手第一次取的石子數y>=f[k-1]/3,則這小堆所剩的石子數小於2y,即後手可以直接取完,此時x=f[k-1]-y,則x<=2/3*f[k-1]。

     我們來比較一下2/3*f[k-1]與1/2*f[k]的大小。即4*f[k-1]與3*f[k]的大小,由數學歸納法不難得出,後者大。

     所以我們得到,x<1/2*f[k]。

     即後手取完k-1堆後,先手不能一下取完k堆,所以遊戲規則沒有改變,則由假設可知,對於k堆,後手仍能取到最後一顆,所以後手必勝

     即i=k+1時,結論依然成立。

對於不是FIB數,首先進行分解。

 

分解的時候,要取儘量大的Fibonacci數。

比如分解85:85在55和89之間,於是可以寫成85=55+30,然後繼續分解30,30在21和34之間,所以可以寫成30=21+9,

依此類推,最後分解成85=55+21+8+1。

則我們可以把n寫成  n = f[a1]+f[a2]+……+f[ap]。(a1>a2>……>ap)

我們令先手先取完f[ap],即最小的這一堆。由於各個f之間不連續,則a(p-1) > ap  + 1,則有f[a(p-1)] > 2*f[ap]。即後手只能取f[a(p-1)]這一堆,且不能一次取完。

此時後手相當於面臨這個子游戲(只有f[a(p-1)]這一堆石子,且後手先取)的必敗態,即先手一定可以取到這一堆的最後一顆石子。

同理可知,對於以後的每一堆,先手都可以取到這一堆的最後一顆石子,從而獲得遊戲的勝利。

例:HDU 2516 <此題可手動畫出PN圖發現規律>

明顯的FIB博弈
#include<iostream> 
#include<cstdio> 
#include<cstring> 
#include<algorithm> 
#include<cmath> 
#include<vector> 
#include<string> 
#include<map> 
#define LL long long 
#define N 1000000 
#define inf 1<<20 
using namespace std; 
int fib[50]; 
int main(){  
   fib[0]=1;fib[1]=2;  
   for(int i=2;i<45;i++)  
       fib[i]=fib[i-1]+fib[i-2];  
   int n;  
   while(scanf("%d",&n)!=EOF&&n){  
       int i=0;  
       for(i=0;i<45;i++)  
           if(fib[i]==n)  
               break;  
       if(i<45)  
           puts("Second win");  
       else  
           puts("First win");  
   }  
   return 0; 
}  

引用:https://www.cnblogs.com/naturepengchen/articles/3837643.html

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章