博弈論

“趨利避害”作爲博弈論的一個重要理論,給我們的啓示是:競爭是動態的!戰略制定不僅要考慮其所帶來的好處,更要考慮被對手搶佔先機後所帶來的弊處。
博弈並非只是爾虞我詐的競爭和衝突,對企業來講,任何一個“損人利己”的戰略都會招致對手的強烈反應。而對手的反戰略又往往會使原有的戰略失去效用,到頭來大傢什麼都沒得到,最終導致“囚徒困境”。

正確的博弈應該既有競爭又有合作,要創造性地引入各種參與者,擴大遊戲範疇,一起把市場做大,創造價值和獲取價值。

一、囚徒困境

故事講的是,兩個嫌疑犯作案後被警察抓住,分別關在不同的屋子裏接受審訊。警察知道兩人有罪,但缺乏足夠的證據。警察告訴每個人:如果兩人都抵賴,各判刑一年;如果兩人都坦白,各判八年;如果兩人中一個坦白而另一個抵賴,坦白的放出去,抵賴的判十年。於是,每個囚徒都面臨兩種選擇:坦白或抵賴。然而,不管同夥選擇什麼,每個囚徒的最優選擇是坦白:如果同夥抵賴、自己坦白的話放出去,不坦白的話判一年,坦白比不坦白好;如果同夥坦白、自己坦白的話判八年,不坦白的話判十年,坦白還是比不坦白好。結果,兩個嫌疑犯都選擇坦白,各判刑八年。如果兩人都抵賴,各判一年,顯然這個結果好。但這個帕累託改進辦不到,因爲它不能滿足人類的理性要求。囚徒困境所反映出的深刻問題是,人類的個人理性有時能導致集體的非理性——聰明的人類會因自己的聰明而作繭自縛。

二、旅行者困境

兩個旅行者從一個以出產細瓷花瓶著稱的地方旅行回來,他們都買了花瓶。提取行李的時候,發現花瓶被摔壞了,於是他們向航空公司索賠。航空公司知道花瓶的價格大概在八九十元的價位浮動,但是不知道兩位旅客買的時候的確切價格是多少。於是,航空公司請兩位旅客在100元以內自己寫下花瓶的價格。如果兩人寫的一樣,航空公司將認爲他們講真話,就按照他們寫的數額賠償;如果兩人寫的不一樣,航空公司就認定寫得低的旅客講的是真話,並且原則上按這個低的價格賠償,同時,航空公司對講真話的旅客獎勵2元,對講假話的旅客罰款2元。

爲了獲取最大賠償而言,本來甲乙雙方最好的策略,就是都寫100元,這樣兩人都能夠獲賠100元。可是不,甲很聰明,他想:如果我少寫1元變成99元,而乙會寫100元,這樣我將得到101元。何樂而不爲?所以他準備寫99元。可是乙更聰明,他算計到甲要算計他寫99元,於是他準備寫98元。想不到甲還要更聰明一個層次,估計到乙要寫98元來坑他,於是他準備寫97元……大家知道,下象棋的時候,不是說要多“看”幾步嗎,“看”得越遠,勝算越大。 你多看兩步,我比你更強多看三步,你多看四步,我比你更老謀深算多看五步。在花瓶索賠的例子中,如果兩個人都“徹底理性”,都能看透十幾步甚至幾十步上百步,那麼上面那樣“精明比賽”的結果,最後落到每個人都只寫一兩元的地步。事實上,在徹底理性的假設之下,這個博弈唯一的納什均衡,是兩人都寫0。

三、是競爭也是劫持

費城西區有兩個互爲敵手的商店——紐約廉價品商店和美國廉價品商店.他們正好緊挨着, 兩店的老闆是死敵, 他們一直進行着沒完沒了的價格戰.出售愛爾蘭亞麻牀單, 甚至連有鷹一般眼睛的貝蒂·瑞珀女士都不能找出任何疵點, 不信請問她;而這牀單的價格又低得可笑, 只需6美元50美分".當一個店的櫥窗裏出現這樣的手寫告示時每位顧客都會習慣地等另一家廉價品商店的迴音.果然, 大約過了兩小時, 另一家商店的櫥窗裏出現了這樣的告示: "瑞珀女士該配副近視眼鏡了, 我的牀單質量一流, 只需5美元95美分".價格大戰的一天就這樣開始了.除了貼告示以外, 兩店的老闆還經常站在店外尖聲對罵, 經常發展到拳腳相加, 最後總有一方的老闆在這場價格戰中停止爭鬥, 價格不再下降.罵那個人是瘋子, 這就意味着那方勝利了.這時, 圍觀的、路過的、還有附近每一個人都會擁入獲勝的廉價品商店, 將牀單和其他物品搶購一空.在這個地區, 這兩個店的爭吵是最激烈的, 也是持續時間最長的, 因此竟很有名聲, 住在附近的每個人都從他們的爭鬥中獲益不少, 買到了各式各樣的"精美"商品.突然有一天, 一個店的老闆死了, 幾天以後, 另一個店的老闆聲稱去外地辦貨, 這兩家商店都停業了.過了幾個星期, 兩個商店分別來了新老闆.他們各自對兩個商店前任老闆的財產進行了詳細的調查.一天檢查時, 他們發現兩店之間有條祕密通道, 並且在兩商店的樓上兩老闆住過的套房裏發現了一扇連接兩套房子的門.新老闆很奇怪, 後來一瞭解才知道, 這兩個死對頭竟是兄弟倆.原來, 所有的詛咒、謾罵、威脅以及一切相互間的人身攻擊全是在演戲, 每場價格戰都是裝出來的, 不管誰戰勝誰, 最後還是把另一位的一切庫存商品與自己的一起賣給顧客.真是絕妙的騙局。

四、酒吧博弈問題(bar problem

酒吧博弈問題是美國人W. B.Arthur1994年在《美國經濟評論》發表的題爲《歸納論證和有界理性》一問中提出的,然後他又從1999年的《科學》雜誌上發表的《複雜性和經濟學》一文中闡述了這個博弈。''該博弈是說:有一羣人,例如n=100,每個週末,均要決定是去一酒吧活動還是呆在家裏。酒吧的容量是有限的,假定是60人。如果某人預測去酒吧的人超過60人,那麼他決定去還是不去?......每個參與者或決策者面臨的信息只是以前去酒吧的人數,只能根據以前的人數的信息來歸納出策略來。這是一個典型的動態博弈問題。......通過計算機的模型實驗,阿瑟得出了一個有意思的結果:不同的行動者是根據自己的歸納來行動的,並且,去酒吧的人數沒有一個固定的規律,然而,經過一段時間以後,去的平均人數總是趨於60。阿瑟說,預測者自組織到一個均衡系統中去和不去的人羣,或形成一個生態穩定系統。......這就是酒吧問題。

酒吧問題所反映的是這樣一個社會現象,正象阿瑟教授說的那樣,我們在許多行動中,要猜測別人的行動,然而我們沒有更多關於他人的信息,我們只有通過分析過去的歷史來預測未來。

五、槍手博弈

今天,我講一個有關博弈論的經典故事。

彼此痛恨的甲、乙、丙三個槍手準備決鬥。甲槍法最好,十發八中;乙槍法次之,十發六中;丙槍法最差,十發四中。

先提第一個問題:如果三人同時開槍,並且每人只發一槍;第一輪槍戰後,誰活下來的機會大一些?

一般人認爲甲的槍法好,活下來的可能性大一些。但合乎推理的結論是,槍法最糟糕的丙活下來的機率最大。

我們來分析一下各個槍手的策略。

槍手甲一定要對槍手乙先開槍。因爲乙對甲的威脅要比丙對甲的威脅更大,甲應該首先幹掉乙,這是甲的最佳策略。

同樣的道理,槍手乙的最佳策略是第一槍瞄準甲。乙一旦將甲幹掉,乙和丙進行對決,乙勝算的概率自然大很多。

槍手丙的最佳策略也是先對甲開槍。乙的槍法畢竟比甲差一些,丙先把甲幹掉再與乙進行對決,丙的存活概率還是要高一些。

我們計算一下三個槍手在上述情況下的存活機率:

甲:24%(被乙丙合射40% X 60% = 24%)

乙:20%(被甲射100% - 80% = 20%)

丙:100%(無人射丙)

通過概率分析,我們發現槍法最差的丙存活的機率最大,槍法好於丙的甲和乙的存活機率遠低於丙的存活機率。

但是,上面的例子隱含一個假定,那就是甲乙丙三人都清楚地瞭解對手打槍的命中率。但現實生活中,因爲信息不對稱,比如槍手甲僞裝自己,讓槍手乙和丙認爲甲的槍法最差,在這種情況下,最終的倖存者一定是甲。所以,無論是歷史,還是現實,那些城府很深的奸雄往往能成爲最後的勝利者。這樣的例子,對你的職場生涯或者官場生涯是否很有啓發呢?

我們繼續假定,甲乙丙三人互相不瞭解對手的槍法水平。在這種情況下,甲被乙射、甲被丙射、甲被乙丙射及甲不被乙丙射的機率各爲25%,按貝氏(Bayes)定理計算甲的存活率:

甲活率:31%([被乙射:25% X 40% = 10%] + [被丙射:25% X 60% = 15%] + [被乙丙射:25% X 40% X 60% = 6%])。

乙活率:23%([被甲射:25% X 20% = 5%] + [被丙射:25% X 60% = 15%] + [被甲丙射:25%X20%X60% = 3%])。

丙活率:17%([被甲射:25% X 20% = 5%] + [被乙射:25% X 40% = 10%] + [被甲乙射:25% X 20% X 40% = 2%])。

在槍手互相不知道對手命中率的信息的情況下,這時命中率最高的槍手甲存活的機率最大,槍法最差的丙存活的可能性最小。

我們現在回到甲乙丙都知道對手命中率的情形,進行第二輪槍戰的分析。

在第一輪槍戰後,丙有可能面對甲,也可能面對乙,甚至同時面對甲與乙,除非第一輪中甲乙皆死。儘管第一輪結束後,丙極有可能獲勝(即甲乙雙亡),但是第二輪開始,丙就一定處於劣勢,因爲不論甲或乙,他們的命中率都比丙的命中率爲高。

這就是槍手丙的悲哀。能力不行的丙玩些花樣雖然能在第一輪槍戰中暫時獲勝。但是,如果甲乙在第一輪槍戰中沒有雙亡的話,在第二輪槍戰結束後,丙的存活的機率就一定比甲或乙爲低。

第二輪槍戰中甲乙丙存活的機率粗算如下:

(1) 假設甲丙對決:甲的存活率爲60%,丙的存活率爲20%。

(2) 假設乙丙對決:乙的存活率爲60%,丙的存活率爲40%。

這似乎說明,能力差的人在競爭中耍弄手腕能贏一時,但最終往往不能成事。我們現在用嚴格的概率方法計算一下兩輪槍戰後,甲乙丙各自的存活的機率。

(1) 第一輪:

甲射乙,乙射甲,丙射甲。

甲的活率爲24%(40% X 60%),乙的活率爲20%(100% - 80%),丙的活率爲100%(無人射丙)。

(2) 第二輪:

情況1:甲活乙死(24% X 80% = 19.2%)

甲射丙,丙射甲──甲的活率爲60%,丙的活率爲20%。情況2:乙活甲死(20% X 76% = 15.2%)

乙射丙,丙射乙──乙的活率爲60%,丙的活率爲40%。情況3:甲乙皆活(24% X 20% = 4.8%)

重複第一輪。情況4:甲乙皆死(76% X 80% = 60.8%)

槍戰結束。

甲的活率爲12.672%

(19.2% X 60%) + (4.8% X 24%) = 12.672%

乙的活率爲10.08%

(15.2% X 60%) + (4.8% X 20%) = 10.08%

丙的活率爲75.52%

(19.2% X 20%) + (15.2% X 40%) + (4.8% X 100%) + (60.8% X 100%) = 75.52%

通過對兩輪槍戰的詳細概率計算,我們仍然發現槍法最差的丙存活的機率最大,槍法較好的甲和乙的存活機率仍遠低於丙的存活機率。

對於這樣的例子,有人會發出“英雄創造歷史,庸人繁衍子孫”的感嘆。

我們現在改變遊戲規則,假定甲乙丙不是同時開槍,而是他們輪流開一槍。在這個例子中,我們發現丙的機會好於他的實力,丙不會被第一槍幹掉,並且他可能極有機會在下一輪中先開槍。

先假定開槍的順序是甲、乙、丙,甲一槍將乙幹掉後(80%的機率),就輪到丙開槍,丙有40%的機率一槍將甲幹掉。即使乙躲過甲的第一槍,輪到乙開槍,乙還是會瞄準槍法最好的甲開槍,即使乙這一槍幹掉了甲,下一輪仍然是輪到丙開槍。無論是甲或者乙先開槍,乙都有在下一輪先開槍的優勢。

如果是丙先開槍,情況又如何呢?

丙可以向甲先開槍,即使丙打不中甲,甲的最佳策略仍然是向乙開槍。但是,如果丙打中了甲,下一輪可就是乙開槍打丙了。因此,丙的最佳策略是胡亂開一槍,只要丙不打中甲或者乙,在下一輪射擊中他就處於有利的形勢。

我們通過這個例子,可以理解人們在博弈中能否獲勝,不單純取決於他們的實力,更重要的是取決於博弈方實力對比所形成的關係。

在上面的例子中,乙和丙實際上是一種聯盟關係,先把甲幹掉,他們的生存機率都上升了。我們現在來判斷一下,乙和丙之中,誰更有可能背叛,誰更可能忠誠?

任何一個聯盟的成員都會時刻權衡利弊,一旦背叛的好處大於忠誠的好處,聯盟就會破裂。在乙和丙的聯盟中,乙是最忠誠的。這不是因爲乙本身具有更加忠誠的品質,而是利益關係使然。只要甲不死,乙的槍口就一定會瞄準甲。但丙就不是這樣了,丙不瞄準甲而胡亂開一槍顯然違背了聯盟關係,丙這樣做的結果,將使乙處於更危險的境地。

合作才能對抗強敵。只有乙丙合作,才能把甲先幹掉。如果,乙丙不和,乙或丙單獨對甲都不佔優,必然被甲先後解決。

六、智豬博弈

豬圈裏有兩頭豬,一頭大豬,一頭小豬。豬圈的一邊有個踏板,每踩一下踏板,在遠離踏板的豬圈的另一邊的投食口就會落下少量的食物。如果有一隻豬去踩踏板,另一隻豬就有機會搶先吃到另一邊落下的食物。當小豬踩動踏板時,大豬會在小豬跑到食槽之前剛好吃光所有的食物;若是大豬踩動了踏板,則還有機會在小豬吃完落下的食物之前跑到食槽,爭吃到另一半殘羹。

那麼,兩隻豬各會採取什麼策略?答案是:小豬將選擇“搭便車”策略,也就是舒舒服服地等在食槽邊;而大豬則爲一點殘羹不知疲倦地奔忙於踏板和食槽之間。

原因何在?因爲,小豬踩踏板將一無所獲,不踩踏板反而能吃上食物。對小豬而言,無論大豬是否踩動踏板,不踩踏板總是好的選擇。反觀大豬,已明知小豬是不會去踩動踏板的,自己親自去踩踏板總比不踩強吧,所以只好親歷親爲了。

改變方案一:減量方案。投食僅原來的一半分量。結果是小豬大豬都不去踩踏板了。小豬去踩,大豬將會把食物吃完;大豬去踩,小豬將也會把食物吃完。誰去踩踏板,就意味着爲對方貢獻食物,所以誰也不會有踩踏板的動力了。

如果目的是想讓豬們去多踩踏板,這個遊戲規則的設計顯然是失敗的。

改變方案二:增量方案。投食爲原來的一倍分量。結果是小豬、大豬都會去踩踏板。誰想吃,誰就會去踩踏板。反正對方不會一次把食物吃完。小豬和大豬相當於生活在物質相對豐富的“共產主義”社會,所以競爭意識卻不會很強。

對於遊戲規則的設計者來說,這個規則的成本相當高(每次提供雙份的食物);而且因爲競爭不強烈,想讓豬們去多踩踏板的效果並不好。

改變方案三:減量加移位方案。投食僅原來的一半分量,但同時將投食口移到踏板附近。結果呢,小豬和大豬都在拼命地搶着踩踏板。等待者不得食,而多勞者多得。每次的收穫剛好消費完。

對於遊戲設計者,這是一個最好的方案。成本不高,但收穫最大。

許多人並未讀過“智豬博弈”的故事,但是卻在自覺地使用小豬的策略。股市上等待莊家擡轎的散戶;等待產業市場中出現具有贏利能力新產品、繼而大舉仿製牟取暴利的遊資;公司裏不創造效益但分享成果的人,等等。比如,公司的激勵制度設計,獎勵力度太大,又是持股,又是期權,公司職員個個都成了百萬富翁,成本高不說,員工的積極性並不一定很高。這相當於“智豬博弈”增量方案所描述的情形。但是如果獎勵力度不大,而且見者有份(不勞動的“小豬”也有),一度十分努力的大豬也不會有動力了----就象“智豬博弈”減量方案一所描述的情形。最好的激勵機制設計就象改變方案三----減量加移位的辦法,獎勵並非人人有份,而是直接針對個人(如業務按比例提成),既節約了成本(對公司而言),又消除了“搭便車”現象,能實現有效的激勵。

而從整個社會來講,自身需求大的羣體往往纔是社會生產力推動的主力。換句話說,要迅速提高整個社會的生產力水平,就需要有一個自身具有很大消費需求的羣體,並且需要給他們一定程度的獎勵。第三種改變方案反映的就是這種情況,方案中降低了取食的成本,在現實中,也可以等同於增加了對取食者的獎勵。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章