概率方法是解決離散數學中許多問題的有力工具。大致說來,該方法的工作原理如下:爲了證明具有某些所需屬性的結構存在,定義了一個適當的結構和概率空間。然後顯示所需的屬性保持不變這個空間的概率是正的。
證明存在性分爲結構性證明和非結構性證明。
一 . 支配集(Dominating set)
無向圖G=(V,E)的一個支配集是點集合的子集合,使得每個點至少有一個鄰居在集合U中。
舉例說明:
可以選擇度數較大的點進入U集合,令U={V4,V5},V-U={V1,V2,V3,V6},那麼V-U中的點的鄰居都在U中,U就是支配集。支配集還可以是U={V1,V2,V3,V5}。此時就引出一個問題,最小支配集是誰?
定理:設G=(V,E)是n個頂點的圖,最小度爲>1。那麼G的支配集最多有個頂點。 (希望上界越小越好)
定理證明:
令任意的數,然後以概率p隨機獨立地選擇V的每個頂點。設X是所有選取的頂點的隨機集合,設Y=Yx是V-X中沒有鄰居的所有頂點的隨機集合(因爲X不一定就是支配集)。|X|的數學期望是np。對於每個固定的點,[v和它的所有neighbors不在X中],並且(,未選入X的概率)。隨機變量|Y|可以寫成n個指標隨機變量Xv的和,如果v在Y中,則Xv=1,反之Xv=0,則得出|X|+|Y|的期望值最多爲。集合顯然是G的支配集,其基數最多是這個大小。
上面的論證對任何都適用。我們用初等微積分來優化結果。爲了方便,我們用給出簡單界。右邊對p求導,令它等於0。右邊是最小化。我們令p等於這個值,現在我們有作爲期望。
貪心算法證明:
思想:每次選取未進入支配集的點集中的擁有最多鄰居的點進入到支配集,再從剩餘的點集中按前面的方法挑選,以此類推。
設U爲支配集,當前有r個點未被支配,這r個點都是自身及其鄰居沒有進入U中,即+1個點(爲鄰居),共有個點(其中存在重複點),最壞結果有個點是重複計算在r中不同點的鄰居中,將這些點加入到U中,這些點就是貪婪選擇中鄰居最多的,那麼未進入U的點集衰減至。起始有n個點,衰減過程如上分析,經過t次貪心選擇,,可解得上述結果。
爲支配集一個接一個地選擇頂點,在每一步中選擇一個覆蓋最大未覆蓋頂點數的頂點。這是貪婪算法。
對於每個頂點v用C(v)表示由v和它的所有鄰居組成的集合。假設在選取頂點的過程中,不屬於集合C(v)的並集的頂點數是r。假設集合C(u)對所有未覆蓋的頂點u的基數之和至少爲,因此平均而言,有一個頂點v至少屬於這樣的集合C(u)。把這個v加到選定頂點集合中,未覆蓋頂點的數量現在最多是,因此,在算法的每次迭代中,未覆蓋頂點的數量減少了倍,因此,在步之後,最多還會有個點。未覆蓋的頂點現在可以被添加到選擇的頂點集合中,形成一個最大等於上面定理結論的大小支配集。
三個簡單但重要的想法:
1)期望的線性度隨機變量和的期望值是它們的期望值的和,即使它們不是獨立的。
2)變更原則。隨機選擇沒有立即提供所需的支配集;它只提供了集合X,而集合X必須通過增加集合Yx來得到所需的支配集。
3) p的最優選擇。一個隨機的選擇,但確定應該使用p的概率是多少。其思想是將p作爲參數進行證明,得到一個關於p的函數,用微積分法求出最優p值,實際的最小p值很難處理。概率方法的很大一部分藝術在於找到次優但乾淨的邊界。
二 . 生日悖論
生日悖論“生日悖論”說的是,在一組隨機選擇的23人中,至少有兩人的生日相同,且概率至少爲1/2。
三.獨立集
定理:設G=(V,E)有n個頂點和nd/2邊,d≥1,那麼有(獨立數,最大獨立集中點的數目)。
證明:
構造隨機子集合X,以p概率取點加到X中,|X|=np,X中可能存在相連的情況,e={x,y}在X中的概率爲,那麼邊在X中的期望爲,這些是不想要的,我們需要的是獨立集。對於邊,可以刪掉其中任意一個點,如x或者y,破壞掉這條邊即可,那麼|X|=np-個點,對p求導的式子等於0求解p,p>0,則證明成立。
設爲定義的隨機子集,P待定,事件相互獨立。設X=|S|,Y爲G|s的邊數。對於每個e={i,j},設Ye爲事件的指示器隨機變量。那麼。對於任意這樣的e, ,根據期望的線性關係,。顯然,EY]=np,根據線性期望,。我們令p=1/d來最大化這個量,得到E[X-Y]=n/2d。
因此存在一個特定的S,其中S的頂點數減去S的邊數至少爲n/2d。從S的每條邊中選擇一個頂點並刪除它。這使得集合S'至少有n/2d的頂點。所有被刪除的邊,S'是一個獨立的集合。
四.二部圖
定理:令G=(V,E)是一個有n個頂點和e條邊的圖。那麼G包含至少有e/2條邊的二部圖。(下圖中間的邊有多於e/2條)
證明:
設爲給出的隨機子集,選擇相互獨立。設B=V-T,如果x,y中恰好有一個在T中,則稱這條邊爲{x,y}交叉。設X爲交叉邊的數目。我們分解,其中Xxy爲{x,y}交叉的指示隨機變量。那麼E[Xxy]=1/2作爲兩個均勻拋擲的概率是1/2。然後。因此X≥e/2,對於T的某個選項和這組交叉邊構成一個二部圖。
五.集團(Clique)數
集團:集團中任意兩點之間有邊相連
定理:設G=(V,E)是n點上的一個圖,有。
證明:
我們選擇頂點集合V的一個隨機排列=v1v2v3...vn,其中每個排列是以相同的1/n!概率出現,然後考慮下面的集合,我們放入vi在中,當且僅當vi與vi之前的所有vj(j<i)相鄰。根據定義,是G中的一個集團,令爲對應的隨機變量。,其中Xi是頂點vi的指標隨機變量,即Xi=1或0,這取決於是否。注意,當且僅當vi出現在所有n-1-d(vi)之前,則vi在排列中屬於C。
補圖爲獨立集,,。
六.色數
考慮n個頂點上的圖G和它的色數。如果很大,也就是說,如果我們需要很多顏色,那麼我們懷疑G包含一個很大的完全子圖(即Clique)。
然而,這遠非事實。我們有任意高色數的圖,沒有三角形,也就是說,每個循環的長度至少是4。我們能保證沒有小圈並還有高的色數?是的,我們可以!爲了精確起見,我們稱G中最小的圈的圍長爲。簡單來說就是對於一個圖G,它的色數很大,它的圍長也很大。
定理:對於大的k≥2,存在圖G,其色數>k,圍長>k。
證明:
假設A事件:≤k,B事件:≤k,只需證明P(A)<1/2,P(B)<1/2,那麼,即。概率方法中一般考慮“壞”事件,壞事件發生的概率小於1,那麼好事件(我們期望的事件)發生的概率一定大於0。
我們證明<=k的概率小於1/2,同樣的,<=k的概率也小於1/2。因此,必須存在具有所需屬性的圖。
設V={v1,v2,...,vn}爲頂點集,p是固定數字在0和1之間,需要謹慎選擇。我們的概率空間G(n,p)(隨機圖:n個點之間以p的概率相連)包含V上的所有圖,其中每條邊以p的概率出現,相互獨立。換句話說,我們討論的是伯努利實驗,我們把每條邊都放進去以概率p。,關於色數,有。因此,如果比n小,那麼一定很大,也就是我們想要的。假設2≤r≤n,一個固定的r集在V中是獨立的,概率是,得出結論。因爲適用於所有p。給定任意一個固定的k>0,選擇,並繼續證明當n足夠大時,。確實,因爲比logn增長更快,當n'很大時有,那麼。對於,,因此,當n趨於無窮時,上式是趨於0的。因此對所有的n>=n1都成立。
關於參數,對於給定k,我們想證明沒有太多長度<=k的圈。是固定的i集。A上可能的i圈數是A的循環排列數除以2(因爲我們可以在任意方向上遍歷循環),因此等於(i-1)!/ 2。可能的i圈的總數爲,每個這樣的圈C都以概率出現。設X爲計算圍長小於k的圈的數目的隨機變量。爲了估算X,我們使用了兩個簡單但效果很好的工具。第一個是期望的線性,第二個是非負隨機變量的馬爾可夫不等式,,其中E(X)是X的期望。設Xc爲圍長爲i的圈C的指標隨機變量,也就是說,我們令Xc=1或0取決於C是否出現在圖中。因此。因爲X計數圍長<=k的所有圈,並有,因此根據線性。現在應用a=n/2的馬爾科夫不等式,得到,因爲當n趨於無窮大時,右邊趨於0,我們推斷,對於n>=n2。現在差不多完成了。分析說明對於,存在n個點的圖H,其中,且圍長小(3~k之間的)的圈少於n/2,從每個圈中刪除一個頂點,設G是最終的圖像(H刪除圈的點就成爲了G)。那麼 >k。因爲G包含大於n/2個頂點並滿足,發現,證畢。( >k也滿足,因爲破壞的是3~k的圈,剩下的就是大於k的圈)。
七.邊染色(去隨機化)
在許多情況下,概率方法爲各種算法問題提供了有效的算法。在某些情況下,這些算法可以去隨機化並轉化爲確定性的算法。
定理:存在一個帶有雙色(邊染色)的Kn(n個點的完全圖)中最多有個同色的K4(4個點的完全圖)。
證明:
隨便取一個顏色。設X爲同色K4的個數,求E(X)。用顏色表示X的值最多是這個期望。
條件概率。
我們首先需要確定一個權函數任何部分已染色Kn。Kn的邊爲紅色和藍色。Kn中的K4的每個副本K,權值爲w(K)。如果K的至少一條邊是紅色的,至少一條邊是藍色的,那麼w(K)=0。如果K的邊沒有着色,則w(K)= ,如果K中的r>=1條邊是有顏色的,都是相同的顏色,那麼w(K)= ,也可以定義局部着色Kn的總的權值W爲w(K)的和,K爲K4至Kn的所有副本。總重量W僅僅是K4的單色副本的期望數量,在這樣一個隨機延伸的部分着色的Kn到一個完全着色。
任意對Kn的邊排序,通過將每條邊依次塗成紅色和藍色來構造所需的兩種顏色。假設e1,e2,…e(i-1)已經上色,現在我們要給ei上色。設W爲Kn的權值,對給定的e1,e2,..e(i-1)的部分染色c。同理,設Wred爲通過將ei染成紅色得到的c的部分着色時Kn的權值,設Wblue爲通過將ei染成藍色得到的c的部分着色時Kn的權值。根據W的定義,。現在選擇ei的顏色是爲了最小化結果的權重;也就是說,如果Wred<=Wblue,我們就把它塗成紅色,否則,我們就把它塗成藍色。由上述不等式可知,權函數在算法中不增加。因爲一開始,它的值是恰爲,它最後的值最多是這個量。在最後,所有的邊都染色,並且權值正好是K4的單色副本的數量。因此,上面的過程產生,決定論和在多項式時間滿足定理結論的Kn的2邊着色。
八.終身職位遊戲(去隨機化)
終身職位遊戲是兩個玩家之間的遊戲,系主任保羅和學院院長卡羅爾。最初的職位是由不同的教員擔任不同的終身職位。如果有一些教員獲得終身職位,保羅將贏得這場比賽;如果沒有教員獲得終身職位,卡羅爾就是贏家。每年,主席保羅都會創建一份教員的晉升名單L,然後交給院長卡羅爾,他有兩種選擇。選項一:卡羅爾可以提拔名單L上的所有教員,同時解僱所有其他教員。選擇二:卡羅爾可以提升所有不在L名單上的教員一級,同時解僱所有在L名單上的教員。
讓我們假設有ak教員是離終身職位的k個梯級上的人數。
定理:如果,(得到終身職位的人數的期望),那麼Carole贏了。
證明1:
讓我們想象一下,卡羅爾在每一輪都是隨機選擇的,也就是說,在保羅確定了晉升名單L之後,卡羅爾拋出一枚公平的硬幣來決定是使用選項1還是選項2。修正了保羅的一些確定性策略。無論保羅的策略如何,現在每個教師都有可能獲得終身職位。設T爲教師人數,從而T是一個隨機變量。對於每個教員f,設爲獲得終身教職的指標隨機變量,則。根據期望的線性。注意,當且僅當T=0,則Carole獲勝。我們的假設是E[T]<1,因此Pr[Carole wins]=Pr[T=0]>0。
證明2 (去隨機化)
將一個職位的權重定義爲獲得終身教職的教員的預期數量E[T],如果卡羅爾隨機選擇。現在Paul向Carole出示了一個列表L,假設T1是獲得終身教職的教員人數,如果Carole現在選擇選項1。假設T2和卡羅爾先玩選項2一樣。Carole的策略是如果E[T1]<E[T2],則選擇Option1,否則選擇Option2。這裏的關鍵是。
因爲一直隨機是選擇1然後隨機,然後選擇2然後隨機的平均值。當E[T]<1時,要麼E[T1]<1,E[T2]<1,採用這種策略Carol可以確保E[T]<1在回合結束時。在遊戲結束時繼續這樣做E[T]<1。但遊戲結束時,E[T]是獲得終身職位的教員數目。一個整數小於1就是0,所以卡羅爾贏了。
九.平衡向量博弈
有一個位置向量,它最初被設置爲0。一共有n輪。在每一輪中,Paul首先選擇一個向量。然後卡羅爾將P重置爲P+v或P-v,由她選擇。讓P(final)表示P在遊戲結束時的值。從卡羅爾到保羅回報是,P(final)的n個座標的最大的絕對值。讓。保羅贏得了比賽,當且僅當。
設s爲具有下面分佈的隨機變量:。其中與Xi是相互的獨立的。
定理:如果,那麼Carole贏得平衡向量博弈。