【圖論學習筆記三】概率方法

概率方法是解決離散數學中許多問題的有力工具。大致說來,該方法的工作原理如下:爲了證明具有某些所需屬性的結構存在,定義了一個適當的結構和概率空間。然後顯示所需的屬性保持不變這個空間的概率是正的。

證明存在性分爲結構性證明和非結構性證明。

一 . 支配集(Dominating set)

無向圖G=(V,E)的一個支配集是點集合的子集合U\subseteq V,使得每個點v\in V-U至少有一個鄰居在集合U中。 

 舉例說明:

可以選擇度數較大的點進入U集合,令U={V4,V5},V-U={V1,V2,V3,V6},那麼V-U中的點的鄰居都在U中,U就是支配集。支配集還可以是U={V1,V2,V3,V5}。此時就引出一個問題,最小支配集是誰?

定理:設G=(V,E)是n個頂點的圖,最小度爲\delta>1。那麼G的支配集最多有n[1+ln(\delta +1)]/(\delta +1)個頂點。 (希望上界越小越好)

定理證明:

p\in [0,1]任意的數,然後以概率p隨機獨立地選擇V的每個頂點。設X是所有選取的頂點的隨機集合,設Y=Yx是V-X中沒有鄰居的所有頂點的隨機集合(因爲X不一定就是支配集)。|X|的數學期望是np。對於每個固定的點v\in VPr[y\in Y]=Pr[v和它的所有neighbors不在X中],並且\leq (1-p)^{\delta +1}((1-p)^{d(v)) +1}\leq (1-p)^{\delta +1},d(v)\geq \delta,未選入X的概率)。隨機變量|Y|可以寫成n個指標隨機變量Xv的和,如果v在Y中,則Xv=1,反之Xv=0,則得出|X|+|Y|的期望值最多爲|X|+|Y|\leq np+n(1-p)^{\delta +1}。集合U=X\cup Y顯然是G的支配集,其基數最多是這個大小。

上面的論證對任何p\in [0,1]都適用。我們用初等微積分來優化結果。爲了方便,我們用1-p\leq e^{-p}給出簡單界|U|\leq np+ne^{-p(\delta +1)}。右邊對p求導,令它等於0。右邊是最小化p=\frac{ln(\delta +1)}{\delta +1}。我們令p等於這個值,現在我們有|U|\leq n[1+ln(\delta +1)]/(\delta +1)作爲期望。

貪心算法證明:

思想:每次選取未進入支配集的點集中的擁有最多鄰居的點進入到支配集,再從剩餘的點集中按前面的方法挑選,以此類推。

設U爲支配集,當前有r個點未被支配,這r個點都是自身及其鄰居沒有進入U中,即\delta+1個點(\delta爲鄰居),共有r(\delta +1)個點(其中存在重複點),最壞結果有\frac{r(\delta +1)}{n}個點是重複計算在r中不同點的鄰居中,將這些點加入到U中,這些點就是貪婪選擇中鄰居最多的,那麼未進入U的點集衰減至r-\frac{r(\delta +1)}{n}=r(1-\frac{\delta +1}{n})。起始有n個點,衰減過程如上分析,經過t次貪心選擇,n(1-\frac{\delta +1}{n})^t\leq \frac{n}{\delta +1},可解得上述結果。

爲支配集一個接一個地選擇頂點,在每一步中選擇一個覆蓋最大未覆蓋頂點數的頂點。這是貪婪算法。

對於每個頂點v用C(v)表示由v和它的所有鄰居組成的集合。假設在選取頂點的過程中,不屬於集合C(v)的並集的頂點數是r。假設集合C(u)對所有未覆蓋的頂點u的基數之和至少爲r(\delta +1),因此平均而言,有一個頂點v至少屬於\frac{r(\delta +1)}{n}這樣的集合C(u)。把這個v加到選定頂點集合中,未覆蓋頂點的數量現在最多是r(1-\frac{\delta +1}{n}),因此,在算法的每次迭代中,未覆蓋頂點的數量減少了1-\frac{\delta +1}{n}倍,因此,在\frac{nln(\delta +1)}{\delta +1}步之後,最多還會有\frac{n}{\delta +1}個點。未覆蓋的頂點現在可以被添加到選擇的頂點集合中,形成一個最大等於上面定理結論的大小支配集。

三個簡單但重要的想法:

1)期望的線性度隨機變量和的期望值是它們的期望值的和,即使它們不是獨立的。

2)變更原則。隨機選擇沒有立即提供所需的支配集;它只提供了集合X,而集合X必須通過增加集合Yx來得到所需的支配集。

3) p的最優選擇。一個隨機的選擇,但確定應該使用p的概率是多少。其思想是將p作爲參數進行證明,得到一個關於p的函數,用微積分法求出最優p值,實際的最小p值很難處理。概率方法的很大一部分藝術在於找到次優但乾淨的邊界。

二 . 生日悖論

生日悖論“生日悖論”說的是,在一組隨機選擇的23人中,至少有兩人的生日相同,且概率至少爲1/2。

三.獨立集

定理:設G=(V,E)有n個頂點和nd/2邊,d≥1,那麼有\alpha (G)\geq n/2d(獨立數,最大獨立集中點的數目)。

證明:

構造隨機子集合X,以p概率取點加到X中,|X|=np,X中可能存在相連的情況,e={x,y}在X中的概率爲p^2,那麼邊在X中的期望爲p^2\frac{nd}{2},這些是不想要的,我們需要的是獨立集。對於邊,可以刪掉其中任意一個點,如x或者y,破壞掉這條邊即可,那麼|X|=np-p^2\frac{nd}{2}個點,對p求導的式子等於0求解p,p>0,則證明成立。

S\in VPr[V\in S]=p定義的隨機子集,P待定,事件V\in S相互獨立。設X=|S|,Y爲G|s的邊數。對於每個e={i,j},設Ye爲事件的指示器隨機變量。i,j\in S那麼Y=\sum_{e\in E}Ye。對於任意這樣的e, E[Ye]=Pr[i,j\in S]=p^2,根據期望的線性關係,E[Y]=\sum_{e\in E}E[Ye]=\frac{nd}{2}p^2。顯然,EY]=np,根據線性期望,E[X-Y]=np-\frac{nd}{2}p^2。我們令p=1/d來最大化這個量,得到E[X-Y]=n/2d。

因此存在一個特定的S,其中S的頂點數減去S的邊數至少爲n/2d。從S的每條邊中選擇一個頂點並刪除它。這使得集合S'至少有n/2d的頂點。所有被刪除的邊,S'是一個獨立的集合。

四.二部圖

定理:令G=(V,E)是一個有n個頂點和e條邊的圖。那麼G包含至少有e/2條邊的二部圖。(下圖中間的邊有多於e/2條)

證明:

T\in VPr[x\in T]=1/2給出的隨機子集,選擇相互獨立。設B=V-T,如果x,y中恰好有一個在T中,則稱這條邊爲{x,y}交叉。設X爲交叉邊的數目。我們分解X=\sum_{{x,y\in E}}X_{xy},其中Xxy爲{x,y}交叉的指示隨機變量。那麼E[Xxy]=1/2作爲兩個均勻拋擲的概率是1/2。然後E[X]=\sum_{{x,y\in E}}E[Xxy]=e/2。因此X≥e/2,對於T的某個選項和這組交叉邊構成一個二部圖。

五.集團(Clique)數\omega (G)

集團:集團中任意兩點之間有邊相連

定理:設G=(V,E)是n點上的一個圖,有\omega (G)\geq \sum_{v\in V}\frac{1}{n-d(v)}

證明:

我們選擇頂點集合V的一個隨機排列\pi=v1v2v3...vn,其中每個排列是以相同的1/n!概率出現,然後考慮下面的集合C_\pi,我們放入vi在C_\pi中,當且僅當vi與vi之前的所有vj(j<i)相鄰。根據定義,C_\pi是G中的一個集團,令X=|C_\pi |爲對應的隨機變量。X=\sum_{i=1}^{n}X_i,其中Xi是頂點vi的指標隨機變量,即Xi=1或0,這取決於是否v_i\in C_\pi or v_i\notin C_\pi。注意,當且僅當vi出現在所有n-1-d(vi)之前,則vi在排列中屬於C。

補圖爲獨立集,d(v)_{Complement}=n-1-d(v)_{Clique}\alpha (G)\geq \sum_{v\in V}\frac{1}{d(v)+1}

六.色數\chi (G)

考慮n個頂點上的圖G和它的色數\chi (G)。如果\chi (G)很大,也就是說,如果我們需要很多顏色,那麼我們懷疑G包含一個很大的完全子圖(即Clique)。

然而,這遠非事實。我們有任意高色數的圖,沒有三角形,也就是說,每個循環的長度至少是4。我們能保證沒有小圈並還有高的色數?是的,我們可以!爲了精確起見,我們稱G中最小的圈的圍長爲\gamma (G)。簡單來說就是對於一個圖G,它的色數很大\chi (G),它的圍長\gamma (G)也很大。

定理:對於大的k≥2,存在圖G,其色數\chi (G)>k,圍長\gamma (G)>k。

證明:

假設A事件:\chi (G)≤k,B事件:\gamma (G)≤k,只需證明P(A)<1/2,P(B)<1/2,那麼P(A\cup B)\leq P(A)+P(B)<1,即P(\overline{A}\cap \overline{B})>0。概率方法中一般考慮“壞”事件,壞事件發生的概率小於1,那麼好事件(我們期望的事件)發生的概率一定大於0。

我們證明\chi (G)<=k的概率小於1/2,同樣的,\gamma (G)<=k的概率也小於1/2。因此,必須存在具有所需屬性的圖。

設V={v1,v2,...,vn}爲頂點集,p是固定數字在0和1之間,需要謹慎選擇。我們的概率空間G(n,p)(隨機圖:n個點之間以p的概率相連p^\binom{n}{2})包含V上的所有圖,其中每條邊以p的概率出現,相互獨立。換句話說,我們討論的是伯努利實驗,我們把每條邊都放進去以概率p。Pr(K_n)=p^\binom{n}{2},關於色數\chi (G),有\chi (G)\alpha (G)\geq n。因此,如果\alpha (G)比n小,那麼\chi (G)一定很大,也就是我們想要的。假設2≤r≤n,一個固定的r集在V中是獨立的,概率是(1-p)^\binom{r}{2},得出結論Pr(\alpha \geq r)\leq \binom{n}{r}(1-p)^{\binom{r}{2}}\leq n^r(1-p)^\binom{r}{2}=(n(1-p)^{\frac{r-1}{2}})^r\leq (ne^{-p(r-1)/2})^r。因爲1-p\leq e^{-p}適用於所有p。給定任意一個固定的k>0,選擇p=n^{-\frac{k}{k+1}},並繼續證明當n足夠大時,Pr(\alpha \geq \frac{n}{2k})<1/2。確實,因爲n^{\frac{1}{k+1}}比logn增長更快,當n'很大時有n^{\frac{1}{k+1}}\geq 6klogn,那麼p\geq 6k\frac{logn}{n}。對於r=\left \lceil \frac{n}{2k} \right \rceilpr\geq 3logn,因此ne^{-p(r-1)/2}=ne^{-pr/2}e^{p/2}\leq ne^{-3logn/2}e^{1/2}=(e/n)^{1/2},當n趨於無窮時,上式是趨於0的。因此Pr(\alpha \geq \frac{n}{2k})<1/2對所有的n>=n1都成立。

關於參數\gamma (G),對於給定k,我們想證明沒有太多長度<=k的圈。A\subseteq V是固定的i集。A上可能的i圈數是A的循環排列數除以2(因爲我們可以在任意方向上遍歷循環),因此等於(i-1)!/ 2。可能的i圈的總數爲\binom{n}{i}\frac{(i-1)!}{2},每個這樣的圈C都以概率p^i出現。設X爲計算圍長小於k的圈的數目的隨機變量。爲了估算X,我們使用了兩個簡單但效果很好的工具。第一個是期望的線性,第二個是非負隨機變量的馬爾可夫不等式,Pr(X\geq a)\leq E(X)/a,其中E(X)是X的期望。設Xc爲圍長爲i的圈C的指標隨機變量,也就是說,我們令Xc=1或0取決於C是否出現在圖中。因此E(Xc)=p^i。因爲X計數圍長<=k的所有圈,並有X=\sum Xc,因此根據線性E(X)=\sum_{i=3}^{k}\binom{n}{i}\frac{(i-1)!}{2}p^i\leq 1/2\sum_{i=3}^{k}n^ip^i\leq 1/2(k-2)n^kp^k。現在應用a=n/2的馬爾科夫不等式,得到Pr(X\geq n/2)\leq \frac{E(X)}{n/2}\leq (k-2)\frac{(np)^k}{n}=(k-2)n^{-\frac{1}{k+1}},因爲當n趨於無窮大時,右邊趨於0,我們推斷Pr(X\geq n/2)<1/2,對於n>=n2。現在差不多完成了。分析說明對於n\geq max(n1,n2),存在n個點的圖H,其中\alpha (H)<n/2k,且圍長小(3~k之間的)的圈少於n/2,從每個圈中刪除一個頂點,設G是最終的圖像(H刪除圈的點就成爲了G)。那麼 \gamma (G)>k。因爲G包含大於n/2個頂點並滿足\alpha (G)\leq \alpha (H)< n/2k,發現\chi (G)\geq \frac{n/2}{\alpha (G)}\geq \frac{n}{2\alpha (H)}> \frac{n}{n/k}=k,證畢。( \gamma (G)>k也滿足,因爲破壞的是3~k的圈,剩下的就是大於k的圈)。

七.邊染色(去隨機化)

在許多情況下,概率方法爲各種算法問題提供了有效的算法。在某些情況下,這些算法可以去隨機化並轉化爲確定性的算法。

定理:存在一個帶有雙色(邊染色)的Kn(n個點的完全圖)中最多有\binom{n}{4}2^{-5}個同色的K4(4個點的完全圖)。

證明:

隨便取一個顏色。設X爲同色K4的個數,求E(X)。用顏色表示X的值最多是這個期望。

條件概率。

我們首先需要確定一個權函數任何部分已染色Kn。Kn的邊爲紅色和藍色。Kn中的K4的每個副本K,權值爲w(K)。如果K的至少一條邊是紅色的,至少一條邊是藍色的,那麼w(K)=0。如果K的邊沒有着色,則w(K)= 2^{-5},如果K中的r>=1條邊是有顏色的,都是相同的顏色,那麼w(K)= 2^{r-6},也可以定義局部着色Kn的總的權值W爲w(K)的和,K爲K4至Kn的所有副本。總重量W僅僅是K4的單色副本的期望數量,在這樣一個隨機延伸的部分着色的Kn到一個完全着色。

任意對Kn的\binom{n}{2}邊排序,通過將每條邊依次塗成紅色和藍色來構造所需的兩種顏色。假設e1,e2,…e(i-1)已經上色,現在我們要給ei上色。設W爲Kn的權值,對給定的e1,e2,..e(i-1)的部分染色c。同理,設Wred爲通過將ei染成紅色得到的c的部分着色時Kn的權值,設Wblue爲通過將ei染成藍色得到的c的部分着色時Kn的權值。根據W的定義,W=\frac{W_{red}+W_{blue}}{2}。現在選擇ei的顏色是爲了最小化結果的權重;也就是說,如果Wred<=Wblue,我們就把它塗成紅色,否則,我們就把它塗成藍色。由上述不等式可知,權函數在算法中不增加。因爲一開始,它的值是恰爲\binom{n}{4}2^{-5},它最後的值最多是這個量。在最後,所有的邊都染色,並且權值正好是K4的單色副本的數量。因此,上面的過程產生,決定論和在多項式時間滿足定理結論的Kn的2邊着色。

八.終身職位遊戲(去隨機化)

終身職位遊戲是兩個玩家之間的遊戲,系主任保羅和學院院長卡羅爾。最初的職位是由不同的教員擔任不同的終身職位。如果有一些教員獲得終身職位,保羅將贏得這場比賽;如果沒有教員獲得終身職位,卡羅爾就是贏家。每年,主席保羅都會創建一份教員的晉升名單L,然後交給院長卡羅爾,他有兩種選擇。選項一:卡羅爾可以提拔名單L上的所有教員,同時解僱所有其他教員。選擇二:卡羅爾可以提升所有不在L名單上的教員一級,同時解僱所有在L名單上的教員。

讓我們假設有ak教員是離終身職位的k個梯級上的人數。

定理:如果\sum a_k2^{-k}< 1,(得到終身職位的人數的期望),那麼Carole贏了。

證明1:

讓我們想象一下,卡羅爾在每一輪都是隨機選擇的,也就是說,在保羅確定了晉升名單L之後,卡羅爾拋出一枚公平的硬幣來決定是使用選項1還是選項2。修正了保羅的一些確定性策略。無論保羅的策略如何,現在每個教師都有可能獲得終身職位。設T爲教師人數,從而T是一個隨機變量。對於每個教員f,設I_f爲獲得終身教職的指標隨機變量,則T=\sumI_f。根據期望的線性E[T]=\sum E[I_f]=\sum a_k2^{-k}。注意,當且僅當T=0,則Carole獲勝。我們的假設是E[T]<1,因此Pr[Carole wins]=Pr[T=0]>0。

證明2 (去隨機化)

將一個職位的權重定義爲獲得終身教職的教員的預期數量E[T],如果卡羅爾隨機選擇。現在Paul向Carole出示了一個列表L,假設T1是獲得終身教職的教員人數,如果Carole現在選擇選項1。假設T2和卡羅爾先玩選項2一樣。Carole的策略是如果E[T1]<E[T2],則選擇Option1,否則選擇Option2。這裏的關鍵是E[T]=(E(T1)+E[T2])/2

因爲一直隨機是選擇1然後隨機,然後選擇2然後隨機的平均值。當E[T]<1時,要麼E[T1]<1,E[T2]<1,採用這種策略Carol可以確保E[T]<1在回合結束時。在遊戲結束時繼續這樣做E[T]<1。但遊戲結束時,E[T]是獲得終身職位的教員數目。一個整數小於1就是0,所以卡羅爾贏了。

九.平衡向量博弈

有一個位置向量P\in R^n,它最初被設置爲0。一共有n輪。在每一輪中,Paul首先選擇一個向量v\in \{-1,+1 \}^n。然後卡羅爾將P重置爲P+v或P-v,由她選擇。讓P(final)表示P在遊戲結束時的值。從卡羅爾到保羅回報是|P(final)|_{}\infty },P(final)的n個座標的最大的絕對值。讓\alpha \geq 0。保羅贏得了(\alpha ,n)比賽,當且僅當|P(final)|_{\infty }\geq \alpha

設s爲具有下面分佈的隨機變量:S_n=X_1+X_2+...+X_n。其中Pr[X_i=1]=Pr[X_i=-1]=\frac{1}{2}與Xi是相互的獨立的。

定理:如果nPr[|S_n|\geq \alpha ]<1,那麼Carole贏得(\alpha ,n)平衡向量博弈。

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章