概率方法是解決離散數學中許多問題的有力工具。大致說來，該方法的工作原理如下:爲了證明具有某些所需屬性的結構存在，定義了一個適當的結構和概率空間。然後顯示所需的屬性保持不變這個空間的概率是正的。

證明存在性分爲結構性證明和非結構性證明。

一 . 支配集(Dominating set)

無向圖G=(V,E)的一個支配集是點集合的子集合 $U\subseteq V$ ，使得每個點 $v\in V-U$ 至少有一個鄰居在集合U中。

舉例說明：

可以選擇度數較大的點進入U集合，令U={V4，V5}，V-U={V1，V2,V3,V6}，那麼V-U中的點的鄰居都在U中，U就是支配集。支配集還可以是U={V1,V2,V3,V5}。此時就引出一個問題，最小支配集是誰？

定理：設G=(V,E)是n個頂點的圖，最小度爲 $\delta$ >1。那麼G的支配集最多有 $n[1+ln(\delta +1)]/(\delta +1)$ 個頂點。（希望上界越小越好）

定理證明：

令 $p\in [0,1]$ 任意的數，然後以概率p隨機獨立地選擇V的每個頂點。設X是所有選取的頂點的隨機集合，設Y=Yx是V-X中沒有鄰居的所有頂點的隨機集合(因爲X不一定就是支配集)。|X|的數學期望是np。對於每個固定的點 $v\in V$ ， $Pr[y\in Y]=Pr$ [v和它的所有neighbors不在X中]，並且 $\leq (1-p)^{\delta +1}$ ( $(1-p)^{d(v)) +1}\leq (1-p)^{\delta +1},d(v)\geq \delta$ ，未選入X的概率)。隨機變量|Y|可以寫成n個指標隨機變量Xv的和，如果v在Y中，則Xv=1，反之Xv=0，則得出|X|+|Y|的期望值最多爲 $|X|+|Y|\leq np+n(1-p)^{\delta +1}$ 。集合 $U=X\cup Y$ 顯然是G的支配集，其基數最多是這個大小。

上面的論證對任何 $p\in [0,1]$ 都適用。我們用初等微積分來優化結果。爲了方便，我們用 $1-p\leq e^{-p}$ 給出簡單界 $|U|\leq np+ne^{-p(\delta +1)}$ 。右邊對p求導，令它等於0。右邊是最小化 $p=\frac{ln(\delta +1)}{\delta +1}$ 。我們令p等於這個值，現在我們有 $|U|\leq n[1+ln(\delta +1)]/(\delta +1)$ 作爲期望。

貪心算法證明：

思想：每次選取未進入支配集的點集中的擁有最多鄰居的點進入到支配集，再從剩餘的點集中按前面的方法挑選，以此類推。

設U爲支配集，當前有r個點未被支配，這r個點都是自身及其鄰居沒有進入U中，即 $\delta$ +1個點（ $\delta$ 爲鄰居），共有 $r(\delta +1)$ 個點（其中存在重複點），最壞結果有 $\frac{r(\delta +1)}{n}$ 個點是重複計算在r中不同點的鄰居中，將這些點加入到U中，這些點就是貪婪選擇中鄰居最多的，那麼未進入U的點集衰減至 $r-\frac{r(\delta +1)}{n}=r(1-\frac{\delta +1}{n})$ 。起始有n個點，衰減過程如上分析，經過t次貪心選擇， $n(1-\frac{\delta +1}{n})^t\leq \frac{n}{\delta +1}$ ，可解得上述結果。

爲支配集一個接一個地選擇頂點，在每一步中選擇一個覆蓋最大未覆蓋頂點數的頂點。這是貪婪算法。

對於每個頂點v用C(v)表示由v和它的所有鄰居組成的集合。假設在選取頂點的過程中，不屬於集合C(v)的並集的頂點數是r。假設集合C(u)對所有未覆蓋的頂點u的基數之和至少爲 $r(\delta +1)$ ，因此平均而言，有一個頂點v至少屬於 $\frac{r(\delta +1)}{n}$ 這樣的集合C(u)。把這個v加到選定頂點集合中，未覆蓋頂點的數量現在最多是 $r(1-\frac{\delta +1}{n})$ ，因此，在算法的每次迭代中，未覆蓋頂點的數量減少了 $1-\frac{\delta +1}{n}$ 倍，因此，在 $\frac{nln(\delta +1)}{\delta +1}$ 步之後，最多還會有 $\frac{n}{\delta +1}$ 個點。未覆蓋的頂點現在可以被添加到選擇的頂點集合中，形成一個最大等於上面定理結論的大小支配集。

三個簡單但重要的想法:

1)期望的線性度隨機變量和的期望值是它們的期望值的和，即使它們不是獨立的。

2)變更原則。隨機選擇沒有立即提供所需的支配集;它只提供了集合X，而集合X必須通過增加集合Yx來得到所需的支配集。

3) p的最優選擇。一個隨機的選擇，但確定應該使用p的概率是多少。其思想是將p作爲參數進行證明，得到一個關於p的函數，用微積分法求出最優p值，實際的最小p值很難處理。概率方法的很大一部分藝術在於找到次優但乾淨的邊界。

二 . 生日悖論

生日悖論“生日悖論”說的是，在一組隨機選擇的23人中，至少有兩人的生日相同，且概率至少爲1/2。

三.獨立集

定理：設G=(V,E)有n個頂點和nd/2邊,d≥1，那麼有 $\alpha (G)\geq n/2d$ (獨立數，最大獨立集中點的數目)。

證明：

構造隨機子集合X，以p概率取點加到X中，|X|=np，X中可能存在相連的情況，e={x,y}在X中的概率爲，那麼邊在X中的期望爲 $p^2\frac{nd}{2}$ ，這些是不想要的，我們需要的是獨立集。對於邊，可以刪掉其中任意一個點，如x或者y，破壞掉這條邊即可，那麼|X|=np- $p^2\frac{nd}{2}$ 個點，對p求導的式子等於0求解p，p>0，則證明成立。

設 $S\in V$ 爲 $Pr[V\in S]=p$ 定義的隨機子集，P待定，事件 $V\in S$ 相互獨立。設X=|S|，Y爲G|s的邊數。對於每個e={i，j}，設Ye爲事件的指示器隨機變量。 $i,j\in S$ 那麼 $Y=\sum_{e\in E}Ye$ 。對於任意這樣的e, $E[Ye]=Pr[i,j\in S]=p^2$ ，根據期望的線性關係， $E[Y]=\sum_{e\in E}E[Ye]=\frac{nd}{2}p^2$ 。顯然，EY]=np，根據線性期望， $E[X-Y]=np-\frac{nd}{2}p^2$ 。我們令p=1/d來最大化這個量，得到E[X-Y]=n/2d。

因此存在一個特定的S，其中S的頂點數減去S的邊數至少爲n/2d。從S的每條邊中選擇一個頂點並刪除它。這使得集合S'至少有n/2d的頂點。所有被刪除的邊，S'是一個獨立的集合。

四.二部圖

定理：令G=(V,E)是一個有n個頂點和e條邊的圖。那麼G包含至少有e/2條邊的二部圖。（下圖中間的邊有多於e/2條）

證明：

設 $T\in V$ 爲 $Pr[x\in T]=1/2$ 給出的隨機子集，選擇相互獨立。設B=V-T，如果x，y中恰好有一個在T中，則稱這條邊爲{x,y}交叉。設X爲交叉邊的數目。我們分解 $X=\sum_{{x,y\in E}}X_{xy}$ ，其中Xxy爲{x,y}交叉的指示隨機變量。那麼E[Xxy]=1/2作爲兩個均勻拋擲的概率是1/2。然後 $E[X]=\sum_{{x,y\in E}}E[Xxy]=e/2$ 。因此X≥e/2，對於T的某個選項和這組交叉邊構成一個二部圖。

五.集團（Clique）數 $\omega (G)$

集團:集團中任意兩點之間有邊相連

定理：設G=(V,E)是n點上的一個圖，有 $\omega (G)\geq \sum_{v\in V}\frac{1}{n-d(v)}$ 。

證明：

我們選擇頂點集合V的一個隨機排列 $\pi$ =v1v2v3...vn，其中每個排列是以相同的1/n!概率出現，然後考慮下面的集合 $C_\pi$ ，我們放入vi在 $C_\pi$ 中，當且僅當vi與vi之前的所有vj（j<i）相鄰。根據定義， $C_\pi$ 是G中的一個集團，令 $X=|C_\pi |$ 爲對應的隨機變量。 $X=\sum_{i=1}^{n}X_i$ ，其中Xi是頂點vi的指標隨機變量，即Xi=1或0，這取決於是否 $v_i\in C_\pi or v_i\notin C_\pi$ 。注意，當且僅當vi出現在所有n-1-d(vi)之前，則vi在排列中屬於C。

補圖爲獨立集， $d(v)_{Complement}=n-1-d(v)_{Clique}$ ， $\alpha (G)\geq \sum_{v\in V}\frac{1}{d(v)+1}$ 。

六.色數 $\chi (G)$

考慮n個頂點上的圖G和它的色數 $\chi (G)$ 。如果 $\chi (G)$ 很大，也就是說，如果我們需要很多顏色，那麼我們懷疑G包含一個很大的完全子圖(即Clique)。

然而，這遠非事實。我們有任意高色數的圖，沒有三角形，也就是說，每個循環的長度至少是4。我們能保證沒有小圈並還有高的色數?是的,我們可以!爲了精確起見，我們稱G中最小的圈的圍長爲 $\gamma (G)$ 。簡單來說就是對於一個圖G，它的色數很大 $\chi (G)$ ，它的圍長 $\gamma (G)$ 也很大。

定理：對於大的k≥2，存在圖G，其色數 $\chi (G)$ >k，圍長 $\gamma (G)$ >k。

證明：

假設A事件： $\chi (G)$ ≤k，B事件： $\gamma (G)$ ≤k，只需證明P(A)<1/2,P(B)<1/2，那麼 $P(A\cup B)\leq P(A)+P(B)<1$ ，即 $P(\overline{A}\cap \overline{B})>0$ 。概率方法中一般考慮“壞”事件，壞事件發生的概率小於1，那麼好事件(我們期望的事件)發生的概率一定大於0。

我們證明 $\chi (G)$ <=k的概率小於1/2，同樣的， $\gamma (G)$ <=k的概率也小於1/2。因此，必須存在具有所需屬性的圖。

設V={v1,v2,...,vn}爲頂點集，p是固定數字在0和1之間，需要謹慎選擇。我們的概率空間G(n,p)(隨機圖：n個點之間以p的概率相連 $p^\binom{n}{2}$ )包含V上的所有圖，其中每條邊以p的概率出現，相互獨立。換句話說，我們討論的是伯努利實驗，我們把每條邊都放進去以概率p。 $Pr(K_n)=p^\binom{n}{2}$ ，關於色數 $\chi (G)$ ，有 $\chi (G)\alpha (G)\geq n$ 。因此，如果 $\alpha (G)$ 比n小，那麼 $\chi (G)$ 一定很大，也就是我們想要的。假設2≤r≤n，一個固定的r集在V中是獨立的，概率是 $(1-p)^\binom{r}{2}$ ，得出結論 $Pr(\alpha \geq r)\leq \binom{n}{r}(1-p)^{\binom{r}{2}}\leq n^r(1-p)^\binom{r}{2}$ $=(n(1-p)^{\frac{r-1}{2}})^r\leq (ne^{-p(r-1)/2})^r$ 。因爲 $1-p\leq e^{-p}$ 適用於所有p。給定任意一個固定的k>0，選擇 $p=n^{-\frac{k}{k+1}}$ ，並繼續證明當n足夠大時， $Pr(\alpha \geq \frac{n}{2k})<1/2$ 。確實，因爲 $n^{\frac{1}{k+1}}$ 比logn增長更快，當n'很大時有 $n^{\frac{1}{k+1}}\geq 6klogn$ ，那麼 $p\geq 6k\frac{logn}{n}$ 。對於 $r=\left \lceil \frac{n}{2k} \right \rceil$ ， $pr\geq 3logn$ ，因此 $ne^{-p(r-1)/2}=ne^{-pr/2}e^{p/2}\leq ne^{-3logn/2}e^{1/2}=(e/n)^{1/2}$ ，當n趨於無窮時，上式是趨於0的。因此 $Pr(\alpha \geq \frac{n}{2k})<1/2$ 對所有的n>=n1都成立。

關於參數 $\gamma (G)$ ，對於給定k，我們想證明沒有太多長度<=k的圈。 $A\subseteq V$ 是固定的i集。A上可能的i圈數是A的循環排列數除以2(因爲我們可以在任意方向上遍歷循環)，因此等於(i-1)!/ 2。可能的i圈的總數爲 $\binom{n}{i}\frac{(i-1)!}{2}$ ，每個這樣的圈C都以概率出現。設X爲計算圍長小於k的圈的數目的隨機變量。爲了估算X，我們使用了兩個簡單但效果很好的工具。第一個是期望的線性，第二個是非負隨機變量的馬爾可夫不等式， $Pr(X\geq a)\leq E(X)/a$ ，其中E(X)是X的期望。設Xc爲圍長爲i的圈C的指標隨機變量，也就是說，我們令Xc=1或0取決於C是否出現在圖中。因此。因爲X計數圍長<=k的所有圈，並有 $X=\sum Xc$ ,因此根據線性 $E(X)=\sum_{i=3}^{k}\binom{n}{i}\frac{(i-1)!}{2}p^i\leq 1/2\sum_{i=3}^{k}n^ip^i\leq 1/2(k-2)n^kp^k$ 。現在應用a=n/2的馬爾科夫不等式，得到 $Pr(X\geq n/2)$ $\leq \frac{E(X)}{n/2}\leq (k-2)\frac{(np)^k}{n}=(k-2)n^{-\frac{1}{k+1}}$ ，因爲當n趨於無窮大時，右邊趨於0，我們推斷 $Pr(X\geq n/2)<1/2$ ，對於n>=n2。現在差不多完成了。分析說明對於 $n\geq max(n1,n2)$ ，存在n個點的圖H，其中 $\alpha (H)<n/2k$ ，且圍長小(3~k之間的)的圈少於n/2，從每個圈中刪除一個頂點，設G是最終的圖像(H刪除圈的點就成爲了G)。那麼 $\gamma (G)$ >k。因爲G包含大於n/2個頂點並滿足 $\alpha (G)\leq \alpha (H)< n/2k$ ，發現 $\chi (G)\geq \frac{n/2}{\alpha (G)}\geq \frac{n}{2\alpha (H)}> \frac{n}{n/k}=k$ ，證畢。( $\gamma (G)$ >k也滿足，因爲破壞的是3~k的圈，剩下的就是大於k的圈)。

七.邊染色(去隨機化)

在許多情況下，概率方法爲各種算法問題提供了有效的算法。在某些情況下，這些算法可以去隨機化並轉化爲確定性的算法。

定理：存在一個帶有雙色(邊染色)的Kn(n個點的完全圖)中最多有 $\binom{n}{4}2^{-5}$ 個同色的K4(4個點的完全圖)。

證明：

隨便取一個顏色。設X爲同色K4的個數，求E(X)。用顏色表示X的值最多是這個期望。

條件概率。

我們首先需要確定一個權函數任何部分已染色Kn。Kn的邊爲紅色和藍色。Kn中的K4的每個副本K，權值爲w(K)。如果K的至少一條邊是紅色的，至少一條邊是藍色的，那麼w(K)=0。如果K的邊沒有着色，則w(K)= $2^{-5}$ ，如果K中的r>=1條邊是有顏色的，都是相同的顏色，那麼w(K)= $2^{r-6}$ ，也可以定義局部着色Kn的總的權值W爲w(K)的和，K爲K4至Kn的所有副本。總重量W僅僅是K4的單色副本的期望數量，在這樣一個隨機延伸的部分着色的Kn到一個完全着色。

任意對Kn的 $\binom{n}{2}$ 邊排序，通過將每條邊依次塗成紅色和藍色來構造所需的兩種顏色。假設e1,e2，…e(i-1)已經上色，現在我們要給ei上色。設W爲Kn的權值，對給定的e1,e2，..e(i-1)的部分染色c。同理，設Wred爲通過將ei染成紅色得到的c的部分着色時Kn的權值，設Wblue爲通過將ei染成藍色得到的c的部分着色時Kn的權值。根據W的定義， $W=\frac{W_{red}+W_{blue}}{2}$ 。現在選擇ei的顏色是爲了最小化結果的權重;也就是說，如果Wred<=Wblue，我們就把它塗成紅色，否則，我們就把它塗成藍色。由上述不等式可知，權函數在算法中不增加。因爲一開始，它的值是恰爲 $\binom{n}{4}2^{-5}$ ，它最後的值最多是這個量。在最後，所有的邊都染色，並且權值正好是K4的單色副本的數量。因此，上面的過程產生，決定論和在多項式時間滿足定理結論的Kn的2邊着色。

八.終身職位遊戲(去隨機化)

終身職位遊戲是兩個玩家之間的遊戲，系主任保羅和學院院長卡羅爾。最初的職位是由不同的教員擔任不同的終身職位。如果有一些教員獲得終身職位，保羅將贏得這場比賽;如果沒有教員獲得終身職位，卡羅爾就是贏家。每年，主席保羅都會創建一份教員的晉升名單L，然後交給院長卡羅爾，他有兩種選擇。選項一:卡羅爾可以提拔名單L上的所有教員，同時解僱所有其他教員。選擇二:卡羅爾可以提升所有不在L名單上的教員一級，同時解僱所有在L名單上的教員。

讓我們假設有ak教員是離終身職位的k個梯級上的人數。

定理：如果 $\sum a_k2^{-k}< 1$ ，(得到終身職位的人數的期望)，那麼Carole贏了。

證明1:

讓我們想象一下，卡羅爾在每一輪都是隨機選擇的，也就是說，在保羅確定了晉升名單L之後，卡羅爾拋出一枚公平的硬幣來決定是使用選項1還是選項2。修正了保羅的一些確定性策略。無論保羅的策略如何，現在每個教師都有可能獲得終身職位。設T爲教師人數，從而T是一個隨機變量。對於每個教員f，設爲獲得終身教職的指標隨機變量，則 $T=\sum$ 。根據期望的線性 $E[T]=\sum E[I_f]=\sum a_k2^{-k}$ 。注意，當且僅當T=0，則Carole獲勝。我們的假設是E[T]<1，因此Pr[Carole wins]=Pr[T=0]>0。

證明2 (去隨機化)

將一個職位的權重定義爲獲得終身教職的教員的預期數量E[T]，如果卡羅爾隨機選擇。現在Paul向Carole出示了一個列表L，假設T1是獲得終身教職的教員人數，如果Carole現在選擇選項1。假設T2和卡羅爾先玩選項2一樣。Carole的策略是如果E[T1]<E[T2]，則選擇Option1，否則選擇Option2。這裏的關鍵是。

因爲一直隨機是選擇1然後隨機，然後選擇2然後隨機的平均值。當E[T]<1時，要麼E[T1]<1,E[T2]<1，採用這種策略Carol可以確保E[T]<1在回合結束時。在遊戲結束時繼續這樣做E[T]<1。但遊戲結束時，E[T]是獲得終身職位的教員數目。一個整數小於1就是0，所以卡羅爾贏了。

九.平衡向量博弈

有一個位置向量 $P\in R^n$ ，它最初被設置爲0。一共有n輪。在每一輪中，Paul首先選擇一個向量 $v\in \{-1,+1 \}^n$ 。然後卡羅爾將P重置爲P+v或P-v，由她選擇。讓P(final)表示P在遊戲結束時的值。從卡羅爾到保羅回報是 $|P(final)|_{}\infty }$ ，P(final)的n個座標的最大的絕對值。讓 $\alpha \geq 0$ 。保羅贏得了 $(\alpha ,n)$ 比賽，當且僅當 $|P(final)|_{\infty }\geq \alpha$ 。