冪律分佈與二八法則

轉載自:關於冪律分佈的一個筆記

0:題外話或補記
最早知道二八法則,還是一本介紹猶太民族傑出人物的書,被稱爲猶太法則。說猶太人跟錢打交道較其他民族多,很早就知道了這個世界上是80%的人把錢借給了20%的會錢生錢的人,而且論據之一居然是人體80%是由水組成,只有20%爲其他關鍵物質;另一論據是空氣80%由氮氣構成,只有20%包括氧氣在內的其他氣體。這些固然都是頗有趣的現象,但一直未能上升到理論的高度。

1:冪律即Power law是系統科學中一個常見的現象
經濟學財富分佈滿足Pareto Power law tail分佈,語言中有詞頻的冪律分佈,城市規模和數量滿足冪律分佈,音樂中有f分之1噪音(冪律分佈)……。通常人們理解冪律分佈就是所謂的馬太效應,二八原則,即少數人聚集了大量的財富,而大多數人的財富數量都很小,因爲勝者通吃的原則。

股市中有80%的投資者只想着怎麼賺錢,僅有20%的投資者考慮到賠錢時的應變策略。但結果是隻有那20%投資者能長期盈利,而80%投資者卻常常賠錢。
  20%賺錢的人掌握了市場中80%正確的有價值信息,而80%賠錢的人因爲各種原因沒有用心收集資訊;  當80%人看好後市時,股市已接近短期頭部,當80%人看空後市時,股市已接近短期底部。只有20%的人可以做到鏟底逃頂,80%人是在股價處於半山腰時買賣的。
  券商的80%佣金是來自於20%短線客的交易,股民的80%收益卻來自於20%的交易次數。因此,除非有嫺熟的短線投資技巧,否則不要去貿然參與短線交易。
  只佔市場20%的大盤指標股對指數的升降起到80%作用,在研判大盤走向時,要密切關注這些指標股的表現。
  一輪行情只有20%的個股能成爲黑馬,80%個股會隨大盤起伏。80%投資者會和黑馬失之交臂,但僅20%的投資者與黑馬有一面之緣,能夠真正騎穩黑馬的更是少之又少。
  有80%投資利潤來自於20%的投資個股,其餘20%投資利潤來自於80%的投資個股。投資收益有80%來自於20%筆交易,其餘80%筆交易只能帶來20%的利潤。所以,投資者需要用80%的資金和精力關注於其中最關鍵的20%的投資個股和20%的交易。
  股市中20%的機構和大戶佔有80%的主流資金,80%的散戶佔有20%資金,所以,投資者只有把握住主流資金的動向,才能穩定獲利。
  成功的投資者用80%時間學習研究,用20%時間實際操作。失敗的投資者用80%時間實盤操作,用20%時間後悔。
  股價在80%的時間內是處於量變狀態的,僅在20%的時間內是處於質變狀態。成功的投資者用20%時間參與股價質變的過程,用80%時間休息,失敗的投資者用80%時間參與股價量變的過程,用20%時間休息。

2:幾種冪率分佈模型
以收入或人口數爲橫座標,以不低於該收入值或人口數的個體數或概率爲縱座標,可繪出一條向右偏斜得很厲害,拖着長長“尾巴”的累積分佈曲線(如圖1右圖所示),它與鐘形的泊松分佈曲線有顯著的不同。這種“長尾”分佈表明,絕大多數個體的尺度很小,而只有少數個體的尺度相當大,像國家人口,全世界有300多個國家和地區,只有11個國家的人口數超過一億。“長尾”分佈就屬於冪律分佈。
這裏寫圖片描述

對“長尾”分佈研究做出重要貢獻的是Zipf和Pareto。
1932年,語言學家Zipf在研究英文單詞出現的頻率時,發現如果把單詞出現的頻率按由大到小的順序排列,則每個單詞出現的頻率與它的名次的常數次冪存在簡單的反比關係:P(r)~r^(-α),這種分佈就稱爲Zipf定律,它表明在英語單詞中,只有極少數的詞被經常使用,而絕大多數詞很少被使用。實際上,包括漢語在內的許多國家的語言都有這種特點。物理世界在相當程度上是具有惰性的,動態過程總能找到能量消耗最少的途徑,人類的語言經過千萬年的演化,最終也具有了這種特性,詞頻的差異有助於使用較少的詞彙表達儘可能多的語義,符合“最小努力原則”。
19世紀的意大利經濟學家帕累託(Pareto)研究了個人收入的統計分佈,發現少數人的收入要遠多於大多數人的收入,提出了著名的80/20法則,即20%的人口占據了80%的社會財富。個人收入X不小於某個特定值x的概率與x的常數次冪亦存在簡單的反比關係:P[X≥k]~x^(-k),上式即爲Pareto定律。對Pareto分佈P[X >= x] ~ x-k,通過求導很容易得到其概率分佈密度:p[X = x] ~ x-(k+1) = x-a,a = 1+k。對於Pareto定律,在成熟市場中,金融資產收益率的冪律分佈其冪指數約等於3.
Zipf定律與Pareto定律都是簡單的冪函數,我們稱之爲冪律分佈;還有其它形式的冪律分佈,像名次——規模分佈、規模——概率分佈,這四種形式在數學上是等價的,冪律分佈的示意圖如圖1右圖所示,其通式可寫成y=c*x^(-r),其中x,y是正的隨機變量,c,r均爲大於零的常數。這種分佈的共性是絕大多數事件的規模很小,而只有少數事件的規模相當大。對上式兩邊取對數,可知lny與lnx滿足線性關係,也即在雙對數座標下,冪律分佈表現爲一條斜率爲冪指數的負數的直線,這一線性關係是判斷給定的實例中隨機變量是否滿足冪律的依據。判斷兩個隨機變量是否滿足線性關係,可以求解兩者之間的相關係數;利用一元線性迴歸模型和最小二乘法可得lny對lnx的經驗迴歸直線方程,從而得到y與x之間的冪律關係式。圖2顯示的是圖1右圖在雙對數座標下的圖形,由於某些因素的影響,圖2前半部分的線性特性並不是很強,而在後半部分(對應於圖1右圖的尾部),則近乎爲一直線,其斜率的負數就是冪指數。
這裏寫圖片描述

3:冪律可作爲自組織臨界的證據
冪律分佈是自組織臨界系統在混沌邊緣,即從穩態過渡到混沌態的一個標誌,利用它可以預測這類系統的相位及相變。它認爲,由大量相互作用的成分組成的系統會自然地向自組織臨界態發展;當系統達到這種狀態時,即使是很小的干擾事件也可能引起系統發生一系列災變。著名的“沙堆模型”形象地說明了自組織臨界態的形成和特點(如圖3):
這裏寫圖片描述
設想在一平臺上緩緩地添加沙粒,一個沙堆逐漸形成。開始時,由於沙堆平矮,新添加的沙粒落下後不會滑得很遠。但是,隨着沙堆高度的增加,其坡度也不斷增加,沙崩的規模也相應增大,但這些沙崩仍然是局部性的。到一定時候,沙堆的坡度會達到一個臨界值,這時,新添加一粒沙子(代表來自外界的微小干擾)就可能引起小到一粒或數粒沙子,大到涉及整個沙堆表面所有沙粒的沙崩。這時的沙堆系統處於“自組織臨界態”,有趣的是,臨界態時沙崩的大小與其出現的頻率呈冪律關係。這裏所謂的“自組織”是指該狀態的形成主要是由系統內部各組成部分間的相互作用產生,而不是由任何外界因素控制或主導所致,這是一個減熵有序化的過程;“臨界態”是指系統處於一種特殊的敏感狀態,微小的局部變化可以不斷被放大、進而擴延至整個系統。自組織臨界理論可以解釋諸如火山爆發、山體滑坡、岩層形成、日輝耀斑、物種滅絕、交通阻塞、以及金融市場中泡沫崩潰的現象。

4:啓示
帕累托法則換句話就是強調了重要的少數與瑣碎的多數,也指世界上充滿了不平衡性,比如20%的人口擁有80%的財富,20%的上市公司創造了80%的價值,80%的收入來自20%的商品,80%的利潤來自20%的顧客,等等。
這一法則潛在地影響了許多成功人士,特別是商界精英、計算機專家和質量工程師。這一法則已經幫助人們塑造了一個現代化世界。然而,它現在依然是我們這個時代一個偉大的祕密。即使是那些百裏挑一的能理解並運用80/20法則的行家們,也不過僅僅發現了它的冰山一角而已。

發佈了30 篇原創文章 · 獲贊 252 · 訪問量 26萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章