大數據分析,什麼樣的美女最受男生青睞?

梅根福克斯

這篇文章探討的是女性吸引力,但沒有通常看到的照片分析之類的東西。相反,我們採用過去的女人圖片,分析她在男同胞們頭腦裏產生的反應。 我們將展示以下顯著的現象:

• 男人們作爲一個羣體對女性長相越有分歧,最後喜歡她的人越多。

• 男人們通常會忽視掉那些僅僅可愛的女生。

• 事實上,有些男人認爲她長得醜,這反而會幫到這個女人


公正性警告:我們將把女性作爲客觀對象來討論,不惜筆墨。本文的目的是分析OkCupid網站的數據,沒有一點點客觀對象化是不可能的。不久會輪到把男性作 爲客觀對象來分析展示給大家。按照慣例,本文中沒有任何分析(名人的例子除外)是我個人的觀點。所有數據均是從實際用戶活動中收集的。

1. 咱們從頭開始。

所有的人,尤其是男人們花費大量精力搜索、瀏覽和聯繫我們最熱門的用戶。正如以前提到的,受歡迎女性收到的交友信息大約是相貌平平女性的4倍(備註:原文用 4X表示),是醜女收到的25倍(備註:原文用25X表示)。深陷信息中會把網站用戶,尤其是女性嚇跑。因此,我們必須分析和重新指導這個趨勢,以免 OkCupid成爲sausageparty那樣的網站。

幾乎每隔一段時間,我們都會運行下面這樣的分析圖,顯示以5000名女性爲例,按吸引力排序,在上一個月中能收到多少信息。

大數據


這些圖按種族、位置、年齡、檔案完整程度、登錄活躍程度等做了調整——這些人之間唯一有意義的不同點是她們的長相。運行許多這樣的圖之後,我們開始問自己: 還有什麼原因導致X廣泛分佈,尤其是佔了圖中一半數量的“長相高於平均水平”人收到的信息量有多有少。難道僅僅是隨機現象?


下面是這個女性的分析:

美女大數據

她得到的關注比下面的女性要高:

美女大數據


…儘管根據我們的用戶反饋,她們都是美人

2. 美麗(7分)並不相同

爲了解釋這種現象,第一步就是用數學方法來區分吸引力的程度。 比如,採用經典的10點分來作爲“長相”的滿分,如果一個人的評分爲7,這可能是因爲每個看到她的人都會這樣想:她非常可愛。

7分美女


但是極有可能出現的卻是下面這種情況:

美女大數據


如果我們只知道她的評分爲7,是沒法看出她屬於上面哪一類的。也許對於有些人來說假設的滿分美女是不同凡響、引領潮流的,而其他人認爲美女是享樂主義的。誰知道呢? 事實證明,這種分佈的觀點非常重要。

3. 名人照片:拋磚引玉和說明

讓我們來看看一些著名人物的評分的分佈情況是什麼樣的。我猜想,比如說女演員克里斯汀.貝爾的長相評分大致是這樣的:

美女大數據


貝爾小姐被大衆認爲是美女,但她的分數看上去並不像是一個超級名模或者什麼頂尖人物。她可能在“非常美”的評分範圍只能得到幾票,大多數的票數在“非常有吸引力”左右,沒人把她的票投在圖表左端的“不吸引人”上。


相比較而言,梅根·福克斯可能得到這樣的評分:

梅根福克斯


圖表最右邊,可能有很多的帥哥覺得她是最性感的。在最左邊,少數人看過她的電影。

與貝爾小姐不同,福克斯女士讓人們產生了強烈的反應,即使有時這種反應不是正面的。

4. 現實生活的人們

現在讓我們回頭再來看前面的兩個真實用戶,這一次用她們的圖表。 OkCupid網站按從1到5級評價長相,所以其它討論都以此爲根據。本文展示的所有用戶都是慷慨的女性,她們有足夠信心允許我們在網站上做分析,感謝她們。好了,這裏有:

美女大數據


正如你看到的,儘管上面這兩名女性的吸引力評分非常接近,她們收到的投票 模式卻有所不同。左邊的評分顯示人們有所共識,右邊的評分顯示了意見分歧。


再細緻一點說來就是:

  • 左邊的女士,在絕對意義上,認爲稍微更有吸引力
  • 右邊的女士,相對多達142%的人們給了她最低分
  • 然而,右邊女士收到的交友信息是左邊女士的3倍。


當我們開始用其他”長相和側臉相似,但收到的交友信息數不同”的人來配對時,這種模式一次又一次呈現。收到消息少的女性通常被認爲有一貫的吸引力,而收到消息多的女性往往在男人看來吸引力有分歧。下面再舉幾個例子:

美女大數據

美女大數據


男人對女性長相越有分歧,就有越多的人喜歡她。 我 們感覺似乎能發現什麼,所以,作爲數學書呆子,穿上運動褲。然後做了一些分析。 我們的第一個結論是:對女性評分數和她收到的交友信息數量做標準差比較,發現,男人們對女性長相評價的分歧越多,就有越多人喜歡她。對此繪製的喜好偏差與 收到的交友信息的關係曲線如下,再舉一些例子。


圖中沿曲線標識的女性在吸引力排名中大約爲前80%

美女大數據

美女大數據


這得用一點算術,而且很難用簡單的折線圖來解釋。基本原理是:根據女性得到的投票數,用一個公式來預測女性能得到多少關注量,關注量的計算是基於曲線上的投票數。用這個公式,我們可以把“男人認爲女性長得怎麼樣”翻譯成“她能得到多少關注”。

我們得出的公式看上去不透明,但是用它計算,就會看到人們有趣的觀點,以及男人們會向哪些女性示好。公式


*******************************************

如果你對代數感興趣

我們以43000名女性的數據作爲樣本用迴歸法分析。 爲保證前提一致,所有這些女人是異性戀, 年齡介於20和27歲之間,而且住在同一個城市。本文中給出的公式是降低m3,使其p值非常接近1後,第二次迴歸得到的最佳結果 。


Msgs是觀察期內女性收到消息數量。常數k反映了她在整個網站的活動水平。對於這個方程, R2 = .28, 這在實驗或問題研究中並不是一個大數字,但應用在真實的社會環境中非常好。


*******************************************


需要搞明白,最重要的是ms代表男人對她長相評價的投票,以此算出她收到的交友信息數曲線,譬如:

美女大數據


那些前面帶正號的投票數(ms):表示男人會發信息給女性,前面帶負號的:說明要減去信息數量。這個公式告訴我們的有以下信息: 認爲你火辣(hot)的男人越多,你收到的信息就越多。

我們怎麼知道此原理的——m5前面的0.9是最大的正數,也就是說,認爲你很迷人(投票給你一個滿分’5′)的傢伙們是給你發信息最多的貢獻者。這當然是個預測結果,提示給我們:公式是能講得通的。 覺得你可愛(cute)的男人,實際上應從你收到的信息中減掉。 我們怎麼知道此原理的——因爲m4前面的係數0.1是負數。這就說明,給你投票爲’4′ 的人,認爲你長相高於平均水平的那些人,實際上應從你收到的信息中剔除。非常令人驚訝。事實上,當你把它和m1前面的正數一起看,我們的公式從統計上看能說得通:


如果有人認爲你不火辣(hot)
,那麼最好接下來他們認爲:你醜。

美女大數據


這是一個非常瘋狂的結論,但我們每次計算——通過變換約束值,嘗試不同的數據樣本等,這個理論都會顯現生效。

5. 我們的想法是怎麼回事

所以這便是我們的悖論:當有些人認爲你丑時,其他人更有可能發消息給你。而當有些男人覺得你很可愛時,其他男人對你倒是缺乏興趣。爲什麼會出現這種情況?也許得用點博弈論來解釋:

假設你是個男人,並真地對某人感興趣。如果你懷疑其他男人都不感興趣,就意味着更少人來競爭。因此,此想法會激勵你給她發送消息。你可能會想:也許她很孤單……也許她恰好在等待一個欣賞她的人……至少我不會埋沒在人羣裏……也許這些小心思,加上事實上你真地覺得她漂亮,會促使你行動。發給她你精心考慮過的完美的開場詞。

“最近好嗎”

另一方面,’4′票佔多數的女人,通常被認爲可愛,但並不火辣,看上去的情形可能比實際上更受歡迎。一般男人會這樣考慮:她的魅力明顯足以吸引其他人和她交往。但不足以使男人不顧一切地給她發交往信息。這就是可愛的矛盾之處。
整個情形看起來是這樣:

美女大數據


6. 最後:這對你意味着什麼?

我不認爲每個女人都關心是否其他人關注她。但是如果你關心的話,上面的分析有什麼實際意義呢? 好吧,從根本上,改變你的整體吸引力很難(也就是開篇我們討論的長相評分)。但是你創造出來的差別是掌控在自己手中的,很簡單,即:把差別最大化:


採用任何你認爲有些人不喜歡的方式,突出展示出來。

正如你可能已經注意到的,帶紋身和穿孔的女性似乎憑直覺把握了這個原則。她們炫耀自己與衆不同之處,纔不管人家喜不喜歡呢。而且她們得到很多人的關注。


但我們的建議可以適用於任何人。瀏覽OkCupid網站時,我發現衆多照片顯然在儘可能減少一些不具吸引力的特徵——一個可能超重的人從生活照中剪切出來的頭像就是典型的例子。我們有些算法表明:消減你的“瑕疵” 達到的效果會是相反的。如果你有點小胖,展示出來。如果你有一個大鼻子,展示出來。如果你有一個奇怪的暴牙,展示出來:從統計學上來說,不喜歡它的男人只會幫到你,那些喜歡它的人會更興奮。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章