大數據分析，什麼樣的美女最受男生青睞？

這篇文章探討的是女性吸引力，但沒有通常看到的照片分析之類的東西。相反，我們採用過去的女人圖片，分析她在男同胞們頭腦裏產生的反應。我們將展示以下顯著的現象：

• 男人們作爲一個羣體對女性長相越有分歧，最後喜歡她的人越多。

• 男人們通常會忽視掉那些僅僅可愛的女生。

• 事實上，有些男人認爲她長得醜，這反而會幫到這個女人。

公正性警告：我們將把女性作爲客觀對象來討論，不惜筆墨。本文的目的是分析OkCupid網站的數據，沒有一點點客觀對象化是不可能的。不久會輪到把男性作爲客觀對象來分析展示給大家。按照慣例，本文中沒有任何分析（名人的例子除外）是我個人的觀點。所有數據均是從實際用戶活動中收集的。

1. 咱們從頭開始。

所有的人，尤其是男人們花費大量精力搜索、瀏覽和聯繫我們最熱門的用戶。正如以前提到的，受歡迎女性收到的交友信息大約是相貌平平女性的4倍（備註：原文用 4X表示），是醜女收到的25倍（備註：原文用25X表示）。深陷信息中會把網站用戶，尤其是女性嚇跑。因此，我們必須分析和重新指導這個趨勢，以免 OkCupid成爲sausageparty那樣的網站。

幾乎每隔一段時間，我們都會運行下面這樣的分析圖，顯示以5000名女性爲例，按吸引力排序，在上一個月中能收到多少信息。

這些圖按種族、位置、年齡、檔案完整程度、登錄活躍程度等做了調整——這些人之間唯一有意義的不同點是她們的長相。運行許多這樣的圖之後，我們開始問自己：還有什麼原因導致X廣泛分佈，尤其是佔了圖中一半數量的“長相高於平均水平”人收到的信息量有多有少。難道僅僅是隨機現象？

下面是這個女性的分析：

她得到的關注比下面的女性要高:

…儘管根據我們的用戶反饋，她們都是美人

2. 美麗（7分）並不相同

爲了解釋這種現象，第一步就是用數學方法來區分吸引力的程度。比如，採用經典的10點分來作爲“長相”的滿分，如果一個人的評分爲7，這可能是因爲每個看到她的人都會這樣想：她非常可愛。

但是極有可能出現的卻是下面這種情況:

如果我們只知道她的評分爲7，是沒法看出她屬於上面哪一類的。也許對於有些人來說假設的滿分美女是不同凡響、引領潮流的，而其他人認爲美女是享樂主義的。誰知道呢？事實證明，這種分佈的觀點非常重要。

3. 名人照片：拋磚引玉和說明

讓我們來看看一些著名人物的評分的分佈情況是什麼樣的。我猜想，比如說女演員克里斯汀.貝爾的長相評分大致是這樣的：

貝爾小姐被大衆認爲是美女，但她的分數看上去並不像是一個超級名模或者什麼頂尖人物。她可能在“非常美”的評分範圍只能得到幾票，大多數的票數在“非常有吸引力”左右，沒人把她的票投在圖表左端的“不吸引人”上。

相比較而言，梅根·福克斯可能得到這樣的評分：

圖表最右邊，可能有很多的帥哥覺得她是最性感的。在最左邊，少數人看過她的電影。

與貝爾小姐不同，福克斯女士讓人們產生了強烈的反應，即使有時這種反應不是正面的。

4. 現實生活的人們

現在讓我們回頭再來看前面的兩個真實用戶，這一次用她們的圖表。 OkCupid網站按從1到5星級評價長相，所以其它討論都以此爲根據。本文展示的所有用戶都是慷慨的女性，她們有足夠信心允許我們在網站上做分析，感謝她們。好了，這裏有：

正如你看到的，儘管上面這兩名女性的吸引力評分非常接近，她們收到的投票模式卻有所不同。左邊的評分顯示人們有所共識，右邊的評分顯示了意見分歧。

再細緻一點說來就是：

左邊的女士，在絕對意義上，認爲稍微更有吸引力
右邊的女士，相對多達142%的人們給了她最低分
然而，右邊女士收到的交友信息是左邊女士的3倍。

當我們開始用其他”長相和側臉相似，但收到的交友信息數不同”的人來配對時，這種模式一次又一次呈現。收到消息少的女性通常被認爲有一貫的吸引力，而收到消息多的女性往往在男人看來吸引力有分歧。下面再舉幾個例子：

男人對女性長相越有分歧，就有越多的人喜歡她。我們感覺似乎能發現什麼，所以，作爲數學書呆子，穿上運動褲。然後做了一些分析。我們的第一個結論是：對女性評分數和她收到的交友信息數量做標準差比較，發現，男人們對女性長相評價的分歧越多，就有越多人喜歡她。對此繪製的喜好偏差與收到的交友信息的關係曲線如下，再舉一些例子。

圖中沿曲線標識的女性在吸引力排名中大約爲前80%。

這得用一點算術，而且很難用簡單的折線圖來解釋。基本原理是：根據女性得到的投票數，用一個公式來預測女性能得到多少關注量，關注量的計算是基於曲線上的投票數。用這個公式，我們可以把“男人認爲女性長得怎麼樣”翻譯成“她能得到多少關注”。

我們得出的公式看上去不透明，但是用它計算，就會看到人們有趣的觀點，以及男人們會向哪些女性示好。

*******************************************

如果你對代數感興趣

我們以43000名女性的數據作爲樣本用迴歸法分析。爲保證前提一致，所有這些女人是異性戀，年齡介於20和27歲之間，而且住在同一個城市。本文中給出的公式是降低m3，使其p值非常接近1後，第二次迴歸得到的最佳結果。

Msgs是觀察期內女性收到消息數量。常數k反映了她在整個網站的活動水平。對於這個方程, R2 = .28, 這在實驗或問題研究中並不是一個大數字，但應用在真實的社會環境中非常好。

*******************************************

需要搞明白，最重要的是ms代表男人對她長相評價的投票，以此算出她收到的交友信息數曲線，譬如：

那些前面帶正號的投票數（ms）：表示男人會發信息給女性，前面帶負號的：說明要減去信息數量。這個公式告訴我們的有以下信息： 認爲你火辣（hot）的男人越多，你收到的信息就越多。

我們怎麼知道此原理的——m5前面的0.9是最大的正數，也就是說，認爲你很迷人（投票給你一個滿分’5′）的傢伙們是給你發信息最多的貢獻者。這當然是個預測結果，提示給我們:公式是能講得通的。覺得你可愛(cute)的男人，實際上應從你收到的信息中減掉。我們怎麼知道此原理的——因爲m4前面的係數0.1是負數。這就說明，給你投票爲’4′ 的人，認爲你長相高於平均水平的那些人，實際上應從你收到的信息中剔除。非常令人驚訝。事實上，當你把它和m1前面的正數一起看，我們的公式從統計上看能說得通：

如果有人認爲你不火辣(hot)，那麼最好接下來他們認爲：你醜。

這是一個非常瘋狂的結論，但我們每次計算——通過變換約束值，嘗試不同的數據樣本等，這個理論都會顯現生效。

5. 我們的想法是怎麼回事

所以這便是我們的悖論：當有些人認爲你丑時，其他人更有可能發消息給你。而當有些男人覺得你很可愛時，其他男人對你倒是缺乏興趣。爲什麼會出現這種情況？也許得用點博弈論來解釋：

假設你是個男人，並真地對某人感興趣。如果你懷疑其他男人都不感興趣，就意味着更少人來競爭。因此，此想法會激勵你給她發送消息。你可能會想：也許她很孤單……也許她恰好在等待一個欣賞她的人……至少我不會埋沒在人羣裏……也許這些小心思，加上事實上你真地覺得她漂亮，會促使你行動。發給她你精心考慮過的完美的開場詞。

“最近好嗎”

另一方面，’4′票佔多數的女人，通常被認爲可愛，但並不火辣，看上去的情形可能比實際上更受歡迎。一般男人會這樣考慮：她的魅力明顯足以吸引其他人和她交往。但不足以使男人不顧一切地給她發交往信息。這就是可愛的矛盾之處。
整個情形看起來是這樣：

6. 最後：這對你意味着什麼？

我不認爲每個女人都關心是否其他人關注她。但是如果你關心的話，上面的分析有什麼實際意義呢？好吧，從根本上，改變你的整體吸引力很難（也就是開篇我們討論的長相評分）。但是你創造出來的差別是掌控在自己手中的，很簡單，即：把差別最大化:

採用任何你認爲有些人不喜歡的方式，突出展示出來。

正如你可能已經注意到的，帶紋身和穿孔的女性似乎憑直覺把握了這個原則。她們炫耀自己與衆不同之處，纔不管人家喜不喜歡呢。而且她們得到很多人的關注。

但我們的建議可以適用於任何人。瀏覽OkCupid網站時，我發現衆多照片顯然在儘可能減少一些不具吸引力的特徵——一個可能超重的人從生活照中剪切出來的頭像就是典型的例子。我們有些算法表明：消減你的“瑕疵” 達到的效果會是相反的。如果你有點小胖，展示出來。如果你有一個大鼻子，展示出來。如果你有一個奇怪的暴牙，展示出來：從統計學上來說，不喜歡它的男人只會幫到你，那些喜歡它的人會更興奮。

大數據分析，什麼樣的美女最受男生青睞？

1. 咱們從頭開始。

2. 美麗（7分）並不相同

3. 名人照片：拋磚引玉和說明

4. 現實生活的人們

如果你對代數感興趣

5. 我們的想法是怎麼回事

6. 最後：這對你意味着什麼？

智能鞋墊 SuperShoes：我的目標是你的臭腳丫子

【分享】體育領域的文本分類數據

【分享】列車運行控制系統人工駕駛數據

Vicarious：讓計算機擁有想象力

免費語言學習服務Duolingo正式進入亞洲市場

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結