Pinterest是如何打造出硅谷最成功的推薦算法的?

圖片提供:Jordan Speer(https://beefstrong.bigcartel.com/)

和其他大多數社交網絡公司一樣,Pinterest的成功建立在假設和偏好的基礎上。但和大部分社交網絡公司不同的是,Pinterest對此直言不諱。

從一開始,你就告訴了Pinterest怎樣給你建立個人畫像。當你註冊時,Pinterest的網頁會詢問你兩個私人問題——你的年齡和性別——你的回答決定了接下來將要發生的一切。基於你對這兩個問題的回答,以及你所使用的語言、你所在的地區和你的瀏覽歷史,Pinterest會選擇一組主題列表,系統認爲這個列表裏的東西是你所感興趣的,並會讓你挑選其中5個主題。

如果你告訴Pinterest,你是一位30歲的女性,那Pinterest給你提供的興趣主題會包括“化妝”“理髮教程““健身計劃”和“菜譜”。但如果你告訴Pinterest,你是一位30歲的男性,那你會得到非常不同的主題選項:“伐木工”“搞笑圖片”“求生技能”和“遊戲”。或者你可以在Non-Binary Selection(非二值化的選項框)裏輸入自己感興趣的主題,它允許你輸入任何文字,然後你會得到一系列和性別無關的選項,例如“動物”“家居裝飾”“女式髮型”“男式髮型”以及“美甲”。

當你選擇好了之後,Pinterest的機器學習軟件會爲你定製一個首頁,這個首頁裏包含了大量的圖片或者稱之爲pins,Pinterest預測出你會對這些圖片感興趣。這是非常關鍵的一個時刻。Pinterest稱,其內部數據顯示,如果人們能馬上看到他們喜歡的pins,他們就有很大的概率成爲活躍用戶,他們會定期回來看首頁,尋找和他們興趣相關的新鮮內容,也會看到根據他們興趣定製的廣告,打造屬於他們自己的相關pins“面板”。如果人們第一眼沒有找到足夠有吸引力的東西,他們以後就不會再回來了。

每年新加入Pinterest的用戶有500萬,對他們來說,註冊的過程是對Pinterest推薦算法的首次嘗試,這個算法可謂是硅谷最成功的、而且受審查最少的算法了。生成Pinterest主頁Feed、生成搜索結果和通知的代碼,決定了用戶在每次登錄頁面時所看到的圖像和想法。這有些類似於Facebook的新聞Feed、YouTube的推薦以及TikTok的For You頁面。這是一家於今年成功上市,有着150億美金市值企業的主要產品。這家公司也是衆多獨角獸公司裏(比如Uber、Lyft和Slack)唯一一家股價始終位於IPO價格之上的公司。

然而,在幕後,Pinterest的工程師和高管們正在努力應對在其他公司也會發生的一些緊張關係。公司管理層說,他們想要打造一條和硅谷通常的成功路徑不太一樣的路徑,一條不那麼耀眼,但是更人性化的路徑。但是成爲上市公司的第一年,他們就面臨着關鍵挑戰:怎樣幫助公司成長,擴展自己的用戶羣體(過去其用戶羣一直都傾向於郊區白人女性),同時又不會疏遠忠誠的老用戶,或者刻板地看待新用戶,也不會間接導致錯誤信息和激進主義的傳播。

十月份,這家公司嘗試推出一項新功能,用於解決推薦算法可能最顯而易見的缺陷,也就是容易根據用戶過去的行爲推測出錯誤的結論,這個問題會污染用戶的Feed,塞進去一些用戶不想再看到的內容。比如一個用戶解除了婚約,卻繼續給她推薦婚禮服裝;又比如一個用戶流產了,卻給她推薦育兒室的裝飾。Pinterest稱這個新功能爲Home Feed Tuner(首頁Feed調配器),它允許用戶自己審覈和手動編輯過去的活動和興趣,其實就是告訴算法:哪些需要記住,哪些需要忘記。

Pinterest希望這項功能可以讓那一小撥重要用戶減少抱怨,提高用戶滿意度。但是它對網站用戶的擴張幾乎沒有任何幫助,甚至還可能因爲限制算法獲得信息量而減少用戶的粘性。該公司表示這是他們希望做出的一些權衡,特別是早期的一些測試顯示,這項功能並沒有讓用戶活躍度出現明顯下降。

Pinterest計劃宣佈一項新的功能,命名爲“Tune Your Home Feed”,它允許你告訴算法,爲了預測未來的推薦項,你希望算法用到你的哪些興趣和行爲,哪些不希望算法用到。

但事實證明,還有其他更復雜的方面需要權衡。比如深入理解用戶,讓他們更頻繁地再次訪問我們的網頁,同時又不會讓他們覺得厭煩或者限制住他們,使他們不願再來我們的網站。

“用戶們不喜歡被分類,”Candice Morgan(Pinterest的包容性和多樣性主管)說。她在今年早些時候發起了一項調研,這是爲了理解Pinterest如何能夠做到更好地服務於該平臺不太關注的一羣用戶。“他們不希望我們基於人羣分佈來猜測他們的喜好,”她補充道。

但是,Pinterest仍然基於人口分佈來猜測用戶的喜好,至少在用戶註冊後給出的頁面是這樣生成的。如果Pinterest不這樣做,有部分用戶就會覺得Pinterest不是面向他們這些用戶的。

另外,還有些問題困擾着知名度較高的一些社交網站:錯誤信息的病毒式傳播、激進主義、攻擊性圖片和表情包、垃圾郵件以及試圖利用算法盈利的可疑網站。所有這些問題,Pinterest也需要從某種程度上做處理。這家公司在這些方面採取了和競爭對手平臺不同的措施:接納偏見、限制病毒式傳播以及成爲某種程度上的反社交網絡。

到目前爲止,這些措施都是奏效的。

2010年,來自山景城Hacker Dojo的三名年輕的技術小哥創建了Pinterest。起初,Pinterest努力成爲一個分享圖片集合的大衆化平臺,以此來吸引用戶(https://www.mercurynews.com/2012/03/02/silicon-valleys-hottest-social-network-isnt-facebook-its-pinterest/amp/)。後來,來自愛荷華州的聯合創始人Ben Silbermann參加了一場會議,這場會議是專門爲一些女性博主和有影響力的人物(https://altitudesummit.com/)舉辦的,她們馬上就喜歡上了Pinterest,在這之後,Pinterest就發生了變化。Pinterest網站在女性和郊區居民間迅速發展,她們發現在這裏分享食譜、時尚技巧、DIY項目以及家居裝飾的想法再適合不過了。

這些早期用戶塑造了該網站的發展軌跡。由於Pinterest工程師沿用着社交媒體的固有模式,這些模式通過學習用戶行爲來開發出個性化推薦算法,算法所吸收的興趣和活動模式正是來自於這些早期用戶。但是,過度依賴這些早期用戶產生的具體數據也帶來了一些問題。例如,你可能看到滿屏的婚禮服飾照片,照片中的模特卻清一色都是白種人。

起初,該網站首頁會基於用戶們關注的領域,展示來自所有用戶最喜歡的照片分類,這對於吸引具有相同喜好的新用戶來說非常完美,但對於網站用戶的多樣性則沒有幫助。“在男性用戶中存在這樣一個誤解,即Pinterest只會展示一些關於美容等方面只有女性才使用的東西。”Morgan說道,“儘管展示的大量內容都是不區分性別的。”

“用戶們會主動地提供更多個人信息來增加頁面展示的個性化嗎?我們發現答案是否定的——他們希望產品是爲大衆展示的。”

經過這麼多年的發展後,Pinterest不得不重新設計系統和重新訓練算法,從而更好地識別和針對不同類型的用戶,並將他們的興趣反映到頁面上(https://medium.com/@Pinterest_Engineering/building-the-interests-platform-73a3a3755c21)。於是,Pinterest註冊時向用戶提出的問題就變爲了:選擇用戶性別、挑選感興趣的主題(這是給算法提供的第一次關於用戶喜好的數據),以及能否使用用戶瀏覽器裏的歷史數據(儘管這是行業同行標準,但這也許仍有些冒犯隱私),這些數據可以讓Pinterest瞭解到你以前是否瀏覽過Pinterest的網站,還可以讓Pinterest瞭解到你是通過什麼渠道訪問到Pinterest網站的。

舉例來說,關於語言和地理區域的提問幫助Pinterest瞭解美國以外地區的用戶需求,這部分用戶以前抱怨說“從註冊起,他們就覺得這個網站缺少本土化內容(https://medium.com/pinterest-engineering/personalizing-pinterests-new-user-experience-abroad-60f8f55177ac)。”Pinterest現在有一半以上的用戶來自美國以外地區(https://www.statista.com/statistics/995071/pinterest-app-mau-region/),這和其他同等規模大小的社交網絡情況是一致的。在某種程度上,這些用戶爲Pinterest指明瞭前進方向,使之能夠成爲一個更具包容性的社交網絡平臺:例如,在日本,Pinterest發現首次訪問該網站的男性和女性,今後成爲活躍用戶的概率是相當的。

從一開始,你在Pinterest的體驗就由你選擇的性別決定了。上圖是Pinterest爲一名三十歲男性新用戶提供的興趣選項。圖片來自:Pinterest

但是,將用戶劃分爲更細的子羣體這個方式本身也有風險,特別是對於以前就被該網站忽視的羣體。內部數據可能告訴你一組大男子主義的圖片能夠提升男性用戶的活躍度,但是,這些數據不會告訴你的是,有一部分男性用戶對這樣的照片不感興趣,甚至覺得被冒犯了,因爲這部分用戶喜歡所謂的“男性洞穴”或者全都是女性的“美麗明星”照片。

Pinterest正在努力幫助用戶在產品中看到用戶自己。今年一月份,該公司推出了由Morgan和Omar Seyal(Pinterest核心產品的主管)主導的一個產品,這是他們主導的多元化項目的首批產品之一:一個調色板選擇器,它可以讓你基於自己的膚色過濾美容主題的結果(https://newsroom.pinterest.com/en/post/introducing-more-inclusive-beauty-results)。

這是Pinterest向前邁出的第一步,值得尊敬,但根據該公司的調查顯示這一步並不完美。“我們想要了解,用戶們是否願意主動地提供更多個人信息來增加頁面展示的個性化?我們發現答案是否定的——他們只是想讓我們的產品對所有人都一視同仁。”Morgan說道。

Pinterest從沒有受到媒體太多的審視,就像他們對待Twitter和Facebook的“贊”功能那樣,但這並不表示Pinterest就不存在任何問題,它在其他地方還是有些流言蜚語的討論。其中比較著名的批判者是Mike Caulfield,一位來自華盛頓州立大學溫哥華分校的媒體素養和在線交流專家。2017年,他到Pinterest上來尋找政治文化,他找到的結果和你在其他任何社交平臺上看到的一樣醜陋。有些頁面充滿了虛假新聞、種族成見和QAnon陰謀論。

Caulfield認爲,Pinterest激進的推薦算法,加上它對用戶創建的相關照片“面板”的依賴,可以在幾分鐘之內把用戶的Feed變成一個充滿仇恨的污水坑(https://hapgood.us/2017/11/28/pictures-from-pinterest/)。“只需在網上瀏覽大概14分鐘,一位對疫苗感興趣的新用戶就會從‘怎樣完美製作雞蛋’主題轉到某一個充滿硝煙的主題上”Caulfield寫道(https://hapgood.us/2018/08/15/qanon-and-pinterest-is-a-completely-predictable-disaster/)。

Middlebury學院的Amy Collier解釋道,部分問題原因在於垃圾內容利用Pinterest的算法(https://dlinq.middcreate.net/digital-literacy/information-environmentalism-research-fake-accounts-and-mis-disinformation-on-pinterest/),把流傳甚廣的政治表情包放在一個照片面板上,同時也把他們想賣的東西(比如T恤)放在同一個照片面板上。當用戶看到了這類表情包,算法會給用戶展示同一個面板上的其他照片,因爲算法認爲這些用戶對同一個面板上的其他照片也會感興趣。最終,算法就會給用戶展示這些T恤,其中一部分用戶會購買這些T恤,垃圾內容投放者就可以從中獲利。

Caulfield說道,科技公司會忽視他的批評,或者採取防守態勢,這些他都已經習慣了。所以,Pinterest的反應讓他着實吃了一驚:他們感謝他提出這個問題,並且邀請他會見公司高管,分享想法以解決這些問題。後來,至少在反疫苗這件事情上,該公司從頭到尾進行了跟進。

八月份,Pinterest對搜索引擎處理疫苗相關搜索的響應方式(https://www.theguardian.com/society/2019/aug/28/pinterest-anti-vaccine-combat-health-misinformation)做了一些修改。Pinterest表示,修改後的搜索引擎不會展示那些疫苗主題中最受用戶喜愛的pins,而只會展示來自主流健康組織的pins,例如世界衛生組織和CDC(美國疾病控制與預防中心)。Caulfield讚揚了Pinterest的做法,與其他大多數平臺的做法相比,這是一種更爲果斷堅定的做法。它顯示出該公司願意重寫自己的軟件來解決系統性問題,而這些問題光靠算法本身是無法解決的。

對於一個擁有3億用戶的平臺來說,這個方法在多大程度上能夠適用於該平臺的其他所有問題,還有待觀察。但是,PInterest似乎願意找出答案。

“現實是,科技公司不可能做到地球上所有的事情。”

社交媒體公司的傳統觀點是,你不能給用戶賦予太多責任,讓他們定製他們自己的Feed。Facebook打造了一個新聞Feed算法,這個算法比用戶更瞭解自己,算法更清楚用戶會點擊什麼,Facebook已在這方面確立了全球主導地位。Instagram和Twitter多年來一直拒絕使用Feed算法,但是這兩家公司最終都用上了自動化(https://onezero.medium.com/how-twitter-solved-one-of-its-oldest-problems-7ca8b3dd0604),並且他們的用戶基數和財富值都有了提升。用戶做出的每個操作都等於是進一步打磨了用戶參與度優化機器,而允許用戶對中間過程的過多幹預只會把事情搞砸。

Pinterest和其他社交平臺一樣,通過諸如月活用戶數和活躍度來判斷其平臺價值,正如一篇發表於一月份的博客(發表自該公司首席工程師,http://jwegan.com/growth-hacking/27-metrics-pinterests-internal-growth-dashboard/)所說的那樣。從歷史上來看,該公司的算法一直在打磨用戶的Feed,向他們展示越來越多的他們過去參與過的主題。對於這類事情有一些常見的批評:優化參與度會導致用戶盲目地或者成癮地滾動頁面,而且可能還會讓用戶陷入過濾氣泡中,其中充滿了錯誤信息(或者更糟,https://onezero.medium.com/why-conspiracy-theories-work-so-well-on-facebook-466a42af6b76)。

但是,如果優化參與度並不是最終的目標,那情況又會怎樣呢?這是其他的一些社交網絡,如Facebook和Twitter最近提出的問題,因爲它們正在分別考慮更多定性的目標,如“時間花得是否值當”,以及“健康對話”等。Pinterest公司核心產品主管Seyal表示, 這爲他們這周要推出的新功能鋪平了道路。

多年來,Pinterest用戶最常抱怨的內容之一就是,用戶對算法給他們展示的內容缺少控制,Seyal說道。“你點擊某個東西,你的整個Feed就充滿了那個東西相關的內容。”這裏的挑戰在於如何在不影響算法效率的情況下解決這個問題。“每位運營過在線平臺Feed的人都會說,‘噢,是的,我們嘗試過增加控制性。但當我們嘗試啓動這個功能時,用戶參與度卻大幅下降了。’”

最後,Seyal說道,他認爲上面這個問題是完全錯誤的。相反,對解決用戶控制問題的工程師們,他告訴他們不要擔心用戶參與度的問題。他們唯一的工作就是找到一種修復方式,用來減少用戶對Feed過度糾錯的抱怨。

這個項目催生了“調整你的首頁Feed”功能,這個功能已經對一些用戶開放使用了。(如果你能使用它,你可以在這裏找到它:https://www.pinterest.com/edit/。)Pinterest允許用戶微調算法對用戶每次操作的響應方式,它將提供一定程度的定製化,很少有公司會去部署這樣的功能。但是,Seyal說,在測試中我們明顯看到,使用這個新功能的用戶中很大一部分都是曾經對此有過抱怨的用戶。他們也變成了Pinterest最忠誠的用戶之一。在經過所有這些測試後,我們還沒有發現用戶參與度受到任何明顯的影響。

現在Seyal把它看做重要的一課。“這是一種示範,希望其他平臺也能對用戶更加開放。這個問題很難,但是人們正越來越多地琢磨出好的解決方案。”

Pinterest現在給予了用戶更多控制權,但像任何社交網絡一樣依賴於算法驅動的推薦,它最終也依賴於某種偏好。和同類公司不同的是,Pinterest歡迎這種偏好——只要它是合適的。

“我們終究是用戶生成內容的平臺,”Seyal說道,“我們不可能理解每一件事情。我們確實會碰到垃圾信息散佈者,他們想利用平臺來散佈負面內容。其中有一些甚至是充滿敵意的。”

他說道,爲了緩解這些問題,Pinterest能做的是,仔細研究其系統傾向放大的內容類型,調整算法參數,使某些內容優先於其他內容。

例如,Pinterest的算法會給“保存”pins的操作(相比“點擊”操作)更多正面的信號。“人們其實不大會保存關於總統的煽動性文章,但他們確實會保存一套將來想要購買的衣服。所以我們更偏向於這種類型的互動,而不太偏向於你和你朋友間的互動。”

對於一家社交媒體網站來說,清除掉朋友間的互動看上去是一種奇怪的做法。但是,Pinterest認爲這是公司緩解騷擾和病毒式傳播而採取的一部分措施。“最終,我們不會像在其他平臺上那樣看到錯誤信息的傳播,因爲我們的算法不會獎勵這種行爲。”Malorie Lucich(Pinterest產品溝通主管)說道,“當你試圖大量發佈垃圾信息或者干擾用戶時,你可能希望這些垃圾內容能夠顯示在首頁上,但這在Pinterest上不太容易發生。”

即使是在“點擊”操作的範疇中,該公司軟件也會更加重視“高質量”網站(相比其他網站)的點擊。無論何時Pinterest要測試算法的某種更改時,他們會查看這個更改是如何影響某個人工挑選的著名網站目錄的出站流量的,這樣的網站專注於生活方式、時尚以及家居裝飾等方面。(儘管Facebook嘗試通過調查用戶來建立“信任源”https://www.washingtonpost.com/news/the-switch/wp/2018/01/24/facebook-defends-its-simple-2-question-survey-on-the-trustworthiness-of-news-publishers/,Pinterest卻承認它依賴於老式的、主觀的和人類的判斷。)如果算法的這項更改給那些網站發送的流量減少了,而向其他網站發送的流量增多了,產品團隊就會去調查其原因。這可能會是一個跡象,它表明這項更改讓一些信譽較差的網站鑽了空子,使它們能夠利用該算法。

所有主流社交平臺都會故意修改軟件,不管它們是否承認這點。像Zeynep Tufekci這樣的評論家提出了一個有說服力的理由(https://www.ted.com/talks/zeynep_tufekci_we_re_building_a_dystopia_just_to_make_people_click_on_ads?language=en),社交媒體的很多問題都來自於它們不願意承認算法中使用的基本偏好:不喜歡自由政治,或者保守政治,而是喜歡吸引眼球——越來越多的眼球。

像谷歌、亞馬遜、Facebook和Uber這樣的公司正是以其不設定邊界的野心和看起來無限的增長而著稱。Pinterest也有同樣宏偉的想法。“我們可以在我們所做的事情上做得更好:新的形式、新的交互方式以及除了pins以外的其他東西。”Seyal相信,Pinterest的算法未來不僅會反映用戶的品味和時尚,而且能幫助用戶塑造它們,正像頂級時尚品牌做的那樣。他向Spotify的人工播放列表看齊,比如頗具影響力的RapCaviar(https://www.vulture.com/2017/09/spotify-rapcaviar-most-influential-playlist-in-music.html)。

但是隨後,他停頓了一下。他補充道,隨着Pinterest的發展,關鍵的一點是要記住自己的短板。“我認爲我們只會去做我們能做好的那部分。如果你想讓每個用戶時時刻刻都在使用你的產品,那你就太不謙遜啦。現實是,科技公司不可能做到地球上所有的事情。”

原文鏈接:

https://onezero.medium.com/how-pinterest-built-one-of-silicon-valleys-most-successful-algorithms-9101afdfd0dd

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章