比圖文推薦更難,考拉FM如何實現車載音頻個性化產品?

推薦系統發展了二十年,極大的提升了主流應用的效率,亞馬遜通過推薦系統銷售收入提升35%,Youtube主頁上60%的瀏覽來自推薦服務…到現在,各主流應用基本都用到了推薦系統。我們知道,在個性化推薦中,與用戶的交互非常重要。比如在淘寶購物中瀏覽和購買的物品,以及點擊的“喜歡”和“不喜歡”,都會成爲提升推薦精準度的關鍵。但是在車載環境中,爲了安全起見,主動用戶行爲很少,這種推薦系統產品構建好的關鍵是什麼?一直深耕車載音頻領域的考拉FM是一個典型案例。

2013年6月正式上線的考拉FM(去年升級改名爲聽伴)是一家音頻內容分發平臺,擁有大量的音頻內容資源,每日服務全國數百萬的車載收聽用戶。最開始他們通過手機與車機互聯的方式,向車主提供車載特色精品內容。但由於交互路徑過長,通過手車互聯來映射內容的方式,用戶活躍率並不理想。隨後聽伴改變了策略,通過前裝的方式與車廠合作,將音頻應用預裝到車機裏,同時提供內容推薦算法應用,爲聽衆提供想聽的內容。

聽伴的推薦從場景化與智能電臺流兩方面着手。比如長時間開車是一件枯燥的事,遇到堵車容易產生焦躁情緒,這時候就需要播放一些娛樂放鬆性的內容。場景化是基於車載特點,打造專屬內容庫,結合車主的時間+地點+人物的個性需求,分場景打造內容。聽伴副總裁李建剛表示:“我們有一百多個場景,在不同的場景下推薦規則不一樣。不同的天氣、地點、路況,推薦內容都不一樣。舉個例子,車主在四環上開車,路況很擁擠,聽伴會自動推薦一些堵車時車主愛聽的內容。另外,早晚高峯的場景差異是很明確的。做到這一點非常難,比圖文要難,這也是聽伴非常核心的技術。

在手機上用戶可以通過點播專輯收聽,換節目的成本比較低,隨時可點擊切換到下一個。在車上並不方便“點播”,用戶在不同專輯之間切換的操作很麻煩。這時候就需要流式收聽。流式收聽類似於Feed流,基於這一點聽伴做了獨有的智能電臺。手機上大家都是點播,在找特定節目,電臺流不會受歡迎。但對於車載,電臺流這個形式卻是最合適的。智能電臺以車主畫像爲基礎,結合場景化,用個性化推薦進行主動推送,用語音進行交互。

李建剛曾介紹,聽伴在北美設有專門的實驗室研究個性化推薦,他們的音頻個性化推薦大體流程分四步:

  1. 用戶標籤:由程序初步給節目打上標籤,編輯團隊再次人工複檢標籤的質量,維度的完整性等。
  2. 用戶畫像:通過汽車廠商初步共享的用戶畫像信息(脫敏後,不涉及隱私),比如性別、年齡、城市等標籤幫推薦引擎冷啓動。
  3. 用戶行爲:用戶紅心/完整收聽了某一檔節目/語音主動搜索/主動點播被視爲正向反饋;用戶經常跳過某一檔節目被視爲負向反饋。
  4. 特徵維度機器精排:通過機器學習驗證所有特徵維度的有效性,在粗排候選集的基礎上通過特徵維度的打分對候選結果進行精排。輸出精排結果即爲實時推薦的節目單。

最初在車載端使用的是手機端一樣的一套推薦模型。但車載場景特殊,後來發現推薦的結果非常收斂,覆蓋率和多樣性都出現了問題。經過分析,發現是因爲交互少導致的。對於如何趟過這個坑,李建剛說:“針對這種情況,我們就摒棄了手機端的那套基於用戶主動行爲的推薦模型,而重新去思考、開發針對車載端這種用戶少交互,更多伴隨式收聽的推薦模型。在這個過程中,大數據對我們構建推薦模型起了及其重要的作用。基於考拉十多年車載音頻娛樂服務的數據,我們針對數百萬車載用戶行爲做了挖掘與學習,產生了非常有價值的結果”。針對交互的問題,未來聽伴會加入語音交互。他表示“一個推薦系統中,算法、交互、數據都是極其重要都因素,但最關鍵的還是需要對使用場景的深入理解”。

InfoQ:個性化推薦產品在聽伴的定位是什麼樣的?重要性程度如何?聽伴有哪些利用推薦系統技術的頻道?

李建剛:在車上,用戶的交互成本非常高,主動交互的頻次很低,要讓用戶有優質的收聽體驗,個性化推薦就非常重要,所以基於車載場景的音頻個性化推薦是我們非常重要的產品。

和手機上的展示類推薦相比,音頻的推薦會更復雜。

手機端的推薦模型,我們主要基於用戶反饋,爲用戶發現和展示內容;但在車載端,我們必須根據車載伴隨收聽的特性,進行音頻流式推薦,這種推薦用戶不會主動點擊,推薦出來的內容,直接給用戶收聽。因爲沒有用戶主動點擊的行爲,要有好的體驗,對推薦的要求非常高。

我們的推薦產品,主打兩款智能網聯車載音頻新品K-radio和品牌電臺。K-radio以場景化+智能電臺流技術給用戶提供簡單、便捷的車載音頻娛樂服務,擁有車載直播互動、AI電臺流,多源內容融合、娛樂語義滿足、帳號雲端互通五大核心能力。它的特點一是可以私有化部署,用戶數據部署在車企自有服務器,隔離起來以保護用戶隱私;二是支持SDK+APP+車載桌面多種合作模式,同時可以很方便地集成;三是一站式音頻娛樂信息服務解決方案,可以將音樂、電臺整合到一起收聽。

InfoQ:一些人也用過手機上的FM,那麼車載端FM和手機FM相比有哪些差異?

李建剛:我們同時有做車載和手機端,手機跟車載差異很大,場景、使用方式、服務形態都不一樣。手機是個相對專注的場景,主動點播行爲會更多。在車上點播收聽偏少,更多是伴隨式被動收聽。手機上進行推薦的核心邏輯是挖掘用戶行爲,召回用戶會喜歡的內容。基於所有用戶對推薦結果的點擊行爲,進行排序優化。車載上進行推薦的核心邏輯是通過建立車載娛樂知識圖譜,召回特徵相關的內容,基於用戶自身主動行爲,優化推薦結果順序

手機/PC推薦 車載推薦
用戶意圖 從海量數據中,幫助用戶決策,找到想要的信息 在有限的路途時間裏,推薦優質內容
行爲特點 注意力集中,隱式/顯式主動行爲豐富 注意力在駕駛上,主要行爲是伴隨式被動收聽;用戶行爲很少
時間 隨時隨地 通常駕車時間不會太長
形式 基本以點播爲主 流式,持續收聽
內容 廣度長尾內容 頭部精品內容
維度 用戶和行爲 用戶、行爲、車和場景
模型特點 個性召回,共性排序 共性召回,個性排序
核心邏輯 挖掘用戶行爲,召回用戶會喜歡的內容。基於所有用戶對推薦結果的點擊行爲,進行排序優化 通過建立車載娛樂知識圖譜,召回特徵相關的內容。基於用戶自身主動行爲,優化推薦結果順序。

InfoQ:推薦的內容如新聞類、情感類和音樂類,針對不同的內容,技術上最大的區別在哪裏?
李建剛:

新聞類:時效性很強,選擇基於分類、主題、關鍵詞等維度表示一篇新聞;通過自然語言處理,提取新聞要素,結合知識圖譜消岐,另外新聞的消費時間屬性很強,不同的時間段對新聞類型的需求也是不同的,比如早間希望聽資訊內容,晚上喜歡聽娛樂內容等。
情感類:深挖用戶畫像,尤其是社會方面的特徵(婚姻、家庭、社交)。
音樂類:挖掘用戶開車出行時的場景、車速、位置甚至天氣等,結合音樂內容的場景化表示,推薦出此時此刻最符合車載下的音樂內容。

InfoQ:一個典型的音頻推薦系統架構是怎麼樣的?您是否能給出圖片來解釋?

李建剛:

image

我們的推薦架構從底層到上層,分爲數據平臺、數據挖掘和推薦投放。
數據平臺提供用戶行爲數據的存儲、分佈式/流式計算的能力。
數據挖掘是利用數據平臺的大數據,結合機器學習和自然語言處理等技術,構建用戶畫像、訓練模型等中間數據,並提取領域知識。通過nosql、搜索引擎、key-value緩存等中間件提供給推薦投放系統。
推薦投放,是基於Actor模型的的併發框架akka,利用數據挖掘層的訓練模型和知識圖譜,提供高可用、可擴展、低延遲的結果內容投放能力。

InfoQ:音頻推薦系統,一些先驅是如何做的,考拉FM做過哪些獨特嘗試?
李建剛:音頻領域做得比較多的,是針對歌曲的推薦。目前流行兩類模式:第一類模式是專家對歌曲進行多維度標記,然後基於這些標記做相似度計算並進行推薦,譬如pandora就採用了這種模式。第二類模式是基於協同過濾算法進行推薦,譬如網易雲音樂就採用了這種模式。

但音頻內容,和歌曲還是有較大差異的,譬如用戶很少重複收聽同一段內容,但會反覆聽同一首歌。所以對音頻內容的推薦,和歌曲推薦就會不一樣。而且在車載端,用戶的行爲相對較少。因此爲了更精準地滿足用戶的需求,一方面,我們獨創了共性召回、個性排序的推薦模型。另一方面,我們把用戶場景納入了推薦模型裏,讓場景成爲推薦維度裏的重要因素。

InfoQ:音頻推薦系統中,跟蹤用戶的偏好主要是通過隱式的方式進行獲取。而聽伴有細分到上百個不同場景,那麼如何確定不同情景,根據哪些因素判定情境,並進行個性化推送並滿足聽衆的不同需求的?

李建剛:場景推薦,是聽伴針對車載行爲獨家推出的內容推薦產品。車載行爲和手機端行爲並不一樣,用戶需要專注於開車,行爲被車載場景所限制,對屏幕和內容的控制力都大爲降低。我們針對這種情況,從推薦邏輯及內容層面,都做了針對性的優化。

針對場景的推薦,主要從用戶屬性、車輛屬性,車主當前所處的開車場景等多個維度,去做內容的推薦。爲了能完整的用戶畫像、場景等,我們除了利用用戶的收聽數據之外,我們還需要和車的信息深入的結合,從各個維度信息挖掘用戶當前的狀態和駕車場景,全面瞭解用戶畫像和當下需求。爲了精準推薦內容,我們會根據幾十個不同維度的特徵進行判定,比如時間、天氣、路況、車速、目的地、車主心情、乘客情況等。比如,我們可以結合位置信息和區域天氣,推薦不同天氣場景的電臺內容;還可通過LBS信息及衍生出的車速、軌跡信息來判斷用戶的行駛狀態,是城區還是高速公路,是通暢行駛還是擁堵狀態,以此推薦適合不同心情的音頻內容。

InfoQ:接上,針對不同場景,聽伴如何將音頻內容進行分類、相關性判定、標定、評分、排序的?
李建剛:不是所有音頻內容,都適合在車載場景進行收聽。譬如恐怖驚悚類,就不適合夜晚開車的情景去收聽。有些長篇內容,也不適合短途開車行爲收聽。但在長途駕駛時,類似人物傳記等的長篇,就會有用戶去收聽。因此我們會從聲音及內容兩個維度,做細緻的梳理,包括聲音及情緒、內容類型、上下文關係等特徵。

InfoQ:(車載)用戶行爲分析主要是哪幾方面。依行爲分析作出什麼action?
李建剛:我們主要分析用戶的內容選擇、內容訂閱、內容切換、收聽時長、完播率、語音搜索等行爲。所有的行爲都會作爲用戶畫像特徵的計算依據,經過離線或實時計算,從而優化用戶畫像。

InfoQ:聽伴如何度量推薦結果?通過哪些度量方法?
李建剛:推薦流量下,可以通過如下指標評估:完播率,點擊率,播放時長,收聽留存,日總負反饋次數等.

InfoQ:構建一個優秀的音頻推薦系統產品,您覺得最關鍵的成功因素是什麼?
李建剛:對於一個成功的推薦系統來說,算法、內容和產品策略,三者缺一不可。但是最關鍵的還是需要對使用場景的深入理解,如果不深入理解用戶的場景,一定不能滿足好用戶的需求,對我們來說,車載場景和手機場景就有非常大的區別,完全照搬手機推薦的場景肯定不行,所以我們針對車載場景的獨特特性,設計了一套適合車載的推薦系統,已經在用戶那裏得到了很好的反饋。同時,一個推進系統一定需要持續迭代。基於數據的反饋,不斷優化內容、產品策略及算法,就可以讓推薦產品持續的進步。

InfoQ:未來計劃裏,您們最想攻克的推薦系統問題是什麼?
李建剛:在車載端的用戶行爲,與手機端/pc端完全不一樣,因此不能用手機端或pc端的推薦模型來做。針對車載端,我們思考了很多策略,構建了很多的模型,但針對車載行爲的場景化推薦及有多個乘客時的推薦,是我們最希望取得成功的領域。尤其是開車行爲,與很多因素相關,譬如車況、天氣、速度、目的地等,而不僅僅是用戶興趣或意圖相關聯。如何把各個因素融合進推薦模型裏,去優化推薦結果,是我們重點關注的。

本文系 “推薦系統”專題系列文章之一:
進擊的下一代推薦系統:多目標學習如何讓知乎用戶互動率提升 100%?
阿里媽媽新突破:深度樹匹配如何扛住千萬級推薦系統壓力

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章