百度祕密研發推薦引擎技術 2011年組建百人團隊

6月19日消息,百度主任架構師、推薦引擎負責人廖若雪今日接受媒體採訪時透露,百度從去年起抽調技術人員成立獨立研發團隊,研發“推薦引擎”技術,目前團隊百餘人。百度推薦引擎是一項底層技術,目前已經在音樂隨身聽、百度知道、百度新首頁等項目中應用。

什麼是推薦引擎?

推薦引擎是主動發現用戶當前或潛在需求,主動推送信息、應用和服務給用戶的互聯網技術。跨領域推薦是在推薦引擎基礎上,強調利用通用的推薦技術,進行信息、應用和服務的跨平臺推薦。

百度爲什麼涉足推薦引擎技術?廖若雪介紹,人們在互聯網上獲取信息的方式大致經歷了三代,第一代以分類目錄爲代表,那時的全網信息量僅數萬個網頁;第二代即今天使用的搜索引擎,網頁數高達數百億,同時集成了圖片、視頻、應用等更多媒體內容;下一階段網頁數將超過數百萬億,搜索結果中符合要求的內容可能成百上千,用戶需要花費大量時間去尋找最適合自己的搜索結果,解決之道就是推薦引擎。

目前,百度、Google、有道、bing、搜索、Yahoo都是以搜索滿足用戶的主動表達需求。在國外,以推薦挖掘並滿足用戶潛在需求的如亞馬遜、Pandora、NETFLIX等。

“推薦依賴用戶個性化需求。那些用戶無法表達,或表達出來非常複雜的需求,我們定義爲潛在需求。”廖若雪說。

百度推薦引擎應用於百度知道、百度新首頁

廖若雪介紹,百度推薦引擎有三個特點:一是跨領域,多語言、多媒體、全產品形態。亞馬遜進行商品推薦,Pandora進行音樂推薦,百度進行跨領域推薦;二是平臺化、通用算法、歸一化數據;三是智能化,智能需求感知,滿足用戶需求。

百度推薦引擎於2011年開始研發,早期實踐於音樂隨身聽,自適應用戶喜好變化、採用音樂專家系統技術。近期,推薦引擎實踐於百度新首頁、百度知道。

以百度知道爲例,百度方面透露數據,從一個用戶在百度知道上提出問題,到這個問題被合適的回答者看到,平均需要12個小時;而推薦技術應用到百度知道後,時間縮短到最多不超過5分鐘,回答率提升了50%。

“當用戶使用搜索引擎搜索時,瀏覽網頁時,在移動終端上提交他的位置時,都有大量的行爲動作。 根據用戶的行爲提交,再規避掉他們的隱私數據,用一定的算法匹配,就能夠智能地感知用戶需求,並在短時間內給予他們需要的內容。”廖若雪說。

百度跨領域推薦引擎依託於百度原有的用戶數據庫。百度搜索引擎儲存了上千億的網頁,每天處理100PB級數據。目前,百度推薦引擎是一項基礎服務,融入到搜索中,尚未開發獨立的產品。“當傳統形態不適合時某項服務時,可能打造以推薦爲核心的產品。”

廖若雪透露,如果百度推薦引擎發展成熟,不排除以開放平臺模式與國內垂直網站合作,如京東商城等電子商務網站。

推薦引擎技術處於早期階段

廖若雪說,推薦引擎還處於發展早期。“百度走的早些,但大家都處於0起跑線沒跑幾步的狀態。豆瓣電臺、電子商務網站做了很多工作,但還沒有人做到及格,推薦引擎還是非常新的領域。”

廖若雪描述了未來推薦引擎的一幅畫面:如果你是韓劇愛好者,不用再繁瑣的查詢,就能即使獲得最新韓劇推薦;查詢“好看的電影”,就能獲得符合該用戶喜好的電影;搜索“怎麼向女友求婚”,就能獲得一套針對你和女友量身定製的方案。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章