2016ATF阿里技術論壇於4月15日在清華大學舉辦,阿里巴巴搜索事業部資深總監、清華校友司羅,向我們講述瞭如何構建電商大腦,讓整個電商生態更加智能。比你更懂你,來源於在數據、計算與人工智能的完美結合。
下面請看司羅的圖文演講。
司羅:我們阿里的業務剛纔阿白講,是環繞全球的,阿里的技術團隊也是全球跨地域的,我們有來自各個地方的阿里同事一起用技術的力量,在阿里這個大舞臺上爲大家創造價值。很高興回到我的母校清華大學,還深深記得我大學時的老師精彩的課堂講解和教導,記得當時我們上人工智能的課,我們老師講了一個案例非常有意思,用人工智能的方法來解釋他的小孩如何學家鄉話,這麼多年過去了,他的小孩已經長成了大小夥,人工智能和大數據在社會生活方方面面也有巨大的應用和進步。
今天非常榮幸來到這裏和大家分享大數據在阿里的應用。新的世紀是大數據的時代,我們把數據和算法看作生產資料和生產力的關係,如果沒有智能算法,我們只能簡單的累加數據,30年來,我們屢次見證了智能算法的力量,改變了人們對智能的認識,阿里巴巴在大數據上進行了非常多的創新。阿里電商的豐富場景提供了非常豐富的大數據,爲我們創造了在大數據舞臺上創造更多價值的機會。
我們所做的個性化算法,我們希望通過在線學習抓住消費者的心理,我們知道電商有各種各樣的頻道,有各種各樣的行業,比如說天貓超市或者阿里汽車等等,原有的推薦很多都是人工來控制的,但是我們發現在實際的工作中,這種簡單的設計是不全面的。比如說在下午2點鐘左右是主婦消費羣體,晚上8點鐘左右是下班白領消費羣體。所以說我們需要對不同的消費羣體進行分析。我們的目的是從不確定中尋找規律。比如有一個賭客,來到賭場裏嘗試了一些賭博機。要最大化收益,他既希望把錢花到已經嘗試的收益好的賭博機上,也希望嘗試新的可能帶來更好收益的賭博機。
在實際的應用中,每一個應用都有它自己的特色,比如說在電商領域,我們知道一個商家的連衣裙是非常熱銷的,我們也預估同個店鋪的一個連衣裙新品可能熱銷。我們設計了HierarchicalContextual Banding Learning算法。我們說的這個算法,去年在阿里一個每天有上千萬的流量的頻道上線,每天能多產生近千萬級的銷售額,這裏可以清晰的看到算法的力量。
那麼第二個實例是手淘無線推送,無線推送就是在用戶沒有打開app的情況下,也能夠推送信息主動觸達用戶。無線推送是一種非常重要的引流工具,我們的目的是希望在準確的時間向準確的用戶發送準確的消息。我們把用戶帶到手機淘寶,這樣的話可以提高用戶瀏覽率的目的。這是我們去年時候的給一個用戶推送一個分味小吃的食品的例子。手淘推送是一個非常重要的功能,它原有的工作方式是人工加簡單規則,比如說阿里汽車等等,他們都希望自己的活動能夠送達適合的人羣,但是每個業務方他們由於受到資源的限制,他們無法精確計算適當的人羣。而且我們希望一個用戶只收到一個信息。所以原來簡單人工的方法就是哪個業務方的活動先發,哪個活動拿到用戶,這種方式造成資源浪費,無法進行更好的最大化全局利益(如總打開數)。我們做個性化的方法,能夠根據消費者在阿里全網的信息,能夠準確的分配各種活動到相應的用戶,這種算法很大程度上提高了消費者的整體推送打開數。
下面我們講一些有關模型方法的內容,它的目的是對於一系列的活動,希望把這些活動分配給消費者,能夠把消費者最感興趣的一個活動,僅僅一個活動能夠送達到這個消費者,所以如果我們把這個弄成數學模型,那麼我們在這個活動中,表示着我們究竟應該向什麼樣的用戶發送什麼樣的信息。
我們的目標是希望最大化整體打開數,同時我們還有各種各樣的方式來保證,活動應該選到適當的人羣,也不要超過太多的人數。當然我們還要保證用戶收到的是僅有一個的活動。我們通過優化的方式來實現,非常有效的幫助引流人羣的需求,以及全局利益最大化的目的。
消息推送本身也是非常豐富的應用,一個方式是把圖片加入消息推送中,一個信息本身包含了文字的信息,又包含了圖片的信息,我們在算法上對於圖片和圖,文字的內容進行了聯合建模,能夠提升用戶的體驗,打開率可以提高推送10%—20%。
還有一個就是基於地理位置信息的推送,我們從兩個方式達到這個目的,一個是長時的LBS信息建模,還有一個就是更進一步的即時的LBS信息建模,比如說在一個商圈附近,我們知道這個消費者在線上對一個品牌感興趣,如果剛好這個商圈附近一個線下的店鋪做這個品牌推廣,我們就把相應的信息推送給消費者,這樣就形成消費者和信息的匹配。所以我們會做到更精準的推送,這樣會比推送線上商品收到更精準的效果。
最後一個我簡單介紹一下,我們現在做的一個創新項目,淘寶頭條,如果大家使用手機淘寶,你會發現有一個淘寶頭條的欄目,淘寶頭條的欄目是定位在生活消費資訊平臺,能夠更好的吸引消費者,提升消費者體驗。
那麼淘寶頭條目的是爲了讓消費者看到該看的信息,找出消費者該看的想看的頭條,同時我們也希望反向預估特定的人羣他們所希望看到的信息,這樣的話達到創造明日頭條的目的。
下面一個關於算法的例子驗證了多視角算法在阿里電商方面的運用。我們有一個同事剛生了小孩,一兩個月的小孩得了比較重的過敏症,所以說醫生囑咐就要買比較柔軟的浴巾,他在手淘上購買了非常柔軟的紗布浴巾。下一次他登陸手淘時,頭條就給他推薦了“過敏寶寶添加輔食,必須注意這5點”的頭條內容。以前他並沒有搜索或用其他方式表示小孩過敏的情況,可是算法的力量能夠給他提供他需要看,也是想看的內容,這是怎麼達到的呢?
是因爲我們的算法能夠精確的發現,購買行爲和瀏覽之間的關係,我們發現有很多的用戶,他們購買了像全棉浴巾這樣的東西,我們發現他們對小孩過敏的資訊感興趣,我們把購買行爲和閱讀行爲進行精準的連接。
我們頭條算法經過了多次的迭代,小步快跑,最開始的算法只是把頭條內商品的ID羅列出來來連接消費者。但很多頭條沒有的商品ID,我們只能通過這些內容信息更好的連接頭條和消費者。同時我們也實現了在線學習的功能,用來提升用戶體驗。這些算法的效果是非常明顯的,我們淘寶頭條UV大約一年左右的時間增長到原來的4倍,非常顯著。能夠爲消費者創造更多有趣,有意思的頭條,同時也能產生更多,更大的商業價值。
上面我只是介紹了三個的例子,整個阿里的電商算法應用是非常廣泛的.希望以後有機會和各位老師同學多合作。
阿里搜索事業部求賢若渴,請聯繫 [email protected]。