大數據驅動的運營創新和探索

摘要:以“數字金融新原力(The New Force of Digital Finance)”爲主題,螞蟻金服ATEC城市峯會於2019年1月4日上海如期舉辦。財富管理專場上,螞蟻金服財富事業羣高級技術專家陸鑫做了主題爲《運營科技的創新和探索》的精彩分享。

演講中,陸鑫分別從數據協作,智能營銷和運營分析等幾三個方面介紹了運營科技如何助力運營“自動運營”,螞蟻金服希望未來幾年將運營往自動化方向引進,減少運營工作壓力,節省成本。
在這裏插入圖片描述
陸鑫 螞蟻金服財富事業羣高級技術專家

本次直播視頻精彩回顧,戳這裏
以下內容根據演講嘉賓視頻分享以及PPT整理而成。

本次的分享主要圍繞以下四個方面:

一、背景簡介

二、數據協作

三、智能營銷

四、運營分析

一、背景簡介

作爲工程師,要對接的對象是運營同學。運營同學每天都非常忙,他們每天有各種方案需要彙報,各種的設計稿需要修改,以各種預算需要去申請。工程師思想通常是把複雜事件用簡單的技術方法解決。所以螞蟻金服希望用運營科技去助力運營,通過技術方法自動的幫助運營省去很多繁瑣的工作。
在這裏插入圖片描述
通常來說,自動運營分爲三個方面。做自動的運營首先需要有數據,數據目前螞蟻金服依賴機構的數據和螞蟻內部數據。那如何對兩部分的數據做更好的協作,並且幫助機構描述更好的用戶畫像以及更好的用戶的事件?第二個是智能營銷,即如何藉助人工智能的技術給用戶更適合的圖文物料和更合適的文案,以及如何確定紅包的大小?第三個是運營分析,只有順利得到線上用戶的反饋,才能更好的讓運營系統更好的迭代優化。
在這裏插入圖片描述

二、數據協作

1. 數據協作是機構和平臺聯合運營用戶的基礎

金融學領域經常會抽象這個世界。作爲運營工作,螞蟻金服與金額機構進行了很多運營方面的討論和金融技術的討論。運營中有三個實體。一個是什麼樣的人,要針對什麼樣的人做這個事情。第二個是發生了什麼事情,比如說用戶購買了第一筆基金,做了定投,登登錄支付寶等等都是用戶發生的一個事件。第三個用戶在某個時間點做了一件什麼樣的事情(action)。

如下圖,橫座標描繪了一個用戶的成長路徑。成長路徑是指新用戶成長爲成熟用戶的過程。螞蟻接觸了大量的小白用戶,他們一窮二白,可能有錢,但是無法知道在它們理財領域有什麼樣的知識。另外一端是成熟用戶,通常做資產配置,做組合或者做定投的用戶可以認爲是理財成熟用戶。螞蟻金服希望將小白用戶逐漸推進到成熟用戶。通過定義事件,描述用戶發生了什麼事情。首先將螞蟻平臺的數據和機構數據融合起來,完善用戶畫像。第二個,對平臺做結構化抽取,並讓機構定義自己的事件。比如,有一個用戶在螞蟻或者在機構清倉了,那麼螞蟻需要挽回這個用戶,在用戶下一次登陸支付寶時,給他發送陪伴的文章或者紅包,讓用戶意識到還有一個這樣的機構在陪伴他。螞蟻一直嘗試在持倉頁面陪伴用戶。比如市場上發生了大的波動,很多小白用戶很容易清倉或者拋售,這時螞蟻在持倉頁面上推送一些陪伴的文章,告訴用戶市場上發生的事情只是短期波動而非長期。通過數據協作試圖將機構數據和螞蟻平臺數據進行融合,準確描述用戶的成長路徑。
在這裏插入圖片描述

2. 數據流通釋放數據價值

數據流通是釋放數據價值的關鍵環節。然而,數據流通也伴隨着權屬,質量,合規性,安全性等諸多問題,這些問題成爲了制約數據流通的瓶頸。

a. 數據質量

數據流通首選需要解決數據資源在符合使用方質量要求的前提下的高效流動。高效流動需要數據資源標準化,產品化,數據資源實時在線可按需查詢,數據資源覆蓋度能滿足需方業務需求,以及相同需求的數據資源具備多個數據源可供應。目前,因爲數據需求方的個性化需求,導致實際流通數據多以單一供應方按需定製加工方式處理,對需方來說,不能獲得持續,多源的,標準化的數據資源,阻礙了數據流通效率的提升。同時,數據質量評估也是數據流通需要解決的重要問題。由於數據資源的特殊性,很多情況下必須在實際使用後纔可驗證數據質量,質量評估檢驗的難度較大。加之不同數據源的數據質量參次不齊,質量衡量標準不一,質量評估體系不完備等問題逐漸顯露,使需求方較難在流通之前評估供應源的數據質量,是困擾大數據產業與行業應用的發展的難點問題之一。

b. 數據安全與隱私保護

如何確保數據流通的過程的安全,合法是數據大數據行業發展中遇到的另一個難點問題,尤其在保護個人隱私信息方面是必須解決的問題。現有法律法規的約束使得大數據產業在其發展中仍存在着諸多 不確定因素和法律風險。如不當收集,使用或濫用個人信息,有可能被利用以實施各種犯罪,流通過程中的數據監聽,截獲隱患,超出初始收集目的和業務範疇的再使用,包括提供給合同之外的第三方的使用(即流通)等,都會危害到公民的人身和財產利益。同時,流通中的數據資源也需考慮可流通範圍,流通對象合法性,流通過程的安全保障,使用授權等一系列安全問題。

c. 數據流通基礎設施

數據作爲流通商品的定價問題也日益成爲關注的焦點。由於數據具有質量,覆蓋度,及時性和準確性等多重影響價格的因素,使得目前還未能形成一套通用的數據定價策略。一般來說,供方傾向使用數據加工成本的計算方式評估數據資源價格,而需方則希望按數據使用獲得的價值的比例與供方協商價格,最終無法形成統一認可的市場價格體系。
在這裏插入圖片描述

3. 數據流通技術需求

在過去一年,螞蟻金服一直在嘗試用技術手段解決這些業務問題。

a. 個人信息保護

個人信息保護是數據流通的前提。根據《中國人民共和國網絡安全法》規定:“未經被收集者同意,不得向他人提供個人信息。但是, 經過處理無法識別特定個人且不能復原的除外”。 對此,個人信息保護可以從信息處理和個人授權兩個方面解決。但是,去除個人信息的處理加工方式必然伴隨着信息的流失導致信息使用價值降低。因此,如何同時保證信息完整不缺失和保護被收集者個人信息成爲迫切需求。

  • 數據標識加密技術

  • 加密後的數據標識可進行關聯技術

  • 個人信息被流通前的有效授權技術

差分隱私,同態加密等加密技術都可以實現對個人數據信息保護的前提下,實現數據計算任務。

b. 權益分配

權益分配是數據流通的基本動力。對權益進行合理分配才能促進數據不斷流通。必須保證數據擁有者,數據持有者,數據開發者都能夠得到合理分配的權益。權益分配策略必須在技術上簡單高效可行。技術要能夠滿足以下需求: 一是權益分配方案必須爲各方所共同接受。必須按照各方貢獻價值大小進行分配。二是必須能夠快速高效計算各方貢獻價值,保證各方貢獻價值真實有效。其中,區塊鏈技術可以實現高效安全的多方利益分配機制,做到去中心化,信息可追溯,並且提供可信的多方計算環境。

c. 數據安全保障

安全保障是數據流通的關鍵屏障。必須通過技術手段保障流通數據安全與用戶安全。 一是對流通的數據應採用加密手段處理,保證數據在傳輸過程中的安全。二是在上傳數據前必須明確告知被收集者,禁止在未經被收集者同意情況下采用技術手段直接上傳數據。三是禁止流通任何危害國家安全社會穩定,侵犯他人權利,涉及商業機密的數據。技術上能夠做到對這些數據檢索識別,追蹤數據上傳源頭。四是數據必須在一定範圍內使用,符合有限使用原則。技術上能對數據使用範圍做出檢測,警告超出合理使用範圍的數據應用。 其中,安全多方計算技術,可以確保在保護數據提供方數據的前提下,實現多方安全協同計算,並確保各參與方得到正確的數據結果反饋。

d. 追溯審計

追溯審計是數據流通的堅實後盾。對已經流通的數據建立完善的 追溯審計體制,使違規侵權行爲被及時追蹤發現。技術要能夠滿足以下需求: 一是對參與數據流通各方實體的行爲做到透明日誌記錄,方便數據擁有者查閱其數據使用記錄。二是能夠及時檢測日誌中出現的異常 行爲並快速定位異常情況,追溯到行爲源頭。 其中,區塊鏈技術天然具備透明日誌記錄以及可追溯,不可篡改的特性,非常適合做安全,透明的追溯審計。
在這裏插入圖片描述

4. 用戶的安全求交

用戶的安全求交是多方安全計算典型的例子。比如機構想在支付寶端給直銷用戶,其他用戶或者第三方公開用戶發送紅包。機構知道用戶×××號,手機號,但機構不想將這些信息共享給螞蟻。螞蟻有用戶支付寶ID與×××號的對應關係,但螞蟻也不想把這些數據共享給機構。雙方在互相不泄露信息的情況下如何求共同用戶的交集並實現紅包的發放?技術人員通常會想到兩邊加哈希。但是哈希已被破解,而且通過窮舉哈希也可以碰撞出相應的×××號,哈希方法非常不安全。螞蟻現在採用DH算法,先做哈希再做兩邊加密。如下圖右邊,假設A方是螞蟻,B方是機構,雙方都有自己的亂序ID集合。機構方生成自己的密鑰,螞蟻也生成密鑰,雙方分別加密,將加密之後的信息交換,再用自己的密鑰加密。這時便得到了兩組內容,一組用XY順序加密,另外一組用YX加密,找到兩個加密函數,與原來數據集做對比就可以得到交集。

安全求交的方式解決了大量的機構數據和螞蟻數據相互碰撞的問題。同時,用戶安全求交也可以擴展到很多場景。螞蟻金服也在與很多政府機構進行合作,由於政府機構不能夠將用戶的信息泄露給第三方商業機構,所以螞蟻金服也使用了安全求交的方式實現了這個目的。按用戶的安全求交的方式原始數據沒有出機構運營,也沒有出螞蟻運營,出來的集合只是經過加密的殘缺數據,每方密鑰只有自己密鑰,且無法窮舉,只能還原交集的原始ID。
在這裏插入圖片描述

三、智能營銷

有了數據之後需要做營銷,營銷主要是圍繞人做,大數據可以很好的識人懂人聚人。那理解了用戶之後如何做觸達分發?觸發分發分爲觸達,觸動和觸發。觸達指是將圖片和物料曝光給用戶,這是非常粗糙非常基本的觸達,比如彈屏或者發消息。第二個是觸動,做市場營銷需要知道哪個時間點對用戶有吸引力,在最具吸引力的時間點去打動用戶。第三個是觸發,觸發是指用戶真正觸發的動作,是真正達成目的的時候,這時螞蟻可以發紅包或者推送做push文章做催化劑,之後做轉化。其中,如何才能觸動用戶,發送的圖片文案怎麼樣才能打動用戶?第二個是紅包大小問題。
在這裏插入圖片描述
1. 智能定價
螞蟻金服做了很多智能定價嘗試,其目的只有兩個,提高轉化和節省成本。如下圖左上角,展示了營銷費用與用戶轉化概率的關係。大體上,營銷費用與用戶轉化概率是正相關的,中間有很多波動點,說明至少在局部區域有非常好的優化空間。在此基礎之上,粗略的分析各個用戶的狀態。分別從兩個維度來分析,一是拿到紅包的次數,即覈銷多少優惠。二是交易頻次是上升還是下降。如下圖,第一組用戶:“覈銷了很多優惠,但交易頻次下降了”,這類用戶基本可以判斷爲是薅羊毛的用戶,所以拒絕對這類用戶再發紅包。第二個用戶:“覈銷了較少優惠,但交易頻次上升了”,這類用戶對紅包不敏感,他們有自己的決策邏輯,可能對平臺很忠誠或者有自己的交易理論,所以對這類用戶也不需要再發紅包,因爲他們根本不受紅包的影響。第三組用戶:“覈銷了較少優惠,但交易頻次下降了”,這類用戶非常危險,他們甚至對紅包都不感興趣。這類用戶非常容易流失,所以會建議花更多的錢將他們拉回平臺。第四組用戶:“覈銷了很多優惠,但交易頻次上升了”,這類用戶是平臺喜歡的用戶,他們對營銷非常敏感,所以應該投入更多的錢使第四類用戶提高交易。經過以上對定價策略的分析,基本策略是從下到上,依次重視不同的用戶。下圖右邊是利用模型和數據提高轉化,節省成本。首先做對數據做特徵工程,可以使用用戶的自然屬性數據(男女,家庭住址,觸摸商圈,或者經常看什麼樣的理財文章)。用戶在各個營銷場景的數據(各類獎品發放數據,覈銷統計)。交易數據(淘寶交易或者線下交易,以及錢包場景數據)。螞蟻考慮了各種各樣的場景,並在模型方法上進行了很多嘗試,如邏輯迴歸,GBDT,隨機森林,DNN等。還有嘗試瞭如計算廣告學中的各種CTR模型。最終,螞蟻在前兩個月實現的結果是從整體上可以提高了30%的轉化率,這個結果是對整個營銷工作具有非常大的幫助。另外,螞蟻金服在之前的工作中做了非常多的摸索,很奇妙的現象是1.9紅包效果通常不如1.8紅包的效果。發現只要優化了紅包尾數,成本不僅可以下降,而且轉化率反而可以提高。通過尾數位數金額優化,螞蟻金服節省了5%的成本。
在這裏插入圖片描述
2. 智能圖文
由於非常多的機構提議說做banner圖片成本太高。所以螞蟻金服提供了合成圖文的功能,開放出來讓機構使用。2018年螞蟻在合成圖文領域有很大的進步,目前可以生成成千上萬張圖。生成的圖放在線上讓用戶點擊反饋,篩選出最適合用戶的圖片。智能圖文功能可以節省成本,提高效率,方便用戶。因爲技術的發展,用戶只需在圖中劃幾條線,就可以將圖中人物扣出來。
在這裏插入圖片描述
3. 智能觸達
目前文章推薦和投放的技術都已經非常成熟。在2018年,螞蟻嘗試了一個新的領域,在手機客戶端做用戶的點擊預測。其初衷非常簡單,假設在打遊戲或者手機沒有電時,系統發送一個push信息,這使得用戶體驗非常差。手機端上很多實時的狀態是之前被忽略或者沒有被捕捉的。用戶手機端上的狀態是否可以捕獲到,是否涉及到用戶隱私問題?這是用戶的點擊預測挑戰所在。由於支付寶客戶端並不能將所有用戶端上的信息拿到,然後放在服務端做模型的構建以及點擊預測,所以需要在手機客戶端上進行模型構建來做點擊預測。這會涉及到數據協作,即在支付寶內部有客戶端和服務端協作的問題,由於隱私保護不能將數據直接給支付寶服務端進行落戶,所以通過手機客戶端上的實時狀況的捕獲,提供push效率。目前支付寶的push的打開率提高了20%。
在這裏插入圖片描述

四、運營分析

在剛開始很多金融機構還沒有運營經驗,螞蟻金服希望把平臺經驗以及系統的數據分析能力開放給用戶。運營分析與數據分析類似,基本分爲以下三個步驟,發現問題,分析問題和解決問題。發現問題指的是做報表或者做看板,通過可視化方法看到數據的上升或下降,可以發現問題。分析問題通常需要細分問題,假設有指標異常,只從單個指標找問題或者靠猜想是無法分析的,需要對異常相關的各個因子做分析,纔可以逐漸分析出問題所在。在解決問題部分並沒有很多智能化手段,幸運的螞蟻金服有非常多的互聯網運營經驗的沉澱,在解決問題這一塊,可以理解爲有多少智能就代表着背後有多少人工存在。
在這裏插入圖片描述
1. 流量解決方案-不知所措
由於流量波動難以定位,入口非常多,而且外部影響也很多。一天內支付寶會在各個不同的地方做活動,即使發現了異常也很難定位問題。
在這裏插入圖片描述
螞蟻開發了一套系統,採用迭代優化的方案逐步解決流量難以定位的問題。Step1. 特徵化數據。特徵化簡是指用什麼指標代替流量。比如,一篇文章一般會用一個詞或者句子來代替這篇文章,這個過程就可以稱爲特徵化。特徵化並沒有很深奧,特徵化一篇文章一般選擇最長的句子作爲特徵代表這篇文章。流量問題自然也涉及到非常多的特徵化工作,首先,迭代優化需要在基礎數據這一步將流量特徵化。

Step2. 異常檢測。每秒的流量都在變化,流量是時序數據,可以採用ETS時序算法描述時序數據。ETS時序算法通常用在信息處理領域,用它的信號描述數據的模型並預測流量的大小。假設當天的流量偏離了預測值,就認爲檢測到了異常。異動的歸因,即細分問題。這一步主要分析什麼原因導致了變動。在Step1中,特徵化基礎數據得到了特徵因子,通過查看各個特徵因子的貢獻度,如異動變化的相對值在絕對值以上,就可以發現哪些因子貢獻了變動。

Step3. 歸因決策。在前面幾步的基礎上,歸因決策主要確定要做什麼樣的決策(action),螞蟻金服主要做了一個決策引擎來支持歸因決策。

Step4. 服務輸出。結果導讀,優化開導。
在這裏插入圖片描述

2. 活動解決方案-專人專項,各個擊破

螞蟻金服之前做過很多活動,都是以完全開放式的方式。事實上,大部分機構花費了很高的成本而並沒有得到很好的效果。螞蟻金服總結了一個活動解決方案,按專人專項的方式,使不同用戶迅速知道應該怎麼做。用戶分成三個等級,新用戶,體驗型用戶和流失用戶。針對三種用戶分別做不同的數據分析以及活動。這個解決方案可以讓機構更快更方便的去操作。對不同人羣用不同的活動和不同的物料,覆蓋更多的用戶。
在這裏插入圖片描述

3. 活動解決方案-司南在手,三步搞定

最後是螞蟻金服的目標方案。螞蟻希望智能運營參謀“司南”可以根據機構不同機構的問題,推薦人羣,發現哪些人羣出現了問題。推薦權益方案,如定多少規則和使用哪些算法。給出預測的預期,即所需要的成本和能夠實現的效果。最後進行投放。
在這裏插入圖片描述

4. 自動化運營設想

螞蟻金服試圖在近兩年內將運營往自動化方向引進。運營中有非常多的事件,人羣和運營工具,所以螞蟻金服希望制定出一些自動化運營的方案,比如下圖中,用戶進來之後給他做一個投教,通過自定義的分支自動化的運營用戶。自動化運營可以迴應前面提到的運營同學很忙的問題。假設運營往自動化運營方向逐漸推進引進,運營工作就可以變得更加輕鬆。
在這裏插入圖片描述

點擊閱讀更多,查看更多詳情

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章