從數據倉庫到百萬標籤庫,精細化數據管理,這麼做就夠了

不知道你們有沒有發現,營銷的手段越來越豐富,但也越來越難了。

從數據倉庫到百萬標籤庫,精細化數據管理,這麼做就夠了

 

雖然很多企業都有自己的標籤庫,或者說是DMP吧,但畢竟不是每個產品經理都有機會讓平臺承載的標籤數量超過一百萬,原因很簡單,要麼沒需求,要麼沒數據,要麼沒必要。

我記得當初打造1000+標籤庫的時候,也是覺得太多了,但大數據運營幾年後,卻有了觀念的轉變今天就來講一講,主要包括五大部分內容:標籤庫定位、標籤體系、產品功能、平臺架構

無論你是做什麼的,數據倉庫也好,程序員也罷,市場部也好,這篇文章建議你看看,能幫助你深刻的理解業務。

一、標籤庫定位

標籤庫以標籤形式統一客戶羣數據的封裝規範和操作風格,從而實現客戶洞察知識的沉澱及共享,並通過產品化的形式實現目標客戶羣的快速生成和發佈,提升營銷渠道的客戶羣投放效率,標籤庫建設的目的就是爲了營銷,而不是爲了分析。

企業的標籤庫跟廣告產業的DMP是類似的,企業內部對自己的用戶進行精準投放依賴的是標籤庫,廣告產業DSP依賴的則是DMP。

 

從數據倉庫到百萬標籤庫,精細化數據管理,這麼做就夠了

 

二、標籤體系

標籤庫的核心當然是標籤體系,但每個企業打造的標籤體系其實都不太一樣,既有共性,也有個性。

共性主要體現在用戶的一些基礎屬性,比如年齡、性別、職業、住址等等,個性是由於每個企業的產品特點、基礎數據、目標受衆都不太一樣,比如運營商的標籤會側重通信消費、通信行爲,而電商的標籤則會側重線上消費的各種特徵,以下是某運營商8年前的一個標籤分類示意。

 

從數據倉庫到百萬標籤庫,精細化數據管理,這麼做就夠了

 

但即使是同一個企業,也會由於業務的變化和數據能力的提升而大幅改變標籤體系,比如運營商自從引入DPI、位置信令數據以後,其標籤體系會向線上、線下的生活情況轉變。

從數據倉庫到百萬標籤庫,精細化數據管理,這麼做就夠了

 

在設計標籤體系的時候,要避免追求形式和邏輯上的完美,一定要從企業的營銷實際出發,到一線進行充分的調研後確定要建設的內容,以下是以前的一個標籤調研表格示例,方便理解。

從數據倉庫到百萬標籤庫,精細化數據管理,這麼做就夠了

 

標籤按照生成方式有三種類型:基礎屬性、業務經驗、分析模型和個性標籤。

基礎屬性標籤:基礎屬性標籤是指從業務平臺等數據源直接獲取數據,一般通過信息整理或基礎屬性判定規則即可生成標籤,比如品牌、集團屬性、地域屬性等。

業務經驗標籤:主要是利用業務人員經驗積累的業務規則進行篩選、分析生成標籤名單,數據口徑的業務邏輯較清晰明確,可解釋性強,比如中高端用戶。

分析模型標籤:主要是利用已有基礎數據進行一定的篩選、分析、關聯和數據挖掘,生成客戶標籤結果信息,比如易離網用戶。

個性化標籤:標籤一般要具有共性的價值,但實踐中很多標籤屬於探索性質,個性化很強,應允許在標籤體系之外增加個性標籤發佈類目。

基礎標籤可以基於數據倉庫的基礎模型、融合模型直接生成,分析模型標籤則依賴於挖掘模型的結果,一般來講,基礎屬性標籤最多,業務經驗標籤其次,分析模型標籤最少,這是因爲一個企業內大多數營銷所需的目標客戶需要直接、清晰而可解釋。

三、標籤庫功能

標籤體系是標籤庫的內涵,而標籤庫的功能決定了這些標籤能否方便使用,酒香也怕巷子深。

標籤庫的核心功能包括標籤創建、標籤查詢、客戶羣生成、客戶羣推送、標籤元數據、調度管理這幾項,其他的諸如標籤編輯、標籤停用、標籤下線、標籤評論、標籤審批、標籤推薦、安全管理等等,可以放到次優先級。很多看起來挺好的功能在運營初期一點價值都沒有,你需要聚焦核心功能。

1、標籤創建

標籤創建一般要支持三種模式:簡單模式,高級模式,導入模式

簡單模式:面向業務人員,可以基於現成的模型寬表選擇屬性字段生成標籤,如下圖所示,但受限於開放的寬表的能力和業務人員的驅動力,在我們的實踐中,這種簡單模式並沒有獲得成功。

從數據倉庫到百萬標籤庫,精細化數據管理,這麼做就夠了

 

高級模式:面向獨立編寫SQL能力的使用人員,如下圖所示,但要讓標籤庫同時具備數據開發環境的能力,是比較理想化的。

從數據倉庫到百萬標籤庫,精細化數據管理,這麼做就夠了

 

實踐中更多的還是通過數據開發平臺生成後臺表,同步到標籤庫後臺,標籤庫再配置發佈,雖然比較繁瑣,但跟企業的數據開發體系是融合的。

我們後來直接讓標籤庫前臺對接數據開發平臺的元數據,可以基於數據開發平臺的表一鍵發佈成標籤,如下圖所示,現在數據開發平臺也可以一鍵發佈到標籤庫,這樣就很方便了,標籤庫一定要約束其功能的範圍。

 

從數據倉庫到百萬標籤庫,精細化數據管理,這麼做就夠了

 

從數據倉庫到百萬標籤庫,精細化數據管理,這麼做就夠了

 

2、標籤查詢

標籤查詢一般要支持二種模式:目錄視圖,搜索視圖

從數據倉庫到百萬標籤庫,精細化數據管理,這麼做就夠了

 

 

從數據倉庫到百萬標籤庫,精細化數據管理,這麼做就夠了

 

 

從數據倉庫到百萬標籤庫,精細化數據管理,這麼做就夠了

 

3、客戶羣生成

客戶羣生成一般可以包括客戶羣計算、客戶羣分析、客戶羣拓展三個模塊。

客戶羣計算:基於標籤的組裝生成客戶羣是標籤庫最核心的功能,主要包括選擇標籤及屬性、配置標籤邏輯關係、配置客戶羣屬性三部分,如下圖所示:

 

從數據倉庫到百萬標籤庫,精細化數據管理,這麼做就夠了

 

客戶羣分析:客戶羣在投放前往往還需要進行多維度分析(比如位置、收入、區域、性別、年齡、總量等等),方便對客戶羣做出進一步調整,如下圖所示:

 

從數據倉庫到百萬標籤庫,精細化數據管理,這麼做就夠了

 

客戶羣拓展:選擇某個客戶羣作爲種子用戶,找到這部分用戶的維度特徵(當然還可以有其他辦法),然後基於這些維度特徵找到其他相似用戶,從而擴大投放用戶羣,這個功能其實不太實用,實踐中拓展用戶羣往往是通過放寬標籤設置條件去做。

4、客戶羣推送

沒有出口的標籤庫是沒有價值的,標籤庫需要對外開放,能夠將客戶羣按照一定的接口規範, 通過標準化的交互接口,提供給外部系統進行使用,包括同步、異步及訂閱等多種方式,一般推送的對象就是營銷管理平臺或者說是DSP。

 

從數據倉庫到百萬標籤庫,精細化數據管理,這麼做就夠了

 

 

從數據倉庫到百萬標籤庫,精細化數據管理,這麼做就夠了

 

推送客戶羣有一個關鍵就是有來有回,你出去的數據,必須能跟蹤到渠道投放情況,做不到這一點,就無法形成閉環,後面的運營就很難開展。

很多企業標籤庫和投放端是兩個團隊,數據有去無回,標籤的優化就很難做了,長遠來講損害企業利益。

5、標籤元數據

標籤元數據是整個元數據管理體系的一部分,主要包括對標籤數據來源、數據處理過程、數據建模過程、標籤口徑、標籤效果等的說明,透明化的第一目的就是讓這個標籤值得信任,業務人員敢用,其次是方便覈查問題,但標籤的元數據很難做好,比如效果的自動獲得對於投放的閉環要求非常高。

從數據倉庫到百萬標籤庫,精細化數據管理,這麼做就夠了

 

四、標籤庫架構

1、標籤庫系統數據流向

下圖通過一個案例顯示了標籤庫的數據流向,方便你理解其中的邏輯關係。

從數據倉庫到百萬標籤庫,精細化數據管理,這麼做就夠了

 

(1)(2)(3)(4):外圍系統提供數據通過ETL工具同步到主倉庫和專題庫

(5)(6)(7):主倉庫、專題庫、創新應用平臺生成的基礎模型、融合模型、挖掘模型結果同步到標籤庫

(8):標籤後臺庫負責標籤的生成、標籤寬表存儲、客戶羣計算及清單存儲,向非結構化庫輸出個人標籤清單

(9):基於文件系統非結構化存儲個人用戶的標籤信息(MogoDBS), 滿足對外快速查詢需求

(10):標籤前臺庫存儲標籤、客戶羣、資源權限等系統配置信息

2、標籤庫系統部署結構

從數據倉庫到百萬標籤庫,精細化數據管理,這麼做就夠了

 

標籤庫有大量的關聯批量計算任務,對於在線分析的時限要求高,因此MPP架構往往是後端數據庫的選擇之一,在某些所見即所得的場景(比如在線統計),可以混合使用ES等查詢引擎來提升體驗。

如果你覺得我寫的不錯,或者對你有用,歡迎關注我,並轉發該文章,有不懂的也可以在評論區留言,有問必答!

對了,我的個人公衆號建議關注一下,拉你進羣免費學習!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章