個數是如何用大數據做行爲預測的？

“個數”是“個推”旗下面向APP開發者提供數據統計分析的產品。“個數”通過可視化埋點技術及大數據分析能力從用戶屬性、渠道質量、行業對比等維度對APP進行全面的統計分析。

“個數”不僅可以及時統計用戶的活躍、新增等，還可以分析卸載用戶的成分、流向，此外還能實現流失、付費等用戶關鍵行爲的預測，從而幫助APP開發者實現用戶精細化運營和全生命週期管理。其中很值得一提的是，“個數”在“可視化埋點”及“行爲預測”方面的創新，爲APP開發者在實際運營中帶來了極大便利，所以，在下文中，我們也將圍繞這兩點做詳細的分析。

可視化埋點

埋點是指在產品流程的關鍵部位植入相關統計代碼，以追蹤用戶行爲，統計關鍵流程的使用程度，並將數據以日誌的方式上報至服務器的過程。

目前，數據埋點採集模式主要有代碼埋點、無埋點、可視化埋點等方式。

“代碼埋點”是指在監控頁面上加入基礎js，根據需求添加監控代碼，它的優點是靈活，可以自定義設置，可以選擇自己需要的數據來分析，但對複雜網站來說，每次修改一個頁面就得重新出一份埋點方案，成本較大。目前，採用這種埋點方案的代表產品有百度統計、友盟、騰訊雲分析、Google Analytics等。

可視化埋點通常是指開發者通過設備連接用戶行爲分析工具，直接在數據接入管理界面上對可交互且交互後有效果的頁面元素（如：圖片、按鈕、鏈接等）進行操作實現數據埋點，下發採集代碼生效回數的埋點方式。目前，可視化埋點的代表產品有個數、Mixpanel、神策數據等。

“無埋點”與“全埋點”相似，它的原理是“全部採集，按需選取”，也就是說它可以對頁面中所有交互元素的用戶行爲進行採集，它是先儘可能多收集檢測頁面的內容，然後再通過界面配置決定分析哪些數據，但它是標準化採集，如果需要設置自定義的採集方式仍需要代碼埋點助力。這種方案的代表產品有GrowingIO、數極客、百度統計等。

“個數”爲什麼會選用可視化埋點？

當下移動互聯網正處於高速發展且發展形勢瞬息萬變的階段中，開發者需要及時根據大數據的分析、反饋，對業務功能等做出調整，在傳統的操作模式中，如果想要了解不同節點的數據，就要修改相應代碼裏面的埋點，然後測試發佈，之後再在應用商店審覈、上線，整個週期可能長達幾個星期，這顯然無法滿足業務的需求。所以，“個數”採用的“可視化埋點”技術就是爲了幫助開發者解決這個問題的。

“個數”的可視化埋點靈活、方便，不需對數據追蹤點添加任何代碼，使用者只需要通過設備連接管理臺，對頁面可埋點的元素圈圈點點，即可添加隨時生效的界面追蹤點，同時在數據採集模式及數據分析能力上，個數能夠提供給開發者們準確的、有效的數據。

可視化埋點主要具有以下特性：

零代碼，無需代碼，節省成本
免更新，新增便捷，無需升級
易測試，圈選測試，實時呈現

換而言之，可視化埋點不僅可以節約企業成本，還可以提高開發人員和運營人員的工作效率。

行爲預測

“個數”的行爲預測主要包括流失預測、卸載預測、付費預測等，它的原理是基於App歷史行爲數據構建算法模型預測用戶關鍵行爲，從而幫助開發者達到用戶精細化運營和全生命週期管理的目的。

在這裏需要注意的是，“個數”的行爲預測與電商平臺常用的個性化推薦不同，後者主要是基於用戶近期的行爲，如瀏覽記錄、購買記錄而推出用戶可能需要的東西，而“個數”是基於App各渠道卸載數、卸載趨勢等指標的綜合分析，更多的是對人羣的聚類分析，而非僅僅基於個人的行爲。

行爲預測的步驟

據“個推”大數據科學家朱金星介紹，“個數”的行爲預測主要分爲以下幾個步驟：

1.找樣本，主要從歷史數據庫中抽取；

2.特徵抽取，將用戶與數據庫打通，做匹配；

3.特徵篩選，保留相關性高的或有價值的特徵；

4.模型訓練，將保留下來的特徵放到模型中訓練，在模型的選用上，個數主要用了邏輯迴歸，原因是邏輯迴歸的模型相對深度學習等其他模型來說，簡單一些，而且在特徵篩選上相對好處理，得到的結果好解釋，也相對穩定。

5.參數優化，根據效果進行調整，如果結果不理想，即可返回調整參數重新走一次以上流程。

實例分析

下面我們以付費預測爲例，爲大家梳理一下具體的實現過程。

個數付費預測的流程主要包括以下幾點：

1.目標問題分解

明確需要進行預測的問題即付費預測，以及未來一段時間的跨度。

2.分析樣本數據

（1）提取出所有用戶的歷史付費記錄，這些付費記錄可能僅佔所有記錄的千分之幾，數據量會非常小；

（2）分析付費記錄，瞭解付費用戶的構成，比如年齡層次、性別、購買力和消費的產品類別等；

（3）提取非付費用戶的歷史數據，這裏可以根據產品的需求，添加條件、或無條件地進行提取，比如提取活躍並且非付費用戶，或者不加條件地直接進行提取；

（4）分析非付費用戶的構成。

3.構建模型的特徵

（1）原始的數據可能能夠直接作爲特徵使用；

（2）有些數據在變換後，纔會有更好的使用效果，比如年齡，可以變換成少年、中年、老年等特徵；

（3）交叉特徵的生成，比如“中年”和“女性”兩種特徵，就可以合併爲一個特徵進行使用。

4.計算特徵的相關性

（1）計算特徵飽和度，進行飽和度過濾；

（2）計算特徵IV、卡方等指標，用以進行特徵相關性的過濾。

5.選用邏輯迴歸進行建模

（1）選擇適當的參數進行建模；

（2）模型訓練好後，統計模型的精確度、召回率、AUC等指標，來評價模型；

（3）如果覺得模型的表現可以接受，就可以在驗證集上做驗證，驗證通過後，進行模型保存和預測。

6.預測

加載上述保存的模型，並加載預測數據，進行預測。

7.監控

最後，運營人員還需要對每次預測的結果進行關鍵指標監控，及時發現並解決出現的問題，防止出現意外情況，導致預測無效或預測結果出現偏差。

其他場景下，如流失預測、卸載預測等，在流程上與付費預測類似，所以在這裏就不再一一介紹了。

有了精準的行爲預測，運營者則可以將運營目標進行拆分、細化，具體到每個場景、每個流程，針對不同用戶採取不同的推廣渠道、運營策略。例如基於流失預測，運營能夠提前洞察到用戶流失行爲，提早進行干預，通過個性化內容推薦、消息推送等運營手段對即將流失的用戶進行挽留，從而降低流失率。總的來說，在大數據行爲預測的幫助下，運營能夠更及時、更全面地瞭解用戶，從而達到精細化運營的目的。

關於未來

接下來“個數”還將在商品推薦等領域做更多的探索，例如開發精準的推薦技術等，也會不斷挖掘大數據的潛力，結合反饋的數據做進一步的優化，圍繞客戶提供的樣本數據做更深入的訓練學習等，爲開發者提供更全面的大數據服務，大家敬請期待。

個數是如何用大數據做行爲預測的？

可視化埋點

“個數”爲什麼會選用可視化埋點？

行爲預測

行爲預測的步驟

實例分析

關於未來

EXCEL中下拉菜單中添加新選項或者刪除選項

號稱能打敗MLP的KAN到底行不行？數學核心原理全面解析

Python 爬蟲：Spring Boot 反爬蟲的成功案例

京東科技數字化營銷能力的演進與最佳實踐| 京東雲技術團隊

Java中止線程的方式

[轉帖]Oracle Exadata 學習筆記之核心特性Part1

《最新出爐》系列入門篇-Python+Playwright自動化測試-43-分頁測試

HTTP協議相關文檔

Android全面屏如何做適配

Node和JS基金會宣佈合併爲 OpenJS 基金會

13歲女孩因發佈JavaScript無限循環代碼被捕

上學還是坐牢？百年老校“監控”學生惹爭議

個數是如何用大數據做行爲預測的？

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結