用戶畫像-ID_MAPPING 利用並查集——求無向圖的所有連通子圖來實現所有用戶合併

一 項目背景

本項目是基於https://blog.csdn.net/weixin_41734687/article/details/99174064 此項目的改進。
去年利用jacaard相似度對多用戶進行了合併。由於受到計算資源的制約,在對多用戶進行合併時,只選取了有限量元素進行合併,導致一些用戶沒有合併爲一個用戶,在實際數據運用中,會出現部分數據one_id會發生變化,對用戶畫像分析造成了困擾。經過項目經驗總結後,決定對id_mapping項目進行改進,主要改進思路爲:利用圖計算來對多用戶進行id_mapping,最終利用求無向圖的所有連通子圖來實現id_mapping。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章