怎麼做惡意刷單檢測——數據分析面試刷題1

在這裏插入圖片描述

前言:

近日刷一波數據分析師面試題,學習別人的建議,總結和提升自己的思維。

01 自己思路

1.惡意刷單什麼意思?是競爭對手惡意購買產品進行差評?
2.刷單:就是找人購買、評價、好評、曬圖、差評;
3.選擇因素:銷量、好評、差評、地區;
4.把一整年的單量找出來,從每個月、每個星期開始,根據銷量、好評、差評、地區做分段,查出的每個時間段的頻率;
5.對頻率進行分析,查看其密度值;
6.使用折線圖,頻率過高,差評量異常過高,就有可能是惡意刷單。

02 別人參考

分類問題用機器學習方法建模解決,我想到的特徵有:
1)商家特徵:商家歷史銷量、信用、產品類別、發貨快遞公司等;
2)用戶行爲特徵:用戶信用、下單量、轉化率、下單路徑、瀏覽店鋪行爲、支付賬號;
3)環境特徵(主要避免機器刷單):地區、ip、手機型號;
4)異常值檢測:ip地址經常變動、經常清空cookie信息、賬號近期交易成功率上升等;
5)評論文本檢測:刷單的評論文本可能套路較爲一致,計算與已標註評論文本的相似度作爲特徵;
6)圖片相似度檢測:同理,刷單可能重複利用圖片進行評論。

03 個人總結

1.消費者:進入後、瀏覽店鋪、下單、轉化、評論、用戶信用、支付賬號;
2.商家:產品類別、歷史銷量、評論量(文本、圖片)。
在這裏插入圖片描述

意外收穫

1.跟面試有關的網站可以自己練習和借鑑別人面試經驗;
2.瞭解刷單,惡意刷單1500次導致降權,賣家被判刑;
文章關鍵詞:1500多次;同一賬號、短期內、大量購買、超過正常消費者需求。
3.參考文章

寫在最後:

1.瞭解惡意刷單是怎麼回事;
2.瞭解什麼行爲、事項會導致被評定爲惡意刷單;
3.對事項做檢測、監控、分析。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章