風控建模流程：以京東羣體感知項目爲例

業務需求挖掘

任何項目的起源，都是從需求挖掘開始的，不可能一蹴而就，會經過多次循環。這體現了作爲數據分析師和建模人員的功力，可能有的業務要 A，你就給他A，而沒有往下深入幾個層次進行考慮，因爲有的時候，可能業務的需求自己也沒有想清楚需要的是什麼，這和傳統的軟件工程是一樣的，所以寧可在這裏多花一點時間，也好過到後面踩坑之後，在回來重新挖掘需求。

① 目標

找出關鍵變量（與判斷項目成功與否的指標相關，最好的方法就是定義幾個場景，比如做風控，是壞賬率下降，還是機注量下降了，或者其他指標），並把關鍵變量作爲模型目標
識別業務已經使用或者需要獲取的數據源

② 實現方法

定義目標，與用戶以及其他利益相關方一起理解，識別業務問題，並構建多個問題(這些問題要能定義出業務目標同時也能作爲建模的目標)
識別數據源：基於問題找出能幫助回答的數據源，越多越好

③ 交付物

項目需求文檔（比如 A、B、C 三個場景，機注量下降2%，或者壞賬率下降1%等等）
數據源梳理，有幾張寬表，有幾個數據源，都需要弄清楚

④ 業務方的訴求與抱怨

業務方的訴求與抱怨，抽象來說就是多、快、準、省：

多：在風控反欺詐領域，對於抓黑產，召回率越高越好。
快：實時反應，不能等到 T+1 時間過去了才反應，比如拼多多的風控事件，不僅僅需要做到實時，最好做到事前，並且可以發出告警，提示哪個環節被攻擊。
準：準確率（auc，roc 曲線）大家都比較熟悉，尤其對於金融風控，準確率要求更高。
省：省心，傻瓜式操作，不需要告訴具體指標的含義。對於模型，只需提供給業務方0或1即可。

所以，對於業務的訴求和抱怨，就在這四個字之中，當我們接到羣體風險感知這個 Case 時，我們首先需要做的就是：定義羣體風險感知（爲什麼叫羣體而不叫團伙？），明確業務場景，找出業務痛點。

兩個場景：

一堆人來買我的貨，我不會認爲他們是壞的人；
iphone 新品首發，黃牛帶貨，對我的品牌或者收益造成損失，這時，我們需要進行控制打壓。

所以我們交付的東西，需要是中性的，把模型看作一把刀，具體刀用來做什麼，由業務來決定。

⑤ 需求分析

風險未知可能出現的狀態：

少量交易造成巨大損失（例如：網絡輿情事件，詐騙，網絡攻擊等）
大量交易造成巨大損失（例如：拼多多事件，上萬個賬號薅優惠券，然後快速的變現）

黑灰產的主要特徵：

逐利性（不斷升級，不斷尋找漏洞）：由於他們是在爲自己牟利，沒有 kpi 沒有996，甚至一天可以更新迭代4個版本，他們自己乾的很起勁。
羣體性（短期，快速，大量獲利）目前成熟的電商，基本上不會讓一個賬號短時間內下很多單了，現在的黑產爲了達到短期快速大量獲利，一般使用羣控手機，即用軟件控制幾百臺手機，尤其在6·18和11·11時，給我們造成的壓力也是比較大的。

項目的定義：

以黑灰產羣體作爲特徵指標，發現交易鏈條上可能存在的漏洞增強防控能力，提高黑產成本（黑產本質上是生意，風控人員不是爲了消滅黑產，是爲了讓他們這門生意做不下去，明面上是技術的對抗，實際上是成本的對抗）。

⑥ 項目目標

監控指標體系與異常發現（輸出結果形式）：