推薦算法中點擊率CTR修正方法—威爾遜區間

原創

2020-06-30 00:31

由於原始CTR計算方式只考慮了相對值，沒有考慮絕對值。即，沒有考慮曝光的數值大小，在曝光少的情況下，計算出的CTR其實不可靠，樣本充足的情況下，才能反應真實情況

舉例：

A：點擊數 5 曝光數 10

B：點擊數 50 曝光數 100

C：點擊數 500 曝光數 1000

此三個廣告的CTR 都是 0.5 ，但是按照實際表現，從置信的角度分析，應該是C > B > A，因爲C的樣本數更多，可信度更高。

爲了衡量樣本數對於 CTR 置信區間的影響，科學家們引入"威爾遜（Wilson）區間"的概念。公式如下

p：ctr
n：樣本總數，即曝光數
z：正態分佈裏的參數

import numpy as np

def walson_ctr(num_click, num_pv, z=1.96):
    p = num_click * 1.0 / num_pv
    if p > 0.9:
        return 0.0
    
    n = num_pv
    
    A = p + z**2 / (2*n)
    B = np.sqrt(p * (1-p) / n + z**2 / (4*(n**2)))
    C = z * B
    
    D = 1 + z**2 / n

    ctr = (A - C) / D
    
    return ctr

結果：
walson_ctr(5,10)：0.2365895936154873
walson_ctr(50,100)：0.40382982859014716
walson_ctr(500,1000)：0.4690690341793595

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

###豪豪豪豪######2020 推薦系統技術演進趨勢瞭解

讀知乎文章《推薦系統技術演進趨勢：從召回到排序再到重排》筆記：《推薦系統技術演進趨勢：從召回到排序再到重排》這篇文章主要說了下最近兩年，推薦系統技術的一些比較明顯的技術發展趨勢。主要從以下幾個方面介紹：推薦系統整體架構召回技術演進趨

2020-07-07 09:47:32

推薦系統之wide&deep

wide & deep 相信這是個對有關推薦系統工作者非常眼熟的一個模型，是16年穀歌應用於google play中的模型，在推薦系統中工業界的應用也非常廣泛，是一個比較成熟的模型，近日實習所在組上線這個模型，點擊率相比於LR得到了極大

2020-07-07 08:49:14

推薦系統過濾技術：基於內容的過濾及其利弊

在上一篇文章中，我們介紹了推薦系統的主要工作流程。在接下來的文章中，我們會詳細分析推薦系統中的過濾技術。推薦系統中不同的過濾技術推薦系統要想爲用戶提供切實有用的推薦服務，高效、準確的推薦技術至關重要，也就是說，理解不同推薦過濾

第四范式天枢

2020-07-01 22:52:09

翻譯：用R實現序列模式挖掘進行商業推薦指南

在這份指南中，Allison Koenecke 揭示了當客戶增加Azure雲的服務時，微軟如何通過延伸傳統購物籃分析實現對消費者潛在服務需求的推薦。問題聲明： Market Basket Analys

2020-07-01 12:54:58

神經網絡優化的方法-梯度、超參數

神經網絡優化方法一：使用正則化技巧提高模型的泛化能力二：梯度優化三：網絡初始化技巧和超參數調優一：使用正則化技巧提高模型的泛化能力常用的正則化方法如下所示： L1、L2 正則化 dropout 正則化 Data Augmen

2020-06-30 00:31:24

論文筆記《Item-Based Collaborative Filtering Recommendation Algorithms》

一、基本信息論文題目：《Item-Based Collaborative Filtering Recommendation Algorithms》發表期刊及年份：WWW 2001 二、摘要近幾年由於可獲得信息的大量增長和訪問

帅气的小峰

2020-06-29 23:43:02

####haohaohaohao#####愛奇藝個性化推薦排序實踐

作者｜Michael 作者介紹 Michael，推薦算法助理研究員，2014年碩士畢業於北京郵電大學後加入愛奇藝。從事推薦算法的研發和管理工作，對於機器學習和深度學習在推薦上的應用有着豐富的經驗。請輸入標題 abcdefg 導

2020-06-27 22:22:20

###好好好##知識圖譜與推薦系統

文章目錄知識圖譜與個性化推薦 1、推薦系統的任務和難點 2、知識圖譜的優勢 3、知識圖譜與推薦系統的結合方法 3.1 基於特徵的推薦方法

2020-06-27 22:22:18

pandas2libFFM

import numpy as np # linear algebra import pandas as pd # data processing, CSV file I/O (e.g. pd.read_csv) from sklear

猪逻辑公园

2020-06-27 22:06:46

NLP 神經網絡訓練慎用 Adam 優化器

https://www.jianshu.com/p/48e71b72ca67 NLP 神經網絡訓練慎用 Adam 優化器 theoqian關注 12019.02.10 16:01:45字數 499閱讀 1,168 AllenNL

2020-06-25 15:12:03

推薦系統（一）最通俗易懂的協同過濾算法（CF）

協同過濾算法是典型的基於領域的算法，具體來說協同過濾算法分爲兩種，基於用戶的協同過濾算法和基於物品的協同過濾算法。一.基於用戶的協同過濾算法算法步驟： 1.找到和目標用戶興趣相似的用戶集合 2.找到這個用戶集合中用戶喜歡的，而

2020-06-25 14:33:55

關於推薦系統中評分預測和TOP-N推薦問題的理解

最近在寫畢業論文時，發現自己對推薦系統中的評分預測和TOP-N推薦問題理解的不夠深入，遂查閱資料，在此記錄下自己對這一問題的一點理解。首先說結論，評分預測和TOP-N推薦是推薦系統應用的兩大場景，二者之間沒有必然的聯繫。下面分別對

2020-06-25 08:04:50

推薦算法總結（召回+排序+工程化）

文章目錄召回內容召回word2vecLDA行爲召回ItemCFUserCFSwing關聯規則聚類協同矩陣分解隱語義LFM圖召回PersonalRank圖嵌入圖神經網絡模型召回item2vec（embedding）FM模型召回雙塔模

2020-06-24 01:16:56

用矩陣分解來解決推薦問題

文章目錄整體架構分部細節生成訓練數據bm25矩陣分解lightfm 整體架構讀取數據訓練模型分部細節生成訓練數據從hadoop生成兩個子文件（1）docid，pv，cl （2）mid，cl_docid_durati

2020-06-24 01:16:56

推薦算法知識梳理

文章目錄架構介紹推薦系統架構介紹召回簡單介紹非個性化召回多路召回模型召回雙塔模型因子分解發散點用戶行爲序列召回改進用戶多興趣拆分知識圖譜融合召回圖神經網絡模型召回排序技術發展趨勢模型表達能力顯示特徵組合特徵抽取器的進化AutoML

2020-06-24 01:16:56

24小時熱門文章

最新文章

最新評論文章