原创 史上最詳細的梯度下降優化算法介紹(從SGD到Adam至Lookahead)

文章目錄1.介紹2.常見優化算法2.1 梯度下降法及其變種2.1.1 批梯度下降法2.1.2 隨機梯度下降法2.1.3 小批量梯度下降法2.2 梯度下降法的優化算法2.2.1 Momentum-動量法2.2.2 Nesterov-

原创 深度CTR之DIN:基於深度興趣網絡的點擊率預估模型

文章目錄1.paper介紹2.其他深度CTR模型3.要解決問題的背景4.DIN4.1 特徵表達4.2 基模型(Embedding&MLP)4.3 DIN的模型結構5 訓練技巧5.1 Mini-batch Aware Regular

原创 Xgboost原理-XGBoost論文精讀與總結-A Scalable Tree Boosting System

文章目錄1. xgboost介紹2. 樹提升模型2.1 正則化的學習目標2.2 梯度樹提升算法2.3 學習率和列採樣3. 分裂發現算法3.1 精確貪心算法3.2 近似貪心算法3.3 加權分位數骨架3.4 稀疏感知分裂發現算法4.

原创 深度CTR之xDeepFM:融合了顯式和隱式特徵交互關係的深度模型推薦系統

文章目錄1 解決的問題2 介紹部分3 已有模塊的介紹Embedding LayerImplicit High-order InteractionsExplicit High-order Interactions4 新模型-XDee

原创 FM-Factorization Machines

文章目錄1.介紹2.FM模型函數及應用2.1 FM模型2.1.1 FM模型&模型的表達能力2.1.2 稀疏數據下的參數估計2.1.3 二階交叉特徵部分的計算2.2 FM的應用2.3 FM參數的更新學習2.4 總結參考資料 1.介紹

原创 hive中的排序操作 Sort/Distribute/Cluster/Order By

Hive中常見的排序操作有 order by, sort by, distribute by, cluster by, 下面一一介紹。 1.order by 在hive中如果需要對全部數據進行排序,可以使用order b

原创 leetcode-給定二叉搜索樹和一個目標值,判斷樹中是否有兩元素加和等於目標值 思路與代碼

文章目錄問題描述問題分析問題解法 問題描述 問題鏈接:https://leetcode.com/problems/two-sum-iv-input-is-a-bst/ 給定一個二叉搜索樹和一個目標值,如果在樹中存在兩個元素加和等於

原创 leetcode-根據中序遍歷和後序遍歷重構二叉樹 思路與代碼

問題描述 問題鏈接:https://leetcode.com/problems/construct-binary-tree-from-inorder-and-postorder-traversal/ leetcode,medium

原创 L2和L1正則化防止過擬合-貝葉斯角度和約束優化角度的解釋

文章目錄L2正則化約束優化角度貝葉斯角度L1正則化約束優化角度貝葉斯角度 L1和L2正則化方法對於機器學習模型來說都具有防止模型過擬合的作用,通常我們需要理解他們是如何發揮作用的。L1、L2原理的解釋可以從兩個角度: 帶約束條件

原创 判斷二叉樹是否是二叉排序樹 思路與代碼

文章目錄問題描述問題分析問題解法 問題描述 給定一棵二叉樹的根節點 root,請判斷其是否是二叉樹排序樹? 二叉排序樹的基本概念: 如果二叉樹根節點的左子樹不爲空 ,那麼左子樹的所有節點數值均不大於根節點數值; 如果二叉樹根節

原创 leetcode-連續子數組和爲目標數值的整數倍 思路與代碼

文章目錄問題描述問題分析問題解法 問題描述 問題鏈接:https://leetcode.com/problems/continuous-subarray-sum/ 給定一個非負數組和一個正數目標值k,請判斷數組中是否存在一個連續的

原创 YouTube視頻推薦中的召回模型和排序模型-Deep Neural Networks for YouTube Recommendations

文章目錄1.YouTube論文概述2.召回模型2.1.模型細節2.2.召回模型的工程經驗3.排序模型3.1.特徵表達3.1.1.特徵工程3.1.2.離散特徵embedding化3.1.3.連續特徵歸一化3.2.建模觀看時間3.3.

原创 深度CTR之AFM:基於Attention網絡的FM模型

文章目錄解決的問題介紹FM模型AFM模型Pair-wise 交互層Attention-based 池化層學習過擬合的預防Related WorkExperimentsExperimental Settings超參數設置Attent

原创 linux crontab調度python文件報錯:ModuleNotFoundError: No module named 'pandas'

環境:centOS7,anaconda3  預測python腳本寫好以後,準備用腳本部署調度。但是python文件 在linux本地直接python XX.py可以直接運行,放在crontab中調度一直沒有成功。 首先要確定crontab

原创 機器學習中熵、交叉熵、KL散度(相對熵)之間的關係

文章目錄1 信息量2 熵3 相對熵(KL散度)4 交叉熵 1 信息量 信息的信息量大小和它的不確定性有很大的關係,如果一句話需要很多外部信息才能確定的話,那麼這句話的信息就很大,例如你說‘明天可能是晴天’,那你需要去看天氣預告等去