原创 推薦算法中的 相似度計算

對用戶的行爲進行分析得到用戶的偏好後,可以根據用戶的偏好計算相似用戶和物品,然後可以基於相似用戶或物品進行推薦。這就是協同過濾中的兩個分支了,即基於用戶的協同過濾和基於物品的協同過濾。       關於相似度的計算,現有的幾種方法都是

原创 人工智能架構

人工智能

原创 推薦系統的初體驗(關聯規則,協同過濾)

最近接觸了一個推薦系統的建設項目,於是我順便回顧了一下之前零星學到的推薦知識,把一些困惑很久的問題弄明白了,所以來總結一下。 一般意義下的推薦系統是指個性化推薦,類似簡單的排行榜推薦或者關聯規則推薦被認爲是不夠個性化的。不過我困惑的問

原创 TensorFlow學習(四):梯度帶(GradientTape),優化器(Optimizer)和損失函數(losses)

更新時間: 2017.5.9 簡化了很多不需要的內容,關注重點。 2019.4.17 更新到tensorflow 2.x,添加自動求導和新版本的optimizer 因爲tensorflow 2.x相對於tensorflow 1.x的變動,

原创 關於LDA的一些思考

問1:LDA生成一個文檔的過程是什麼樣的? 答1:1)根據預料級參數α,生成文檔d的主題分佈Θ_d~p(Θ|α) 2)對於文檔d中每個位置i對應的單

原创 Deep Interest Network

作者 | 李寧寧 來源 | 機器學習薦貨情報局(ID:ML_CIA) 編輯 | Vincent AI 前線導讀:Deep Interest Network(DIN) 是蓋坤大神領導的阿里媽媽的精準定向檢索及基礎算法團隊,在 2017 年

原创 TF-IDF及其算法

概念      TF-IDF(term frequency–inverse document frequency)是一種用於資訊檢索與資訊探勘的常用加權技術。TF-IDF是一種統計方法,用以評估一字詞對於一個文件集或一個語料庫中的其中

原创 特徵選擇-卡方檢驗

前文提到過,除了分類算法以外,爲分類文本作處理的特徵提取算法也對最終效果有巨大影響,而特徵提取算法又分爲特徵選擇和特徵抽取兩大類,其中特徵選擇算法有互信息,文檔頻率,信息增益,開方檢驗等等十數種,這次先介紹特徵選擇算法中效果比較好的開方

原创 文本特徵選擇-互信息

在做文本挖掘,特別是有監督的學習時,常常需要從文本中提取特徵,提取出對學習有價值的分類,而不是把所有的詞都用上,因此一些詞對分類的作用不大,比如“的、是、在、了”等停用詞。這裏介紹兩種常用的特徵選擇方法: 互信息   一個常用的方法

原创 初學者如何查閱自然語言處理(NLP)領域學術資料

昨天實驗室一位剛進組的同學發郵件來問我如何查找學術論文,這讓我想起自己剛讀研究生時茫然四顧的情形:看着學長們高談闊論領域動態,卻不知如何入門。經過研究生幾年的耳濡目染,現在終於能自信地知道去哪兒瞭解最新科研動態了。我想這可能是初學者們共

原创 特徵抽取-信息增益

前文提到過,除了開方檢驗(CHI)以外,信息增益(IG,Information Gain)也是很有效的特徵選擇方法。但凡是特徵選擇,總是在將特徵的重要程度量化之後再進行選擇,而如何量化特徵的重要性,就成了各種方法間最大的不同。開方檢驗中

原创 自然語言處理相關網站

1、我愛自然語言處理 http://www.52nlp.cn/ 2、博森中文語義api http://bosonnlp.com/ 1)情感分析:對文本中情感傾向性和評價對象進行抽取,半監督學習準確率80%~85%,標註語料準確率85%~

原创 2017 年深度學習 10 個趨勢預測

原文鏈接:http://www.iteye.com/news/31989 引用 原文:10 Deep Learning Trends and Predictions for 2017  作者:Carlos E. Perez  譯者

原创 GMIS 2017 | 第四範式首席研究科學家陳雨強:機器學習模型,寬與深的大戰

本文轉載自機器之心 機器之心編輯部 原文鏈接:https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650727205&idx=3&sn=8bb5f74d3783184be0b58

原创 時間管理資源

http://www.mifengtd.cn/ 點贊 收藏 分享 文章舉報 趙志雄 發佈了21 篇原創文章 · 獲贊 37 · 訪問量 6萬+ 私信