原创 linux 日期遍歷

date +%Y%m%d        //顯示前天年月日 date +%Y%m%d --date="+1 day"  //顯示前一天的日期 date +%Y%m%d --date="-1 day"  //顯示後一天的日期 date +%

原创 爲什麼MongoDB索引用B樹,而Mysql用B+樹?

引言 如果面試官問的是,爲什麼Mysql中Innodb的索引結構採取B+樹?這個問題時,給自己留一條後路,不要把B樹噴的一文不值。因爲網上有些答案是說,B樹不適合做文件存儲系統的索引結構。如果按照那種答法,自己就給自己挖了一個坑,很難收場

原创 英特爾不爲人知的 B 面

從 PC 時代至今,衆人只知在 CPU、GPU、XPU、製程、工藝等戰場中,英特爾在與同行硬件芯片製造商們的競爭中殺出重圍,且在不斷的成長進化中,成爲全球知名的半導體公司。殊不知,在「剛硬」的背後,英特爾「柔性」的軟件早已經做到了全方位的

原创 推薦算法分類

推薦算法大致可以分爲三類:基於內容的推薦算法、協同過濾推薦算法和基於知識的推薦算法。 1、基於內容的推薦算法,原理是用戶喜歡和自己關注過的Item在內容上類似的Item,比如你看了哈利波特I,基於內容的推薦算法發現哈利波特II-VI,與你

原创 如何從零起步學習AI

所謂萬丈高樓平地起,搞數據科學、機器學習或深度學習,一開始至少得學會跟計算機打交道吧,怎麼跟計算機打交道呢?編程。 第一步:學習編程     實話說,計算機體系很龐大,除了語言、數據機構、算法之外,計算機體系結構、操作系統、網絡、數據庫等

原创 推薦系統技術演進趨勢:從召回到排序再到重排

推薦系統技術,總體而言,與NLP和圖像領域比,發展速度不算太快。不過最近兩年,由於深度學習等一些新技術的引入,總體還是表現出了一些比較明顯的技術發展趨勢。這篇文章試圖從推薦系統幾個環節,以及不同的技術角度,來對目前推薦技術的比較彰顯的技術

原创 10億計算下的合約廣告,如何做個性化投放?

一、導言 合約保量廣告(Guaranteed Delivery)是一種常見的品牌展示廣告採買方式,現有的技術解決方案通常是在人羣粒度上對問題進行抽象和建模,這種建模方式一方面忽略了相同人羣下用戶行爲的差異,另一方面無法對用戶粒度的約束進行

原创 淺析Kafka實時數據處理系統

Kafka是啥?用Kafka官方的話來說就是: Kafka is used for building real-time data pipelines and streaming apps. It is horizontally sca

原创 新的深度學習模型可以準確識別睡眠階段

New deep learning model can accurately identify sleep stages 新的深度學習模型可以準確識別睡眠階段 A new deep learning model developed by

原创 淺析Hbase

無論是 NoSQL,還是大數據領域,HBase 都是非常"炙熱"的一門數據庫。本文將對 HBase 做一些基礎性的介紹,旨在入門。 一、簡介 HBase 是一個開源的、面向列的非關係型分佈式數據庫,目前是Hadoop體系中非常關鍵的一部分

原创 騰訊信息流內容理解技術實踐

導讀:目前信息流推薦中使用的內容理解技術,主要有兩部分構成: 1. 門戶時代和搜索時代遺留的技術積累:分類、關鍵詞以及知識圖譜相關技術; 2. 深度學習帶來的技術福利:embedding。但是分類對於興趣點刻畫太粗,實體又容易引起推薦多樣

原创 “12306”的架構到底有多牛逼?極限併發帶來的思考

每到節假日期間,一二線城市返鄉、外出遊玩的人們幾乎都面臨着一個問題:搶火車票!雖然現在大多數情況下都能訂到票,但是放票瞬間即無票的場景,相信大家都深有體會。尤其是春節期間,大家不僅使用12306,還會考慮“智行”和其他的搶票軟件,全國上下

原创 XGBoost類庫使用小結

在XGBoost算法原理小結中,我們討論了XGBoost的算法原理,這一片我們討論如何使用XGBoost的Python類庫,以及一些重要參數的意義和調參思路。 本文主要參考了XGBoost的Python文檔 和 XGBoost的參數文檔。

原创 張小龍-年薪近3億的微信之父,他是如何做到的?

張小龍生於湖南邵東魏家橋鎮, 家庭主要特點:窮。 不僅自己窮,親戚也都很窮,可以說窮以類聚。爺爺做過銅匠,總的來說,標準的勞動階級出身。 家有兄弟兩人, 一個小龍,一個小虎。 小虎好動,與鄰里打成一片, 小龍好靜,喜好讀書。 “文靜的像個

原创 張小龍微信公開課PRO演講:信息互聯的7個思考

又到了一年一度的微信公開課。很抱歉這次沒有來到現場,在這裏跟大家打個招呼。 其實我是故意不來現場的。記得第一次公開課,我提到說,參加各種會議可能是很浪費時間的。   我還說過,用產品說話,纔是我們應該做的。大家也看到,微信從來沒有開過發