原创 深度學習| 通過蒸餾收斂一個更優模型部署

蒸餾收斂  基於keras的知識蒸餾(Knowledge Distillation)-分類與迴歸 如果通過蒸餾收斂到一個更優的的部署模型 Knowledge Distillation  Introduction to Knowledge

原创 深度學習| word2vec

word2vec 單詞向量化表示 word2vec 下分爲兩個模型CBOW與Skip-gram ,分別包含Hierarchical Softmax和 Negative Sampling兩個方法;    1. 連續詞袋模型(CBOW)與跳字

原创 深度學習| 循環神經網絡RNN與應用

循環神經網絡 CV是和image圖片和視頻打交道; NLP 自然語言處理是和文本打交道,文本天然的時序數據; 1. 場景與多種應用 模仿論文(生成序列) 模型Linux內核代碼“寫程序” (生成序列)| 按概率分佈去做排布 模仿小四的作品

原创 深度學習| 卷積神經網絡與典型結構

神經網絡與卷積神經網絡 從神經網絡到卷積神經網絡 DNN能用到計算機視覺上嗎?爲什麼需要CNN? 卷積神經網絡和人工神經網絡的差異在哪?     1.層級結構 保持了層級網絡結構; 不同層次有不同形式(運算)與功能;    主要是以

原创 深度學習| 神經網絡初步

線性分類器 線性分類器比如邏輯迴歸、線性SVM,我們會拿到一個決策邊界 線性分類器得分函數  圖像數據(32 * 32 * 3的輸入矩陣)——圖像數據 權重/參數f(x, W) ——>  CIFAR-10中的10個類別的得分向量  f(x,

原创 算法-11| 最短路徑| Dijkstra算法

有向有權圖 圖的兩種搜索算法,深度優先搜索和廣度優先搜索。這兩種算法主要是針對無權圖的搜索算法。 針對有權圖,也就是圖中的每條邊都有一個權重,該如何計算兩點之間的最短路徑(經過的邊的權重和最小)呢?常用的最短路徑算法(Shortest Pa

原创 兩套經典的用戶畫像-梁寧

  有非常多的書在講用戶畫像,並且有一大堆方法論。 在實際工作的過程中用到的用戶畫像,希望能夠給你啓發或者能夠直接用得上。 1. 第一套用戶畫像:羊羣與草地   比如,YY的創始人和董事長李學凌給講了一組用戶畫像,早期做產品就是用他的這組用

原创 AI導論

1. 自然語言處理應用 自然語言處理(Natural Language Processing, NLP),通過理解人類語言來解決實際問題的一門學科。 自然語言處理不僅是學術界的研究熱點,在工業界也有許多成果,如谷歌的文本搜索引擎、蘋果的Si

原创 端到端的Exactly Once| Kafka的事務和冪等性| Flink的Exactly Once

  1. Kafka的事務和 Exactly Once Kafka 中的事務,它解決的問題是,確保在一個事務中發送的多條消息,要麼都成功,要麼都失敗。注意,這裏面的多條消息不一定要在同一個主題和分區中,可以是發往多個主題和 分區的消息。Ka

原创 clickhouse副本| 集羣讀寫

  1. 副本 副本的目的主要是保障數據的高可用性,即使一臺ClickHouse節點宕機,那麼也可以從其他服務器獲得相同的數據。 副本寫入流程   副本的配置步驟 ① 啓動zookeeper集羣 (hadoop102、 hadoop103

原创 Elasticsearch-RestFulAPI

  1. 基本概念 Elasticsearch有幾個核心概念,先理解這些概念將有助於掌握Elasticsearch。 近實時(Near Realtime / NRT)  Elasticsearch是一個近實時的搜索平臺,從生成文檔索引到文檔

原创 Kylin |3.Cube的優化

  Kylin Cube的優化         在沒有采取任何優化措施的情況下,Kylin會對每一種維度的組合進行預計算,每種維度的組合的預計算結果被稱爲Cuboid。假設有4個維度,我們最終會有24 =16個Cuboid需要計算。 但在現

原创 Kylin的module項目的構建

  employee實事表纔會參與真正運算,dept維表不參與 model模型分以下2種:  ① 當所有維表都直接連接到“ 事實表”上時,整個圖解就像星星一樣,故將該模型稱爲星形模型   星狀模型是直接關聯; ② 當有一個或多個維表沒有直接

原创 算法| 高級動態規劃

  動態規劃 Dynamic Programming 1. “Simplifying a complicated problem by breaking it down into simpler sub-problems”  (in a r

原创 數據結構 |Redis中數據類型對應的數據結構

  Redis Redis 是一種鍵值(Key-Value)數據庫。相對於關係型數據庫(比如 MySQL),Redis 也被叫作非關係型數據庫。  像 MySQL 這樣的關係型數據庫,表的結構比較複雜,會包含很多字段,可以通過 SQL 語句