原创 分佈式系統distributed-system資料

分佈式系統(Distributed System)資料 希望轉載的朋友,你可以不用聯繫我.但是一定要保留原文鏈接,因爲這個項目還在繼續也在不定期更新.希望看到文章的朋友能夠學到更多. 《Reconfigurable Distribut

原创 sort-based shuffle的核心:org.apache.spark.util.collection.ExternalSorter

依據Spark 1.4版 在哪裏會用到它 ExternalSorter是Spark的sort形式的shuffle實現的關鍵。SortShuffleWriter使用它,把RDD分區中的數據寫入文件。 override def

原创 王川: 深度學習有多深, 學了究竟有幾分?

上一篇文章提到了數據挖掘、機器學習、深度學習的區別:http://www.cnblogs.com/charlesblc/p/6159355.html 深度學習具體的內容可以看這裏: 參考了這篇文章:https://zhuanl

原创 IBM發佈基於內存的人工智能計算架構

12月1日 美國IBM公司發佈消息稱,該公司研究人員實現了在內存計算技術上的一次重大突破,發明了一種可以運行在100萬個相變內存(PCM)上的無監督式機器學習算法,有望比傳統計算機在計算速度和能耗利用效率方面提升200倍,非常適合

原创 5G時代的智能邊緣計算AI-EC平臺

5G時代的智能邊緣計算AI-EC平臺 轉自http://www.ccf.org.cn/c/2017-10-20/617329.shtml 閱讀量:19 10月20日 收藏本文 2017年9月初華爲透露:首款搭載AI芯片的商務手機將於

原创 簡單易學的機器學習算法——Metropolis-Hastings算法

在簡單易學的機器學習算法——馬爾可夫鏈蒙特卡羅方法MCMC中簡單介紹了馬爾可夫鏈蒙特卡羅MCMC方法的基本原理,介紹了Metropolis採樣算法的基本過程,這一部分,主要介紹Metropolis-Hastings採樣算法,Metro

原创 大數據平臺系統概覽

開源(Open Source)用之於大數據技術,其作用有二:一方面,在大數據技術變革之路上,開源在衆人之力和衆人之智推動下,摧枯拉朽,吐故納新,扮演着非常重要的推動作用。另一方面,開源也給大數據技術構建了一個異常複雜的生態系統。每一天

原创 B-tree/B+tree/B*tree

   B~樹                1.前言: 動態查找樹主要有:二叉查找樹(Binary Search Tree),平衡二叉查找樹(Balanced Binary Search Tree),紅黑樹 (Red-Black Tree

原创 思考與學習方法

思考方法 0. 學習的時候需要自頂向下,抓中心主旨。先知道一個事物的用處,然後它的大致框架,與已有的主要思想區別,然後再細化學習各個模塊。 1. 學習一個新的東西的時候,抓中心思想,與已有東西的區別-(1)與已有東西的相同之處(2)新的

原创 Yarn資源調度策略

YARN資源調度策略 轉載2016-08-21 21:23:56 標籤:yarn YARN雖然是從MapReduce發展而來,但其實更偏底層,它在硬件和計算框架之間提供了一個抽象層,用戶可以方便的基於YARN編寫自己的分佈

原创 時空軌跡數據壓縮

本文內容是對微軟亞洲研究院鄭宇博士的書籍《TextBook_computing with spatial trajectories》進行的學習總結。 Perpendicular Euclidean distancec does’t

原创 稀疏矩陣存儲格式總結+存儲效率對比:COO,CSR,DIA,ELL,HYB

稀疏矩陣是指矩陣中的元素大部分是0的矩陣,事實上,實際問題中大規模矩陣基本上都是稀疏矩陣,很多稀疏度在90%甚至99%以上。因此我們需要有高效的稀疏矩陣存儲格式。本文總結幾種典型的格式:COO,CSR,DIA,ELL,HYB。  

原创 廣義線性模型

今天我來介紹一種在機器學習中應用的比較多的模型,叫做廣義線性模型(GLM)。這種模型是把自變量的線性預測 函數當作因變量的估計值。在機器學習中,有很多模型都是基於廣義線性模型的,比如傳統的線性迴歸模型,最大熵 模型,Logistic

原创 安裝Gensim,測試node2vec

0.pip install wheel 1.從網上下載與python27對應的 numpy-1.12.1+mkl-cp27-cp27m-win32.whl,用pip命令安裝 2.pip install scipy 3.pip insta

原创 Linux下JNI調用簡單實例操作全過程

開發環境:Linux(Ubuntu 11.04) + JDK 7 實例說明:利用JNI調用本地代碼的方法來實現一個計算Int數組總和的功能 使用JNI調用本地代碼,整個開發流程主要包括以下幾個步驟: 1、創建一個Java類(Int