原创 ALS算法的基本思想
SparkALS算法基本思想 ALS算法是基於模型的推薦算法。起基本思想是對稀疏矩陣進行模型分解,評估出缺失項的值,以此來得到一個基本的訓練模型。然後依照此模型可以針對新的用戶和物品數據進行評估。ALS是採用交替的最小二乘法來算出
原创 基於eclipse的spark開發環境搭建
1、下載spark安裝包,然後直接解壓即可。 2、配置環境變量 SPARK_HOME F:\spark-2.1.0-bin-hadoop2.6 Path追加F:\spark-2.1.0-bin-hadoop2.6\
原创 Mahout基於用戶的協同過濾算法的例子
每行測試數據分別標識用戶id(uid),物品id(itemid),評分(rating),評分時間(time) 3464,2502,3,973282547 3464,3160,2,973282494 3464,2505,3,9
原创 Mahout基於物品的協同過濾算法例子
每行測試數據分別標識用戶id(uid),物品id(itemid),評分(rating),評分時間(time) 464,2551,4,967174774 3464,1753,3,967247306 3464,144,5,96
原创 基於ALS算法電影推薦(java版)
基於ALS算法的最佳電影推薦(java版) package spark; import java.util.Arrays; import java.util.List; import org.apache.log4j.Leve
原创 Spark K-Means 算法例子
k-means算法是以空間的點距離爲基準,隨機或者按照一定規則選擇幾個中心點數據,計算每個點到該幾個中心點的距離,按照距離值最近歸爲一類的原則,把空間所有的點歸爲初始化的幾個中心,稱之爲中心簇。 然後,找到每個中心簇的中心,再次
原创 spark LDA聚類算法的例子
LDA是狄利克雷分佈算法,一般用於海量文檔主題聚類。一般每個文檔都有一個隱藏的主題,LDA算法就是找出可能性最高的幾個主題。在找出主題的同時,也就找到了文檔中每個單詞在主題中的分佈概概率。可以參考http://blog.csdn.net/
原创 Unsafe例子
java無法訪問操作系統底層API,諸如釋放內存、原子操作、線程的掛起以及獲取字段的內存地址等等。但是強大的java並非完全屏蔽了所有的入口,Unsafe類就可以提供上述功能的操作。下面例子只是簡單的獲取了Unsafe類,並實現了獲取字段
原创 sparkALS算法例子
該例子援引的是http://files.grouplens.org/datasets/movielens/ 中ml-100k.zip的數據,可以直接下載下來保存到本地,修改代碼中的路徑即可。 package spark; imp
原创 記一次生產上線的問題
昨天項目上線,在完成驗證之後,我深吸一口氣,完美上線,未出任何問題。然而半個小時之後,收到運維團隊發過來的告警,說是有一臺服務器的幾個端口未被探測到。當時聽說之後,我心中一緊,不對呀,我們服務器之後都觀察了系統日誌,交易一切
原创 搶紅包問題隨想
前些天看了一篇文章,內容是講述分佈式鎖的,舉的例子是搶紅包的例子,大意是說10w人分1億紅包。其大致的思想是通過分佈式鎖來控制紅包的金額,每來一個請求就按照當前紅包剩餘金額分配額度,直至紅包剩餘金額爲0爲止。文章的鏈接地址如下:h
原创 服務熔斷的設計與實現
一、背景 這些天我所負責的項目(某知名民營銀行的開放平臺)需要實現服務熔斷的功能。因該項目是直接購買第三方公司的產品,所以在接到該任務後,我第一時間找到該公司詢問是否有現成的產品和設計。無奈,現實很殘酷,該公司並沒有現成
原创 作爲網關如何合理的估算線程池大小
作爲一名項目項目經理,在項目上線之後我們經常會遇到一些參數設置的問題,比如今天要討論的:如何合理的設置線程池大小。 線程池作爲應用的關鍵組成部分,是應用處理業務的關鍵角色,而線程池大小直接關係着應用的吞吐量、處理能