原创 如何在Hive中實現遞歸計算

Hive腳本中添加: set hive.mapred.supports.subdirectories=true; set mapred.input.dir.recursive=true;

原创 Hive中的函數列表

原文見:https://cwiki.apache.org/confluence/display/Hive/LanguageManual+UDF 1.內置運算符 1.1關係運算符 運算符 類型 說明 A = B 所有原始類型

原创 準確率和召回率介紹

引用:http://bookshadow.com/weblog/2014/06/10/precision-recall-f-measure/ 1、準確率與召回率(Precision & Recall) 準確率和召回率

原创 Spark:用Scala和Java實現WordCount

http://www.cnblogs.com/byrhuangqiang/p/4017725.html 爲了在IDEA中編寫scala,今天安裝配置學習了IDEA集成開發環境。IDEA確實很優秀,學會之後,用起來很順手。關於如何搭

原创 卷積神經網絡CNN

引用:http://blog.csdn.net/zouxy09/article/details/9993371 自己平時看了一些論文,但老感覺看完過後就會慢慢的淡忘,某一天重新拾起來的時候又好像沒有看過一樣。所以想習慣地把一些感覺有

原创 thrift的使用介紹

引用:http://gemantic.iteye.com/blog/1199214 一、About  thrift    二、什麼是thrift,怎麼工作? 三、Thrift  IDL 四、Thrift   Demo 五、Thrift

原创 Java 內存區域和GC機制

轉:http://www.cnblogs.com/hnrainll/archive/2013/11/06/3410042.html Java垃圾回收概況   Java GC(Garbage Collection,垃圾收集,垃圾回收)

原创 協同過濾介紹

原文:http://www.ibm.com/developerworks/cn/web/1103_zhaoct_recommstudy2/index.html 本系列的第一篇爲讀者概要介紹了推薦引擎,下面幾篇文章將深入介紹推薦

原创 如何在Excel中將文件大小中有GB、MB的信息轉化成統一格式

已知條件:Excel中導出了一份數據,第一列是日期,第二列是文件大小 20150901 1.87 GB 20150902 1.85 GB 20150903 219.46 MB 20150904 227.99 MB 現在希望能繪製一個E

原创 神經網絡入門3

引用:http://blog.csdn.net/zzwu/article/details/575108 4. 聰明的掃雷機工程(Smart Minesweeper Project)       我要向你介紹的第一個完整例子,是怎麼

原创 基於物品的協同過濾和內容過濾有什麼區別?

鏈接:http://www.zhihu.com/question/19971859/answer/20424386    基於物品的協同過濾,首先從數據庫裏獲取他之前喜歡的東西,然後從剩下的物品中找到和他歷史興趣近似的物品推薦給他。核心

原创 kettle介紹

引用:http://lichao-super.iteye.com/blog/1577166 1,Kettle跨平臺使用。    例如:在AIX下(AIX是IBM商用UNIX操作系統,此處在LINUX/UNIX同樣適用),運行Kett

原创 ssis+ssas+ssrs 介紹

SSIS,數據抽取服務,實現數據的Extract,Transfom,Cleansing,Loading,或是按Kimball的說法,進行ECCD 的ETL過程,它實現了從源頭提取、數據,清洗數據,一致化數據,加載交付數據到數據倉庫這些功能

原创 mahout調用協同過濾

./mahout recommenditembased --booleanData true --endPhase 2147483647 --input ****  --maxPrefsPerUser 3  --maxSimilariti

原创 元數據管理器中存在錯誤。 日誌文件的擴展名只能是 .LOG。

在SSAS搭建中,點擊處理時,報錯信息“元數據管理器中存在錯誤。 日誌文件的擴展名只能是 .LOG。” 解決辦法:參考微軟的MSDN:https://msdn.microsoft.com/zh-cn/library/ms180058(v