原创 scala學習五:scala函數式編程

scala學習五:scala函數式編程 標籤(空格分隔): scala scala學習五scala函數式編程 一值函數 二匿名函數 三帶函數參數的函數 四閉包 五柯里化函數 六高階函數實例 一,值函數 值函數:將函數

原创 scala學習三:scala面向對象

scala學習三:scala面向對象 標籤(空格分隔): scala scala學習三scala面向對象 一面向對象的基本概念 二構造器 三object 四scala中的apply方法 五繼承 一,面向對象的基本概念

原创 企業大數據平臺二:企業大數據平臺環境準備

企業大數據平臺二:企業大數據平臺環境準備 標籤(空格分隔): 企業大數據平臺 企業大數據平臺二企業大數據平臺環境準備 一Hadoop髮型版本 二準備工作 一,Hadoop髮型版本 1,apache版本–開源版本 2

原创 lucene二----luke的使用

1,將安裝包放到根目錄下 2,java -jar  lukeall-4.10.3.jar

原创 lucene一---基本原理和結構

數據的分類 結構化數據:有固定類型或者有固定長度的數據          例如:數據庫中的數據(mysql,oracle等), 元數據(就是windows中的數據) 結構化數據搜索方法:          數據庫中數據通過sql語句可

原创 maven二

1,maven的生命週期 2,eclipse配置maven 3,依賴範圍 4,調試maven項目 5,maven整合struts 6,maven的概念模型

原创 Hive作業優化

1、Join原則將條目少的表/子查詢放在 Join的左邊。 原因是在 Join 操作的 Reduce 階段,位於 Join左邊的表的內容會被加載進內存,將條目少的表放在左邊,可以有效減少發生內存溢出的機率。 當一個小表關聯一個超大表時,容

原创 hive數據壓縮技術001

一、 壓縮方案比較 關於Hadoop HDFS文件的壓縮格式選擇, 我們通過多個真實的Track數據做測試,得出結論如下: 1. 系統的默認壓縮編碼方式 DefaultCodec 無論在壓縮性能上還是壓縮比上,都優於GZIP 壓縮編碼。

原创 hive-udaf開發實例1

1,pom配置: <dependency>     <groupId>org.apache.hive</groupId>     <artifactId>hive-exec</artifactId>     <version>1.1.0-

原创 oozie修改爲GMT時間

1,修改oozie-site.xml:<property>        <name>oozie.processing.timezone</name>        <value>GMT+0800</value>  </property>

原创 Solr3---SolrJ的使用

1,什麼是solrJ 2,依賴的包 3,添加文檔 3.1,實現步驟 4,刪除文檔 5,修改文檔 6,查詢文檔 6.1簡單查詢 6.2 複雜查詢 7,總結

原创 jdbc通過hive server2訪問hive

1,pom配置: <dependency>     <groupId>org.apache.hadoop</groupId>     <artifactId>hadoop-client</artifactId>     <version

原创 Solr2---域的類型和分類以及中文分詞

一,域的類型和分類 C:\solrhome\collection2\conf\schema.xml 二,配置中文分詞 1,拷貝IKAnalyzer2012FF_u1.jar到apache-tomcat-7.0.81\webapps

原创 分佈式模式之Broker模式

問題來源:  創建一個遊戲系統,其將運行在互聯網的環境中。客戶端通過WWW服務或特定的客戶端軟件連接到遊戲服務器,隨着流量的增加,系統不斷的膨脹,最終後臺數據、業務邏輯被分佈式的部署。然而相比中心化的系統,複雜度被無可避免的增大了,該如何

原创 Solr1---什麼是Solr以及安裝配置

一,solr的介紹 Solr 是Apache下的一個頂級開源項目,採用Java開發,它是基於Lucene的全文搜索服務器。Solr提供了比Lucene更爲豐富的查詢語言,同時實現了可配置、可擴展,並對索引、搜索性能進行了優化。 Solr可